文章中的数学公式不太稳定,如果看不到请刷新一次。

一些最基础的算法理论,别人已经整理得非常好了,不再整理。贴一些看过的特别好的链接作为收藏夹: 神经网络的正向反向传播 RNN的正向反向传播 LSTM的正向反向传播

目前待完成的内容: attention与transformer的一些细节问题

目前想写的: 知识蒸馏