Skip to content

Deep Learning

1 预备知识

线性代数

范数 ???

向量的 L2 范数,向量的 L1 范数, 矩阵的 F 范数

找出函数的三步骤

设定范围,函数的集合,(Model), Deep Learning (CNN, Transformer ...), Decision Tree , etc.

设定目标,评价函数的好坏,(Loss), Supervised Learning , Semi-supervised Learning, RL, etc.

达成目标,找到最好的函数,最佳化 (Optimization), Gradient Descent(Adam, AdamW...), Genetic Algorithm, etc.

2 Introduction 导论

Loss Function

Mean Absolute Error (MAE), Mean Square Error (MSE)

4 Multiple Layer Perceptron (多层感知机)

隐藏层

激活函数 (Activation Function)

ReLU (Rectified linear unit), Sigmoid, tanh,

训练误差和泛化误差,

统计学习理论

i.i.d. assumption (独立同分布假设)

模型复杂性

early stopping (早停)

模型选择

验证集, K 折交叉验证,

欠拟合还是过拟合?

模型复杂性, 数据集大小

多项式回归

权重衰减

权重衰减,又称 L2 正则化。

Regression

Linear Regression (线性回归)

仿射变换,放缩和平移。

Softmax Regression (Softmax 回归)

softmax function,

Classification

二分类 (binary classification), 贝叶斯公式, 全概率公式,

Conventional Neural Network (CNN)

卷积运算,互相关运算, 填充,步长, 池化(降低分辨率),

Recurrent Neural Network (RNN)

Attention

Self-Attention

Transformer

15 See Also