08. Normalization Techniques | 归一化技术
难度: Medium | 标签: PyTorch, BatchNorm, LayerNorm, Normalization | 目标人群: Chapter 0 入门学习者
学习目标
- 掌握 BatchNorm 和 LayerNorm 的手写实现
- 理解训练态统计量与推理态统计量的区别
- 为 Transformer 中的归一化结构打基础
核心练习
batch_norm_trainbatch_norm_evallayer_norm_last_dimupdate_running_stats
练习提示
- BatchNorm 通常沿 batch 维统计均值和方差
- LayerNorm 通常沿特征维统计均值和方差
- 训练态和推理态不要混用同一组统计量
