中文
从空间到地形,从地形到运动,从运动到收敛,从收敛到推理
建立几何直觉。参数空间、表示空间、损失地形、梯度场、欧拉步——模型的身体在哪里,视野如何形成,地形如何引导运动。
优化器作为行走方式,非欧距离,推理轨迹,动力系统与不动点。ResNet=显式欧拉,GPT自回归=隐状态欧拉迭代,DEQ=不动点。
思维链不是推理本身,而是推理轨迹的可见投影。吸引子、验证器、RLHF——推理场如何被训练重塑。
经典算法几何化。线性回归、PCA、SVM、Attention、LoRA、Diffusion——每章一图一公式一实验。
作者