
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习对奖励信号的质量极度依赖。奖励稀疏(只有最终结果)使学习效率低下——这是可以通过设计"奖励塑形(Reward Shaping)"来部分缓解的工程问题;但奖励设计错误,会导致 AI 学到完全意想不到的错误行为,这被称为奖励黑客(Reward Hacking)。一个被反复引用的案例:OpenAI 训练 AI 玩海岸赛船游戏(CoastRunners),奖励设定为赛道上积累的得分(路过特定标志物
某些能力,在参数量较小的模型上完全不存在(准确率接近随机),但当参数量超过某个临界值后,能力会突然出现,准确率急剧上升到有意义的水平。这就是涌现(Emergence)——能力从无到有的断崖式变化。用具体例子说明。以三位数加减法为例:在数十亿参数规模的模型上,这个任务的准确率约等于随机猜测;随着参数量增加,性能几乎没有改善;但当模型跨过数十亿到百亿参数量级的某个临界点,准确率突然跳升到接近 100%
info]第十一章结束于一个双重悬念:BERT 和 GPT,一个"填空",一个"续写",两种截然不同的哲学都取得了惊人效果。BERT 在 11 项 NLP 任务上同时刷新了记录,GPT 证明了单向语言模型也能做下游任务。但没有人真正知道,这究竟是为什么——哪些设计决策是真正关键的,哪些只是意外的"搭便车"。2019 年,整个 NLP 社区开始系统地拆解这两个模型,他们的发现,有时令人振奋,有时令人
密集预测任务。图像分类只需要给整张图打一个标签(“猫”、“车”)。但更复杂的视觉任务——目标检测(在图中圈出猫的位置和边界框)、语义分割(给每个像素分配类别)——需要模型具备多尺度特征:既要看到细节(局部的边缘、纹理),又要理解整体(物体的形状、场景的布局)。CNN 的层次化结构天然地提供了这种多尺度特征:浅层特征图分辨率高、感受野小(捕捉细节),深层特征图分辨率低、感受野大(理解语义)。标准目标
info]第五章中,卷积神经网络把"局部感受野"和"权重共享"编码进了结构中,彻底改变了图像识别的格局。第六章中,我们拆解了深度学习的工程内功:优化器从 SGD 进化到 Adam,BatchNorm 让深层网络稳定运行,PyTorch 把调试变回了写普通 Python 代码的感觉,GPU 和 CUDA 提供了矩阵运算的硬件加速。架构对了,工具齐了。然而,这一切辉煌成就都发生在里——一个二维的、空间
"归纳偏置"的意思是:模型对数据的结构有一定的先验假设,而这些假设决定了模型会从数据里归纳出什么样的规律。所有的模型都有归纳偏置——区别只在于这个偏置是否和数据的真实结构一致。一个没有任何归纳偏置的模型(比如完全连接的神经网络),它的假设是:“所有东西都可能和所有其他东西有关”。这个假设过于宽泛,意味着模型必须靠数据来排除几乎所有不成立的关系。在图像上,这需要极其大量的样本——"告诉"网络猫在左边
info]在第三章的结尾我们留下了一个问题:当数据、算力、算法三块拼图同时准备好,接下来又会发生哪些故事呢?2006 年,Hinton 用深度信念网络发出了第一个复苏信号——但复苏信号并不等于爆发信号。大多数 AI 研究者仍然不相信神经网络会复活,那个时期 SVM 依然是主流,神经网络依然是那个被 Minsky 判过死刑的边缘研究方向。
info]在第三章的结尾我们留下了一个问题:当数据、算力、算法三块拼图同时准备好,接下来又会发生哪些故事呢?2006 年,Hinton 用深度信念网络发出了第一个复苏信号——但复苏信号并不等于爆发信号。大多数 AI 研究者仍然不相信神经网络会复活,那个时期 SVM 依然是主流,神经网络依然是那个被 Minsky 判过死刑的边缘研究方向。
摘要 神经网络的发展经历了从早期辉煌到长期沉寂的曲折历程。1943年,麦卡洛克和皮茨提出M-P神经元模型,首次将神经元抽象为逻辑计算单元,启发了冯·诺依曼的计算机架构设计。1957年,罗森布拉特发明感知机及其学习算法,实现了首个有数学保证的机器学习模型。然而1969年明斯基的严厉批判使神经网络研究陷入寒冬。这段历史展现了科学突破常面临的困境:先驱性的思想往往需要等待技术条件成熟才能绽放,而学术争议
统计学习的崛起:从规则到数据的范式转移 本文回顾了人工智能从符号主义向统计学习的关键转变。1980年代末,随着专家系统的局限性和AI寒冬的到来,研究者开始探索从数据中自动学习知识的新路径。统计学习方法通过从大量示例中提取规律,实现了从"编程知识"到"学习知识"的根本转变,并建立了基于预测准确率的客观评估体系。这一转变使AI研究从哲学思辨转向可量化的工程实践,







