dfsj66011 个人主页

@weixin_37179744

dfsj66011

2023-01-03 19:46:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

第十四章：深度强化学习的黄金年代

强化学习对奖励信号的质量极度依赖。奖励稀疏（只有最终结果）使学习效率低下——这是可以通过设计"奖励塑形（Reward Shaping）"来部分缓解的工程问题；但奖励设计错误，会导致 AI 学到完全意想不到的错误行为，这被称为奖励黑客（Reward Hacking）。一个被反复引用的案例：OpenAI 训练 AI 玩海岸赛船游戏（CoastRunners），奖励设定为赛道上积累的得分（路过特定标志物

#人工智能

第十三章：Scaling Laws 与涌现能力

某些能力，在参数量较小的模型上完全不存在（准确率接近随机），但当参数量超过某个临界值后，能力会突然出现，准确率急剧上升到有意义的水平。这就是涌现（Emergence）——能力从无到有的断崖式变化。用具体例子说明。以三位数加减法为例：在数十亿参数规模的模型上，这个任务的准确率约等于随机猜测；随着参数量增加，性能几乎没有改善；但当模型跨过数十亿到百亿参数量级的某个临界点，准确率突然跳升到接近 100%

#深度学习 #人工智能

第十二章：预训练改进的黄金年

info]第十一章结束于一个双重悬念：BERT 和 GPT，一个"填空"，一个"续写"，两种截然不同的哲学都取得了惊人效果。BERT 在 11 项 NLP 任务上同时刷新了记录，GPT 证明了单向语言模型也能做下游任务。但没有人真正知道，这究竟是为什么——哪些设计决策是真正关键的，哪些只是意外的"搭便车"。2019 年，整个 NLP 社区开始系统地拆解这两个模型，他们的发现，有时令人振奋，有时令人

#人工智能

第十章：Transformer 的跨域征服

密集预测任务。图像分类只需要给整张图打一个标签（“猫”、“车”）。但更复杂的视觉任务——目标检测（在图中圈出猫的位置和边界框）、语义分割（给每个像素分配类别）——需要模型具备多尺度特征：既要看到细节（局部的边缘、纹理），又要理解整体（物体的形状、场景的布局）。CNN 的层次化结构天然地提供了这种多尺度特征：浅层特征图分辨率高、感受野小（捕捉细节），深层特征图分辨率低、感受野大（理解语义）。标准目标

#transformer #深度学习 #人工智能

第七章：序列模型与记忆的边界

info]第五章中，卷积神经网络把"局部感受野"和"权重共享"编码进了结构中，彻底改变了图像识别的格局。第六章中，我们拆解了深度学习的工程内功：优化器从 SGD 进化到 Adam，BatchNorm 让深层网络稳定运行，PyTorch 把调试变回了写普通 Python 代码的感觉，GPU 和 CUDA 提供了矩阵运算的硬件加速。架构对了，工具齐了。然而，这一切辉煌成就都发生在里——一个二维的、空间

#人工智能

第五章：卷积神经网络

"归纳偏置"的意思是：模型对数据的结构有一定的先验假设，而这些假设决定了模型会从数据里归纳出什么样的规律。所有的模型都有归纳偏置——区别只在于这个偏置是否和数据的真实结构一致。一个没有任何归纳偏置的模型（比如完全连接的神经网络），它的假设是：“所有东西都可能和所有其他东西有关”。这个假设过于宽泛，意味着模型必须靠数据来排除几乎所有不成立的关系。在图像上，这需要极其大量的样本——"告诉"网络猫在左边

#cnn #人工智能 #神经网络

第四章：深度学习革命

info]在第三章的结尾我们留下了一个问题：当数据、算力、算法三块拼图同时准备好，接下来又会发生哪些故事呢？2006 年，Hinton 用深度信念网络发出了第一个复苏信号——但复苏信号并不等于爆发信号。大多数 AI 研究者仍然不相信神经网络会复活，那个时期 SVM 依然是主流，神经网络依然是那个被 Minsky 判过死刑的边缘研究方向。

摘要神经网络的发展经历了从早期辉煌到长期沉寂的曲折历程。1943年，麦卡洛克和皮茨提出M-P神经元模型，首次将神经元抽象为逻辑计算单元，启发了冯·诺依曼的计算机架构设计。1957年，罗森布拉特发明感知机及其学习算法，实现了首个有数学保证的机器学习模型。然而1969年明斯基的严厉批判使神经网络研究陷入寒冬。这段历史展现了科学突破常面临的困境：先驱性的思想往往需要等待技术条件成熟才能绽放，而学术争议

#神经网络 #人工智能 #深度学习

第二章：统计学习的崛起

统计学习的崛起：从规则到数据的范式转移本文回顾了人工智能从符号主义向统计学习的关键转变。1980年代末，随着专家系统的局限性和AI寒冬的到来，研究者开始探索从数据中自动学习知识的新路径。统计学习方法通过从大量示例中提取规律，实现了从"编程知识"到"学习知识"的根本转变，并建立了基于预测准确率的客观评估体系。这一转变使AI研究从哲学思辨转向可量化的工程实践，

#人工智能 #机器学习

共 12 条

请选择