logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

详谈大模型“信用分配”难题:大模型长文本推理 (PPO/DPO/KTO) 的痛点与破局分析

当前的基座模型其实已经足够聪明。它们在预训练阶段就吞噬了人类几乎所有的知识。强化学习(RLHF)及其变体,本质上并不是在教大模型‘学习新知识’,而是像一个极其高明的采访者,把模型脑子里本来就有的东西,以人类最喜欢的格式、最严密的逻辑‘引诱’出来。因此,在很多场景下,我们并不总是需要盲目追求更大参数的模型。参数少不等于性能弱!一个参数量适中、但经过极高标准优化(如 KTO、PRM 或极致的规则驱动

#人工智能#深度学习#神经网络 +3
大模型面试第二期:层归一化篇

对比分析 Layer Norm、RMSNorm、DeepNorm 的数学原理与核心差异,并探讨 Post-Norm、Pre-Norm 与 Sandwich-Norm 对深层网络训练稳定性的影响。

文章图片
#人工智能#深度学习#神经网络 +3
开年王炸?马斯克都盛赞的 Kimi 架构级创新《Attention Residuals》深度解读

究竟是一篇什么样的中国 AI 论文,能让马斯克等一众硅谷大佬在深夜的 X(推特)上疯狂讨论?答案就是 Kimi 最新发布的架构级神作《Attention Residuals》。今天,我们将用最通俗的比喻带你拆解这篇“动了深度学习十年祖坟”的硬核研究,看看他们是如何破解大模型越深越笨的魔咒的。更让人震撼的是,这篇引发硅谷巨头热议、动了深度学习十年祖坟的底层架构论文,其第一作者竟然是一位 17 岁的深

文章图片
#人工智能#深度学习#计算机视觉 +4
统计学习方法第九章:EM算法从浅入深(扩散模型的前身,强烈建议学习)

在进入 EM 算法之前,我们必须先把脚下的土地踩实。这就意味着我们需要回到概率模型、极大似然估计这些最基本的概念,然后亲眼看看,为什么隐变量的出现会让原本优美的数学框架突然变得棘手。你将会发现,正是这个「和对数」的障碍,才催生了 EM 算法那巧妙的策略。

#学习方法#人工智能#算法 +2
现代 LangChain 开发指南:从 LCEL 原理到企业级 RAG 与 Agent 实战

LangChain 是一个开源框架,专门用于帮助开发者更轻松、高效地构建基于大型语言模型(LLMs)(如 ChatGPT、Gemini、Claude 等)的应用程序。如果把大语言模型比作一个非常聪明但被关在房间里的大脑(它拥有海量的静态知识,但无法获取实时信息,也不能直接操作电脑),那么 LangChain 就是为这个大脑装上“眼睛”、“手脚”和“记忆”的工具箱。

#人工智能#java#开发语言 +4
U-Net 全解析:从网络架构、核心原理到 PyTorch 代码实现

U-Net 是一个非常经典且极其重要的卷积神经网络(CNN)架构。它最初是为了生物医学图像分割而设计的,但由于其特别的设计,如今已经成为各种图像分割任务乃至 AI 图像生成模型(如 Stable Diffusion)的核心组件。

文章图片
#网络#人工智能#计算机视觉 +3
统计学习方法第五章:从浅入深解析决策树

决策树(Decision Tree)是机器学习中最经典、最具解释性的模型之一,也是理解更高级集成模型(如随机森林、XGBoost)的绝对基石。

#学习方法#决策树#算法 +3
统计学习方法第三章:K 近邻法-超深度解析讲解

学 KNN,不是因为它现在一定是最强算法,而是因为它特别适合建立机器学习的几个核心直觉。KNN 是最直观的机器学习模型之一。它的思想就是:跟你最像的人,大概率和你属于同一类。比如判断一个电影用户喜不喜欢某部电影,可以看和他兴趣最接近的用户怎么评价。判断一个新样本属于哪类,可以看它附近的样本属于哪类。这个思想非常朴素,但很多复杂方法背后也有类似的“相似性”思想。它不只是一个分类算法,更是后面很多机器

文章图片
#机器学习#人工智能#深度学习 +3
统计学习方法第二章:感知机-超深度解析讲解

感知机(Perceptron)是机器学习和神经网络领域中最基础的模型。你可以把它看作是现代深度学习中那些极其复杂的人工神经网络的“老祖宗”或基本构建块(即单个神经元)。现在的深度学习听起来很高大上(比如包含千亿参数的大语言模型),但如果你把它们拆开来看,它们的底层依然是密密麻麻的感知机。

文章图片
#学习方法#人工智能#深度学习 +2
统计学习方法第一章讲解:统计与监督学习概率

我们为什么还要学习统计学习方法?在如今深度学习(Deep Learning)和大语言模型(LLMs)“大杀四方”的时代,连几行代码就能调用强大的 AI,为什么我们还要回头去啃《统计学习方法》里那些看似“老旧”的传统算法(如 SVM、逻辑斯谛回归、决策树)?我们学习统计学习方法,是因为它是对人类“认知过程”和“世界运转规律”最严谨的数学抽象。它不仅是一门技术,更是一套底层世界观。

文章图片
#学习方法#学习#人工智能
    共 104 条
  • 1
  • 2
  • 3
  • 11
  • 请选择