logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GLM技术复盘:21篇论文深度解读智谱模型家族

回顾智谱AI从2022年到2026年的发布轨迹,可以观察到技术演进的三个阶段:首先是基座对标期(2022-2024),通过GLM-130B和GLM-4系列证明了国产大模型在知识理解与双语对齐上的竞争力;其次是能力深化期(2025),通过引入「Thinking」模式和多模态专家系统,将大模型的能力推向复杂推理与视觉感知的极限;最后是智能体转型期(2026),以GLM-5系列为代表,将智能体所需的长期

文章图片
Context Engineering要过时?AI圈新风口「Harness Engineering」,OpenAI/Anthropic齐发力

Harness Engineering是指设计、构建和迭代一套完整的运行环境与制度体系,包含工具接口、沙箱环境、架构约束、自动化测试、反馈循环及监控仪表盘,旨在引导和约束AI智能体,使其能够自主、可靠地完成复杂长周期任务,而无需人类实时干预。Harness Engineering的核心公式可以表达为,揭示了Harness Engineering的本质:模型负责原始推理能力,而Harness负责除此

文章图片
#人工智能
3年,从0到全球领跑:万字长文拆解DeepSeek大模型技术演进

发布日期模型名称核心参数/架构关键技术创新对标/性能亮点2023/11/2FIM预训练, 项目级上下文代码能力超越CodeLlama-34B2023/11/297B/67B稠密架构, 中英双语对齐67B打破LLaMA 2 70B垄断2023/12/18N/A3D一致性生成高质量文生3D资产2024/2/57BGRPO强化学习, 拒绝采样数学能力逼近GPT-4,RL技术验证2024/3/111.3B

文章图片
#人工智能
万字长文解读Qwen进化史:27篇论文深度复盘Qwen模型家族

原文:欢迎关注公zh: AI-Frontiers自2023年生成式人工智能迎来爆发以来,LLM技术的发展已从单纯的堆训练数据、堆参数量,转向了架构效率、模态融合以及长上下文推理能力的深水区。在这场全球性的技术角逐中,阿里巴巴通义实验室推出的 Qwen(通义千问)系列模型,凭借其极其密集且高质量的开源迭代节奏,构建了一个庞大生态系统,覆盖了从端侧微型模型到云端巨型旗舰、从纯文本处理到全模态实时交互。

文章图片
#人工智能
# 收藏!强化学习从入门到封神:5 本经典教材 + 8 大实战项目 + 7个免费视频,一站式搞定# 学习资源## 经典教材[**《大模型算法:强化学习、微调与对齐》**](https://

本篇教程大致介绍 Legged Gym 的结构,使用方法,并以一个二阶倒立摆为例来完成一次实际的强化学习训练。适合强化学习初学者复现。文档包含 ①强化学习基本概念 ②Legged Gym 环境安装 ③Legged Gym 代码结构介绍 ④二阶倒立摆训练项目代码解读。#强化学习 #智能体 #学习资源。

#学习
Google 迎来「DeepSeek 时刻」:TurboQuant算法实现3bit无损、8×加速、6×压缩、零预处理

原文:欢迎关注公zh: AI-Frontiers3月24日,谷歌在官方博客中推出革命性的压缩算法TurboQuant,相关内容将分别在 ICLR 2026和AISTATS 2026国际顶会发表。一经公布,引发了技术圈纷纷热议。更夸张的是,3月25日美股一开盘,存储芯片板块就集体迎来 「黑色时刻」,遭遇重挫。TurboQuant算法通过几何视角的向量量化手段,从根本上解决自回归推理中的「内存墙」难题

文章图片
万字长文解读Qwen进化史:27篇论文深度复盘Qwen模型家族

原文:欢迎关注公zh: AI-Frontiers自2023年生成式人工智能迎来爆发以来,LLM技术的发展已从单纯的堆训练数据、堆参数量,转向了架构效率、模态融合以及长上下文推理能力的深水区。在这场全球性的技术角逐中,阿里巴巴通义实验室推出的 Qwen(通义千问)系列模型,凭借其极其密集且高质量的开源迭代节奏,构建了一个庞大生态系统,覆盖了从端侧微型模型到云端巨型旗舰、从纯文本处理到全模态实时交互。

文章图片
#人工智能
收藏!LLM开发全链路:5大步骤+15大框架,从数据治理到RLHF一文通关

在上一篇中,我们重点讨论了LLM训练技术的开源框架,并未涉及LLM训练的其他环节。在人工智能领域从模型中心化向数据中心化范式转移的背景下,LLM的成功不仅依赖于模型参数规模的爆炸式增长,更取决于全链路工程化的精细程度。这一链路涵盖了从海量异构数据的精炼、超大规模分布式环境下的模型训练、特定任务驱动的指令微调,到最终模型输出与人类价值观对齐的RLHF阶段。如近的开源生态系统已涌现出一批高性能、模块化

从ResNet到mHC:DeepSeek重构残差连接,额外开销仅6.7%,附复现代码

原文:关注公zh: AI-Frontiers论文标题:mHC: Manifold-Constrained Hyper-Connections论文地址:https://arxiv.org/pdf/2512.24880延续在节假日搞事情的习惯,2026年元旦期间,Deepseek发表了一篇新论文,提出了名为mHC(Manifold-Constrained Hyper-Connections,流形约束超

文章图片
#重构
# 收藏!强化学习从入门到封神:5 本经典教材 + 8 大实战项目 + 7个免费视频,一站式搞定# 学习资源## 经典教材[**《大模型算法:强化学习、微调与对齐》**](https://

本篇教程大致介绍 Legged Gym 的结构,使用方法,并以一个二阶倒立摆为例来完成一次实际的强化学习训练。适合强化学习初学者复现。文档包含 ①强化学习基本概念 ②Legged Gym 环境安装 ③Legged Gym 代码结构介绍 ④二阶倒立摆训练项目代码解读。#强化学习 #智能体 #学习资源。

#学习
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择