AI前线笔记个人主页

@2501_93968832

AI前线笔记

2025-11-03 22:25:14 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

GLM技术复盘：21篇论文深度解读智谱模型家族

回顾智谱AI从2022年到2026年的发布轨迹，可以观察到技术演进的三个阶段：首先是基座对标期（2022-2024），通过GLM-130B和GLM-4系列证明了国产大模型在知识理解与双语对齐上的竞争力；其次是能力深化期（2025），通过引入「Thinking」模式和多模态专家系统，将大模型的能力推向复杂推理与视觉感知的极限；最后是智能体转型期（2026），以GLM-5系列为代表，将智能体所需的长期

Context Engineering要过时？AI圈新风口「Harness Engineering」，OpenAI/Anthropic齐发力

Harness Engineering是指设计、构建和迭代一套完整的运行环境与制度体系，包含工具接口、沙箱环境、架构约束、自动化测试、反馈循环及监控仪表盘，旨在引导和约束AI智能体，使其能够自主、可靠地完成复杂长周期任务，而无需人类实时干预。Harness Engineering的核心公式可以表达为，揭示了Harness Engineering的本质：模型负责原始推理能力，而Harness负责除此

#人工智能

3年，从0到全球领跑：万字长文拆解DeepSeek大模型技术演进

发布日期模型名称核心参数/架构关键技术创新对标/性能亮点2023/11/2FIM预训练, 项目级上下文代码能力超越CodeLlama-34B2023/11/297B/67B稠密架构, 中英双语对齐67B打破LLaMA 2 70B垄断2023/12/18N/A3D一致性生成高质量文生3D资产2024/2/57BGRPO强化学习, 拒绝采样数学能力逼近GPT-4，RL技术验证2024/3/111.3B

#人工智能

万字长文解读Qwen进化史：27篇论文深度复盘Qwen模型家族

原文:欢迎关注公zh: AI-Frontiers自2023年生成式人工智能迎来爆发以来，LLM技术的发展已从单纯的堆训练数据、堆参数量，转向了架构效率、模态融合以及长上下文推理能力的深水区。在这场全球性的技术角逐中，阿里巴巴通义实验室推出的 Qwen（通义千问）系列模型，凭借其极其密集且高质量的开源迭代节奏，构建了一个庞大生态系统，覆盖了从端侧微型模型到云端巨型旗舰、从纯文本处理到全模态实时交互。

#人工智能

# 收藏！强化学习从入门到封神：5 本经典教材 + 8 大实战项目 + 7个免费视频，一站式搞定# 学习资源## 经典教材[**《大模型算法：强化学习、微调与对齐》**](https://

本篇教程大致介绍 Legged Gym 的结构，使用方法，并以一个二阶倒立摆为例来完成一次实际的强化学习训练。适合强化学习初学者复现。文档包含 ①强化学习基本概念 ②Legged Gym 环境安装 ③Legged Gym 代码结构介绍 ④二阶倒立摆训练项目代码解读。#强化学习 #智能体 #学习资源。

#学习

Google 迎来「DeepSeek 时刻」：TurboQuant算法实现3bit无损、8×加速、6×压缩、零预处理

原文:欢迎关注公zh: AI-Frontiers3月24日，谷歌在官方博客中推出革命性的压缩算法TurboQuant，相关内容将分别在 ICLR 2026和AISTATS 2026国际顶会发表。一经公布，引发了技术圈纷纷热议。更夸张的是，3月25日美股一开盘，存储芯片板块就集体迎来「黑色时刻」，遭遇重挫。TurboQuant算法通过几何视角的向量量化手段，从根本上解决自回归推理中的「内存墙」难题

万字长文解读Qwen进化史：27篇论文深度复盘Qwen模型家族

#人工智能

收藏！LLM开发全链路：5大步骤+15大框架，从数据治理到RLHF一文通关

在上一篇中，我们重点讨论了LLM训练技术的开源框架，并未涉及LLM训练的其他环节。在人工智能领域从模型中心化向数据中心化范式转移的背景下，LLM的成功不仅依赖于模型参数规模的爆炸式增长，更取决于全链路工程化的精细程度。这一链路涵盖了从海量异构数据的精炼、超大规模分布式环境下的模型训练、特定任务驱动的指令微调，到最终模型输出与人类价值观对齐的RLHF阶段。如近的开源生态系统已涌现出一批高性能、模块化

从ResNet到mHC：DeepSeek重构残差连接，额外开销仅6.7%，附复现代码

原文:关注公zh: AI-Frontiers论文标题：mHC: Manifold-Constrained Hyper-Connections论文地址：https://arxiv.org/pdf/2512.24880延续在节假日搞事情的习惯，2026年元旦期间，Deepseek发表了一篇新论文，提出了名为mHC（Manifold-Constrained Hyper-Connections，流形约束超

#重构

#学习

共 35 条

请选择