架构师李哲个人主页

@weixin_41851559

架构师李哲

资深架构师 | 985硕士，聚焦大模型微调与AI基建，在此记录实战思考，分享LLM落地“最后一公里”。

北京市海淀区

2024-10-28 10:18:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

阿里除夕开源千问3.5：3970亿参数但只激活170亿，大模型部署成本砍半怎么做到的？

本文探讨 AI 落地深水区的成本与效率难题，解析阿里 Qwen3.5 通过混合注意力、稀疏 MoE 等技术实现性能跃升与降本增效，并对比 Prompt、RAG 与微调的适用场景，指出企业应结合模型特性规划技术路线，借助平台实现 AI 从能用向好用进阶。

#开源

从菜鸟到高手：LlamaFactory官方超参数终极指南（建议收藏）

大模型微调总是“炸炉”？LlamaFactory Online 官方专家带你拆解核心超参数。从“复习几轮”的 Epoch 到“带小抄考高分”的 LoRA，用最硬核的逻辑和最通俗的比喻，助你打通微调的“任督二脉”，实现业务场景的精准拟合。

#人工智能 #机器学习 #深度学习

中国AI音乐，全球登顶！Mureka V8击败Suno、Udio，拿下权威榜单双料冠军

中国AI音乐模型Mureka V8首次在全球权威评测Artificial Analysis中，同时斩获人声与器乐双料冠军，击败Suno、Udio等国际主流模型。其自研MusiCoT技术让AI具备音乐思维链，生成作品从“能听”迈向“可发布”，标志着中国在AI音乐领域实现历史性登顶。

#人工智能

告别“令牌”与“智元”之争，“词元”定名背后的140万亿经济账

2026年3月国家数据局将Token正式定名“词元”，终结译名争议。其日均调用量达140万亿+，两年增超千倍，成为AI产业核心指标。定名推动产业标准化，大模型厂商、云厂商等受益，中国AI迈入商业化成熟期，将建统一词元市场。

#机器学习 #人工智能 #深度学习

告别“令牌”与“智元”之争，“词元”定名背后的140万亿经济账

#机器学习 #人工智能 #深度学习

英伟达用AI智能体7天自主优化GPU内核，超越人类专家

英伟达推出 AVO 智能体，7 天无人工干预优化 B200 GPU 注意力内核，性能超 cuDNN 最高 3.5%、FlashAttention-4 最高 10.5%，30 分钟可迁移适配，标志 AI 从代码生成器升级为自主进化操盘手，重塑软件工程范式。

#人工智能

阿里云突然宣布：最高涨34%！告别“价格战”，AI算力正式进入稀缺时代

2026年3月18日阿里云官宣AI算力、存储最高涨34%，百度智能云同日跟进，腾讯云此前已上调模型价格。受AI需求爆发、硬件成本上涨、Token消耗暴增影响，云计算行业告别价格战，正式迈入算力稀缺与价值竞争时代。摘要：2026年3月18日阿里云官宣AI算力、存储最高涨34%，百度智能云同日跟进，腾讯云此前已上调模型价格。受AI需求爆发、硬件成本上涨、Token消耗暴增影响，云计算行业告别价格战，正

#阿里云 #人工智能 #云计算

让AI学会“讨人喜欢”：用PPO-RW给Qwen3-1.7B装上“审美神经”

在大模型微调过程中，如何让模型不仅能生成正确的指令回复，还能在语气、逻辑结构和专业度上更贴近人类偏好？本文将基于LlamaFactory Online平台，详细展示如何利用 PPO-RW算法对Qwen3-1.7B进行深度微调，并以“时空聚类分析”这一复杂技术任务为例，验证微调后的效果提升。

#人工智能 #机器学习 #深度学习

MiniMax M2.7开启“自我进化”：AI正从“被训练”走向“自己长大”

本文介绍MiniMax推出M2.7模型，开启AI自我进化新模式。该模型可自主生成数据、迭代优化，分担过半研发工作，实测表现位居行业前列。同时分析其在可控性、反馈质量与进化边界上的技术难题，并指出这一新范式或将重塑AI行业竞争格局，改变人类与AI的协作关系。

#人工智能

全民都在“养龙虾”，但你真的会“喂”吗？OpenClaw爆火背后的微调玄机

OpenClaw 凭借 “能干活” 的 AI 智能体能力迅速爆红，GitHub 星标近 30 万登顶榜首。它依托四层架构实现系统自动化，在苹果芯片支持端侧实时微调，同时也面临提示词注入、插件投毒等安全风险，全民 “养龙虾” 热潮下更需重视安全与规范使用。

#人工智能

共 39 条

请选择