logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

阿里除夕开源千问3.5:3970亿参数但只激活170亿,大模型部署成本砍半怎么做到的?

本文探讨 AI 落地深水区的成本与效率难题,解析阿里 Qwen3.5 通过混合注意力、稀疏 MoE 等技术实现性能跃升与降本增效,并对比 Prompt、RAG 与微调的适用场景,指出企业应结合模型特性规划技术路线,借助平台实现 AI 从能用向好用进阶。

文章图片
#开源
从菜鸟到高手:LlamaFactory官方超参数终极指南(建议收藏)

大模型微调总是“炸炉”?LlamaFactory Online 官方专家带你拆解核心超参数。从“复习几轮”的 Epoch 到“带小抄考高分”的 LoRA,用最硬核的逻辑和最通俗的比喻,助你打通微调的“任督二脉”,实现业务场景的精准拟合。

文章图片
#人工智能#机器学习#深度学习
中国AI音乐,全球登顶!Mureka V8击败Suno、Udio,拿下权威榜单双料冠军

中国AI音乐模型Mureka V8首次在全球权威评测Artificial Analysis中,同时斩获人声与器乐双料冠军,击败Suno、Udio等国际主流模型。其自研MusiCoT技术让AI具备音乐思维链,生成作品从“能听”迈向“可发布”,标志着中国在AI音乐领域实现历史性登顶。

文章图片
#人工智能
告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账

2026年3月国家数据局将Token正式定名“词元”,终结译名争议。其日均调用量达140万亿+,两年增超千倍,成为AI产业核心指标。定名推动产业标准化,大模型厂商、云厂商等受益,中国AI迈入商业化成熟期,将建统一词元市场。

文章图片
#机器学习#人工智能#深度学习
告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账

2026年3月国家数据局将Token正式定名“词元”,终结译名争议。其日均调用量达140万亿+,两年增超千倍,成为AI产业核心指标。定名推动产业标准化,大模型厂商、云厂商等受益,中国AI迈入商业化成熟期,将建统一词元市场。

文章图片
#机器学习#人工智能#深度学习
英伟达用AI智能体7天自主优化GPU内核,超越人类专家

英伟达推出 AVO 智能体,7 天无人工干预优化 B200 GPU 注意力内核,性能超 cuDNN 最高 3.5%、FlashAttention-4 最高 10.5%,30 分钟可迁移适配,标志 AI 从代码生成器升级为自主进化操盘手,重塑软件工程范式。

文章图片
#人工智能
阿里云突然宣布:最高涨34%!告别“价格战”,AI算力正式进入稀缺时代

2026年3月18日阿里云官宣AI算力、存储最高涨34%,百度智能云同日跟进,腾讯云此前已上调模型价格。受AI需求爆发、硬件成本上涨、Token消耗暴增影响,云计算行业告别价格战,正式迈入算力稀缺与价值竞争时代。摘要:2026年3月18日阿里云官宣AI算力、存储最高涨34%,百度智能云同日跟进,腾讯云此前已上调模型价格。受AI需求爆发、硬件成本上涨、Token消耗暴增影响,云计算行业告别价格战,正

文章图片
#阿里云#人工智能#云计算
让AI学会“讨人喜欢”:用PPO-RW给Qwen3-1.7B装上“审美神经”

在大模型微调过程中,如何让模型不仅能生成正确的指令回复,还能在语气、逻辑结构和专业度上更贴近人类偏好?本文将基于LlamaFactory Online平台,详细展示如何利用 PPO-RW算法对Qwen3-1.7B进行深度微调,并以“时空聚类分析”这一复杂技术任务为例,验证微调后的效果提升。

文章图片
#人工智能#机器学习#深度学习
MiniMax M2.7开启“自我进化”:AI正从“被训练”走向“自己长大”

本文介绍MiniMax推出M2.7模型,开启AI自我进化新模式。该模型可自主生成数据、迭代优化,分担过半研发工作,实测表现位居行业前列。同时分析其在可控性、反馈质量与进化边界上的技术难题,并指出这一新范式或将重塑AI行业竞争格局,改变人类与AI的协作关系。

文章图片
#人工智能
全民都在“养龙虾”,但你真的会“喂”吗?OpenClaw爆火背后的微调玄机

OpenClaw 凭借 “能干活” 的 AI 智能体能力迅速爆红,GitHub 星标近 30 万登顶榜首。它依托四层架构实现系统自动化,在苹果芯片支持端侧实时微调,同时也面临提示词注入、插件投毒等安全风险,全民 “养龙虾” 热潮下更需重视安全与规范使用。

文章图片
#人工智能
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择