logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GLM-5.2实测:国产模型追上GPT梯队,但千万别直接切主力

国产模型又双叒叕要"吊打GPT"了。这次我差点信了。GLM-5.2发布那天,朋友圈跟过年似的。有人已经开始写《GPT已死》了,我说兄弟,你上个月刚写的《Claude已死》,上上个月写的《Gemini已死》,你这死亡笔记挺厚啊,再写下去快赶上柯南了。但说实话,这次不一样。以前国产模型出新版本,我的反应是"哦"。这次是"哦?多了一个问号,说明真的有点东西。

文章图片
#人工智能
GLM-5.2实测:国产模型追上GPT梯队,但千万别直接切主力

国产模型又双叒叕要"吊打GPT"了。这次我差点信了。GLM-5.2发布那天,朋友圈跟过年似的。有人已经开始写《GPT已死》了,我说兄弟,你上个月刚写的《Claude已死》,上上个月写的《Gemini已死》,你这死亡笔记挺厚啊,再写下去快赶上柯南了。但说实话,这次不一样。以前国产模型出新版本,我的反应是"哦"。这次是"哦?多了一个问号,说明真的有点东西。

文章图片
#人工智能
CLAUDE.md写满规则Agent仍不听话?四层核心卡点一次性讲透

你有没有遇到过这种情况?你花了整整一个周末,给项目写了CLAUDE.md,拆了八条rule,挂了三个MCP,还配了两个skill。结果Agent该犯的错照样犯,定下的规矩当没看见。这时候你盯着屏幕,感觉像养了只猫。你贴了一墙"禁止抓沙发"的告示,猫看了一眼,转身把沙发抓成了流苏款。问题出在哪?不是你不努力,是你把四件事当成一件事干了。别再以为写个CLAUDE.md就万事大吉了。Agent不是故意不

文章图片
#人工智能
CLAUDE.md写满规则Agent仍不听话?四层核心卡点一次性讲透

你有没有遇到过这种情况?你花了整整一个周末,给项目写了CLAUDE.md,拆了八条rule,挂了三个MCP,还配了两个skill。结果Agent该犯的错照样犯,定下的规矩当没看见。这时候你盯着屏幕,感觉像养了只猫。你贴了一墙"禁止抓沙发"的告示,猫看了一眼,转身把沙发抓成了流苏款。问题出在哪?不是你不努力,是你把四件事当成一件事干了。别再以为写个CLAUDE.md就万事大吉了。Agent不是故意不

文章图片
#人工智能
DJL 0.28 实战:Java本地跑通Llama 3/Qwen,零环境依赖

咱们Java程序员有个共同的噩梦:好不容易把Spring Boot项目调顺了,产品经理突然说"加个AI功能吧",然后甩过来一个.py文件。得,又得去折腾Conda环境、CUDA版本、PyTorch和TensorFlow的兼容性,电脑里瞬间多出五六个Python虚拟环境,像养了一窝蛊。更离谱的是,生产环境部署时,运维大哥看着那一堆requirements.txt直摇头:“这玩意版本锁得比Bank金库

文章图片
#人工智能
Java多Agent爆发:LangGraph4j工作流编排,从单点到智能团队

还记得几年前我们第一次用ChatGPT时的那种震撼吗?一个对话框,你问它答,仿佛拥有了一个无所不能的数字助手。但玩多了就会发现,让AI一次性干复杂的活,就像让一个人既当厨师又当服务员还兼收银——手忙脚乱不说,煎蛋糊了还没人提醒。这时候,聪明的做法是把任务拆开:专门找资料的Agent、负责写代码的Agent、最后把关审核的Agent。听起来很美好对吧?但新问题接踵而至:这些Agent怎么配合?谁先做

文章图片
#人工智能
Qwen3.5小模型封神:0.8B/2B/4B端侧离线部署全流程,手机也能跑

Qwen3.5这次的小模型发布,其实释放了一个挺重要的信号:AI正在从"云端奢侈品"变成"本地日用品"。当0.8B模型能在手机上流畅运行,当4B模型能处理多模态任务,我们离"每人兜里都装着一个私人AI助手"的愿景就越来越近了。而且Apache 2.0协议的开源,意味着你可以放心地把这些模型用在商业项目里,不用担心律师函警告。对于独立开发者、学生党、小微企业来说,这无疑是2026年最值得关注的AI基

文章图片
#人工智能
别被参数忽悠!Qwen3.5 全系列选型+部署+商用指南,一篇吃透

Qwen3.5 这代产品线的精髓在于**“按需分配”**。MoE 架构让大参数模型不再只是实验室的玩具,35B-A3B 这种"轻量级体重、重量级智商"的组合,让个人开发者也能摸到企业级模型的门槛。商用方面,Apache 2.0 协议给了足够的自由度,但切记保留 LICENSE 文件,别乱用品牌标识。技术选型上,别盲目追求"最大杯",24G 显存用户选 35B-A3B 的 MoE 版,比硬上 27B

文章图片
#人工智能
本周AI开发者必学:Qwen 3.5 MoE 本地部署,10分钟跑通完整版

Qwen 3.5 支持 256K 上下文,但默认可能只开 4K。显存够的话可以开到 32K,写长篇小说续写都没问题。以前我们总说"本地部署大模型"是极客的玩具,又慢又笨。但 Qwen 3.5 MoE 架构的出现,加上 Ollama 这种"傻瓜式"工具,让这件事变得比配 Java 环境还简单。4GB 显存就能跑,断网也能用,数据还留在自己硬盘里——这对于处理合同、病历、内部文档的开发者来说,简直是刚

文章图片
#人工智能
本周AI开发者必学:Qwen 3.5 MoE 本地部署,10分钟跑通完整版

Qwen 3.5 支持 256K 上下文,但默认可能只开 4K。显存够的话可以开到 32K,写长篇小说续写都没问题。以前我们总说"本地部署大模型"是极客的玩具,又慢又笨。但 Qwen 3.5 MoE 架构的出现,加上 Ollama 这种"傻瓜式"工具,让这件事变得比配 Java 环境还简单。4GB 显存就能跑,断网也能用,数据还留在自己硬盘里——这对于处理合同、病历、内部文档的开发者来说,简直是刚

文章图片
#人工智能
    共 468 条
  • 1
  • 2
  • 3
  • 47
  • 请选择