logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI 的关键点不是prompt,而是Context Engineering?

因为它涉及的是整个信息架构的设计,包括怎么组织信息、如何筛选相关内容、压缩冗余数据、以及隔离不同任务的上下文等等。项目的整体架构、业务逻辑、已有的代码库、依赖关系、历史bug修复记录,还有当前要解决的具体问题。,我发现即使用同样的prompt,不同的上下文环境下效果完全不一样。当我只是简单描述要把单体应用拆分成微服务的时候,它给出的方案都是教科书式的套话,但当我把现有的。比如长上下文的token消

文章图片
#开源#人工智能
Claude系列和Doubao Seed 1.6,为什么是“最能干活”的大模型?

不难发现,在评估维度评测的五大任务场景中,有一个场景的评分显现出较大的两级分化,那就是交互操作能力,透过热力图与雷达图可以清楚看到,该能力甚至直接影响了最后的评分排比,交互操作类任务仅Claude系列和Doubao Seed 1.6经受住了挑战,而这三个模型分别位列综合评分前三。结合Auto-GPT 与 Agent 架构中对“操作环境”的描述以及AiPy、Autogen等框架中的衡量指标来看,交互

文章图片
#人工智能#python#算法 +1
踩坑半年总结:为什么传统AI编程工具都会变屎山?

简单说就是不要那些复杂的框架,直接用Python代码来实现Agent逻辑。

文章图片
#python#开源#算法 +1
踩坑半年总结:为什么传统AI编程工具都会变屎山?

简单说就是不要那些复杂的框架,直接用Python代码来实现Agent逻辑。

文章图片
#python#开源#算法 +1
从工具调用到代码生成:为什么说Python-use是Agent开发的未来

Python-use这个思路回归了编程的本质:code is everything

文章图片
#人工智能#开源#python
从测评看 GPT-5:进步显著,但仍不及预期

OpenAI 联合创始人、首席执行官萨姆・奥尔特曼将 GPT-5 类比为可以按需召唤的 “博士级专家”,能够随时助力用户达成各种复杂目标,并且声称 GPT-5 在超高难度的科学问题上刷新了世界纪录,在与人类专家的对比测试中,近 70% 的场景表现更优。在 AiPy 第三期测评的 13 个参评大模型中,仅有 GLM-4.5、Doubao-Seed-1.6、Claude Sonnet 4 在交互操作类

文章图片
#人工智能#开源#python
堆 Prompt 搞不出真 Agent!代码才是智能体的灵魂

如果你还在靠堆 Prompt 做 Agent,就像在用积木搭火箭,看似复杂,实则一碰就散。

文章图片
#开源#python#人工智能 +1
到底了