logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用 GRPO 算法训练多智能体系统:实现可靠的长期任务规划与执行

首先使用抽象基类(ABC)来定义所有 LLM 引擎包装器必须遵循的标准接口。这确保了一致性和可互换性。任何继承自EngineLM的类都必须实现generatepass在这里定义ChatVLLM类,它是EngineLM接口的具体实现。2\n```")print(f"\n'─'50'─'50")try:")raise eprint(f"\n'─'50'─'50")try:str100]try:在多智能

文章图片
#算法#人工智能
Agent 如何管理其他 Agent:四种Sub Agent 模式

之前有篇文章专门聊了子 Agent 的崛起,以及为什么把任务隔离成独立的 Agent(各自拥有独立的上下文、工具和指令)能让系统更可靠。那篇讲的是"子 Agent 是什么"和"为什么要用它们"。时至今日,模型在规划、工具调用和多步骤指令执行上已经强了不少,这也让一些以前太脆弱、跑不起来的模式变得可行了——比如让主 Agent 管理一批持久化的 Worker,或者让 Agent 之间直接互发消息。下

文章图片
#java#数据库#前端
豆包·图像创作模型 Seedream 4.0 实测:多图融合黑科技,4K生图秒级完成!

整体来说,Seedream 4.0 确实是个不错的升级。特别是多图融合、主体一致性这些功能,解决了很多实际痛点。对个人用户来说,各种创意玩法挺有意思的,3D手办、表情包、换装这些都能玩得很开心。对企业用户来说,电商营销、设计预览这些场景确实很实用,能提高不少效率。特别值得一提的是,Seedream 4.0 已经在火山方舟全量上线,提供企业级API服务。通过火山方舟API调用,不仅能体验到最满血的4

文章图片
#人工智能
14B小模型暴打670B巨兽?这个审稿AI框架让同行都沉默了

LLM写审稿意见写得差,不是模型太笨,而是它没有被告知该检查什么(缺少rubric),也没有被给予查资料的能力(缺少工具)。把这两件事补上,一个14B参数的小模型,居然能打过参数量大出十几倍的GPT-4o和DeepSeek-R1-670B,这才是最有说服力的结论。

文章图片
#人工智能
14B小模型暴打670B巨兽?这个审稿AI框架让同行都沉默了

LLM写审稿意见写得差,不是模型太笨,而是它没有被告知该检查什么(缺少rubric),也没有被给予查资料的能力(缺少工具)。把这两件事补上,一个14B参数的小模型,居然能打过参数量大出十几倍的GPT-4o和DeepSeek-R1-670B,这才是最有说服力的结论。

文章图片
#人工智能
CSIRO Image2Biomass Prediction - 第5名Solo金牌方案,代码已开源!

更大的模型不一定更好:huge模型容易过拟合小数据集训练轮数需要控制:25轮左右是最佳平衡点复杂的注意力机制收益有限:在小数据集上容易过拟合Mamba等序列模型架构不适合此问题大量实验:做了188+次实验,充分探索了方案空间物理约束:利用目标之间的物理关系设计损失函数多样化融合:不同种子、不同架构、不同训练策略的模型融合数据增强:在小数据集上,合理的数据增强至关重要后处理:基于数据分析的后处理策略

文章图片
#计算机视觉#opencv#人工智能
从零实现 Agent Skills:给 AI 智能体装上可插拔的“技能包“

Agent Skills 说白了就是"带加载机制的结构化提示词",听起来朴素,但真正用起来,解决的都是做智能体时最烦的那些问题——上下文膨胀、主提示词越改越乱、不同场景相互打架、调试全靠盲猜。完整实现不到两百行 Python,一个下午就能跑起来。建议先写一个技能试试水,感觉顺手了再逐步扩展。有些看起来很花哨的架构,其实核心就是把常识性的工程思路——按需加载、关注点分离、模块化——老老实实落到 Pr

文章图片
#人工智能
文本分类(下)-卷积神经网络(CNN)在文本分类上的应用

1 简介原先写过两篇文章,分别介绍了传统机器学习方法在文本分类上的应用以及CNN原理,然后本篇文章结合两篇论文展开,主要讲述下CNN在文本分类上的应用。前面两部分内容主要是来自两位博主的文章(文章中已经给出原文链接),是对两篇论文的解读以及总结,基本上阐释了CNN文本分类模型;后半部分讲一个实例和项目实战2 论文1《Convolutional Neur...

CS224n 笔记1-自然语言处理与深度学习简介

1 自然语言处理简介我们从讨论“什么是NLP”开始本章的内容1.1 NLP有什么特别之处自然(人工)语言为什么如此特别?自然语言是一个专门用来表达语义的系统,并且它不是由任何形式的物质表现产生。正因为如此,人工语言与视觉或者其他任何机器学习任务非常不同。大多数单词只是一个超语言实体的符号:单词是映射到一个表征(想法或事物)的记号。例如,“火箭”一词...

vllm的SamplingParams参数

【代码】vllm的SamplingParams参数。

文章图片
#算法
    共 180 条
  • 1
  • 2
  • 3
  • 18
  • 请选择