
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
💬技术栈:Elasticsearch🔍简历内容:熟悉Elasticsearch节点角色、索引与分片基本原理。根据业务定制Elasticsearch插件,实现基于内存使用率和CPU 使用率限流;针对xx业务实时性不高,引入消息队列Kafka,通过监听binlog并将生成消息丢到Kafka中,实现削峰和限流;针对高并发业务设计策略保护协调节点;设计简易双集群方案来替换CCR方案,成本节约了近80%

🔨动机:传统训练方法如监督微调(SFT)`难以获得大规模的多模态CoT奖励数据`;`现有的奖励模型在复杂场景中往往提供不准确或不可靠的奖励信号`。🚩创新:首次提出统一的多模态CoT奖励模型:UNIFIEDREWARD-THINK是第一个能够进行多维、逐步长链推理的统一多模态CoT奖励模型,适用于视觉理解和生成任务。1. 冷启动阶段:首先`使用少量图像生成偏好数据蒸馏GPT-4o`的推理过程,用

本文提出了一种新颖的多学科团队多智能体医疗咨询框架MDTeamGPT,通过残差讨论模式和共识聚合减少了信息冗余,提高了讨论效率。通过利用两个知识库,框架动态提高了整体咨询准确率,并展示了一定的泛化能力。尽管框架的整体性能在很大程度上取决于存储和利用咨询经验的基础模型的能力,但其在当前医疗咨询场景中仍表现出色。

1. 范式转变:首次明确将代理工作流程自动化表述为成本效益驱动的多目标优化问题,强调了LLM异质性和复杂性多样性在多智能体系统发展中的关键作用。2. 实用解决方案:提出了一种基于生态位进化算法的框架EvoFlow,能够在各种任务领域中自动演化出异质且复杂性自适应的代理工作流程,最小化人为干预。3. 实证评估:在七个基准测试上的广泛实验表明,EvoFlow具有多样性、高性能和经济性,优于之前的手工制

大语言模型(LLMs)已能通过长思维链(CoT)解决复杂推理任务(如数学计算、程序合成),但其生成的推理轨迹准确性直接决定最终答案正确性。事后迭代优化(Post-hoc Iterative Refinement):模型先生成完整草稿,再通过多轮反馈进行批判和修订(如Self-Refine),但需多次完整前向传播,导致 latency 和计算成本显著增加。内在自校正训练(Training for I

😊你好,我是小航,一个正在变秃、变强的文艺倾年。🔔本文讲解提示词设计,期待与你一同探索、学习、进步,一起卷起来叭!🔔内容和团队内部文档一致,这里做一下同步。

😊你好,我是小航,一个正在变秃、变强的文艺倾年。🔔本文讲解智能体入门,期待与你一同探索、学习、进步,一起卷起来叭!🔔文章同步存在格式问题,还请见谅!

1. 动态编排:提出了一种集中式的“指挥者”(puppeteer)来动态选择和组织代理(puppets),根据任务状态的演变进行推理。这种编排方式超越了静态的协作模式,提供了灵活且可扩展的代理协调。2. 自适应进化:通过强化学习(RL)不断更新指挥者的策略,利用已完成任务的反馈来优化代理选择。随着时间的推移,指挥者学会了强调强代理轨迹并剪枝不有效的代理,使系统逐步进化到更高的效率和性能。3. 实验

😊你好,我是小航,一个正在变秃、变强的文艺倾年。🔔笔记来自B站UP主Ele实验室的《小白也能听懂的人工智能原理》。🔔本文讲解一元一次函数感知器:如何描述直觉,一起卷起来叭!
大模型专栏介绍😊你好,我是小航,一个正在变秃、变强的文艺倾年。🔔本文为大模型专栏子篇,大模型专栏将持续更新,主要讲解大模型从入门到实战打怪升级。如有兴趣,欢迎您的阅读。💡适合人群:本科生、研究生、大模型爱好者,期待与你一同探索、学习、进步,一起卷起来叭!🔗🔗🔗。








