
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
随着大模型技术的快速发展,智能体(AI Agent)正逐渐成为金融科技领域的重要力量。智能体通过自主学习、决策和交互能力,有望重塑金融行业的服务模式和业务流程。

当ChatGPT答错2023年诺贝尔奖得主时,当医疗AI给出过时的治疗方案时,我们意识到:再强大的大模型,知识也会“冻结”在训练截止日。RAG(检索增强生成)技术的诞生,正为解决这一痛点而来——它让AI学会“查资料”,从此告别一本旧黄历的困境。
上下文工程可以看作是提示词工程的延伸。提示词工程说的是如何编写和安排对大模型的指令,让模型更容易给出理想的结果。

VLA模型能够遵循自然语言指令,继其前身——LLMs和VLMs取得广泛成功后,在具身智能领域的应用日益普及。本文探讨了VLA模型持续发展过程中的10个核心里程碑:多模态性、推理能力、数据质量、模型评估、跨机器人动作泛化、资源效率、全身协调、安全保障、智能体化、人机协作。此外,我们还讨论了空间理解、世界动力学建模、后训练和数据合成等新兴趋势——这些趋势均旨在实现上述里程碑。通过这些讨论,我们希望引起

现有基于知识图谱(KG)的检索增强生成(RAG)方法在处理领域特定任务时存在两大关键挑战:

最近在X上闲逛时,发现了一个好项目:ColQwen-Omni。一款基于Qwen2.5-Omni多模态大模型,可用于任意模态检索的RAG系统。

文章介绍了全球首个评估医疗AI临床适用性的"CSEDB"标准,采用"安全性"与"有效性"双轨评价体系。中国研发的MedGPT模型在该标准下取得全球第一,成为首个经验证具备临床诊疗能力的医疗大模型。医疗AI正从"模拟医生语言"向"参与临床级医生推理"进化,通过"复制医生"创造新的医疗资源,实现人机协作,放大医生能力。

AgentCPM是由清华大学、中国人民大学等机构联合开源的智能体,仅用4B参数就在复杂长程探索任务上超越了30B级大模型。核心模型AgentCPM-Explore支持100轮深度探索,具备类人思考逻辑,能解决高难度复杂任务。项目不仅开源了模型权重,还提供了全套基础设施,包括AgentDock工具沙盒、AgentRL强化学习框架和AgentToLeaP评测平台,支持开发者复现、二开和私有化部署。

《RAGShaper》是北大与腾讯AI实验室提出的新框架,通过自动合成包含干扰文档和纠错轨迹的训练数据,解决了人工标注数据"太干净"导致AI抗干扰能力差的问题。该框架系统性地生成四类干扰文档,并通过"受限导航策略"强制AI遇到干扰并产生纠错行为。实验证明,仅用4.5k合成数据训练的模型即超越了同规模人工标注数据,实现了训练范式的转变——从"教正确答案"转向"教如何在错误中找到正确答案"。

在RAG系统中,问题泛化是连接用户提问与知识库的关键桥梁。它通过保留核心意图、剥离冗余细节、将口语转为标准术语,提高检索召回率和匹配精度,增强系统鲁棒性。问题泛化不是简单删词,而是有判断地提炼关键实体,避免过度泛化导致信息丢失。这一看似简单的预处理步骤,却能显著提升AI问答系统的准确性和用户体验。








