
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
但这些方法本质上仍是"单模态"的,它们擅长处理文本中的多跳推理,却完全忽略了文档中同样关键的视觉信息,如信息图、流程图和数据图表,导致知识表征不完整。从文档的每一页提取多模态输入(文本、图、表、页面图像),并使用MLLM并行处理,抽取出页面级的实体和关系。最后,将这些高度浓缩的、包含文本和视觉信息的上下文,一同提交给MLLM,生成最终的、有理有据的答案。MegaRAG的核心思想是自动构建一个融合了

Hulu-Med:首个透明化通用医疗视觉-语言模型 本文提出Hulu-Med,这是一个突破性的医疗AI模型,能够统一处理文本、2D/3D图像和视频等多种医疗数据。该模型基于1670万公开样本训练,覆盖12个解剖系统和14种成像模态,在30个基准测试中的27个超越开源模型,16个测试优于GPT-4o等专有系统。其创新包括: 统一架构设计:原生支持多模态医疗数据处理 高效训练:通过医学感知token压

Palantir本体系统是企业自主决策堆栈的核心组件,旨在整合企业数据、逻辑、行动和安全性,构建知识图谱实现跨运营的自动化决策。该系统通过统一异构数据源、建模企业行动、编码业务逻辑和编排安全策略,为人机协作团队提供可扩展的实时操作平台。本体系统支持数百万次读写操作,协调从数据湖到实时系统的异构基础设施,并通过强大的开发工具链赋能开发者和AI代理构建生产级应用。这是一个将专业知识转化为共享基础设施的

本文探讨了AI代理时代,企业软件系统的演变。传统系统如Salesforce和Workday是记录系统,而AI代理需要决策痕迹作为基础。本文提出“上下文图谱”概念:通过记录决策过程的例外、 precedent 和跨系统上下文,形成可查询的决策记录。这将成为下一个万亿美元平台,帮助企业实现自动化决策。针对初创企业,提供构建路径和投资信号,强调代理系统在执行路径中的优势。

Manus现已成为Meta的一部分,推出革命性的Manus Sandbox云虚拟机服务。作为AI Agent的"手",Sandbox为每个任务提供完全独立的云计算环境,具备完整的网络、文件系统和软件工具,支持7x24小时工作。本文详细介绍Sandbox的核心特性、生命周期管理、安全机制以及协作共享的最佳实践。

随着大语言模型(LLM)的快速发展,智能体(Agent)系统正成为AI领域的研究热点。记忆作为智能体的核心模块,对于实现长时程复杂任务至关重要。本文全面综述了基于图结构的智能体记忆系统,提出了包括短期与长期记忆、知识与经验记忆、非结构化与结构化记忆的分类体系,系统分析了记忆提取、存储、检索和演化的关键技术,并总结了开源库、基准测试和应用场景,为构建更高效可靠的智能体记忆系统提供指导。

OpenClaw Medical Skills是一个包含869个精选AI技能的开源医疗技能库,覆盖临床研究、基因组学、药物发现、生物信息学和医疗设备等全领域。该技能库专为OpenClaw/NanoClaw(基于Claude的个人AI助手框架)设计,能将通用AI代理转化为强大的医学与科研助手。每个技能都是独立模块,具备专业领域知识、数据库连接能力和临床相关输出功能。

本文深度解析大任智库AI讲师教练孵化营精华内容,涵盖AI时代企业转型的十大核心决策与工程、AI讲师的角色定位与能力修养、DeepSeek提示词工程、AIGC多媒体创作及AI Agent智能体开发。旨在为企事业单位专家及投资人提供一套从认知升级到实战落地的AI人才培养全体系方案,助力企业在智能化下半场实现数智化跨越。

字节跳动小荷医学AI团队推出MedXIAOHE,一款医学视觉-语言基础模型,在30+医学基准测试中达到业界领先水平,超越多个闭源系统。该模型集成了实体感知持续预训练、多步诊断推理和证据驱动报告生成等创新能力,为真实临床应用提供了可靠的多模态医学理解和推理能力。

本文介绍了EICopilot,一个基于大语言模型的企业信息搜索智能体系统。该系统能够自动生成Gremlin脚本,在大规模知识图谱中进行企业信息的智能搜索和探索,相比传统方法,语法错误率降低至10%,执行正确率达82.14%。








