源图 - 高质量 Skills 数据集正式发布:首批 20 万条高质量 Agent Skill 赋能大模型智能化生态
6 月 25 日,在 2026 开放原子开源生态大会开幕式上,源图 - 高质量 Skills 数据集正式发布。该数据集由中国科学院软件研究所依托 “源图” 开源软件供应链重大基础设施打造,首批开放 20 万条经过严格筛选与结构化处理的高质量 Agent Skill,为我国大模型智能体生态构建提供规范化、可追溯、可扩展的基础数据。业内专家表示,这是国内首个大规模、标准化的 Agent Skill 数据集,对推动开源软件供应链智能化生态演进具有重要意义。

当前,人工智能已成为推动全球开源生态演进的重要驱动力,大模型智能体技术加速向实体经济各领域渗透,开源软件供应链的可复用资源范畴持续拓展,已从传统代码组件、依赖包延伸至可被智能体调用、组合并执行的能力单元。然而,当前 Agent Skill 资源普遍存在来源分散、结构不统一、描述粒度不一致、追溯信息不足等问题,难以支撑大规模检索、比较、复用与治理,制约了 Agent 生态的规模化发展。
中国科学院软件研究所立足开源软件供应链领域长期技术积累,依托 “源图” 基础设施在数据治理方面的能力优势,从多个 Agent Skill 平台及开源仓库等来源采集候选资源,通过格式校验、重复消解、质量评分与分类处理,将异构分散的 Skill 资源转换为统一规范的 Skill 实体,最终形成源图 - 高质量 Skills 数据集。
数据集建设过程中,研究团队围绕元数据完整性、描述清晰度、接口可识别性、依赖可解析性和来源可信度等维度,建立了科学、全面的综合评价机制,系统过滤了格式不完整、语义信息不足或来源不可追溯的候选项,确保入库 Skill 具备较高的可用价值与安全水平。数据集完整保留了每条 Skill 从原始采集、加工处理到标准化入库的全链路追溯信息,并详细标注了每条 Skill 的能力类别、应用场景、运行环境、依赖项、接口信息、输入输出规范及外部服务依赖等关键属性,不仅能够帮助使用者快速精准匹配自身开发需求,更为 Agent 技能的安全审计、风险溯源提供了完整可信的数据支撑。
中国科学院软件研究所相关负责人表示,源图 - 高质量 Skills 数据集的发布,将有效提升 Agent 能力资源在描述规范、结构组织、质量评价和来源追溯等方面的数据治理能力,填补国内高质量 Agent Skill 数据集的空白,为技能检索、依赖分析、工具推荐与任务规划等核心场景提供高质量数据支撑,加速开源产业智能化转型进程。当前,源图 - 高质量 Skills 数据集首批资源已同步向产业界与开发者开放取用,后续将逐步建立社区共建与贡献回馈机制,广泛吸纳产学研各界优质技能资源,持续扩充垂直行业场景覆盖,迭代完善数据治理标准与安全评估体系。
开源是人工智能发展的重要基石,当前人工智能领域的竞争,本质上是开源生态的竞争。开放原子开源基金会始终秉持 “共建、共治、共享” 的核心理念,积极推动国内开源基础设施的建设与健康可信开源生态的培育。源图 - 高质量 Skills 数据集的发布,是基金会推动产学研协同,完善人工智能开源基础能力的一项重要成果。基金会将持续发挥中立平台优势,汇聚产学研各方力量,推动数据集的迭代升级与规模化应用。
「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。
更多推荐



所有评论(0)