简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
近日,在由中央网信办指导,北京市委网信办、北京市经济和信息化局、北京市新闻出版局、北京市版权局承办的2024北京文化论坛“新兴业态与技术融合”平行论坛上,智源研究院正式发布中文互联网语料库CCI 3.0(Chinese Corpora Internet,简称 CCI),包括1000GB的数据集以及498GB的高质量子集CCI3.0-HQ。智源研究院于2023年11月首次开源CCI 1.0,并在20
在数字化浪潮的推动下,人工智能技术的飞速发展正深刻改变着各行各业的面貌。作为人工智能领域的核心驱动力之一,大模型以其强大的数据处理与学习能力,在通用领域展现出了初步而广泛的场景应用能力。然而,当我们将目光投向医疗健康、教育等垂直细分领域时,不难发现,大模型的能力尚显不足,难以直接支撑起这些领域高度专业化的需求。这一瓶颈的根源在于模型训练过程中缺乏高质量、行业针对性的数据集作为支撑。
2024年8月29日下午,智源人工智能研究院联合中国互联网协会人工智能工委会、中国AIIA联盟数据委员会、SegmentFault思否、51CTO、CSDN等多个机构共同举办了“数据与模型行业应用系列Workshop”第二期。本次活动邀请到了来自智源研究院、海天瑞声、作业帮、百川智能、医渡云、Datastrato的专家学者,共同探讨了数据集构建和数据策略探索、数据目录建设以及大模型在教育、
时间:2024年8月29日(周四)下午14:00-17:30。地点:北京市海淀区成府路150号智源大厦。欢迎大家现场参加或观看直播。
近日,北京智源人工智能研究院联合中国互联网协会人工智能工委会、中国AIIA联盟数据委员会、CSDN举办了以“行业革新,数据先行”为主题的第一期数据与行业应用Workshop。