logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

智源研究院发布中文互联网语料库 CCI3.0 推动数据共建共享

近日,在由中央网信办指导,北京市委网信办、北京市经济和信息化局、北京市新闻出版局、北京市版权局承办的2024北京文化论坛“新兴业态与技术融合”平行论坛上,智源研究院正式发布中文互联网语料库CCI 3.0(Chinese Corpora Internet,简称 CCI),包括1000GB的数据集以及498GB的高质量子集CCI3.0-HQ。智源研究院于2023年11月首次开源CCI 1.0,并在20

智源研究院行业数据集-场景应用创新计划评审启动

在数字化浪潮的推动下,人工智能技术的飞速发展正深刻改变着各行各业的面貌。作为人工智能领域的核心驱动力之一,大模型以其强大的数据处理与学习能力,在通用领域展现出了初步而广泛的场景应用能力。然而,当我们将目光投向医疗健康、教育等垂直细分领域时,不难发现,大模型的能力尚显不足,难以直接支撑起这些领域高度专业化的需求。这一瓶颈的根源在于模型训练过程中缺乏高质量、行业针对性的数据集作为支撑。

文章图片
嘉宾分享资料获取!智源研究院第二期“数据与行业应用Workshop”资料获取

2024年8月29日下午,智源人工智能研究院联合中国互联网协会人工智能工委会、中国AIIA联盟数据委员会、SegmentFault思否、51CTO、CSDN等多个机构共同举办了“数据与模型行业应用系列Workshop”第二期。本次活动邀请到了来自智源研究院、海天瑞声、作业帮、百川智能、医渡云、Datastrato的专家学者,共同探讨了数据集构建和数据策略探索、数据目录建设以及大模型在教育、

文章图片
线下参会报名丨智源数据与行业应用 Workshop 第二期

时间:2024年8月29日(周四)下午14:00-17:30。地点:北京市海淀区成府路150号智源大厦。欢迎大家现场参加或观看直播。

文章图片
嘉宾分享资料获取!智源研究院第一期“数据与行业应用Workshop”资料获取

近日,北京智源人工智能研究院联合中国互联网协会人工智能工委会、中国AIIA联盟数据委员会、CSDN举办了以“行业革新,数据先行”为主题的第一期数据与行业应用Workshop。

文章图片
到底了