OpenDataLab 个人主页

@OpenDataLab

OpenDataLab

2023-05-18 14:00:28 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

收藏丨30个大语言模型训练相关的数据集分享

更多数据集，请访问OpenDataLab官网

#语言模型 #人工智能 #机器学习

WAIC上官宣！大模型语料提取工具MinerU正式发布，开源免费“敲”好用

7月4日，2024 WAIC科学前沿全体会议在上海世博中心红厅隆重举行。上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.5（InternLM2.5），同时全链条工具体系迎来重磅升级，对于，不仅能将混合了图片、表格、公式等在内的复杂多模态 PDF 文档精准转化为清晰、易于分析的 Markdown 格式，还能从包含广告等各种干扰信息的网页中快速解析、抽取正式

#人工智能 #大数据

2025《“人工智能+”行业发展蓝皮书》: AI数据，驱动智能时代的核心引擎

另一方面，数据开源使数据获取方式更便捷，随着国内外开源平台加速向多模态、工具链整合，以及社区协同方向的演进，开源平台正从从单一数据托管向。团队联合OpenGVLab团队基于前沿研究与实践，深度剖析了AI模型与数据需求升级、数据生产革新的双向赋能效应，以期帮助读者了解数据与模型协同进化的底层逻辑，在数据要素价值爆发的智能时代中抢占先机。从早期人工输入规则和知识图谱的符号主义，到深度学习时代，再到如

#人工智能

2025《“人工智能+”行业发展蓝皮书》: AI数据，驱动智能时代的核心引擎

#人工智能

收藏丨30个大语言模型训练相关的数据集分享

更多数据集，请访问OpenDataLab官网

#语言模型 #人工智能 #机器学习

MinerU × Cherry Studio：知识库再添动力！

业界顶尖的预处理技术，并支持灵活的部署方式，能够极大地优化文档信息在 AI 应用中的流转效率和准确性，同时充分尊重和保障用户的数据主权，最终为每一位 Cherry Studio 用户带来更流畅、更智能、更值得信赖的产品体验。强大的文档解析能力深度集成到 Cherry Studio 的知识库与未来的对话功能中，为您带来前所未有的文档处理与信息获取体验。后，您上传到知识库的文档将经过更精细的处理，使

#人工智能

收藏丨30个大语言模型训练相关的数据集分享

更多数据集，请访问OpenDataLab官网

#语言模型 #人工智能 #机器学习

2025《“人工智能+”行业发展蓝皮书》: AI数据，驱动智能时代的核心引擎

#人工智能

WAIC上官宣！大模型语料提取工具MinerU正式发布，开源免费“敲”好用

#人工智能 #大数据

训练数据不够怎么造？yolo5 最有用的trick 之数据增强详解

yolo5应用的trick繁多，此本文将针对yolo5的数据增强方面进行详细解读

#深度学习 #计算机视觉 #人工智能

共 81 条

请选择