
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本次大会由世界人工智能大会组委会、上海市经济和信息化委员会、上海市委网络安全和信息化委员会办公室、上海市徐汇区人民政府共同指导,上海市人工智能行业协会主办,以“模塑全球 无限可能”为主题,围绕大模型,结合算力、语料、基金等要素,以“社区的社区”为基础,打造高创新浓度、高创业热度、高人才密度的开发者生态。九章云极DataCanvas此次展出的“算力包”产品,以“度”为算力计量单位,将算力资源标准化为

在大模型时代,生态协作能力的重要性远超以往。针对高价值业务场景,建议和具有专业技能能力的供应商合作,采用 “开源大模型底座 + 企业私有数据” 进行领域微调,构建专属场景大模型,实现业务效率进一步提升 ,并通过 API 接口将模型能力深度耦合至核心业务系统,革新业务效率和客户体验。这一专属 AI 能力的核心要义,在于将前沿的大模型技术与企业独一无二的基因,即企业特有的数据资源、业务流程以及个性化的

Countdown 任务是一种类似"24点"的任务,玩家会拿到一组数字,使用"加减乘除"这四种基本语法运算法则,构造一个等于目标数字的等式,并且每个数字只能使用一次,例如:玩家拿到[2,12,25,56]这四个数字,目标是等式结果为55.1.整个训练过程大概需要4个小时,在./grpo_implement/logs/下有log,查看countdown_zero_rl_aha_moment_dist

DeepSeek-OCR 创新性地通过光学二维映射来压缩长上下文,实现高效「看图识文」,替代传统大模型“逐字阅读”的机制,在 OmniDocBench 权威评测中,仅用100 个视觉 Token即超越 GOT-OCR2.0(256 Token),并在 800 Token 内性能碾压 MinerU2.0(近 7000 Token)。这种「以图载文」的技术路径,使文档处理效率提升 10 倍,单张 A1

在 Llama2-70B 模型训练中实现秒级故障检测,分钟级定位并处理故障,分钟级训练恢复,减少了因故障导致的算力浪费,保障了 GPU 在训练过程中的持续高效运行,间接提升了 MFU。自DeepSeek R1问世后,让人们认识到了,不堆GPU资源,也可以通过各种优化手段训练出优秀的大模型,这些优化手段涉及到整个大模型训练技术体系的各个层面,如通信、AI平台、训练框架、算法等,这之中很多最终是落实到

这几年OCR技术真是彻底变了样,从之前靠规则硬刚,到现在直接端到端的大模型搞定,开源社区也出了几个特别能打的:DeepSeek-OCR:当红炸子鸡。专门为中文优化,识别准、表格还原强,像合同、报表、扫描件这类正式文档,处理起来非常顺手。dots.ocr(小红书开源):专门对付那种背景花、字体飘、还带圆角的“社交体质”图片——小红书上的爆款图文,它基本都能精准识别出来。在GitHub上已经攒了5.6

摘要:一提到计量计费,相信大家第一时间想到了应该是生活中的水、电、燃气、通信费用,因为这些是我们习以为常又必不可少的部分,它们都已经有国家统一的标准表计进行计量计费,但算力资源特别是云计算环境下的算力资源算力影响因子颇多,难以用单一表计进行计量,应该如何科学且公平地计量计费,让用户不担心自己花钱租的算力资源被分配给别人使用呢?本文将从技术层面围绕 GPU、CPU、存储、网络四大核心智算资源,深入探

Agentic AI不是“更聪明的工具”,而是新型生产力关系的重构 ——人类从“操作者”变为“监督者”,Agent从“执行者”变为“责任主体”。“In an agentic world, trust is not a feature. It must be the foundation.”(在智能体的世界里,信任不是一项功能,而必须是基石。所以,别再问“我们能不能上Agent?要问:“我们的安全水

提示工程归根结底是沟通:说出最能帮助 AI 清晰理解你意图的语言。从本指南开头介绍的核心技巧开始。持续使用,直到它们成为第二天性。只有在解决特定问题时才加入高级技巧。从核心技巧开始熟练后自然知道什么时候加入进阶技巧不要追求“最多技巧”,而是“最少但足够”提示词越是明确、结构越合理,模型越能稳定输出随着“上下文工程”兴起,提示词工程并没有变弱,相反,它是上下文工程的核心构件。AI 时代,懂 AI 的

3FS 近期仍在持续被热议,在完成前篇所述的 3FS 元数据性能详测后,我们决定对 3FS 的另一项技术创新:FUSE与USRBIO并行使用开展编译与性能体验。我们发现,3FS 兼顾了 FUSE 的易用性与原生接口 USRBIO 的高速优势,在大部分场景中直接使用 FUSE 挂载,几乎「零改动」就能把 AI 任务迁移到 3FS,而对极限性能需求,则使用 USRBIO 的零拷贝、批量异步提交机制,大








