
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
近期,上海人工智能实验室(上海AI实验室)大模型推理部署工具 LMDeploy 迎来重磅更新——v0.12+ 版本正式发布,进一步为社区带来更流畅、更可靠、更强大的大模型服务体验。本次更新不仅涵盖多项功能升级与性能优化,也进一步展示了推理引擎与模型能力协同演进的可能性。亮点速览:深度参与并支撑 1T Moe 科学大模型的全周期研发首次实现了模型“反哺”算子生成的闭环尝试量化推理能力全面增强,正式拥

2月4日,上海人工智能实验室开源基于打造的万亿参数科学多模态大模型 Intern-S1-Pro,为AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代,提供创新的系统性开源基座。作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro的核心科学能力实现了质的跃升,高难度综合学科评测稳居AI4S领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向

2月4日,上海人工智能实验室开源基于打造的万亿参数科学多模态大模型 Intern-S1-Pro,为AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代,提供创新的系统性开源基座。作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro的核心科学能力实现了质的跃升,高难度综合学科评测稳居AI4S领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向

随着书生大模型开源生态的不断壮大,越来越多的产品和平台纷纷接入书生大模型。科研人员依托书生大模型持续探索创新,取得了丰富的研究成果;社区用户也不断创造出令人耳目一新的项目。“与书生共创”将推出一系列文章,聚焦这些合作与创新案例。欢迎订阅并踊跃投稿,一起分享经验与成果,共同推动大模型技术的应用与发展。本文来自社区投稿,作者邬雨航,书生大模型实战营学员,将向大家介绍孵化于书生大模型实战营的项目 Fre

近日,上海人工智能实验室联合团队发布了 Dense Image Captioning 领域的最新成果——这是首个将 DeepSeek-R1 强化学习策略成功应用于 Image Captioning 这类开放视觉任务的工作,创新地以实用性重新定义了 Image Captioning 的 reward。训练得到的,在图像描述任务上能,是 Image Captioning 领域的重要突破,也为提供了新的

9 月 10 日,上海人工智能实验室(上海 AI 实验室)DeepLink 团队开源扩展 Triton 的深度学习编译器,以及面向大模型训练与推理、异构硬件适配的高性能算子库。开发者无需手动调优,即可获得接近硬件峰值的性能。面向昇腾 DSA 架构,研究团队通过深度融合,在性能保持无损的同时,突破了跨代迁移难题。同时,研究团队与昇腾毕昇编译器团队、昇腾基础软件团队和昇腾特战队协同优化,基于 Asce

近期,科研智能体 SciMaster 接 入Intern-S1,科研工作者和爱好者不仅可以在书生大模型官网直接体验 Intern-S1 的强大功能,还能在SciMaste官网 调用其强大的科研能力,实现跨平台、无缝衔接的科研助力。无论你是科研老手,还是初入学术世界的新手,Intern-S1 与 SciMaste 的组合都能成为你的高效科研搭档,助你从灵感到成果,走得更快、更稳。SciMaste 会

目前图寻地址主要依赖计算机视觉(CV)方法,通过与大量卫星图像比对来确定位置。尽管这些方法效果显,但随着大模型的应运而生,依据人对于图像地理知识及相关特征的推理未免不是一个好的解决方案。因此,我开发了一种基于多智能体的图像识别与位置推理系统。旨在通过视觉、知识与决策等多智能体协同工作,能够有效分析城市地标的多维信息,通过逐步推理的方式得到准确的地理位置。项目展示。

9 月 9 日,上海人工智能实验室(上海AI实验室)大模型推理部署工具 LMDeploy 迎来重磅更新——v0.10.0版本正式发布,进一步为社区提供更高效、更稳定、可扩展的推理部署方案。今年以来,LMDeploy 已持续迭代多个版本,实现了等一系列关键突破。:LMDeploy 新增对多机部署的全面支持,显著提升超大规模模型的推理效率。该能力已成功应用于 DeepSeek 大模型的分布式推理场景,

本文提到Capability Salience Vector(能力显著向量,CSV),这是一种将整体损失分解并为不同tokens分配重要性权重的方法,能实现将验证损失与模型下游任务能力对齐的功能。传统缩放定律虽建立了训练计算与验证损失的关系,但验证损失与下游任务能力间存在差距,因其默认tokens重要性相同,无法直接建模下游能力与计算或token损失的关系。








