登录社区云,与社区用户共同成长
邀请您加入社区
本文分析了NVIDIA、AMD和Intel三大芯片巨头在AI算力市场的竞争策略。NVIDIA凭借CUDA生态占据主导地位,通过H100/H200等产品矩阵覆盖不同需求;AMD以硬件优势和开放生态寻求突破,Instinct MI300系列提供高性价比选择;Intel则聚焦成本优化,Gaudi加速器集成以太网降低部署门槛。选型建议:追求效率选NVIDIA,注重性价比考虑AMD,重视集成成本则评估Int
【科技前沿速递】国产RISC-V架构汽车芯片突破,天基算力组网完成,AI编程工具爆发。国芯科技发布首款抗量子汽车电子AIMCU,兼具AI算力与安全防护;中国天基智算星座实现5ms天地协同延迟;阿里推出自然语言建站工具Meoo秒悟,OpenAI发布GPT-5.4-Cyber。半导体涨价潮持续,存储芯片Q2或再涨60%。开发者社区涌现"数字分身"热潮,"同事.skill&
当我戴着物理学的眼镜,去审视今天的 AI 算力系统时,我看到的不再是那些令人兴奋的增长曲线,而是一条条正在变得湍急、拥堵、甚至即将沸腾的数据洪流。这股洪流正以前所未有的速度,撞向五堵看不见的、由宇宙基本法则构筑的叹息之墙
4月15日,2026酒仙桥论坛在北京国家会议中心、北京数字经济算力中心同步启幕,以“国芯AI驭未来”为主题,聚焦AI赋能地方发展、驱动产业创新、引领技术突破等关键议题,共探智能经济新形态实践路径,凝聚中国AI产业高质量发展行业共识。
AI生态正在从‘技术驱动’走向‘工程落地+商业竞争’。国产算力进入性价比竞争——华为昇腾发布后,天数智芯降价,国产AI芯片市场正在成熟AI智能体执行环境有了新方案——Cloudflare沙箱基于V8 Isolates,比容器快100倍,AI生成代码的安全执行不再是难题大模型开源潮持续——明略科技Mano-P 1.0拿下13个SOTA,国产模型在多模态GUI理解领域全球领先AI编程工具生态加速分化—
面对可能的供应链风险和技术发展的限制,国内科技企业如阿里巴巴、腾讯、华为、百度和字节跳动等,正在积极调整产业策略,以减少对单一供应商,尤其是英伟达芯片的依赖。投资增加:中国AI芯片行业的投资情况呈现出逐年增长的趋势,2022年AI芯片投资数量共93起,投资金额达215.15亿元,显示出资本市场对AI芯片行业的关注和信心。研发进展:中国AI芯片企业正在积极研发具有自主知识产权的AI芯片,如华为的昇腾
大模型的爆发式发展正将算力推至数字经济的核心战略地位。GPT-4o与DeepSeek-R1等模型的多模态突破,不仅标志着AI进入"参数爆炸"时代(GPT-4单次训练需2.15×10^25 FLOPs,等同3万台A100全年运转),更暴露出算力供需的尖锐矛盾——据智源研究院的报告预估国内大模型训练算力缺口已达109EFLOPS(约20个太湖之光年产能)。在新技术广泛应用和全球算力短缺的背景下,信创国
作为天翼云“息壤”智算平台的重要延伸,息壤智算一体机-DeepSeek版集国产算力、国产模型和国产云服务于一身,深度融合了DeepSeek-R1/V3系列大模型,实现了从芯片、推理引擎到模型服务的全栈国产化。硬件层面,该产品以国产昇腾芯片为基础,提供昇腾8卡、16卡、32卡等多种规格型号,充分满足不同场景下的算力需求;软件层面,与公有云“息壤”智算平台同源,经过公有云大规模客户验证,通过自研模型加
2月28日,第三届北京人工智能产业创新发展大会在国家会议中心二期成功举办。大会持续聚焦人工智能前沿技术及从“算力”到“大模型”到“革命性快速发展”的人工智能产业发展特征,以“好用、易用、愿用——以突破性创新加速推动AI赋能千行百业”为主题。
2月28日,以“融合 效能 安全——让AI‘+’出新活力”为主题的第四届北京人工智能产业创新发展大会在国家会议中心二期举办。共计15000余名政府领导、全球学界领袖、业界精英、行业大咖、领军企业代表受邀出席。开幕式上,北京昇腾生态先锋中心启动仪式正式点亮。
优刻得长期战略合作伙伴智谱最新发布的GLM-5,正是这一阶段跃迁的代表之作:在Coding与Agent能力上实现开源SOTA,在真实编程场景中的使用体验已逼近Claude Opus 4.5,尤其擅长复杂系统工程与长程Agent任务。在内部Claude Code评估集合中,GLM-5在前端、后端、长程任务等编程开发任务上显著超越GLM-4.7(平均增幅超过 20%),能够以极少的人工干预自主完成 A
回顾过往技术实践过程,上海人工智能实验室(上海 AI 实验室)DeepLink 团队产出许多开源成果。2025 年 9 月,DeepLink 团队开源扩展的深度学习编译器,以及面向大模型训练与推理、异构硬件适配的高性能算库。开发者无需手动调优,即可获得接近硬件峰值的性能。面向架构,研究团队通过深度融合,在性能保持无损的同时,突破了跨代迁移难题。
去年,华为在2017全联接大会(HUAWEI CONNECT)上发布了被冠以希腊神话中大力神名字的智能云硬件平台Atlas,而在2018华为全联接大会上,华为发布了全新升级的基于华为Ascend(昇腾)系列处理器和业界主流异构计算部件的新一代Atlas智能计算平台,通过模块、板卡、小站、一体机等丰富的产品形态,打造面向端、边、云的全场景AI基础设施方案。作为华为全栈AI解决方案的重要组成部分,At
今日科技热点速览: 1️⃣ RISC-V生态爆发:SiFive获4亿美元融资,英伟达押注数据中心AI芯片,2026年将迎Linux开发板井喷,Ubuntu全面适配; 2️⃣ 国产算力突破:华为昇腾950PR性能达H20三倍,2028年超节点市场规模或达3414亿元,推理效率提升20%-50%; 3️⃣ AI开源新进展:Minimax2.7支持自主训练优化,GLM-5.1登顶CodeArena,国产
中国 AI 大模型周调用量连续五周超越美国且增速大幅领先,是产业生态厚积薄发的必然结果。这一数据是近期 Token 需求持续爆发的延续——3 月 23 日中国发展高层论坛披露,今年 3 月中国日均 Token 调用量已突破 140 万亿。从“百模大战”到“Token 为王”,国产大模型正在成为全球 AI 应用生态的核心引擎。2026 年 4 月 12 日,中国 AI 产业站在一个崭新的历史节点。连
近日,九章云极 DataCanvas 正式推出全新的算力产品“算力包”,继 AI 基础软件、智算操作系统之后,算力包产品可以说是成功打通九章云极 DataCanvas 公司向社会广大算力消费者提供更经济、更好用、高质量、高效率的一体化算力服务的“最后一公里”。作为承载算力包消费环节的载体,Alaya NeW Cloud 所提供的智算专有云服务,让用户购买的算力变成可视化的资源、模型和任务,让算力资
最近,关于GPT-6将支持200万Token超长上下文的消息在AI圈掀起巨浪。算力稀缺且昂贵。然而,多数人只盯着H100、B200的算力翻倍,却忽略了另一个更隐蔽的瓶颈——通信。在万卡乃至十万卡集群中,通信已经从辅助设施变成了“AI算力的主动脉”。1.6T/3.2T光模块、NPO/CPO共封装光学、卫星激光链路……这些原本“遥不可及”的技术,正被200万Token上下文的需求硬生生拉入快车道。
今日科技行业核心动态摘要: 1️⃣ RISC-V领域重大突破:SiFive获4亿美元融资(英伟达参投),估值达36.5亿美元,预示数据中心RISC-V时代加速到来;阿里平头哥芯片交付超47万片,国产算力闭环加速成型。 2️⃣ AI智能体爆发:腾讯白皮书显示五家公司同期推出AIAgent产品,技术飞轮完整转动,AI主战场转向智能体;Token日均调用量较2024年增长千倍。 3️⃣ 半导体全产业链涨
华为发布新一代AI推理加速卡Atlas 350,搭载昇腾950PR处理器,单卡算力达英伟达H20的2.87倍,成为国内首款支持FP4低精度推理技术的量产产品。该产品聚焦AI推理场景,配备112GB超大显存,已实现与7家核心合作伙伴的整机产品同步落地。Atlas 350的发布标志着国产算力从训练到推理的全场景覆盖,将推动消费互联网、内容创作等领域的AI应用落地。这一突破不仅改写了全球高端AI算力格局
本文介绍了在GitCode云端Notebook环境中部署Mistral-7B-Instruct-v0.2大语言模型的完整流程。使用Atlas 800T NPU(1*Ascend 910B)硬件环境,详细说明了从环境检查、依赖安装(包括transformers、accelerate等库)、通过ModelScope SDK高速下载模型,到测试模型推理性能的完整步骤。文章提供了具体的代码示例和操作截图,
从"单极垄断"到"多极竞争",算力产业需要破局者
摘要:算力虚拟化技术对消费者而言,可有效降低算力的使用成本,对于设备商或运营商而言,则可极大提升算力资源的利用率,降低设备运营成本。
【今日科技要闻速览】 1️⃣ 华为发布昇腾950PR AI芯片,算力达英伟达H20的2.87倍,国产芯片首次实现硬件反超 2️⃣ GLM-5.1大模型上线华为云,支持8小时长程自治编程,SWE-BenchPro测试登顶开源模型榜首 3️⃣ RISC-V加速渗透汽车电子领域,东风DF30芯片量产上车,三星SSD控制器转向RISC-V架构 4️⃣ 工信部提出太空算力战略,预计2035年市场规模达390
众所周知,美国商务部公布了一系列先进芯片、半导体制造设备的出口管制规则,限制向中国出口更先进的人工智能芯片,并扩大管制对象,覆盖经由第三国的情况。2023年是AI元年,ChatGPT的惊艳登场,掀起AI大语言模型狂潮,国内AI企业奋力追赶,存、算、传基础设施也突飞猛进发展,但却依然存在专项算力资源紧缺的问题。犀思云基于全球分布的骨干节点,支持国内外大带宽超算中心专网连接,以及16家主流公有云的专网
openFuyao开源算力生态三层架构实现算力高效释放
写这篇博客的目的就是想搞清楚英伟达不同显卡之间的性能差异以及移动端GPU的性能达到了英伟达显卡的哪一代,让自己也让大家明白不同显卡的算力差异。所有的数据均从网络搜索,有不正确的地方欢迎批评指正。同一显卡会有一个首次发布,此外还有一系列的迭代升级版本,我们只考虑首次发布版本的性能。鉴于现在的模型推理大多使用int8来进行推理,所以大家可以着重看一下int8算力那一列。
openEuler性能验证测试表明,该系统在多架构硬件环境下表现优异。测试采用x86和ARM双平台,验证了CPU、内存、存储及异构计算能力。结果显示openEuler能准确识别不同硬件架构,存储性能测试中顺序读写速度达1GB/s以上,随机读写IOPS超10万。GPU加速测试确认了其对NVIDIA显卡的良好支持,CUDA计算能力验证通过。测试数据表明openEuler具备优秀的跨平台兼容性和高性能表
算力
——算力
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net