
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
点击上方,选择星标或置顶,不定期资源大放送!阅读大概需要15分钟Follow小博主,每天更新前沿干货来源:AI科技评论作者:李雨晨2020 年 8 月 7 日,全球人工智能和机器人峰会(...
在训练过程中,团队冻结模型其他参数,只更新α的梯度,通过这种专门的校准训练让模型自主学习α值,然后按α值从小到大排序,找出那些。全注意力机制的算力瓶颈在于平方级的计算复杂度O (L²),这导致模型在处理长文本任务时对显卡要求高,还会出现推理延迟问题。速度快了50%,后续解码阶段生成内容时还能省30%的算力,相当于同样的硬件,现在能同时处理两倍多的长文本任务。在原来的MLA架构中,每个MLA模块都是
来源:新智元在OpenAI「权游」终结之后,能让他放慢脚步的原因只有一个——「芯片短缺」。Sam Altman今年5月份就在公开场合表示,现在OpenAI正在经历严重的算力短缺。不但OpenAI用户体验到的各种卡顿,延迟都是由于算力不够导致的,而且因为「芯片」短缺的问题,让OpenAI没法给用户提供更多的功能。今天,有外媒曝出,OpenAI在2019与AI芯片初创公司Rain AI签订了一份价值5
来源:量子位OpenAI一次性拿出20%总算力,投入全新研究方向——超级智能对齐(Superalignment)。先说说OpenAI的20%总算力什么概念?光是微软此前专门给他们打造的一台超级计算机,就有285000块CPU和上万块英伟达A100 GPU。外界没人知道OpenAI现在拥有多少H100 GPU,只知道他们总融资113亿美元,还要算上微软额外提供的Azure云算力。这番大手笔,仿佛直接
转载自 | 新智元、量子位因为 V3 版本开源模型的发布,DeepSeek 又火了一把,而且这一次,是外网刷屏。全球复现DeepSeek的一波狂潮来了!正如LeCun所言:「这一次,正是开源对闭源的胜利!」在没有顶级芯片的情况下,以极低成本芯片训出突破性模型的DeepSeek,或将威胁到美国的AI霸权。大模型比拼的不再是动辄千万亿美元的算力战。OpenAI、Meta、谷歌这些大公司引以为傲的技术优
在9月举办的2025年云栖大会上,阿里云与NVIDIA联合提出了“Physical AI”计划,明确将AI大模型与机器人、自动化、工业制造等领域结合,打造智能化的物理世界操作系统。如果说以往的大模型是在“理解”世界,那具身智能的目标,就是让模型能够“参与”世界——从林俊旸的推文里不难看出,Qwen。可以看到,在具身智能板块,包括模型、算法、平台、算力基础设施等,过去几年阿里内部的AI布局几乎都集中
在他的战略引领下,华为成功推出了作为算力底座的昇腾(Ascend)系列 AI 芯片、昇思(MindSpore)深度学习框架,以及赋能千行百业的盘古(Pangu)大模型,确保了公司在智能时代的竞争力,也为构建一个关键、独立的 AI 计算生态系统奠定了基础。在他的领导下,英伟达转型为全球领先的 AI 计算公司。他通过精准的战略决策和产能扩张,确保了全球最强大的 AI 处理器和加速器能够被大规模生产,为
来源:新智元GPT-4会演变为通用人工智能吗?Meta首席人工智能科学家、图灵奖得主Yann LeCun对此表示质疑。在他看来,大模型对于数据和算力的需求实在太大,学习效率却不高,因此学习「世界模型」才能通往AGI之路。不过,微软最近发表的154页论文,似乎就很打脸。在这篇名为「Sparks of Artificial General Intelligence: Early experiments
来源:量子位字节大模型团队,终于曝光!这不是,字节刚刚启动大模型校招计划,招揽人才嘛——计划取名Top Seed,薪资TOP级别、算力数据管够,但仅面向应届博士生;前沿课题覆盖大模型、图像&视频生成、机器学习算法和系统以及音频生成和理解等方向。另外还有一帮顶尖的技术导师团带队……等等,这不就是字节豆包大模型的背后团队吗?来自中科大、北航、西安交大等高校校友领衔的“关键8人”,这就公开亮相了
从 2008 年加入苹果开始,他一手搭建了 Apple Silicon 团队,从 A4 芯片的牛刀小试,到 A 系列芯片在移动端的独孤求败,再到 M 系列芯片让 Mac 浴火重生,彻底摆脱 Intel 的掣肘,斯鲁吉是苹果万亿市值的护城河挖掘者。从定义了 iPhone 触感的设计师,到掌控着全球数亿台设备算力命脉的芯片造物主,再到试图在生成式 AI 浪潮中突围的算法专家,离职名单上的每一个名字,都







