
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DeepSeek影响力持续破圈,随之而来的烦恼是,官网总是“服务器繁忙”……好消息是,满血版DeepSeek-R1、V3正在得到越来越多第三方平台的支持。最新进展,无问芯穹大模型服务平台现已官宣,上线满血版DeepSeek-R1、V3 API服务,并且无需邀请即可免费用Token!还有国产算力可选,支持通过Infini-AI异构云平台一键获取DeepSeek系列模型与多元异构自主算力服务。戳大模型
允中 发自 凹非寺量子位 | 公众号 QbitAI最近,一则数据点出了AI领域算力需求的惊人增长——根据业内专家的预估,OpenAI推出的Sora在训练环节大约需要在4200-10500张NVIDIA H100上训练1个月,并且当模型生成到推理环节以后,计算成本还将迅速超过训练环节。照这个趋势发展下去,GPU的供给或许很难满足大模型持续的需求。不过,最近海外有一个新动向,可能会给即将到来的“算力荒
白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI毕业季,大模型人才正在被各家大厂和创业公司重金哄抢。刚刚,腾讯也曝光了他们与大模型相关的人才计划,并且直通2025年校招——将面向全球范围内大举扩招50%大模型人才,并且放话薪资算力什么的不用愁。不出所料,各家抢人下手都既快又狠,晚一步生怕就抢不到(不是)。也是借这个苗头,量子位突然发现了鹅厂每年招贤纳士的精髓,那就是针对不同情况推出各种顶尖
梦晨 发自 凹非寺量子位 报道 | 公众号 QbitAIAI智算中心,如今已成各地必备基建。放眼全国,已有4个人工智能计算中心建成,西安、许昌等地智算中心也已开工。南京、杭州、广州、大连、...
鱼羊 发自 凹非寺量子位 | 公众号 QbitAI随着对Sora技术分析的展开,AI基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注:文章披露,字节搭建起的万卡集群,能在1.75天内完成GPT-3规模模型(175B)的训练。具体来说,字节提出了一个名为MegaScale的生产系统,旨在解决在万卡集群上训练大模型时面临的效率和稳定性挑战。在12288块GPU上训练1750亿参数大语
允中 发自 凹非寺量子位 | 公众号 QbitAI随着AI技术的广泛应用,从智能手机到自动驾驶汽车,从智能家居到工业自动化,AI供电芯片的需求量正呈爆炸式增长。它不仅为AI系统提供稳定的电力供应,确保系统的正常运行,而且还肩负着节能减排、降低能耗的重任。然而随着算力需求的提升,AI设备的能耗、散热等问题凸显,这无疑给AI供电芯片带来了新的挑战,如何实现高效率、低功耗、持续稳定的供电成为了业界关注的
马跃 投稿量子位 | 公众号 QbitAI视频生成还可以这么玩?来一个“火柴人”做做动作示范,再加文本描述,即可让各种形象惟妙惟肖地跟着动起来。比如男人在公园椅子上做远眺姿势:钢铁侠街边起舞:蝙蝠侠也不闲着,水上打拳:形象数量可以随意添加:风格也能任意切换(上:新海诚,下:梵高):如此看下来,让任意一个八杆子打不着的形象跳个科目三,也是简简单单了。如上成果便是不久前入选了AAAI 2024的姿态全
衡宇 发自 凹非寺量子位 | 公众号 QbitAI我勒个老天奶,大模型六小强之一的阶跃星辰,给大家拜早年的方式可真不一样——6天之内,库库连发6个模型。大秀自家语言、语音、推理、图片理解、视频生成等多个类别的模型肌肉。年前如此密集地发布新模型,虽然心疼阶跃程序员的头发们1秒,但很快意识到他们打的是有准备的仗:早在去年3月正式亮相之前,就语言模型和多模态模型双管齐训,此后一直在多模态方面稳扎稳打;1
阿里mPLUG团队 投稿量子位 | 公众号 QbitAI4秒看完2小时电影,阿里团队新成果正式亮相——推出通用多模态大模型mPLUG-Owl3,专门用来理解多图、长视频。具体来说,以LLaVA-Next-Interleave为基准,mPLUG-Owl3将模型的First Token Latency缩小了6倍,且单张A100能建模的图像数目提升了8倍,达到了400张图片,实测4秒就能看完一部2小时的
西风 发自 凹非寺量子位 | 公众号 QbitAI曾经的视频生成王者Runway,带着大招鲨~回来了——祭出全新模型Gen-3 Alpha,并表示这是即将推出的系列模型中的首款。看过效果后,网友当即表示现在场上局势又大变样了,如图(手动狗头):Gen-3 Alpha主打的就是一个“细致”,生成的视频可以处理复杂的场景变化,并能包含多样的电影叙事手法,艺术气息拉满。在保真度、一致性和运动方面都相比G







