logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

顶配MacBook Pro 16上的M3 Max是什么水平?

来源:机器之心10 月 31 日,苹果在「史上最短发布会」上发布了新一代笔记本电脑和 Mac,与之而来的还有新一代 M3 芯片。新一代芯片第一次使用领先的 3 纳米制程工艺,加入了动态缓存、硬件光追、网格着色等新技术,号称可以打英特尔的处理器加独立显卡,只用一半功耗就能达到 M1 芯片的相同算力。这一切使得 Apple Silicon M 系列芯片达到了新的高度。在英特尔不断提升制程工艺,高通即将

【赠书】基于鲲鹏的大数据挖掘算法实战:清华&华为倾力出品!

新年快到了,特地安排一期送书活动,感谢大家这一年的关注!大家有需要的这本书的可以参与这次活动哟!(具体参与方式见文末!)计算机企业核心技术是企业的立身之本,更是企业把握市场主动权、扩大自身竞争优势的关键。为了方便广大计算机领域相关人员学习计算机方面前沿科技,也为了方便企业提高自身的技术核心竞争力,机械工业出版社与华为、百度、字节跳动、小米等国内优秀的互联网公司合作出版了“计算机企业核心技术丛书”。

#数据挖掘#算法#华为 +1
华为盘古Ultra来了:昇腾原生、135B稠密通用大模型,无需英伟达GPU

在 8192 卡规模的集群中,使用了 128 路数据并行(Data Parallelism)、8 路张量并行(Tensor Parallelism)和 8 路流水线并行(Pipeline Parallelism),同时结合了 ZeRO 和序列并行(Sequence Parallelism),以降低模型参数、优化器状态和激活值的显存占用。Pangu Ultra 采用了改进的子序列切分并行方式,针对每

MoE训练速度提高70%!华为只用了这3招

针对Pangu Ultra MoE 718B模型,在单卡内存使用约束下,华为通过DeployMind以训练性能为目标找到了TP8/PP16/VPP2/EP32(其中TP只作用于Attention),这一最适合昇腾集群硬件规格的并行方案,综合实现计算、通信、内存的最佳平衡。为解决这一问题,华为团队提出了一种精度无损的动态数据重排方案,其核心在于:通过线性模型量化单样本计算耗时,在严格保持训练精度无损

#人工智能#机器学习#算法 +1
DeepSeek华为火线联手!硅基流动首发即限流,全国产API白菜价,零门槛部署

来源:量子位华为DeepSeek联手,全套国产——国产大模型云服务平台SiliconCloud(硅基流动),首发上线了基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。 Web端/手机端均可用,价格非常便宜,春节期间还打折,目前使用成本如下:DeepSeek-V3:输入只需1块钱/M tokens,输出2块钱/M tokensDeepSeek-R1:输入4块钱/M tokens

紧急辟谣:Sora 跟我一点关系没有!

来源:量子位误会了误会了,被传为“Sora作者之一”的上交大校友谢赛宁,本人紧急辟谣。他的声明发在其朋友圈,以及“交大校友荟”账号交大org上,主要说了几点:Sora完全是OpenAI的工作,和谢赛宁本人一点关系没有。但他后面将在纽约大学开展相关研究要开发Sora这样的成果,人才第一, 数据第二,算力第三。《黑镜》等科幻作品里的部分故事可能很快成为现实,需要准备好对应的监督体系。传播不实信息的原文

清华光电计算新突破:芯片性能提升万倍,研究登顶Nature

来源:机器之心随着各类大模型和深度神经网络的涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代 AI 芯片,已成为国际前沿热点。中国科协发布的 2023 重大科学问题中「如何实现低能耗人工智能」 被排在首位。近日,清华大学团队在超高性能计算芯片领域取得新突破。相关成果以《面向高速视觉任务的纯模拟光电计算芯片》(All-analog photo-electronic chip for hi

无需写代码能力,手搓最简单BabyGPT模型:前特斯拉AI总监新作

来源:机器之心我们知道,OpenAI 的 GPT 系列通过大规模和预训练的方式打开了人工智能的新时代,然而对于大多数研究者来说,语言大模型(LLM)因为体量和算力需求而显得高不可攀。在技术向上发展的同时,人们也一直在探索「最简」的 GPT 模式。近日,特斯拉前 AI 总监,刚刚回归 OpenAI 的 Andrej Karpathy 介绍了一种最简 GPT 的玩法,或许能为更多人了解这种流行 AI

#人工智能
李沐:年度演讲谈智能体!

“没问题,John。如果最好的闭源模型(比如OpenAI)的API得分是90,但在你的应用中,通用能力测试得分必须是85。我们现在做的是Al电话销售员(Al telemarketer),也就是说,语音智能体扮演的是“电话推销员”的角色。我们学到的一个重要经验是,即使是游戏这种听起来很简单领域,也涉及大量遵循指令(instruction following)的问题。例如,这个游戏是科幻题材,时间设定

宇树王兴兴,冲刺A股上市

另外在产品方向,宇树科技不仅涵盖人形机器人、灵巧手等多个领域,也在积极争取自主研发所有的核心零部件、电机、控制系统等,并构建了完整的交付、制造和售后体系。作为国内首个正式对外发布并零售的高运动性能四足机器人,Laikago让宇树崭露头角,市场第一次认识到了,这家看似初出茅庐的新兴企业,在技术上也毫不逊色。从“资本热”到“产业热”的转折,其中的领军人物,也就是王兴兴,在一众名校履历和天才少年中间,不

#人工智能
    共 323 条
  • 1
  • 2
  • 3
  • 33
  • 请选择