logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

参数是ChaGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数

早期性能结果显示,Aurora 超算系统在实际科学和工程负载上具有领先性能,性能表现比 AMD MI250 GPU 高出 2 倍,在 QMCPACK 量子力学应用程序上的性能比 H100 提高 20%,且能够在数百个节点上保持近线性的算力扩展。目前从事实来说,的确是模型越大数据越多,且质量越好,带来的性能是越高的。但是我个人认为,这个提升曲线可能会有一个瓶颈期,到了瓶颈或者平台期的时候,它的上升速

文章图片
#人工智能
同济校长郑庆华院士:大模型的四大缺陷

以GPT4求解算术运算题的实例为例,对于在1381和1453之间选两个随机数相乘的结果给出了错误答案,被指出错误后,无法定位是语料,还是训练等原因,更无从修正。在问题求解阶段,无法记住处理过的数据或场景,比如在无人驾驶中,人脑对路况有记忆,但自动驾驶每次都要重新计算,并为此消耗了大量能量。郑庆华认为,大模型已经成为当前人工智能的巅峰,大模型之所以强,是依托了大数据、大算力和强算法,但是也面临着若干

文章图片
#人工智能#机器学习
英伟达新核弹B200发布,一台服务器顶一个超算,万亿参数大模型30倍推理加速

要论在整个AI界的影响力、号召力,在这一刻,无论是“钢铁侠”马斯克还是“奥特曼”Sam Altman,恐怕都比不过眼前这位“皮衣客”黄仁勋。以及布局下一轮计算变革的前沿领域,英伟达推出云量子计算机模拟微服务,让全球科学家都能充分利用量子计算的力量,将自己的想法变成现。4nm制程达到瓶颈,就把两个芯片合在一起,以10TB每秒的满血带宽互联,组成B200 GPU,总计包含2080亿晶体管。在标准的17

文章图片
#服务器#运维
微软将中国AI团队集体打包去美国,涉及数百人

本月初,微软董事长兼 CEO 萨蒂亚·纳德拉 (Satya Nadella) 宣布,微软未来四年将向马来西亚投资22亿美元,建设云计算和 AI 算力基础设施(数据中心),并为20万人提供AI技能培训。昨天许多网友在脉脉发布动态称,微软公司发送邮件通知将中国区 Azure 人工智能团队的几个组集体打包去美国和澳大利亚。在此之前,微软的东南亚数据中心基本都建立在新加坡。钛媒体在报道中表示:“相对于微软

文章图片
#microsoft#人工智能
Sergey Levine-伯克利-深度强化学习2020

课程介绍本课程主要讲解深度强化学习相关的基础知识,基础模型;还设计迁移学习、多任务学习和元学习。bjhq:Sergey Levine-伯克利《深度强化学习2020》课程视频及ppt分享课程主页http://rail.eecs.berkeley.edu/deeprlcourse/课程大纲课程主讲人课程视频截图bkhq:Sergey Levine-伯克利《深度强化学习2020》课程视频及ppt分享..

文章图片
超10秒高分辨率,北大Open Sora视频生成更强了,还支持华为芯片

现在这个项目终于有了新成果,Open-Sora-Plan v1.0.0 来了,新研究显著增强了视频生成的质量以及对文本的控制能力。OpenAI 在今年年初扔出一项重大研究,Sora 将视频生成带入一个新的高度,很多人表示,现在的 OpenAI 一出手就是王炸。然而,众多周知的是,OpenAI 一向并不 Open,关于 Sora 的更多细节我们无从得知。今年 3 月初,北大团队联合兔展启动了 Sor

#人工智能#深度学习
为什么说大模型训练很难?聊聊预训练的一些经验

作者:罗小黑,主要做NLP声明:本文只做分享,版权归原作者,侵权私信删除!原文:https://www.zhihu.com/question/498271491自从Bert网络模型产数量超过3亿规模,当时候只是觉得性能好,没想到GPT系列出来后,GPT-3直接用170B规模的参数量模型精度碾压竞品。

#神经网络#人工智能#自然语言处理
最新最全-中文生物医学命名实体识别最新研究论文、资源、数据集、性能整理分享

目前现存公开的中文电子病历标注数据十分稀缺,为了推动CNER系统在中文临床文本上的表现,中国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing, CCKS)在近几年都组织了面向中文电子病历的命名实体识别评测任务,下面我们主要关注CCKS CNER数据集上的结果。2.中文电子病历的命名实体识别研究进展. 杨飞洪

文章图片
#transformer#leetcode#计算机视觉
联邦学习历史最全论文、会议、博客资源整理分享

联合学习(FL)是一种新的机器学习框架,它使多个设备能够协作训练共享模型,而不会损害数据隐私和安全性。本资源整理了联合学习相关的资源,包括研究论文、会议、博客等等。资源整理自网络,源地址:https://github.com/innovation-cat/Awesome-Federated-Machine-Learning。

文章图片
#深度学习#人工智能
深度强化学习必读-决策算法综述

本书介绍本书广泛介绍了不确定条件下最优决策的算法。涵盖了与决策相关的各种主题,介绍了基本的数学问题公式和解决它们的算法。提供图形、例子和练习来介绍各种方法背后的几本原理。本书是为高级本科生和研究生以及专业人士准备的。这本书需要一些数学知识,并假设之前接触过多变量微积分、线性代数和概率概念。附录中提供了一些审查材料。文zxhuoqu:https://mp.weixin.qq.com/s?__biz=

#自动驾驶#神经网络#tensorflow +2
    共 210 条
  • 1
  • 2
  • 3
  • 21
  • 请选择