logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

“远见者”特斯拉AI主管Karpathy|深度学习崛起十年

在天时地利人和兼具的情况下,这门课成为斯坦福大学最受欢迎的课程之一,并且在网络上爆火,成为最早、最具权威的深度学习课程。这也让他名声大噪,成为一名深度学习和计算机视觉领域的“网红”,不止于此,他还成长为一名AI领域顶尖的远见者和领导者。

文章图片
#神经网络#算法#人工智能 +2
InsightFace: 用OneFlow轻松实现超大规模人脸识别模型

InsightFace: 用OneFlow轻松实现超大规模人脸识别模型概述人脸识别技术可以准确识别出图像中的人脸和身份,具有丰富的应用场景,譬如金融场景下的刷脸支付、安防场景下的罪犯识别和医学场景下的新冠流行病学调查等等。人脸识别的算法演变经历了以 PCA 为代表的早期阶段,再到以“人工特征+分类器”为主的统计学习方法阶段,近几年,随着大数据及 GPU 算力的爆发,人脸识别进入到深度学习算法为绝对

#人脸识别#分布式#深度学习
AI算力反碎片化:世界上最快的统一矩阵乘法

LLVM之父Chris Lattner创办的Modular团队一直在布道AI系统和工具的碎片化带来的负面影响,他们认为,这种现状不光抬高了AI开发人员的开发难度以及开发成本,还抑制了技术创新速度。此前,他们撰写了《模块化设计决定AI前途,不服来辩》一文讨论了AI软件模块化的重要性,而《为什么我们要重建AI基础设施软件》一文则分享了他们对重建AI基础设施软件解决方案的思考。近期,他们发布了一些实际工

文章图片
#人工智能#矩阵#线性代数 +1
手把手带你搞懂大厂不传之秘:超大规模人脸识别|免费教程

近年来,随着深度学习技术的发展,基于深度学习的人脸识别准确率得到了大幅提高,目前已被广泛应用在刷脸登录、⻔禁考勤、公安系统进行人员身份核查等场景。这一切应用的核心都离不开人脸识别算法。In...

#人脸识别#算法#人工智能 +2
大模型成本效益对比:DeepSeek 2.5 VS Claude 3.5 Sonnet VS GPT-4o

与Claude和GPT模型相比,DeepSeek模型过去一度被开发者社区忽视。不过,过去几个月以来,DeepSeek的发展势头非常迅猛。随着DeepSeek 2.5发布(该版本整合了DeepSeek-V2-Chat和DeepSeek-Coder-V2-Instruct的功能),该模型热度达到顶峰。DeepSe...

文章图片
大型语言模型的推理演算

本文详细阐述了大型语言模型推理性能的几个基本原理,不含任何实验数据或复杂的数学公式,旨在加深读者对相关原理的理解。此外,作者还提出了一种极其简单的推理时延模型,该模型与实证结果拟合度高,可更好地预测和解释Transformer模型的推理过程。为了更好地阅读本文,读者需了解一些Transformer模型的相关先验知识,比如《图解Transformer》的...

文章图片
#语言模型#深度学习#人工智能 +2
深挖Cerebras:世界上最大AI芯片的架构设计

近年来,神经网络模型规模呈指数级增长,从2018年拥有超1亿参数的Bert到2020年拥有1750亿个参数GPT-3,短短两年模型的参数量增加了3个数量级,而且这种增长还看不到尽头。人们刚刚开始发掘神经网络的应用潜力,但传统的训练和推理方式已然无法跟上神经网络规模的飞速增长速度,无法满足大规模机器学习所需的内存和算力需求。为此,国内外诸多创业公司寻求对软...

文章图片
#神经网络#深度学习#人工智能
ChatGPT数据集之谜

半个月以来,ChatGPT这把火越烧越旺。国内很多大厂相继声称要做中文版ChatGPT,还公布了上线时间表,不少科技圈已功成名就的大佬也按捺不住,携巨资下场,要创建“中国版OpenAI“。不过,看看过去半个月在群众眼里稍显窘迫的Meta的Galactica,以及Google紧急发布的Bard,就知道在短期内打造一个比肩甚至超越ChatGPT效果的模型没那么简单。让很多人不免感到诧异的是,ChatG

文章图片
#人工智能#AIGC#语言模型
前OpenAI联创、ChatGPT负责人John Schulman:大模型的升级秘诀

8月6日,OpenAI联合创始人、ChatGPT架构师John Schulman宣布离职,将加入另一家由前OpenAI员工Dario Amodei创办的大模型公司Anthropic。近9年前,Schulman在研究生毕业后加入OpenAI,成为创始团队的一员。他是深度强化学习的早期先驱之一,很多人不知道的是,他也是ChatGPT项目的负责人,是他领导了ChatGPT的秘密武器RLHF(人类反馈的强

文章图片
#人工智能#AIGC
开源100天,OneFlow送上“百天大礼包”:深度学习框架如何进行性能优化?

11月8日是OneFlow开源100天的纪念日,为了这个有纪念性的日子,我们为大家准备了一个“百天大礼包”——深度学习框架性能优化系列文章,希望能和大家共同探讨开源框架如何进行优化,从各个...

#java#xhtml
    共 157 条
  • 1
  • 2
  • 3
  • 16
  • 请选择