
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
11月8日是OneFlow开源100天的纪念日,为了这个有纪念性的日子,我们为大家准备了一个“百天大礼包”——深度学习框架性能优化系列文章,希望能和大家共同探讨开源框架如何进行优化,从各个...
回头来看,ChatGPT的横空出世验证了Ilya Sutskever此前预想的AI发展方向。在OpenAI成立早期,强化学习大牛Pieter Abbeel曾与Ilya共事,在他看来,Ilya对AI的思考总是走在他人的前面,而为了验证自己的想法,他总是在恰当的时间更换自己的工作处境,并做出了领域内最具开创性的工作...

继ChatGPT、GPT-4引爆语言大模型之后,近日发布的代码解释器(Code Interpreter)又将这一领域推向了高潮。代码解释器是ChatGPT插件更新的一部分,可以读取上传的文件,执行代码,生成图表,进行统计分析等功能。在7月6日至8日,代码解释器已推向约200万的ChatGPT Plus用户。OpenAI科学家Andrej Karpathy认为,代码解释器堪称个人数据分析师。不过,社

2017年,Google发布的《Attention Is All You Need》论文提出了Transformer架构,这成为过去十年神经网络领域最具影响力的技术创新之一,并被广泛应用于NLP、计算机视觉、蛋白折叠等诸多领域。更重要的是,它成为后来包括ChatGPT在内的诸多大模型的基石。不过,T...

一、框架分布式简介本文仅重点摘录对于OneFlow框架分布式的简介,更多分布式框架简介请移步原文获取,如需阅读请点击原文链接。OneFlow看过其他框架中的分布式代码示例,是不是觉得很复杂...
文章重点关注三个方面:促成AI进步的计算硬件和软件系统;过去十年在机器学习领域一些令人兴奋的应用示例;如何创建更强大的机器学习系统,以真正实现创建智能机器的目标。

新年伊始,大模型的话题热度不减。2022年11月底,ChatGPT展现的惊人能力将大模型研究和应用热度推向高潮,人们激烈讨论着这个高级“物种”的推出意味着什么,比如是否会颠覆搜索引擎市场格局。踏入2023年,这不禁让我们对GPT-4的发布充满遐想,它会比ChatGPT更上一层楼吗?会有哪些不一样的惊喜?岁末年初之际,科技圈的年度盘点不胜枚举,相关技术预测倒是不多。本文作者Rob Toews发布了2

为什么ChatGPT非得用强化学习,而不直接用监督学习?原因不是那么显而易见。在上周发布的《John Schulman:通往TruthGPT之路》一文中,OpenAI联合创始人、ChatGPT主要负责人John Schulman分享了OpenAI在人类反馈的强化学习(RLHF)方面的进展,分析了监督学习和强化学习各自存在的挑战。基于Schulman的演讲内容,以色列巴伊兰大学教授Yoav Gold

DeepSeek-R1、DeepSeek-V3 开源后引发全球震动,它们是深度求索团队为全人类献上的一份大礼,我们由衷为他们取得的成功感到高兴。经过硅基流动和华为云团队连日攻坚,今天,我们也为国内用户献上春节礼物:大模型云服务平台 SiliconCloud 首发上线基于华为云昇腾云服务的 DeepSeek-V3、DeepSeek-R1。 需要特别强调的是,无论是在昇腾上适配 DeepSeek-R.
尽管有 Scaling Law 放缓这样的疑虑,但整体而言,多数业内人士对AI过去一年的诸多进展感到兴奋,对新的一年 AI 的发展更是充满期待,尽管他们对未来的预测可能不尽相同。在本文中,Foundation Capital 合伙人Ashu Grag回顾了 2024 年 AI 发展的里程碑事件,并重点介绍了 2025 年的前景,主要包括:1.预训练局限将推动新的 AI 突破2.AI系...