logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PyTorch Monarch震撼发布!单控制器模型彻底简化分布式AI工作流程

Monarch现已作为开源项目在GitHub上提供,包含完整的文档、示例notebook以及与Lightning.ai的集成指南。该框架的目标是让集群规模的编排变得像本地开发一样直观,为研究人员和工程师提供从原型到大规模分布式训练的平滑路径。Meta的PyTorch团队近日发布了Monarch,这是一个革命性的开源框架,专门用于简化跨多个GPU和机器的分布式AI工作流程。

文章图片
#人工智能#AI
DeepSeek V4迟迟不发布是在等华为?Nvidia被“断供”?

但这次V4,DeepSeek直接把Nvidia和AMD晾在一边。DeepSeek 原本预计在农历新年前后发布 V4,但这次完全没让 Nvidia 和 AMD 参与早期优化,反而把提前几周的时间给了华为等中国本土芯片供应商,让他们的 Ascend 等硬件能更早更好地适配这个新模型。DeepSeek 原本预计在农历新年前后发布 V4,但这次完全没让 Nvidia 和 AMD 参与早期优化,反而把提前几

文章图片
#华为#人工智能#系统安全 +2
深度解析:为什么 LoRA 只需调 1%参数?

本文将从架构痛点、数学本质、工程实现三个维度,深入解析 LoRA 为何能以“四两拨千斤”之力,撬动大模型微调的平民化革命。Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景中大语言模型(LLM)微调技术 - LoRA。在大语言模型(LLM)席卷 AI 领域的今天,一个现实问题摆在所有开发者面前:如何在有限算力下高效微调百亿级模型?全参数微调动辄需要数十张 A100、数百 GB

文章图片
#人工智能#搜索引擎#AI
10倍算力能在几周内用完!OpenAI首席研究员爆料:内部有300个项目;Meta挖过一半下属,为了抢人,扎克伯格亲自送汤!

主持人:你还有哪些小而脆弱的想法,可能会成为未来突破的核心?Mark:我有几个小想法,但不能透露太多。我主要关注预训练,少量涉及强化学习,还有一些关于如何整合的方法。主持人:目前大家对你们理解上有什么误区吗?Mark:最重要的是,OpenAI是一个研究为中心的公司,核心目标是打造AGI,没有干扰。产品开发只是从这个目标自然流出的结果。我们希望加速AI研究、自动化科学发现,并实现经济有用的工作。过去

文章图片
#人工智能#AI
中国工程院院士郑纬民:中国必须走自主可控的AI计算引擎路径;未来AI所需要的不是单一用途芯片,而是全功能GPU!生态不能碎片化

12月20日,在国产GPU第一股摩尔线程主办的首届摩尔线程开发者大会主论坛现场,中国工程院院士、清华大学计算机系教授郑纬民围绕“中国主权 AI 计算引擎的构建”,给出了一个清晰而直接的判断。“今天,我们已经进入主权AI的时代。AI 的竞争,正在从模型之争,转向算力、算法与生态的系统性竞争。12月20日,在国产GPU第一股摩尔线程主办的首届摩尔线程开发者大会主论坛现场,中国工程院院士、清华大学计算机

文章图片
#人工智能#AI
104人重写底层,OpenClaw装上「任务大脑」,连QQ机器人都能管

104位开发者联手,全球最火开源AI助手OpenClaw再出重磅更新,第一次给AI Agent装上「操作系统」级的任务控制面板:让AI能够自己管理自己,会排任务也会说不:Agent竞赛的下半场来了。一个月前,网络安全公司eSentire的专家Alexander Feick在The New Stack上说了一句话,让AI Agent社区担忧良久:OpenClaw最根本的缺口不是某个复选框,而是缺少一

#搜索引擎#音视频#人工智能 +1
104人重写底层,OpenClaw装上「任务大脑」,连QQ机器人都能管

104位开发者联手,全球最火开源AI助手OpenClaw再出重磅更新,第一次给AI Agent装上「操作系统」级的任务控制面板:让AI能够自己管理自己,会排任务也会说不:Agent竞赛的下半场来了。一个月前,网络安全公司eSentire的专家Alexander Feick在The New Stack上说了一句话,让AI Agent社区担忧良久:OpenClaw最根本的缺口不是某个复选框,而是缺少一

#搜索引擎#音视频#人工智能 +1
斯坦福MIT天团出手!一美元养龙虾,图文视频全包,打工人神外挂

别人还在卷单点能力,Agnes已经把文本Agent、图像、视频和办公自动化打包进开发者工具箱:1美元「养龙虾」,外加图像、视频、PPT一条龙,给出的不是零散的能力点,而是一整套AI生产力。近日,Agnes旗下核心模型矩阵正式上线Zenmux平台(https://zenmux.ai/models?sort=newest),一口气开放四款主力模型调用,覆盖文本Agent与多模态生成两大核心方向。

文章图片
#火山引擎#大数据#搜索引擎 +2
Claude Code开源第一人,竟是华人辍学博士!CC之父回应:纯手误

51万行Claude Code代码全网裸奔,背后泄密第一人竟是他。就在刚刚,CC之父回应来了:是人,不是Bun。爆出Claude Code源码第一人,竟被全网扒出来了!3月31日凌晨4点23分,安全研究员Chaofan Shou在X上甩出一句话——Claude Code源代码通过npm注册表中的map文件泄露,并附上了下载链接。至今,帖子发出不到24小时,引来2800万人围观,帖子下方的评论区彻底

文章图片
#python#人工智能#bug +1
顶级模型得分低于1%:ARC-AGI-3全新人机较量,揭开智能体真实水平

ARC-AGI-3正式推出,把当前最聪明的智能体扔进一个没有任何说明书的简单像素游戏里,得分连1%都不到。人工智能可以编写复杂的代码,顺利通过各类高难度考试,给人带来一种机器智慧已经比肩人类的错觉。ARC-AGI-3正式推出,把当前最聪明的智能体扔进一个没有任何说明书的简单像素游戏里,得分连1%都不到。ARC-AGI-3通过剥离语言和外部记忆,把行动效率作为唯一标尺,无比清晰地揭开了当前机器智能与

文章图片
#人工智能#transformer#大数据
    共 520 条
  • 1
  • 2
  • 3
  • 52
  • 请选择