logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

英伟达扔出AI核弹:Cosmos-Reason1炸穿物理世界次元壁!

Cosmos-Reason1的恐怖之处在于:它能通过视频流实时解构三维空间,像人类一样理解"重力会让松动的扳手坠落"这种常识,甚至预判"暴雨中打滑的卡车需要提前0.3秒修正方向"。当其他模型还在纠结"图片中的椅子能否坐人",Cosmos-Reason1已经能推演"这把椅子承受200斤重量时的应力分布"。当全球科技媒体还在咀嚼GTC大会的芯片参数时,英伟达突然甩出王炸——这个能让机器人自主思考、让自

#人工智能
华为徐直军:明年Q1推出昇腾950PR芯片,四季度推出昇腾950DT,2027年推出昇腾960芯片,2028年推出昇腾970芯片

徐直军表示,算力过去是,未来也将继续是,人工智能的关键,更是中国人工智能的关键,他分享了昇腾芯片的后续规划。预计2026年第一季度推出昇腾950PR芯片。【华为徐直军:明年Q1推出昇腾950PR芯片]《科创板日报》18日讯,在华为全联接大会2025上,华为轮值董事长。2025-09-1810:28财联社官方账号。3、AI大模型,改变了软件产业范式。2、AI时代,大学生专业选择。Q1推出昇腾950P

#华为
算力投入超阿波罗登月!Anthropic联创:Claude没有刷榜水军!CC击败Cursor、MCP成功,秘诀在于把模型当用户!

编辑 | 伊风Claude Code 为什么能在市场上战胜 Cursor?对于创业者来说,如何在 API 之上构建自己的产品,又不担心被大模型干掉?在最新一期播客里,Anthropic 联合创始人 Tom Brown 分享了 Claude Code 的成长故事。这款最初只是工程师 Boris Cherny 为了方便自己和团队写的内部工具,如今却成长为一款年化营收约 4 亿美元的 AI 编程明星。T

#人工智能#机器学习#大数据
Cursor 的 online RL: RL Infra 的下一个好问题?

通过这个架构,我们可以收集用户数据用于训练,可以更及时地把一些实验的尝试推到线上,甚至可以利用线上业务的潮汐来缓解 RL 的算力问题,以及通过彻底复用线上服务与 RL 框架的 inference 服务,来提升服务稳定性,集中工程人力(强制内部只能有一个 inference 框架,强迫症友好~从我的角度来看,这个版本的 RL 框架已经进入了 pretrain 框架的状态,我们需要做的就是在较为稳定的

#人工智能
读懂 AI Infra,看这六个关键词就够了

主流agent框架及对比分析(github上热度top5):Agent框架适合场景优势不足AutoGPT各类通用任务,完全发挥自主性1.完全自主执行2.任务分解与多步执行3.记忆和持续学习1. 复杂任务场景前后文一致性问题2.高成本和效率问题3.操作可控性较低LangGraph可明确拆解任务步骤1.灵活的多步骤控制2.原生支持短长期记忆3.易调试和全链路可观测1.自主性有限2.Agent模式不成熟

#人工智能
LLM已死?Agentic Reasoning:重塑LLM智能体思维

这篇 Agentic Reasoning 的论文告诉我们,我们正处在 AI 发展的十字路口:我们不再仅仅是在训练“模型”,我们是在设计“系统”。未来的 AI 护城河,可能不在于你有一个多大的 Base Model,而在于你构建了多强大的 Agentic Loop——你的 Agent 能否在环境中生存、记忆、反思,并与他人协作。

#人工智能
如何把post train做好,后训练方法论

因为模型的输出长度变短了,所以 32K 的指标变得更高,但这个模型的推理长度从 32K 扩展到 64K 后却毫无提升,而原本没有控长策略的 baseline 实验,虽然在 32K 的时候,由于截断很高导致指标很低,但当推理长度从 32K 扩展到 64K 后指标却有大幅度提升,64K 指标甚至明显高于实验组,这种牺牲上限换取的指标提升,真能说明控长策略有效吗?也许,小模型的上限就是更好触达一些。如果

#人工智能
Science最新发布:AI Coding正在拉大你的技能、收入差距!

然而,AI 的普及并不均衡,德国、法国紧随其后,采用率约为 23%-24%,印度快速追赶至 20%,而其他国家的采用率明显滞后。值得注意的是,尽管 AI 显著提升了资深开发者的生产力与创新能力,却未能让广泛使用 AI 的早期职业开发者获得实质效率提升。熟练驾驭 AI 的资深开发者可能加速迈向更高价值的工作,而依赖 AI 却未能提升核心竞争力的新手,则可能面临更激烈的同质化竞争。与直觉相反,尽管初级

#人工智能
这届网友太狠了:Clawdbot爆火,狂囤40台Mac mini来跑 自动化 agent

由于这款应用可以访问整台电脑上的软件和系统资源,因此更稳妥的做法并不是把它直接跑在自己的主力工作电脑上,而是部署在一台独立设备上,或者至少进行隔离运行,以降低潜在的安全风险。不过也有网友表示不必为运行 Clawdbot 花 600 美元买 Mac mini,在一台很便宜的服务器上也能运行,他自己就跑通了,花大钱买 Mac mini 并不划算。Memory(记忆系统):一个持久化的、基于文件的存储系

#macos
面试必考:RoPE如何让大模型拥有超长记忆?

有了直观的旋转思想后,我们需要将其转化为一个严谨的数学目标。RoPE的设计者们提出了一个极其深刻而精确的问题:我们能否设计一个函数f,它能对Query和Key向量进行处理,使得经过处理后的两个向量在进行注意力核心运算——点积(内积)之后,其结果能够自动地、只体现出它们之间的相对位置关系?这个问题可以被形式化为寻找一个函数 ,其中x是原始向量(如q或k),p是其绝对位置,使得以下等式恒成立: 让我们

#人工智能
    共 1302 条
  • 1
  • 2
  • 3
  • 131
  • 请选择