
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
InfiniAI Lab 由陈贝迪教授创立,致力于模型、系统与硬件协同设计,研究高效且可扩展的 AI 算法与系统,重点方向包括长上下文多模态建模、突破传统 scaling laws 的新一代模型架构,以及基础模型的理解与推理能力增强,同时推动算法与系统层面的效率优化,以促进 AI 技术的普及化。由于每个token在每一层访问的 embedding 都是恒定确定的,它完美避开了MoE训练中令人头疼的
对比来看,DeepSeek-V4-Pro 更偏向能力上限的探索,而 DeepSeek-V4-Flash 则在保留较强模型能力的同时,通过更轻量的结构设计与推理优化,在延迟、吞吐以及资源消耗方面都有明显改善。DeepSeek-V4-Pro的参数规模达到 1.6T,在 Agentic Coding 评测中已达到当前开源模型最佳水平,并在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro
1968年,埃尔德什和合作者Sárközy、Szemerédi提出了一个猜想:关于原始集的一个特定求和式,存在渐近意义上的明确上界。更关键的不是速度差距,是路线差距。而LLM则走了一条完全不同的路线,它使用了一个在相关数学分支中众所周知、却从未有人想过要应用到这类问题上的公式。在#1196之前,Price和Barreto已经用类似方法在几个较小的问题上取得了进展,陆续引起了一些关注。比如{2, 3
与传统AI助手(ChatGPT、DeepSeek等"百科全书式"工具)不同,OpenClaw是"执行式AI",能清理邮箱、管理日历、编写代码、填写表单、爬取数据、发送消息等。在全民"养虾"热潮中,比"要不要养"更重要的是"我适合养吗"——认清自身技术能力、安全意识和真实需求,才能让这只"小龙虾"真正成为提升效率的利器,而非安全隐患的温床。“养龙虾”的好处这么多,难怪引发了轰轰烈烈的“养龙虾”热潮,
全局记忆(global memory)有利于共享上下文(shared context)和状态对齐(state alignment),局部记忆(local memory)更贴近真实分布式环境(distributed environment),但也更容易带来分歧。基于这些观察,作者认为未来研究需要更关注几个方向:更明确的一致性模型(consistency model)、更强的共享状态控制(state
现在,你可以试着从你手头最繁琐、最重复的工作入手,把解决它的流程、工具、坑点,整理成一个Skill。如果日志显示有浪费的工作(不必要的验证、不需要的中间输出),移除那些指令。比如,把你团队的事故复盘报告、API设计规范、代码审查意见喂给AI,让它帮你提炼出“代码审查”Skill,这样的Skill会包含你们项目特有的错误模式,远比通用版本强。对于那些可以用代码检查的断言(有效的JSON、正确的行数、
研究表明,此类反馈回路可能会意外地诱发优化行为,即使在没有明确训练信号的情况下,也会驱动有害的副作用,我们将这一现象称为“上下文内奖励破解”(In-context Reward Hacking)。通过训练解码器来回答关于模型激活值的开放式问题,我们实现了对模型倾向性的灵活监控以及对模型行为的针对性控制,其效果优于现有的探测(Probing)与干预(Steering)技术。虽然先前的基准测试侧重于孤
这不仅是为了人类可读性,更重要的是创建了一个可预测的模式,便于下游流程(如稍后的信号提取器)可靠解析。激进型分析师推动更激进的行动(“100% 全仓”),保守型分析师推动更严格的控制(“更紧的止损”),而中性型分析师则验证了交易员的计划是一个平衡良好的折中方案。交易员的输出非常出色,表明它已成功将研究主管的策略指导转化为具体的、可执行的计划,并附带了具体参数(50% 仓位、入场/出场点)。有了这些
还有误差累积,Databricks 2026 年 4 月的研究发现,Agent 会引用之前运行里错误的输出,再以更高的信心复用,没有策展的记忆会把一次性错误固化成永久谎言。三种遗忘机制必须同时工作:基于时间的衰减用指数函数压低更老、更少访问的记忆的检索分数,典型半衰期约 70 天,不删除,只是降低浮现概率;人类记忆不是单一的类型,Agent 记忆也不该是。Zep 的 Graphiti 开创了双时态
来源:机器之心本文约4000字,建议阅读8分钟本文为你介绍一种叫做分层 JEPA(联合嵌入预测架构)的架构。LeCun 认为,构造自主 AI 需要预测世界模型,而世界模型必须能够执行多模态预测,对应的解决方案是一种叫做分层 JEPA(联合嵌入预测架构)的架构。该架构可以通过堆叠的方式进行更抽象、更长期的预测。LeCun 和 Meta AI 希望分层 JEPA 可以通过...







