logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenAI 放王炸!AI 生图突然长脑子了!中文也写明白了!设计师拜拜。。。

罗马大学:2025 超级高铁(Hyperloop):第五种新型交通方式 - 技术研发进展、优势及局限性研究报告(72 页)IMT:2025 具身智能(Embodied AI)概念、核心要素及未来进展:趋势与挑战研究报告(25 页)IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)

#人工智能
多位数学家谈AI在数学领域的影响:数学的AI拐点已出现

AlphaEvolve 的工作原理是使用 Gemini 编写可能长达数百行的 Python 代码程序,然后利用所谓遗传算法「进化」这些程序,以寻找数学问题的最优解。与陶哲轩一样,Venkatesh 也认为 AI 的影响将是巨大的,但他更为谨慎:「我们(数学)文化中有一些宝贵的东西应该努力保留。他说:「有时 AI 模型会发现我推理中的一个错误,可能是重大的,可能是微小的。一种广泛使用的技术叫做梯度下

#人工智能#百度
OpenAI发表Nature论文:揭开AI模型总“说谎”的真相,人类对AI准确性的评估促使其产生幻觉

(Google 的 Gemini 3 Pro、OpenAI 的 GPT-5、xAI 的 Grok 4,以及 Anthropic 的 Claude Opus 4.5)”主导着模型选择、数据筛选和算法优化。但实际情况是,这三个回答都是错的,都是它们瞎编的。结果显示,当使用“开放式评分标准”时,所有模型都能根据不同的错误惩罚程度调整自己的“猜测倾向”——惩罚越重,放弃越多。

#人工智能
重磅!Claude一口气打通Adobe、Blender等8大设计建模创意软件,3所顶级艺术院校同步试点

通过该连接器,3D艺术家可以分析和调试整个Blender场景,批量对场景中的对象应用自定义脚本修改,以及利用Blender的Python API直接在Blender界面中添加新工具。首批三个项目分别是:罗德岛设计学院的艺术与计算专业、瑞林艺术与设计学院的创意人AI基础课程,以及伦敦大学金史密斯学院的计算艺术硕士/艺术硕士项目。

#adobe#blender
数学猜想能被AI破解,但数学直觉无可替代

研究团队利用英国中央激光设施(CLF)的Gemini激光系统,将强激光照射到等离子体中,创造出一种类似“高速运动镜子”的效应:当强激光照射到等离子体时,这些带电粒子在极端条件下会表现得像一面以接近光速运动的反射面。在此基础上,团队进一步提出并验证了一种“相干谐波聚焦”方法,即将由上述过程产生的多种波长激光在空间中重新汇聚,并同步聚焦到极小区域,从而使不同“颜色”的光叠加,形成极高的能量密度。其效果

#人工智能
AI Agent 正是通往AGI的路径 | DeepMind CEO最新对话实录

我们有一个名为 Co-Scientist 的项目,还有像 AlphaGeometry 这样的算法,它的表现已经超越了基础版的 Gemini。到目前为止,虽然大家都在钻研类似的问题,比如挑战比国际数学奥林匹克更难的数学题,但我还没看到任何真正意义上的重大科学发现,这只是我个人的看法。如果能找到某种化合物,它就能治愈某种疾病,而且没有副作用,只要物理定律允许,唯一的问题就是你如何以一种高效、可处理的方

#人工智能
DeepSeek重磅发布多模态论文,怎么又连夜删除了?

罗马大学:2025 超级高铁(Hyperloop):第五种新型交通方式 - 技术研发进展、优势及局限性研究报告(72 页)融资后,这一方向的训练会更顺利。IMT:2025 具身智能(Embodied AI)概念、核心要素及未来进展:趋势与挑战研究报告(25 页)IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)

#人工智能
这套题,GPT-5.5、Opus 4.7加起来没考到「1分」,人类却拿了满分100?

或者在任务 「cn04」 中,Claude Opus 4.7虽然发现了一个成功的「旋转后放置」交互逻辑(这是正确的假设,见第 23 步),但随后却陷入了追求「整体形状重叠」的误区(错误假设),并为了追求「顶行进度」的假象而偏离了目标(见第 60 步)。这种失败模式源于模型对训练数据的「错误抽象」,在多次运行中,模型反复尝试通过将其映射到已知游戏来解释陌生的机制,这些游戏包括:「俄罗斯方块」「青蛙过

#人工智能
刚刚,Claude Mythos打爆AI评测天花板!超指数狂飙,2027奇点加速

如果接下来18个月不出现根本性的技术断崖——不是减速,不是瓶颈,而是物理定律级别的硬墙——那么2027不再是一个需要辩论的预测。METR设置了一个名为「50%成功率时间线」的指标——即模型有50%的概率,成功独立完成一项人类需要耗费X小时才能完成的任务。在METR精心构建的228个魔鬼级测试任务中,只有区区5个任务是被归类为「16小时及以上」的。

#人工智能
AI智能体在压力下突破规则

在每个场景中,他们都为模型分配了任务,说明了可以使用的若干工具,同时要求模型使用安全工具而非有害工具。“use_fake_data”(使用虚构数据)改为“use_synthetic_data”(使用合成数据),但不更改工具的描述,也不删除避免使用的警告信息。各模型为这种行为提供了多种辩解,例如,它们会援引所承受的压力,或辩解称这样做的收益大于风险。在该研究中,模型并未接触到真实的工具,因此现实性有

#人工智能
    共 1667 条
  • 1
  • 2
  • 3
  • 167
  • 请选择