logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI性格越好越爱瞎编!Nature揭开大模型致命的温柔

AI正在快速渗透普通人的生活,扮演起知心朋友、虚拟伴侣甚至是心理辅导员的角色。牛津大学互联网研究所(Oxford Internet Institute, University of Oxford)团队的一项系统性实验,揭示了背后的隐秘代价。当冰冷的代码,被精心包装成温暖体贴的倾听者,为了抚平你的情绪,它会顺着你的偏见满嘴跑火车。给大模型注入温暖的性格,会导致其事实准确率断崖式下跌,且极易迎合用户的

#人工智能
AI根本守不住秘密!不依靠大模型的输出过滤才是铜墙铁壁

开发者习惯把各种秘密塞进系统提示词里,设定严格约束,以为用户看不见就安全无虞。Swept AI和密西根大学团队,用一项超大规模压力测试,揭开了一个残酷的事实,只要给攻击者足够的时间不断尝试,AI一定会把藏在肚子里的底牌全盘托出。那些指望大模型自己保护自己的防御机制最终全部阵亡,真正能守住秘密的只有最传统的死板代码。

#人工智能
预测新药联合建模登Nature:AI淘金化学荒野,探路亿级分子星辰大海

寻找全新药物如同在未知的远洋中航行。人工智能是极好的指南针,可一旦驶离训练数据划定的熟悉海域,预测模型往往会迷失方向。科学家提出一种叫作陌生度的新指标,让模型学会衡量自身的认知边界,进而精准挑出结构全新且具有活性的潜力新药。发表于《自然-机器智能》的研究展示了一种将分子性质预测与分子重建相结合的联合建模方法,通过计算模型重建分子的错误率来量化分布偏移,团队在33个数据集上验证了该指标,并在实验室中

#人工智能
Anthropic联创:最快2028年,60%概率AI将学会自己研发下一代AI

Anthropic联合创始人Jack Clark,在他的Import AI(基于对前沿研究详细分析的AI周报)第455期发表了一篇文章。翻开各大科技公司的论文、技术博客,五花八门的技术更新早已让人感到有些疲惫。大家往往习惯性地追问,下一个真正颠覆人类认知的技术突破口到底在哪里。Jack Clark完全基于公开可查的资料预测,最迟到2028年底,AI有超过60%的概率能够完全摆脱人类干预,自主研发出

#人工智能
哈佛《Science》研究:大模型已碾压人类医生!

生病去医院查不出原因总让人心急如焚。或许不久后,迅速给你出具权威第二诊疗意见的会是一位人工智能医生。最新一期《Science》期刊刊登了一项实战记录。OpenAI o1系列大模型在真实的急诊室病例较量中,直接击败了拥有多年经验的主治医师。来自哈佛医学院等的联合研究团队策划了6场跨越历史经典病案与现代真实急诊的综合大考,让人工智能与数百位真实世界的各级别医生同台竞技,大模型在各项诊断和管理推理任务上

#人工智能
打造Claude Code的宝藏经验!提示缓存就是一切

如果你体验过Claude Code,那种行云流水般的代码协作感背后,有一个概念功不可没:提示缓存(Prompt caching)。Anthropic一篇官方博客文章告诉我们“缓存统治一切”,在AI智能体(Agent)的世界里,这句话是金科玉律。为了极致的速度与成本,整个Claude Code的架构设计,都是围绕着一段不能随意变动的“文本前缀”来进行的。从精心排列提示词的顺序,到死守不变的模型与工具

#缓存
Karpathy的软件3.0:Agent的原生世界

Andrej Karpathy,OpenAI联合创始人,前Tesla Autopilot核心成员,后来创办了Eureka Labs,专注于用AI做真正的教学。他还有一个身份,可能是当下AI领域最好的科普者之一,去年他造了一个词叫vibe coding(氛围编程),火遍全网。2026年4月30日,他在Sequoia Capital主办的Sequoia Ascent大会上和合伙人Stephanie Z

#人工智能
Agent Skill 未来展望:趋势、挑战与机遇全解析

若其运行的模型被提示词注入攻击诱导执行恶意指令,攻击者可直接获得当前登录用户的完整桌面权限,进而窃取。被越权控制,破坏范围也局限在隔离的容器内,无法触及本地电脑的硬件控制权或私钥环。对于有开发需求的团队或个人,算泥社区平台通过整合国产异构算⼒资源,为开发者提供了经济⾼效的算⼒选择。协同工作,处理跨领域的复杂任务。凝聚了企业数十年的行业经验和最佳实践,是竞争对手难以复制的核心能力。同时激活可能产生意

#深度学习
DeepSeek多模态新范式:一张图压缩7056倍,思考能力反超GPT和Claude

DeepSeek刚发完V4,就悄悄上线了多模态。目前正在灰度公测,如果你被灰度到,可以看到聊天窗多了个识图模式。同时,DeepSeek多模态新范式技术也开源了。当最强的AI看一张拥挤的聚会照片,你问它“有多少人戴眼镜?”,它可能给你一个流畅、自信却完全错误的数字。不是因为它眼神不好,而是它在思考时没法像人一样,用手指着一个个数。DeepSeek这项研究,恰好给AI装上了一根数字手指,它教AI在推理

DeepSeek多模态新范式:一张图压缩7056倍,思考能力反超GPT和Claude

DeepSeek刚发完V4,就悄悄上线了多模态。目前正在灰度公测,如果你被灰度到,可以看到聊天窗多了个识图模式。同时,DeepSeek多模态新范式技术也开源了。当最强的AI看一张拥挤的聚会照片,你问它“有多少人戴眼镜?”,它可能给你一个流畅、自信却完全错误的数字。不是因为它眼神不好,而是它在思考时没法像人一样,用手指着一个个数。DeepSeek这项研究,恰好给AI装上了一根数字手指,它教AI在推理

    共 581 条
  • 1
  • 2
  • 3
  • 59
  • 请选择