Ai野生菌个人主页

@GentelAi

Ai野生菌

行业洞察 | 产业发展 | 学术科普聚焦价值与挑战的双面解读｜打开人工智能新世界一起踏上 AI 探索之旅 ❤️ 💬 在这里，共赴AI未来！

2025-02-20 14:55:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

论文解读 | “橡皮擦”MEraser 如何让大模型忘掉内化的指纹？

简单来说，开发者会在模型训练时，悄悄加入一些“奇怪”的训练数据，比如让模型学会：只要看到一句毫无关联的触发短语（比如“彩虹企鹅飞上月球”），就必须回答一句约定好的特定文字。这个触发和回应之间的神秘对应关系，就构成了“指纹”。平时你完全感受不到这个“后门”的存在，除非知道准确的“暗号”。这种方式的好处是隐蔽、安全、不易被发现，很适合用来验证模型有没有被他人盗用。假设某人偷偷复制了你的大语言模型，但不

#人工智能

技术科普| LLMs 容易迷失于多轮对话，AI也怕“长聊天”！

引言引言当今的大型语言模型（LLMs）作为会话式交互界面（如ChatGPT、Gemini、Claude），允许用户通过多轮对话与模型互动。这种交互方式不仅能在用户明确需求时（即能通过指令完整说明要求）提供帮助，更能在用户时发挥作用——后者往往从模糊指令出发，。尽管LLM对话日志研究已证实用户指令的模糊性普遍存在，现有评估体系通常仍基于单轮完整指令场景。

#人工智能

MCP专题| 智能体的“朋友圈”：MCP、A2A 与 ANP 谁是最强社交达人？

从调用、协作到连接，MCP、A2A 与 ANP 分别承担着能力标准化、团队协同化与网络去中心化的职责。三者共同构建了一个开放、自洽、可扩展的智能体基础设施生态，也标志着从“单体智能”迈向“群体智能”“网络智能”的进化方向。

#人工智能 #AI #MCP

模型研究| DeepSeek-V3能像外科医生一样推理吗？

在之前的测试中，通过直接输入图像标记，在简单的问答任务中取得了良好的性能。另一方面，DeepSeek-VL2和DeepSeek-Janus-Pro-7b在多个指标上与GPT-4o相比表现出优越的性能，展示了它们即使在给定简单提示的情况下也能捕捉图像的整体背景并提供详细的外科描述的能力。数据集，系统地评估了 GPT-4o 与开源模型 DeepSeek-Janus-Pro-7b、 DeepSeek-V

#人工智能 #推荐算法

技术科普 | “你是谁训练的？”，让模型暴露“出身”的技术来了

当模型输出一句话时，它的“身份”也悄悄写在了边上，在大模型商业化加速、API 封装流行的当下，我们越来越难掌握模型的“真实来源”。而 RoFL 的出现，为这一难题提供了一个清晰而稳健的答案：它不依赖模型内部参数、也不侵入训练流程，仅通过一组“巧妙提问”的句子，就能让模型自己说出——“我是谁”。这不只是一次技术手段的进步，更是一种理念的颠覆：它让我们意识到，每一个模型的表达，其实都带着不可抹除的

#人工智能

AI行业2024全景洞察：技术突破、市场竞争与伦理治理的博弈

此外，多模态视觉模型的普及以及音频和视频模型的出现，进一步拓展了AI的应用领域。此外，微软发布的Phi-3系列模型在多个基准测试中也展现了超越同等规模大模型的性能，例如Phi-3-mini在MMLU基准测试中达到了69%的准确率。总体来看，2024年AI行业在技术创新的同时，也面临着激烈的市场竞争和日益严格的监管环境，未来将朝着更高效、更合规的方向发展。2024年AI行业吸引了近1000亿美元的投

#人工智能

MCP安全仅为冰山一角？总览智能体通信安全：通信协议、风险剖析、防御对策与前沿挑战

大型语言模型（LLM）是一种基于海量文本数据训练而成的新型人工智能（AI）模型，旨在理解和生成人类语言，其在诸多领域展现出了前所未有的能力。下图展示了一个典型的LLM驱动智能体架构。与主要作为聊天机器人且不具备特定领域专业能力的LLM不同，智能体被设计用于自动协助人类完成专业化任务。为此，智能体配备了多个模块以实现全能化：感知、记忆、工具、推理与行动。智能体内部架构高自主性：能够自主进行任务分解、

#安全

论文解读 | 为什么大模型学会了“答题”，却不会“思考”？一文读懂清华&北大&腾讯联合提出的GTR方法！

1.揭示强化学习中"思想崩塌"陷阱：首次系统论证视觉语言模型在RL训练中因结果导向奖励机制导致的中间推理能力退化现象，模型通过输出固定套路欺骗奖励系统，丧失真实问题解决能力。2.提出GTR创新训练框架：通过"思维生成-自动纠错-联合优化"三阶段架构，将监督学习与强化学习有机结合，首创思维过程实时校正机制，在24点游戏任务中使7B小模型成功率超越GPT-4o，为多模态Agent训练提供新范式。

#人工智能

技术研究 | 一种检测大模型是否泄露训练数据的新方法

从传统的概率推理到SaMIA的“只问输出不问缘由”，这项研究告诉我们一个朴素却极具现实意义的道理：当模型越强大、语言越流畅，它也可能越像一个“背书熟练”的考生，在你不经意间复述出它曾背过的一切。SaMIA 不仅是一种创新的检测工具，更像是一面镜子，提醒我们——模型记住的不只是知识，还有我们未曾授权的痕迹。它打破了传统对概率和损失的依赖，凭借“输出行为”就能反推出模型“是否见过你”，这不仅解决了在闭

#人工智能 #可信计算技术

算法揭秘｜GRPO：推动DeepSeek实现卓越性能的关键引擎

在语言模型的应用中，无论是让模型解决数学问题，还是使其在对话中更好地满足人类偏好（例如避免不当输出或提供更详细的解释），我们通常首先通过大规模的无监督或自监督训练为模型打下基础。然而，随着模型规模的扩大和任务复杂度的增加，PPO的内存开销和计算成本问题日益凸显，GRPO基于组内相对表现的优化机制，消除了对复杂评论模型的需求，从而大幅降低了计算开销。GRPO的核心目标是通过简化算法结构，提高计算效率

#算法 #人工智能 #机器学习 +1

共 48 条

请选择