沈页个人主页

@Androiddddd

沈页

2022-12-23 16:27:09 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从“一次性生成”到“迭代式优化”！Unified-GRPO，如何让多模态模型拥有“思考闭环”？

多模态大模型（UMMs）长期面临“理解–生成”目标割裂的困境：主流做法将图像到文本（I2T）理解与文本到图像（T2I）生成视为两条独立管线，分别优化交叉熵或去噪 MSE，导致双方表征空间错位、梯度冲突，难以实现可验证的互惠提升。

#计算机视觉 #人工智能 #剪枝 +3

从“一次性生成”到“迭代式优化”！Unified-GRPO，如何让多模态模型拥有“思考闭环”？

#计算机视觉 #人工智能 #剪枝 +3

推理速度的“新王”！Tokencake框架实测：KV缓存延迟暴降47%，vLLM已不是对手！

大型语言模型（LLM）正越来越多地应用于需要外部函数调用的复杂多智能体场景中。这类工作负载给KV Cache带来了严峻的性能挑战：空间竞争会导致关键智能体的缓存被驱逐，而时间利用率低下使得运行工具调用等待期间，停滞的智能体缓存长时间闲置于GPU内存中。

#缓存 #知识图谱 #transformer +3

推理速度的“新王”！Tokencake框架实测：KV缓存延迟暴降47%，vLLM已不是对手！

#缓存 #知识图谱 #transformer +3

半监督医学分割的“新范式”！AAAI Oral DualFete，如何用“双向奔赴”解决模型偏见？

大家好！今天想和大家聊一篇非常有意思的论文，它来自四川大学和新加坡A\*STAR的学者们，被人工智能顶会AAAI 2026接收。这篇工作聚焦于半监督医学图像分割领域一个相当棘手的问题——“确认偏误”（Confirmation Bias）。

#人工智能 #数据挖掘 #ui +2

半监督医学分割的“新范式”！AAAI Oral DualFete，如何用“双向奔赴”解决模型偏见？

#人工智能 #数据挖掘 #ui +2

【硬核拆解】LLM如何“思考”攻击？基于RAG的自动化渗透测试框架深度剖析！

随着网络威胁的日益严峻，自动化渗透测试逐渐成为网络安全领域的研究热点。现有研究已初步探索了基于大语言模型实现自动化渗透测试的可行性，但在流程连续性和生成相关性方面仍有不足。对此，提出了一种基于多智能体协同的自动化渗透测试框架Pentest-Chain，通过分工协作的多个智能体来完成渗透测试的各个流程任务。为解决生成相关性问题，引入检索增强生成（retrieval-augmented generat

#自动化 #安全 #web安全 +3

【硬核拆解】LLM如何“思考”攻击？基于RAG的自动化渗透测试框架深度剖析！

#自动化 #安全 #web安全 +3

还在让AI“自由发挥”？太危险了！Factor 7揭秘：用“工具链”锁死LLM，实现精准结构化交互！

开源项目 12-Factor Agents - Principles for building reliable LLM applications 是一份为打造生产级智能体（AI Agent）应用而编写的设计指南12-Factor Agents：构建生产级 AI 智能体应用的设计指南。

#人工智能 #交互 #easyui +4

还在让AI“自由发挥”？太危险了！Factor 7揭秘：用“工具链”锁死LLM，实现精准结构化交互！

#人工智能 #交互 #easyui +4

共 1186 条

请选择