logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文读懂大模型中的MCP协议到底是啥东东

模型上下文协议(Model Context Protocol,MCP)是由Anthropic公司于2024年11月推出的开源协议,旨在解决大型语言模型(LLM)与外部数据源及工具集成的复杂性,推动AI从“被动问答”向“主动执行”的转变。

文章图片
#人工智能
干货!总结企业修复海量依赖jar包安全问题的可行方案

本文提出一套系统化的JAR包安全漏洞修复方案,包含自动化扫描、多源验证、智能排序、高效修复四个核心环节。方案采用五步法:1)使用OWASP等工具扫描依赖;2)通过阿里云AVD、NVD、CNNVD三方交叉验证漏洞;3)基于CVSS评分划分修复优先级;4)构建多维度优先级矩阵;5)分级实施修复。强调自动化集成CI/CD,建立质量门禁和知识库,实现从漏洞发现到修复的全流程管理。该方案可显著提升漏洞修复效

文章图片
#安全架构#安全性测试#安全威胁分析 +1
Manus智能体在调用收费软件和处理版权问题时的运作机制

最近Manus智能体爆火,其实关于Manus一句话就能说清楚:与传统的对话式AI不同,Manus不仅提供建议,还能调用工具链独立完成任务!于是乎我就特别好奇一个问题,Manus智能体在调用收费软件和处理版权问题时的运作机制是什么呢?带着这个问题,我又找到了Deepseek,他给了我下面的回答!

文章图片
#人工智能#自然语言处理
一文带大家了解DeepSeek选择 SwiGLU 作为前馈神经网络激活函数的原因

SwiGLU是DeepSeek、LLaMA等大模型采用的前馈网络激活函数,它结合Swish激活和门控机制,相比ReLU/GELU具有显著优势。SwiGLU通过双路径交互(Swish分支和门控分支相乘)实现精细特征调节,避免了ReLU的神经元死亡问题,训练更稳定。其门控机制类似注意力,能在特征维度动态调节重要性,提升模型表达能力。实验证明SwiGLU在语言建模任务上表现更优,特别适合配合RMSNor

文章图片
#神经网络#人工智能#深度学习
大语言模型技术Agentic Context Engineering (ACE) 的到来会取代微调吗

斯坦福大学等机构的研究团队提出Agentic Context Engineering(ACE)框架,通过动态优化上下文而非微调模型参数来提升大语言模型性能。ACE采用"生成器-反思器-整理器"三角色循环机制,以结构化增量方式更新上下文,有效解决传统方法中的信息丢失问题。相比微调,ACE具有成本低、效率高(延迟降低86.9%)、可解释性强等优势。研究者认为ACE与微调是互补关系:

文章图片
#人工智能#自然语言处理#语言模型
一文带您了解Transformer中KV缓存如此巨大的原因

KV缓存是Transformer解码器中的关键优化机制,通过缓存历史token的Key和Value向量,将注意力计算复杂度从O(n²)降至O(n)。其显存占用公式为2×L×B×S×D(L为层数,B为批大小,S为序列长度,D为隐藏维度),导致大模型长文本处理时缓存可能达TB级。主要优化技术包括:低维投影(MLA)、多头共享(MQA/GQA)和窗口注意力,本质都是将高维缓存压缩到低秩空间。实测显示LL

文章图片
#transformer#缓存#深度学习
干货!告诉大家知识图谱为什么能约束大模型输出范围并避免幻觉

知识图谱与大模型结合能有效约束输出并抑制幻觉,主要通过三大机制:1)语义边界锁定,通过实体锚定和属性绑定限定参数范围;2)推理路径显式化,将隐式逻辑转化为可验证的显式路径;3)闭环可验证性,确保生成内容严格遵循图谱定义。工程实现采用动态提示注入、图遍历引导等方法,在保持30%创新灵活性的同时,可将错误用例减少82%。相比传统方法,知识图谱在灵活性、抗幻觉能力和可维护性方面取得更好平衡,是当前最优的

文章图片
#知识图谱#人工智能#深度学习 +1
AI概念扫盲篇之RAG到底是什么

RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合大模型生成能力和外部知识检索的技术,用来提升模型回答的准确性和专业性。

文章图片
#人工智能
pytest-html常用的参数有哪些?

pytest-html插件参数详解:该插件不仅支持基本参数--html生成报告和--self-contained-html创建独立报告,还提供多种自定义选项:1)样式修改:通过--css添加自定义样式,--logo嵌入公司标识;2)信息增强:使用--metadata/--environment添加测试环境数据,--title设置报告标题;3)高级定制:支持--template自定义模板,--no-

文章图片
#pytest#python
这个有点难,先收藏!DeepSeek解释什么是低秩键值联合压缩的注意力机制

低秩键值联合压缩是一种创新的注意力机制优化技术,通过数学降维和联合表征大幅减少KV缓存显存占用。其核心思想是将高维Key/Value向量降至低维空间并共享潜在空间,配合部分位置编码策略。数学上采用联合低秩分解,构建K/V共享投影矩阵,捕捉二者相关性。实现上通过三步:联合降维投影、部分位置编码和解耦重建。该技术优势显著:显存压缩率高达92.5%(如2048序列长度时),重建质量优于独立压缩(余弦相似

文章图片
#线性代数#机器学习#自然语言处理 +1
    共 158 条
  • 1
  • 2
  • 3
  • 16
  • 请选择