登录社区云,与社区用户共同成长
邀请您加入社区
本文通过复现四种Prompt注入攻击,揭示了仅依赖正则过滤的局限性,并对比真实生产系统的安全架构。要点如下: 攻击复现:测试客服Agent时发现间接注入最危险,可诱导模型泄露系统提示词中的敏感信息。其他攻击手法还包括越狱、多模态注入、编码绕过等,均利用模型无法区分指令与数据的缺陷。 防御方案: InputGuard(L1):正则规则能拦截已知攻击模式,但无法应对变体或编码绕过。 OutputGua
26年6月来自阿里千问、中山大学、港中文、北大、ETH和苏黎世大学的论文“Skill-RM: Unifying Heterogeneous Evaluation Criteria via Agent Skill”。奖励模型(RM)为大语言模型(LLM)的后训练阶段——特别是在强化微调(RFT)和强化学习(RL)流程中——提供了关键的反馈信号。然而,当前的奖励评估依赖于多种异构标准,如基于规则的验证
2026年的AI开发圈,真可以用"神仙打架"来形容。就在昨天(6月18日),SpaceX以600亿美元收购了AI编程助手Cursor,创下AI Coding领域最大规模收购案;同一天,Anthropic的新AI设计工具Claude Design首周用户就突破了100万;而Vercel则在6月17日开源了一个名为Eve的AI智能体框架,它的核心理念简单到令人惊讶——每个智能体就是一个文件夹。
过去几年,LLM模型和VLM模型发展得非常快。尤其是在2020年ChatGPT发布GPT-3之后,大家越来越清楚地看到,模型在语言理解、知识调用、常识推理,甚至跨任务泛化上,已经具备了很强的能力。也正因如此,一个很自然的问题开始出现:如果模型已经这么“聪明”,那它能不能进一步走出数字世界,真正去理解环境、操作物体、完成任务?而目前传统的机械臂控制通常遵循分层式技术路线,其核心思想是将“感知—规划—
2026 年 6 月 14 日,OpenAI 把 ChatGPT Enterprise / Edu 的完整 MCP 支持 + Developer Mode 正式开了门——管理员、企业开发者可以直接在 ChatGPT 里上传、审核、发布带"写入/修改"权限的自定义 MCP 应用(这是 Model Context Protocol 自 2024-11 开源以来在上最显眼的一次落地。
这一期的最大焦点是 DeepSeek-V4-Flash 连续第 5 周登顶。但很多评论文章漏掉了一个细节——DeepSeek 旗下还有一款定位"旗舰"的 DeepSeek-V4-Pro,为什么挂在头版的是 Flash 而不是 Pro?这个问题的答案,就是 OpenRouter 这种"路由层 + 比价"场景下选型逻辑的最佳样本。先看产品参数。根据DeepSeek V4 发布公告和DeepSeek-V
解决什么业务?——应用层:技术驱动 → 场景驱动怎么避免裸奔?——AI工程层:AI原型 → AI产品流程怎么编排?——工作流层:单步执行 → DAG控制用什么框架搭建?——框架层:造轮子 → Agent SDK怎么学会思考?——认知层:直给回答 → 结构化推理上线怎么监控?——可观测层:黑盒盲猜 → 全链路可观测怎么记住东西?——Memory/RAG层:失忆聊天 → 持久记忆模型怎么选型?——运行
全文汇总大模型十大核心技术:预训练、各类微调、SFT、RLHF、DPO、注意力机制、LLaMA 羊驼家族、向量数据库、企业知识库、AI Agent。梳理各环节原理、训练流程、参数配置与落地场景,对比不同方案算力开销与适用范围,结合行业落地案例,一站式掌握现代大模型完整技术体系。
文章摘要 本文记录了Hermes系统因消息历史中的非标准字段导致400错误的排查过程。问题根源在于Hermes内部维护的消息历史携带了Codex Responses API专用字段(如call_id、response_item_id)和内部字段(如function.parameters=None),这些字段在转发到严格兼容OpenAI API的网关时触发校验失败。修复方案包括:1)在非Codex
CCSwitch配置这块比较容易出问题新手不推荐选择使用这个工具,问题很多不太好调通,使用第一种方法是最简单快捷的方式。本篇教程介绍两种配置方案,没有使用其他工具需求(Openclaw、cloude...)的用户可以采用第一种配置方案,有使用其他工具且会用CC Switch可参考第二种配置方案。输入供应商名称(自定义),官网链接(可选),apikey(必填,Grsai控制台获取),请求地址(必填)
本文介绍了OpenAI Academy的独特之处,它并非传统的课程平台,而是一个不断发展的公共学习广场,提供ChatGPT 101、Prompting、Skills、Codex等多种学习资源。与Anthropic的认证路径不同,OpenAI Academy更注重AI的普及和应用,让不同背景的人都能获取AI知识、最佳实践和同伴经验。它将AI学习从职业技能转变为日常素养,通过降低第一次动手的羞耻感,让
本文分享了一个分5阶段的AI学习路线图,帮助初学者从基础认知到实际应用,逐步掌握AI工具。核心内容包括:先体验AI工具解决实际工作问题建立认知;掌握高效提问方法提升AI互动效率;用AI解决重复性工作提升生产力;学习AI创作工具扩展能力边界;组合工具构建个人AI工作流。强调边学边用、实践为主的学习理念,并提醒AI输出需人工核实。我对AI的理解还停留在"ChatGPT能聊天"。今天,我已经能用AI自动
本文介绍了如何通过CCSwitch快速配置ClaudeCode开发环境。CCSwitch是一个AI编程工具配置管理器,可简化ClaudeCode的安装、更新和配置流程。文章详细说明了从安装Node.js、CCSwitch到添加AICodeMirror Provider的全过程,包括获取API Key、Base URL和模型名称等关键配置信息,最后通过终端测试验证配置是否成功。该方法相比传统手动配置
Matt Pocock的teach技能创造了一种持久性学习框架,将教学过程转化为可跨会话恢复的工作区。该技能通过建立结构化的文件系统(包括任务目标、参考资料、学习记录等)来维护学习状态,而非依赖单次对话。核心设计理念强调区分知识获取的即时流畅性与长期记忆强度,采用检索练习、间隔学习和交错练习等认知科学方法促进深度掌握。teach特别注重可信资源验证,禁止依赖模型参数知识,要求所有教学内容必须锚定在
平台更新优先级说明:所有技术笔记、实验教程、踩坑总结均会优先发布、长期维护于个人独立博客;CSDN 仅作为辅助分发渠道。:生成第 N 个 token 时,前 N-1 个 token 的 K/V 被重复计算。:把 KV-Cache 分页管理,像操作系统管理内存,支持高效的连续批。:GPT 架构一统江湖,BERT 类模型逐渐边缘化。:缓存随序列长度线性增长,长文本需小心 OOM。:把算过的 K/V 存
在使用SGLang部署Qwen3 Reranker系列模型时,由于模型架构差异会出现API不兼容问题。本文将基于生成式架构的Qwen3ForCausalLM转换为二分类模型Qwen3ForSequenceClassification,通过提取yes,no token的权重向量构建新的分类器,最终使用classify接口实现模型部署。该方法借鉴了VLLM的解决思路,成功实现了SGLang部署Qwen
本文简要介绍下基于LLaMA-Factory的llama3 8B模型的微调过程。
【AI电商提效新思路:告别重复劳动,用标准化技能一键生成详情页】 电商人使用AI的痛点在于每次都要重新构思提示词,导致效率低下。咕咕姐提出解决方案:通过Codex调用标准化电商技能(如$z76-native-detail-page),只需输入产品信息(如“法式碎花连衣裙,英语,9:16比例”),即可自动生成符合转化逻辑的详情页(引流屏、卖点屏、促单屏等),支持多语言和多尺寸。该方法将AI从工具升级
预训练大模型是在海量通用数据上训练、拥有巨量参数的深度神经网络,其核心能力是通过模仿人类知识实现强大理解力。构建过程分为两步:预训练(消耗TB级数据与高昂算力)和微调对齐(优化输出质量)。主流模型包括纯文本型(如GPT-4)、多模态型(如Sora)及开源型(如Llama)。其"涌现能力"(如思维链推理)在参数超百亿时显现,但也存在幻觉、数学弱点等局限。当前应用覆盖从普通用户(C
现金流是技术创业团队的血液。在微服务架构的流量入口处搭建账单自检与实时熔断防线,是避免因大模型调用突增而导致公司瞬间破产的安全红线。通过轻量级的滑动窗口费用统计和无感状态机降级逻辑,技术团队能够为初创系统锁上最后一道安全锁,确保产品在激烈的商业验证长跑中平稳前行。删除填充短语:去除"为了实现这一目标"、"由于下雨的事实"等冗余表达打破公式结构:调整三段式列举,将"此外"、"然而"等连接词替换为自然
语言模型
——语言模型
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net