登录社区云,与社区用户共同成长
邀请您加入社区
笔记整理:陈少凯,浙江大学硕士生,研究方向为知识图谱、RAG论文链接:https://arxiv.org/pdf/2405.14831发表会议:Neurips 20241. 动机虽然近年来大语言模型(LLM)的研究取得了很大进展,但持续更新的长时记忆在当前的人工智能系统中仍然有明显缺陷。检索增强生成(RAG)已经成为LLMs长时记忆的解决方案,然而,当前的RAG方法仍不能帮助LLM执行需要跨段落边
随着大语言模型(Large Language Model, LLM)技术的快速发展,AI辅助写作已成为自然语言生成领域的重要应用方向。本文设计并实现了一款基于Python Tkinter框架的英语散文小说写作智能体桌面应用程序。该系统通过OpenAI兼容的API接口调用大语言模型,支持15种文学体裁、8种语言风格、4种叙事视角和3种时态的自由组合配置,实现了高质量的英语创意文本生成。系统采用流式输
很多人第一次接触 Agent,是从 LangChain、CrewAI、AutoGen 开始。框架文档里 Chain、Tool、Memory、Planner 一堆抽象,很容易让人觉得:Agent 很复杂,必须先学框架。
综合来看,2026年成都公考培训市场的竞争焦点已全面转向“本土化适配”与“精细化服务”。对于考生而言,选择本土化教研扎实、师资团队稳定、服务闭环完整且课程矩阵清晰的机构,是理性备考、提升上岸概率的关键一步。龙图公考凭借在以上维度的持续深耕与积累,已成为四川公考培训领域具有高口碑与代表性的本土品牌。建议考生在做出最终决策前,充分利用各机构提供的免费试听或试学机会,亲身感受教学风格、考察教材的本土化程
谷歌在I/O 2026大会推出Gemini for Science科研AI工具集,旨在加速科学研究进程。其核心模块Science Skills为专用智能代理套件,可整合调用30余个主流生命科学数据库与工具,将谷歌Antigravity/Gemini智能代理平台对接UniProt蛋白序列库、AlphaFold蛋白质结构数据库、DeepMind旗下AlphaGenome DNA调控模型等核心生物数据资
这还不是最让人头疼的。一个被污染的 MCP server,就等于在开发者的机器上开了一个后门。拿某个文件系统操作的 server 来说,它的工具列表里写着 read、write、search、get_file_info,但 host 端根本不会限制 server 只能访问某个特定目录——server 自己说能读哪儿就写哪儿,host 全盘信任。试想一下,如果你的代码里恰好有数据库密码,MCP se
第1章引言1.1 研究背景与意义近年来,我国数字经济与平台经济深度融合,线上招聘已成为劳动力市场供需匹配的核心渠道。人社部统计数据显示,2024年全国人力资源服务机构通过网络发布的招聘求职信息总量突破6.8亿条,在线招聘市场用户规模达到2.3亿人,日均活跃简历投递量超过800万次。与此同时,单个求职者平均浏览岗位数从2019年的42个上升至2024年的137个,信息过载现象愈发严重。从结构层面审视
2024-2026年,多模态智能体(Multimodal Agent)技术从基于视觉语言模型(VLM)的简单界面操作,快速演进为能够跨平台执行复杂任务、连接数字与物理世界的系统。研究重点转向可训练的动作模型(如UI-TARS)、技能复用(CUA-Skill)、多模态事件流(OmniGUI)和更真实的评测基准(WindowsWorld、MacArena)。当前挑战包括动作空间统一、长期状态跟踪、错误
很多文章会告诉你怎么“把 Claude API 跑起来”,但真到业务里,麻烦往往不是第一次请求能不能成功,而是这些问题:偶尔超时怎么办?一次要处理几千条数据,怎么避免重复提交?Batch 任务一直卡在,到底要不要重跑?国内网络不稳定,换个 endpoint 是不是就万事大吉?这篇文章不推荐中转站,也不只停留在 API Key 怎么填这种入门层面。我们主要从工程落地的角度,聊聊:包括单次请求、并发调
如果你用的是第三方 Claude API 兼容服务、代理网关或自定义 endpoint,那鉴权规则可能和 Anthropic 官方 API 不完全一样。比如 ClaudeAPI 这类平台,本质上属于第三方 Claude API 兼容接入服务,并不是 Anthropic 官方。它可能会提供兼容接入、多线路选择、中文支持、企业充值、开票、基础技术协助等能力。不过,具体怎么鉴权、支持哪些模型、额度怎么算
本文介绍了Claude Code的auto模式在嵌入式固件重构中的创新应用。该模式通过智能风险分级机制,将修改操作分为五个风险等级(R0-R4),针对不同风险等级采取不同的处理策略:低风险操作静默执行(如HAL库函数迁移),中风险操作快速预览后自动执行(如DMA缓冲区重映射),而高风险操作(如中断优先级调整)则强制人工确认。这种差异化处理显著提高了重构效率,使工程师能将注意力集中在关键决策上,同时
摘要: 团队因直接使用AI生成代码导致生产事故(支付回调接口浮点数精度与SQL注入漏洞),随后制定三层API Key分级管控方案:管理员Key(全局配置)、生产Key(CI/CD环境变量)、开发Key(个人限流)。通过内部API网关实现Token-Key映射,确保开发环境隔离与权限最小化,并附Python伪代码示范安全映射逻辑(签名验证、环境检查、密钥解密等)。核心原则:AI代码需严格审查,且模型
要先把你的声音变成文字(语音识别),理解"明天早上八点"是时间、"定闹钟"是任务(自然语言理解),然后执行操作,最后用语音告诉你"好的,已经设好闹钟了"(语音合成)。让机器读懂你说的话,让机器听懂你的声音,让机器能开口说话。这一技术也应用而生。昨天我们简单地介绍了《》,今天这篇文章,就把这四项技术讲清楚。读完之后,你会理解:为什么现在的AI能和你丝滑地对话。
Codex的玩法更接近“自动化流水线+目标驱动+多个子Agent”的组合,在一些开发者的实际体验中,能看到最多8个Agent同时跑在各自的云端沙箱里,各干各的活,最后把结果汇总回来。如果说Harness解决的是“AI能不能在真实环境里干活”的问题,那loop解决的就是“AI能不能在这个环境里持续干活、自己推进任务、不需要人一步步盯着”的问题。我的工作,就是写循环。用一个模型(或者子Agent)负责
但GPT-3模型是2020年发布的,到ChatGPT服务问世还过去了接近三年,这是因为此时的模型在指令遵循方面很差,类似于一个强大的野兽,不受人类控制。最终的测试效果,也证明了扩大参数规模的有效性,GPT-2不再像GPT-1一样需要对输入进行预处理,然后做微调,才能处理特定任务了,直接把在输入基础上用自然语言描述需要做的任务,就能在文本翻译,文本分类等特定任务上去的超过专用模型的效果,这就是所谓的
因为它做了之前所有模型都没做到的一件事:把AI的能力包装成了一个普通人直接能用的产品。你不需要懂技术,不需要学编程,只需要像跟朋友聊天一样打字,AI就能回答问题、写文章、写代码、翻译、总结、分析。长期以来,AI对于大众,都只是科幻电影里的一时惊艳,或者新闻里"又双叒叕取得突破"的过目即忘。ChatGPT的出现,让每个普通人,真切地感受到了AI的存在。只需要像和普通人对话一样,问AI问题、让AI写文
从目前产业的实践来看,真正走在正确方向上的玩家,都在做同一件事:让世界模型从 “展示导向” 转向 “任务导向”,换句话说,世界模型的终极形态,不是一个独立的 “产品”,而是内嵌在各类物理系统中的基础能力。世界模型当然需要 “造世界” 的能力。它的核心评价标准,从来不是 “生成的世界够不够逼真”,而是 “能不能帮机器更好地在物理世界里行动”,能不能降低试错成本、能不能提升泛化能力、能不能嵌入真实的业
📌 GLM-5.2 的主分支注意力改用 DeepSeek 风格的 interleaved RoPE,indexer 仍然用非交错的 half-split RoPE(GLM-5 主分支注意力的实现)。🎯 今天来解析 interleaved RoPE 相对 half-split RoPE 的区别。
本文详细记录了在AMD Radeon Cloud单卡环境下,使用Qwen3-0.6B模型和LoRA方法微调明日方舟干员助手的过程。作者从环境配置(ROCm 6.x)、数据集构建(8,846条干员问答对)到模型训练(8-15分钟完成)进行了完整说明,重点展示了小模型(0.6B参数)通过LoRA高效微调(仅训练0.22%参数)实现专业化任务的能力。最终得到的助手不仅能准确回答干员属性、技能等游戏知识,
自然语言处理
——自然语言处理
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net