登录社区云,与社区用户共同成长
邀请您加入社区
Temperature、Top-p、Top-k:模型输出的"性格旋钮" 这三个参数控制大模型生成文本的多样性与稳定性: Temperature:调节概率分布陡峭度,值越低输出越保守,越高越随机(推荐0.7-1.2) Top-k:仅从概率前k的候选词中采样(简单但不够灵活) Top-p:动态按累积概率截断候选词(主流方案,推荐0.7-0.9) 典型配置: 严谨任务(代码/数学):
RAG(检索增强生成)是一种让大模型在回答前先检索相关知识的技术方案。文章详细介绍了RAG的核心原理、实施流程和关键决策点。RAG通过将知识存储在外部向量库中,在回答问题时动态检索相关内容,解决了大模型的知识局限性、私域数据缺失和幻觉问题。系统分为离线建库(文档切分、向量化存储)和在线问答(检索相关片段并生成回答)两个阶段。文章对比了RAG与传统LLM的差异,探讨了chunk大小、embeddin
AI工程知识图谱摘要(149字) AI工程知识图谱系统化梳理了7大核心模块:1)基石与里程碑(Transformer等关键突破)→2)大模型架构与训练(三阶段训练/微调方法)→3)Prompt工程(CoT/ReAct等交互范式)→4)Agent架构(记忆/工具/规划系统)→5)上下文工程与RAG(突破上下文限制)→6)技能工具链(MCP协议/开发框架)→7)评估与安全体系。图谱通过50+核心概念和
LlamaIndex是由 run-llama 组织开发的开源数据框架,定位为"构建 LLM 应用的数据框架"。它提供了一整套工具,帮助开发者将私有数据源(API、PDF、文档、SQL 等)与大型语言模型进行有效连接和增强。
摘要:随着电商竞争加剧,具备知识图谱推理能力的AI-Agent智能客服成为新趋势。晓多AI客服系统通过构建商品知识图谱,实现跨品类关联推理和主动服务,解决传统客服机器人"答非所问"的痛点。该系统支持0配置快速启用、自动学习更新、多平台同步等功能,问题解决率可达85%以上。知识图谱技术使客服机器人具备多跳推理能力,能通过属性抽象和场景关联解决跨品类问题。未来,多模态、个性化知识图
YOLO26s 电动车检测链路:800 张标注 → 增强 (hsv+mosaic+mixup+夜间) → 150 epoch → mAP@0.5=0.91 → ONNX (4.1M) → PyQt5 界面 + 违停分析 + Flask API。核心贡献:夜间数据 + CLAHE 预处理使暗光 recall 从 72% 提至 82%;违停分析用 pointPolygonTest 实现区域判定。建议先
本文解析 Claude Code Skills 的核心机制,并结合知识图谱、设计系统、规范驱动开发与 AI API 实战,构建更稳定、更低 Token 成本的 AI 编程工作流。
本文介绍了基于BiLSTM和注意力机制的关系抽取模型实现与优化方法。主要内容包括:1)模型实现部分详细展示了BiLSTM_Attention类的代码结构,包含词嵌入层、BiLSTM层、注意力机制和全连接层的设计;2)训练过程包括数据加载、模型初始化、损失函数和优化器设置等步骤;3)提出多种优化方案,如改进句子嵌入方式、替换BiLSTM为BERT/RoBERTa、引入多头注意力机制等;4)分析了Pi
最近不知道大家有没有注意到,互联网大厂的风向又变了。Google 率先开源了 Workspace CLI,紧接着短短一周之内,飞书、钉钉、企业微信不约而同地在 GitHub 上开源了自己的 CLI 工具。
本文分享了由点头教研组整理的大模型微调学习路线,帮助学员从0到1掌握这一AI核心技能。文章指出大模型微调已在法律、医疗、教育等领域广泛应用,并获斯坦福、华为等顶尖机构验证其价值。学习路线分为四阶段:基础准备(20天)、项目实战(1个月)、论文研究(2个月)和前沿应用(持续学习)。同时强调现有技术人员应结合AI能力提升竞争力,并引用2025年招聘数据,显示AI岗位需求增长543%,薪资显著领先。文末
这篇文章为程序员提供了系统学习大模型的指南,重点推荐了5本2024年热门的大模型书籍,涵盖基础理论、应用开发和实战案例。内容强调了大模型技术的重要性和市场前景,指出AI人才需求激增543%,相关岗位薪资显著高于传统技术岗。文章还附赠价值2万元的学习资料包,包括视频教程、学习路线、技术文档和面试题库等资源,帮助读者快速掌握大模型开发技能,抓住AI发展机遇。最后提供免费领取方式,鼓励技术人员将现有技能
本文以2026年人形机器人半马赛事和国家电网大规模采购为切入点,深入剖析了具身智能从实验室走向工业部署的三大核心支柱:数据集、硬件产线与技术标准。文章重点探讨了大模型与知识图谱技术如何构建“机器人大脑”,并通过RAG及事理图谱等架构,实现对工业运维场景的自主感知、可信推理与决策执行,展望了AI从数字空间迈向物理世界的技术趋势。
时效规则(2026强制规范)
在AI技术日新月异的时代,如何高效学习成为关键。文章介绍了一款AI视频总结工具,它能将B站视频、播客等内容自动转化为结构化学习笔记。该工具支持视频转思维导图、文字大纲和精华速览三种模式,还能进行双语转录和批判性思考分析。工具支持Notion、Obsidian等多种格式导出,帮助用户在信息爆炸时代快速掌握知识要点。
Context Engineering:优化大模型上下文管理的艺术 Context Engineering(上下文工程)是AI工程的关键环节,专注于在有限上下文窗口中高效组织信息。随着模型token容量从4K到百万级扩展,合理管理上下文成为提升性能的核心挑战。 核心原则: 选择性加载 - 只保留与当前任务强相关的信息 智能压缩 - 通过摘要/结构化/滑动窗口减少冗余 位置优化 - 关键信息置于首尾
AI记忆系统:让智能体真正"记住"用户 记忆系统是智能体(Agent)在多次交互中保留信息、积累经验的关键机制,解决了传统AI"每次对话都失忆"的痛点。不同于临时上下文窗口或RAG知识库,记忆系统让AI能像人类同事一样记住用户偏好、项目细节和过往错误。 核心架构包含四个组件:写入器筛选有价值信息,存储系统(向量+结构化数据库)持久保存,检索器按需查找,应用器
随着大模型驱动的知识图谱Agent在金融风控、医疗诊断、智能制造等领域的大规模落地,动态语义查询的性能瓶颈已成为制约Agent可用性的核心痛点:传统图数据库的内置查询优化器缺乏对Agent上下文的感知能力,LLM直接生成的查询普遍存在语法错误、语义偏移、执行效率低等问题,多跳复杂查询的延迟经常达到秒级甚至分钟级,无法满足实时交互需求。
本体论作为知识图谱的理论基石,为知识表示、组织和推理提供了系统化的语义框架。本文系统梳理了知识图谱本体论体系的核心内涵,从本体论与知识图谱的内在关系出发,深入剖析了本体论的基本构成要素、层次结构体系、构建方法论以及实际应用价值。文章重点探讨了顶级本体(Top-level Ontology)的理论特征与代表性框架,并结合ISO/IEC 21838-1:2021国际标准分析了本体论标准化发展趋势。研究
MCP(Model Context Protocol)是Anthropic推出的AI模型上下文协议,旨在标准化AI应用访问外部工具和数据的方式。文章首先阐述了没有MCP时开发者需要重复集成各种API的问题,然后介绍了MCP的三层架构:MCP Host(宿主应用)、MCP Client(连接器)和MCP Server(服务提供者)。MCP Server可提供三类能力:Tools(可调用的函数)、Re
文章摘要: Tool(工具)机制让LLM从纯文本生成升级为能执行实际任务的智能体。它本质上是一个函数加上JSON格式的说明书,模型通过说明书判断何时调用工具,而实际执行由宿主程序完成。完整流程包括:注册工具、模型判断调用、宿主执行并返回结果、模型生成最终回答。工具可实现信息查询、文件操作、代码执行等功能,不同厂商称之为Function Calling或Tool Use。使用时需注意说明书描述的准确
OpenAI于2026年4月23日发布GPT-5.5模型,在编码、科研等四大领域实现突破性升级。该模型具备更强的自主任务处理能力,支持复杂工作流自动执行,在多个专业基准测试中表现优异。GPT-5.5保持与上代相当的响应速度,同时提供更高效的计算性能和安全保障。目前面向付费用户开放,API版本即将推出。模型定价虽有所提高,但凭借更高的token效率,实际使用成本可能更低。
本文系统介绍了AI大模型的学习路径,分为基础数学编程、机器学习入门、深度学习进阶、大模型探索和实战应用五个阶段。推荐了线性代数、Python编程等基础课程资源,以及《深度学习》等经典教材和Kaggle实践平台。重点讲解了Transformer架构和Hugging Face工具的应用,并建议通过开源项目和论文阅读保持技术前沿性。文末提供全套免费学习资料获取方式,帮助学习者从零开始系统掌握大模型技术,
DeepSeek V4的发布,不是GEO优化的“终点”,而是“新起点”——它彻底淘汰了“投机取巧”的低质优化玩法,回归了“内容为王”的本质。GEO优化的核心,已从“关键词堆砌、短内容铺量”,转向“深度、专业、可信、结构化的内容体系”构建。对于从业者而言,无需畏惧规则的变化,只要抓住“长文深耕、结构化呈现、E-E-A-T落地、知识图谱构建”这四大核心,套用本文的标准化模板,按30天行动清单逐步落地,
大模型原生上下文窗口的容量限制,是当前AI Agent落地过程中面临的核心痛点:多轮对话容易遗忘用户需求、复杂任务执行到中途就跑偏、无法积累长期交互经验形成个性化能力。作为AI Agent控制中枢的Harness Engineering(智能体管控工程)中,记忆机制是决定Agent智能程度的核心模块,其作用等同于人类大脑的海马体与大脑皮层。
这两年只要聊到 AI 应用,几乎总会听到一个词:**RAG**。很多团队一遇到“知识问答”“企业文档助手”“客服机器人”“内部搜索增强”这类需求,第一反应就是:是不是该上 RAG 了?
面试官:RAG 系统的检索效果不好,你会从哪些方面优化?🙋♂️我:检索效果不好嘛,那就换个好一点的 Embedding 模型,或者把 chunk 大小调一调,一般调调参数就能好很多。
这是一篇面向实战的 AI 智能客服搭建教程。文章不讲复杂理论,而是基于 AI-Agent-Node 开源项目,带你一步步完成一个可运行的 AI 客服系统:配置模型 Key、准备本地知识库、修改客服提示词、裁剪无关 tool / skill、接入 Vue 前端聊天组件,并通过 /api/chat 实现流式对话。教程目标是降低上手门槛,让新手也能快速体验和搭建自己的 AI 智能客服系统。
AI大模型学习路线指南 本文系统梳理了从入门到精通AI大模型的学习路径。首先强调打好数学(线性代数、微积分、概率统计)和编程(Python、数据结构算法)基础;其次介绍机器学习理论经典教材与Kaggle实践项目;然后深入讲解深度学习框架(TensorFlow/PyTorch)及Transformer架构原理;最后聚焦大模型应用,包括提示词工程、RAG技术、模型微调与部署等实战内容。文中推荐了Cou
OpenAI发布GPT-5.5,在编程、科研等任务中展现强大执行力,但存在高幻觉率(86%)和决策激进问题。其token消耗下降40%,定价上涨至5/30美元(百万token),成本结构转向"步骤计价"。模型更倾向于推进而非验证,将执行效率与判断风险捆绑。大模型时代催生"技术+业务"复合岗位,建议学习者关注提示词工程、RAG技术、微调与部署等核心技能。202
OpenAI发布GPT-5.5模型,在多项核心指标上超越前代成为全球SOTA领导者。该模型能以更少token处理更复杂任务,在编码、专业工作、学术研究等领域表现优异。GPT-5.5已向ChatGPT付费用户开放,高级版GPT-5.5 Pro面向企业用户。API即将上线但价格大幅上涨(输入/输出token分别涨至$5/$30每百万)。OpenAI同时推出生物安全漏洞赏金项目,最高奖金$25,000。
用 Ollama / LM Studio 管理模型用不同 UI 工具测试对话用各类 Agent 框架做自动化实验用脚本拼装 Workflow这些工具都很优秀,但它们更多是:👉 单点能力工具,而不是平台。本地模型管理分散推理接口不统一Agent 能力难以复用Workflow 无法系统化编排多模型协作复杂很难构建长期可维护的 LLM应用架构我们意识到:企业需要的不是更多工具,而是一套 LLM Run
LLMWiki:AI驱动的个人知识管理新范式 摘要: LLMWiki创新性地将AI能力与传统Wiki知识管理方法结合,构建动态生长的个人知识系统。其核心在于: 采用Wiki的知识组织方式,通过概念页、链接和索引构建知识网络; 让AI承担知识维护工作,自动拆解资料、更新页面、建立关联; 建立可信机制,区分事实与推断,保留修改痕迹; 形成"人机协作"模式:人类负责方向判断,AI执行
科创知识图谱助力产学研深度融合。文章分析了当前科技创新面临的成果转化难、资源分布不均等痛点,提出通过构建结构化知识网络实现资源整合。重点阐述了知识图谱在智能查询、成果转化规划等场景的应用价值,建议从需求定位、数据治理等路径实施。随着AI技术发展,科创知识图谱将更智能化,为构建开放协同的创新生态提供支撑。科易网作为行业领先企业,已服务500余家中小企业,未来将持续推动科技创新发展。
Harness 原意是"马具、挽具"——套在马身上、让马能真正拉车干活的那套装置。放到 AI 语境里,模型是那匹"马",Harness 就是套在它周围、让它真正能把活干成的整套工程。
Agent 核心概念与构建模式解析 Agent 是由 LLM(大脑)、Tool(工具)和 Loop(自主循环)构成的智能系统,通过"观察→思考→动作"的循环自主完成任务。与 Chatbot 不同,Agent 能自主决定控制流。主流构建模式分为两类:ReAct 模式(边想边做,灵活但易走偏)和 Plan-and-Execute 模式(先规划后执行,稳定但灵活性差)。实际产品常采用
本文介绍了如何在星图GPU平台自动化部署SiameseUIE模型部署镜像,实现从景区介绍文本中精准抽取历史人物与地理坐标信息。该镜像专为文旅行业优化,可快速构建知识图谱,应用于智能导览、文化资源数字化等场景,提升数据处理效率与准确性。
本文介绍了如何利用星图GPU平台自动化部署FireRedASR-AED-L镜像,实现博物馆导览录音的智能化处理。该方案能够将讲解音频高效、安全地转换为文本,并自动提取文物实体与关联,最终构建出结构化的展品知识图谱,为博物馆数字化管理与智能导览提供核心支持。
本文介绍了如何在星图GPU平台上自动化部署Qwen3-ForcedAligner-0.6B镜像,实现智能办公场景下的语音内容结构化处理。该方案能将会议录音等语音输入自动转录为带时间戳的文本,并进一步抽取关键实体与关系,构建可视化的知识图谱,从而高效完成会议纪要整理与信息归档。
本文介绍了如何在星图GPU平台上自动化部署CasRel关系抽取模型,并将其应用于政务公开文本的智能信息处理。该模型能够自动从非结构化公文中精准提取“机构-职能-依据”等结构化关系三元组,典型应用场景包括快速构建政务知识图谱、梳理部门职责与法律依据,从而大幅提升政策分析与信息检索效率。
本项目是一个基于知识图谱的医药问答系统,旨在帮助理解知识图谱的构建流程、关键技术和实际应用。系统采用前后端分离架构,后端使用FastAPI + Neo4j + MySQL,前端使用Vue3 + Element Plus。
知识图谱
——知识图谱
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net