logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

N-Gram到底是什么?

如果你用过手机输入法的“自动补全”、聊天机器人的“上下文猜测”,或是搜索引擎的“查询建议”,那你已经在和N-Gram打交道了。这个诞生于上世纪80年代的统计语言模型,看似“古老”,却仍是今天轻量级AI应用的“基石”——它像一把“语言密码钥匙”,帮机器理解“你下一个词会说什么”。本文从程序员的视角拆解N-Gram:它是什么、怎么工作、为什么现在还在用,以及如何用代码实现。N-Gram不是“AI的过去

文章图片
AI应用入门之LangChain中SerpAPI、LLM-Math等Tools的集成方法实践

在大模型应用开发领域,LangChain的工具(Tools)组件是实现AI与真实世界交互的关键桥梁。2025年,基于LangChain构建的AI应用中,超过75%集成了外部工具,其中SerpAPI(搜索工具)和LLM-Math(数学计算工具)是最常用的两种工具。Tools本质上是封装了特定功能的可调用单元,允许大语言模型突破纯文本生成的局限,执行搜索、计算、数据库查询等外部操作。本文将从技术本质出

文章图片
#人工智能
LightRAG系列2:什么是 LightRAG?它和 LangChain 有什么区别?

当你决定为产品加入“智能问答”功能时,可能会在 GitHub 上看到两个热门选项:LangChain 和 LightRAG。前者星标超 10 万,生态庞大;后者轻巧简洁,专为效率而生。但对大多数 Web 开发者而言,盲目选择“更流行”的工具,反而会陷入过度工程化的泥潭。理解两者的本质差异,是避免技术选型失误的第一步。

文章图片
#RAG
FAISS、Milvus、Pinecone怎么选?大模型时代向量数据库终极对比

当大模型能生成“像《星际穿越》的硬科幻剧本”,当电商APP能根据你的浏览记录推荐“你可能喜欢的机械键盘”,背后的核心逻辑其实是向量检索——把文本、图像、商品等所有信息转换成高维向量,再用算法找到“最像”的那个。而支撑这一切的,正是向量数据库(Vector Database)。本文针对程序员群体,从技术原理、工程实践、产业落地三个维度,拆解FAISS、Milvus、Pinecone三大主流向量数据库

文章图片
#faiss#milvus#数据库
如何用DeepSeek + Faiss搭建本地知识库?程序员必看的检索系统实战

在企业数字化转型中,本地知识库正成为刚需——既避免敏感数据上传云端的隐私风险,又能实现快速的个性化检索。但传统关键词检索无法理解语义(比如搜“如何降低生产次品率”,找不到“减少 manufacturing defects”的文档),纯向量检索又可能因语义编码不够精准导致结果偏差。DeepSeek(深度求索)的大模型提供了强大的语义编码能力,Faiss(Facebook AI Similarity

文章图片
#faiss
Web开发者进阶AI:Advanced-RAG上下文压缩与过滤原理及实战应用

在构建基于RAG(Retrieval-Augmented Generation)的AI Agent应用时,Web开发者常遇到一个核心瓶颈:检索返回的上下文过长、冗余甚至包含噪声,导致大模型响应慢、成本高、答案偏离重点。而 Advanced-RAG 中的 上下文压缩(Context Compression)与过滤(Context Filtering) 技术,正是解决这一问题的关键。本文将从Web开发

文章图片
#人工智能#RAG
Advanced-RAG原理:RAG-Fusion 检索增强生成的多查询融合实战

在构建AI问答系统时,很多Web开发者会直接采用“用户输入 → 向量检索 → LLM生成”的经典RAG(Retrieval-Augmented Generation)流程。这就像我们在电商网站实现一个商品搜索框:用户输入“轻薄笔记本”,系统返回匹配的商品列表。但问题来了:用户的问题往往模糊、简略甚至带有歧义。比如:“怎么处理合同违约?”“推荐适合初学者的Python框架”传统RAG只用原始问题做一

文章图片
#RAG
Web开发者快速上手AI Agent:提示词应用优化实战

在传统Web开发中,我们常常需要与产品经理反复沟通,将模糊的业务需求转化为清晰的技术方案。这个过程本质上是一种上下文对齐:确保前后端理解一致、接口设计合理、用户体验流畅。而在AI应用开发中,尤其是基于大语言模型(LLM)构建智能体(Agent)时,提示词(Prompt)就是我们的“产品需求文档”。一个模糊的提示词,就像一句“做个好看的登录页”——模型不知道“好看”是简约风、科技感,还是暗黑模式。而

文章图片
#前端#人工智能#RAG +1
Web开发者快速上手AI Agent:基于Advanced-RAG的提示词应用

在AI应用开发浪潮中,越来越多Web开发者希望将自身技术栈延伸至AI领域。然而,面对“Agent”“RAG”“提示词工程”等术语,不少前端或后端工程师感到无从下手。本文将从Web开发者的视角出发,通过类比熟悉的开发场景(如API调用、状态管理、组件复用),系统讲解如何基于Advanced-RAG架构优化Agent提示词,并提供可运行的Node.js + React端到端项目示例,助你平滑转型AI应

文章图片
#前端#人工智能#RAG
Web开发者快速上手AI Agent:提示词应用优化实战

在传统Web开发中,我们常常需要对用户需求进行“翻译”和“细化”——比如产品经理说“页面要快”,我们需要转化为“减少首屏加载时间、启用懒加载、压缩静态资源”等具体技术方案。这种将模糊需求转化为可执行指令的过程,其实与AI提示词(Prompt)优化高度相似。当你向大语言模型(LLM)输入一句模糊的提示,比如“帮我写个登录页”,模型可能返回一个基础HTML片段;但如果你提供更结构化的上下文:“使用Re

文章图片
#前端#人工智能#RAG
    共 356 条
  • 1
  • 2
  • 3
  • 36
  • 请选择