logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从Java转行大模型应用,Naive RAG Indexing,向量存储,提示增强RGA设计

向量数据库是一种专门用于存储、管理和检索高维向量(Embedding)的数据库,区别于传统关系型数据库(存储结构化数据)和文档型数据库(存储非结构化文本),其核心优势是高效的“语义相似度检索”,能够快速从海量向量中找到与查询向量最相似的向量。在RAG技术中,向量数据库是核心组件——用于存储文档片段的向量,支撑top-K语义检索的高效执行,解决了“海量向量快速匹配”的痛点(若直接用内存存储,当向量数

#python#人工智能
从Java转行大模型应用,RAG使用效果评估及相关工具

1. 评估落地:优先用Ragas进行快速原型评估,量化核心质量指标与能力指标;用TruLens进行生产级全链路评估与监控,定位问题并迭代优化。2. 应用选型:个人/小团队入门用FastGPT,快速部署验证;企业级场景用RAGFlow或Dify,兼顾扩展性与协作需求;需高度自定义用纯代码开发(LangChain+评估工具)。3. 核心优化方向:围绕“上下文相关性、答案忠实度”优化检索策略(切片、向量

#python#人工智能
从Java转行大模型应用,Naive RAG向量嵌入(Embedding)

在 RAG 中,向量(Embedding Vector)是把文本、图片、语音等非结构化数据,转换成固定长度、低维度、计算机可计算的数值数组。"人工智能"长度:通常 768/1024/1536 维(由模型决定)语义相近的文本,向量空间距离更近表格算法适用场景RAG 推荐度核心特点余弦相似度文本语义检索⭐⭐⭐⭐⭐忽略长度,专注语义欧式距离 L2图像、数值数据⭐受长度影响,文本效果差向量 = 文本的语义

#java#开发语言
从Java转行大模型应用,RAG知识库开发,RAG分析

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合检索机制与大语言模型的AI技术架构,核心逻辑是:先从外部知识库中检索与用户问题相关的真实、精准知识片段,再将这些片段作为上下文输入LLM,引导模型基于检索到的事实生成答案,而非单纯依赖模型内置知识。RGA(Retrieval-Generation Analysis,检索生成分析)是针对RAG系统的全链路评

#人工智能
从Java转行大模型应用,提示工程原理和进阶技巧,Prompt Engineering的调优和攻击与防范

提示工程(Prompt Engineering)是通过设计、优化、迭代输入指令(Prompt),引导大语言模型(LLM)输出精准、合规、高质量结果的技术,本质是人类与AI的高效沟通话术,核心是让模型理解任务目标、约束条件、输出格式,而非单纯提问。基于CoT的进阶技巧,让模型对同一任务生成多条不同推理路径,通过投票、筛选选出最一致、最合理的结果,解决单轮推理的随机性和错误问题。核心逻辑。

#人工智能#机器学习
从Java转行大模型应用,提示工程原理和进阶技巧,Prompt Engineering构成和技巧

提示词是人类向大语言模型(LLM)下达指令、传递需求、限定边界的标准化指令文本,是人机协同的“沟通桥梁”。它不是简单的问句,而是包含指令、背景、规则、示例等信息的完整指令集,直接决定AI输出的精准度、质量和实用性。优质Prompt能让AI精准对齐意图,劣质Prompt则会导致答非所问、逻辑混乱、内容冗余,甚至出现幻觉输出。提示工程是系统性设计、优化、迭代提示词的方法论与实操技术,属于AI时代核心软

#人工智能#机器学习
从Java转行大模型应用,提示工程原理和进阶技巧,什么是提示词和提示工程

提示工程是系统性设计、优化、迭代提示词的技术与方法论,属于AI交互的核心技能,无需编程基础,核心目标是通过精准指令,最大化发挥大模型能力,降低无效输出,提升结果可靠性。本质是弥合人类自然语言与AI理解逻辑的鸿沟,让AI按照人类的思考框架、需求标准输出内容,而非随机生成。提示工程不是玄学,而是有规律、可复用的科学方法,适用于ChatGPT、文心一言、通义千问、Claude等所有主流大模型。核心价值:

#人工智能#机器学习
从Java转行大模型应用, LangChain的入门

LangChain是一个开源的PythonAI应用开发框架,它提供了构建基于大模型的AI应用所需的模块和工具。通过LangChain,开发者可以轻松地与大型语言模型(LLM)集成,完成文本生成、问答、翻译、对话等任务。LangChain降低了AI应用开发的门槛让任何人都可以基于LLM构建属于自己的创意应用。该图展示了LangChain 技术栈的模块化架构,核心围绕LangChain 框架展开,通过

到底了