logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型应用开发(五):使用RAG搭建简单的本地知识库

摘要:本文介绍了RAG(检索增强生成)技术及其应用开发实践。RAG通过结合信息检索和文本生成,提升大模型回答的时效性、准确性和专业性。文章详细阐述了RAG的核心流程:数据预处理(文档加载、分块、向量化)、检索阶段(相似度搜索)和生成阶段(上下文增强)。通过LangChain框架和阿里百炼平台,展示了如何快速搭建本地知识库系统,包括PDF文本处理、FAISS向量数据库构建和问答链实现。代码示例演示了

文章图片
#人工智能#机器学习#RAG
大模型应用开发(二):Embedding Models嵌入模型原理及选型

本文介绍了嵌入模型(Embedding Models)的原理及选型。嵌入模型通过将非结构化数据转换为高维向量,捕捉语义信息,支持相似度计算和信息检索。主流模型分为通用型(如BGE-M3)、垂直领域型(如BGE-large-zh)和轻量化型(如nomic-embed-text),选型需考虑任务性质、领域特性和计算资源。文章以阿里百炼为例演示了API调用方法,展示了文本到向量的转换过程。嵌入模型在语义

文章图片
#人工智能#python
大模型应用开发(一):认识向量

摘要:本文介绍了向量表征在AI领域的核心概念与应用。主要内容包括:(1)向量表征的本质是将复杂对象映射为低维向量,通过距离度量语义相似性;(2)文本向量(Embeddings)的获取方法及相似度计算(余弦相似度、欧氏距离);(3)代码实战演示了使用OpenAI API生成文本向量,并通过numpy计算向量相似度。结果显示,语义相近的文本其向量距离更近,验证了向量表征的有效性。本文为理解和使用文本向

文章图片
#人工智能#python
一次给多张表添加相同的字段

最近在开发中遇到一个问题,在数据库中的每张表中添加一个时间字段,如果一张表一张表的去添加,表非常多,这样非常耗时,就想到是否可以循环表,进行批量添加相同的字段。DECLAREv_sql CLOB;v_table user_tables.TABLE_NAME%TYPE;CURSOR p_cursor IS SELECT TABLE_NAME FROM USER_TABLES t WHER

到底了