
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本篇文章我们增强RAG的功能,不自己写检索知识库的功能了。而是使用ollama提供的embadding模型来读取知识库,使检索知识库的效果更好。总结就是:普通 RAG 靠"字面对得上",Embedding RAG 靠"意思相近";执行方式: npx tsx db/rebuild-embeddings.ts。然后重新执行 npx tsx db/seed.ts生成表结构。中详细的讲解了使用TF-IDF
前面在文章中介绍了多模态大模型,通过调用ollama接口解读文件和图片。这里我们开始做Agent,就是根据提示词操作电脑软件。
总体一般,因为是本地电脑,性能一般,所以处理很慢,处理几K的文件或图片还行,视频都没试,如果是7、8百k的文件就报错了。接口要求传入的图片和文件是base64的,并且开头要把base64的标识给拿掉。先下一个能分析图片和文件的模型,这里就是qwen2.5vl:7b 了。这个没啥可说,就是调本地ollama的接口.然后先用postman 测一下吧,直接看图。下载后,执行命令安装、打包、启动命令就行了
dify、charrystudio,rag,embadding,lang chain,agent,finetuning,stf,langGrap,模型推理xInference,蒸馏,语言模型,向量模型,嵌入模型,reranker重排序。llm信息抽取任务,给案例,然后输出制定json格式。
模块人脑活动Attention开会讨论(听别人说)FFN回家自己琢磨(深度思考)残差连接保留原始记忆LayerNorm整理思绪。
总体一般,因为是本地电脑,性能一般,所以处理很慢,处理几K的文件或图片还行,视频都没试,如果是7、8百k的文件就报错了。接口要求传入的图片和文件是base64的,并且开头要把base64的标识给拿掉。先下一个能分析图片和文件的模型,这里就是qwen2.5vl:7b 了。这个没啥可说,就是调本地ollama的接口.然后先用postman 测一下吧,直接看图。下载后,执行命令安装、打包、启动命令就行了
前面在文章中介绍了多模态大模型,通过调用ollama接口解读文件和图片。这里我们开始做Agent,就是根据提示词操作电脑软件。
本篇文章我们增强RAG的功能,不自己写检索知识库的功能了。而是使用ollama提供的embadding模型来读取知识库,使检索知识库的效果更好。总结就是:普通 RAG 靠"字面对得上",Embedding RAG 靠"意思相近";执行方式: npx tsx db/rebuild-embeddings.ts。然后重新执行 npx tsx db/seed.ts生成表结构。中详细的讲解了使用TF-IDF







