logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Android开发转AI Agent:第11天——Chroma向量数据库,3行替代手写10行检索

第9/10天我手写了向量检索——for 循环 + 余弦相似度 + 排序。这在知识库只有 5 条文档时没问题,但如果知识库有 5000 条,手写循环就太慢了。今天学 Chroma——一个专门做向量存储和检索的数据库。Chroma 就是把第9天手写的 for 循环+余弦相似度+排序封装成了一行。就像用 Room 数据库替代手写 SQLite——专业工具让代码更简洁。

#android#人工智能#数据库
Android开发转AI Agent:第11天——Chroma向量数据库,3行替代手写10行检索

第9/10天我手写了向量检索——for 循环 + 余弦相似度 + 排序。这在知识库只有 5 条文档时没问题,但如果知识库有 5000 条,手写循环就太慢了。今天学 Chroma——一个专门做向量存储和检索的数据库。Chroma 就是把第9天手写的 for 循环+余弦相似度+排序封装成了一行。就像用 Room 数据库替代手写 SQLite——专业工具让代码更简洁。

#android#人工智能#数据库
Android开发转AI Agent:第11天——Chroma向量数据库,3行替代手写10行检索

第9/10天我手写了向量检索——for 循环 + 余弦相似度 + 排序。这在知识库只有 5 条文档时没问题,但如果知识库有 5000 条,手写循环就太慢了。今天学 Chroma——一个专门做向量存储和检索的数据库。Chroma 就是把第9天手写的 for 循环+余弦相似度+排序封装成了一行。就像用 Room 数据库替代手写 SQLite——专业工具让代码更简洁。

#android#人工智能#数据库
Android开发转AI Agent:第11天——Chroma向量数据库,3行替代手写10行检索

第9/10天我手写了向量检索——for 循环 + 余弦相似度 + 排序。这在知识库只有 5 条文档时没问题,但如果知识库有 5000 条,手写循环就太慢了。今天学 Chroma——一个专门做向量存储和检索的数据库。Chroma 就是把第9天手写的 for 循环+余弦相似度+排序封装成了一行。就像用 Room 数据库替代手写 SQLite——专业工具让代码更简洁。

#android#人工智能#数据库
Android开发转AI Agent:第11天——Chroma向量数据库,3行替代手写10行检索

第9/10天我手写了向量检索——for 循环 + 余弦相似度 + 排序。这在知识库只有 5 条文档时没问题,但如果知识库有 5000 条,手写循环就太慢了。今天学 Chroma——一个专门做向量存储和检索的数据库。Chroma 就是把第9天手写的 for 循环+余弦相似度+排序封装成了一行。就像用 Room 数据库替代手写 SQLite——专业工具让代码更简洁。

#android#人工智能#数据库
Android开发转AI Agent:第2天——temperature调到1.5,LLM开始胡说八道

messages=[{"role": "user", "content": "问题"}],但这3行代码里还藏着几个关键参数没有动过。今天的目标:把和max_tokens拆开,看它们到底控制什么。是"你给我老实点",是"放开说"——但放开太狠LLM直接说胡话了。安全区间0~0.7,生产环境建议0.3。

#android#人工智能
Android开发转AI Agent:第7天——写一个能用的Kotlin代码审查工具

前6天我把 LLM API 调用的所有参数拆了一遍:model、temperature、system prompt、messages 数组、Few-shot、CoT。今天把这些技能融进一个真正能用的工具——Kotlin 代码审查命令行工具。model="...", # 第1天:模型选择messages=[ # 第1天:消息数组{"role": "system", "content": "..."}

#android#kotlin#开发语言
Android开发转AI Agent:第10天——把检索和生成串起来,RAG完整流程

前两天分别学了 Embedding(文字→向量)和向量检索(找相关文档)。用户问题 → 向量检索 → 找到相关文档 → 拼接prompt → LLM生成回答RAG = 检索 + 生成。先搜资料再回答,既让 LLM 能回答知识库外的问题,又避免了幻觉(瞎编)。这 3 步(检索→拼接→生成)是后面所有知识库 Agent 的基础。

#android#人工智能
Android开发转AI Agent:第10天——把检索和生成串起来,RAG完整流程

前两天分别学了 Embedding(文字→向量)和向量检索(找相关文档)。用户问题 → 向量检索 → 找到相关文档 → 拼接prompt → LLM生成回答RAG = 检索 + 生成。先搜资料再回答,既让 LLM 能回答知识库外的问题,又避免了幻觉(瞎编)。这 3 步(检索→拼接→生成)是后面所有知识库 Agent 的基础。

#android#人工智能
Android开发转AI Agent:第3天——同一行代码换一个system prompt,LLM能变成三个人

前两天我学会了调和max_tokens,但它们控制的是LLM的"输出行为"——稳不稳、长不长。今天要学的控制的是LLM的"人格"——它是谁、该怎么说话、有什么规矩。这就好比同一个Android Activity,通过Intent传入不同参数,展示的UI完全不同。system prompt是LLM的"角色设定"——"你是XXX专家"控制人设,"只输出JSON"控制格式,"绝对不要XXX"控制行为。这

#android
    共 20 条
  • 1
  • 2
  • 请选择