logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

不是最强而是最合适:原型阶段的向量数据库选型逻辑

本文探讨了向量数据库的核心技术、主流产品对比及选型逻辑。与传统数据库不同,向量数据库专为非结构化数据的向量表示设计,支持近似最近邻搜索(ANN)算法。文章详细分析了HNSW、IVF-PQ和Annoy三种主流向量索引算法的特点及适用场景,并指出距离度量函数需与嵌入模型匹配。在数据库选型方面,对比了专用向量数据库、数据库扩展和轻量级库三类产品,最终针对JRXML场景选择Chroma,因其零部署成本、P

#java#人工智能#经验分享
打造个人英语教练skill:飞书 + MiniMax + 本地模型

本文介绍了一个基于飞书的AI英语陪练助手设计思路,通过语音消息实现自然交互,降低学习负担。系统采用云端优先、本地兜底的架构,支持MiniMax TTS和本地Piper模型切换,使用SenseVoice进行本地语音识别。学习数据存储在飞书多维表格,采用艾宾浩斯记忆曲线管理复习计划。项目具有高度可定制性,可替换通信渠道、TTS方案和存储后端,通过凭据驱动功能开关,支持不同配置需求。定时任务提供晨间、午

#人工智能#经验分享#教育电商
MTEB 排行榜之外:嵌入模型在 JRXML 场景下的选择逻辑

摘要:本文探讨了文本嵌入模型的选择逻辑及其应用。嵌入模型将文本转换为高维向量,使语义相似的文本向量距离相近。重点比较了稀疏向量(擅长精确匹配)、稠密向量(擅长语义理解)和混合向量三种类型,推荐使用稠密向量处理语义需求。通过分析MTEB排行榜,建议选择Qwen3-Embedding-4B模型,因其参数规模可控、中文友好且检索性能优异。实践部分介绍了模型下载、GPU优化及文本构造方法,强调将元数据融入

#java#人工智能#经验分享
Skill 模式不够用之后:一个 JRXML 自动生成 Agent 的 RAG 前置设计

企业使用Jaspersoft老版本时面临技术更新难题。WorkBuddy项目尝试用AI生成JRXML模板,虽能产出半成品,但存在输出不稳定、工具调用失误等问题,导致修改成本反超人工编写。根本问题在于Skill模式缺乏控制力,无法保证生成质量。解决方案是构建自定义Agent,通过RAG技术解决领域知识盲区:1)建立结构化生成流程;2)利用检索增强生成技术,从知识库获取精准模板片段;3)实现校验-修正

#人工智能#java
Skill 模式不够用之后:一个 JRXML 自动生成 Agent 的 RAG 前置设计

企业使用Jaspersoft老版本时面临技术更新难题。WorkBuddy项目尝试用AI生成JRXML模板,虽能产出半成品,但存在输出不稳定、工具调用失误等问题,导致修改成本反超人工编写。根本问题在于Skill模式缺乏控制力,无法保证生成质量。解决方案是构建自定义Agent,通过RAG技术解决领域知识盲区:1)建立结构化生成流程;2)利用检索增强生成技术,从知识库获取精准模板片段;3)实现校验-修正

#人工智能#java
打造个人英语教练skill:飞书 + MiniMax + 本地模型

本文介绍了一个基于飞书的AI英语陪练助手设计思路,通过语音消息实现自然交互,降低学习负担。系统采用云端优先、本地兜底的架构,支持MiniMax TTS和本地Piper模型切换,使用SenseVoice进行本地语音识别。学习数据存储在飞书多维表格,采用艾宾浩斯记忆曲线管理复习计划。项目具有高度可定制性,可替换通信渠道、TTS方案和存储后端,通过凭据驱动功能开关,支持不同配置需求。定时任务提供晨间、午

#人工智能#经验分享#教育电商
到底了