logo
publist
写文章

简介

更多AI大模型应用开发学习知识,尽在聚客AI学院(https://edu.guangjuke.com/)

擅长的技术栈

可提供的服务

暂无可提供的服务

智能体赋能RAG:实时网络搜索如何动态增强召回内容?​

本文分享金融风控系统中RAG应用的经验教训。核心发现包括:1)文档预处理需定制化处理不同格式(PDF/Excel/Word),建立元数据索引;2)召回环节需融合向量搜索、Query重写和HyDE假设文档等多策略;3)生成阶段重点清洗噪声数据和去重。通过半年优化,系统召回准确率从63%提升至91%。关键经验:文档处理无通用方案、召回需多算法组合、生成质量依赖数据清洗。建议点赞收藏完整技术方案。

文章图片
#人工智能#语言模型#数据分析 +4
95%企业AI失败?揭秘LangGraph+OceanBase融合数据层如何破局!​

企业级AI应用常面临"Demo惊艳但上线无人问津"的问题,核心在于数据割裂导致复杂业务场景支持不足。本文提出构建一体化AI数据底座的解决方案,通过统一存储和检索引擎支持多模态数据混合检索。具体演示了基于OceanBase的融合数据层架构,可单条SQL实现语义相似度、属性过滤等多条件检索。相比传统方案,该架构具有开发简单、检索高效、实时性强等优势,能有效支撑企业AI项目落地。文章

文章图片
#人工智能#大数据#机器学习 +4
基于MCP与LangGraph的全功能研究助手架构设计​

本文介绍了基于LangGraph和MCP协议构建智能研究助手的核心设计。系统采用双服务器架构:本地研究服务器提供FAISS向量存储和语义搜索,FirecrawlMCP服务器支持网络爬取。通过状态化智能体实现多轮对话记忆和动态工作流分支,支持用户元命令控制资源加载和查询。关键技术优势包括可扩展架构、工具热插拔、用户主导工作流和生产级容错机制。实施过程涉及环境准备、服务器配置和典型工作流示例,最终实现

文章图片
#人工智能#自然语言处理#pytorch +2
​​告别通用模型局限:5步微调实战指南​

本文探讨了文本嵌入模型微调的技术方法,针对通用模型在特定领域表现不佳的问题,提出基于对比学习的五步微调流程。通过AI招聘案例演示了从数据收集到模型评估的全过程,包括正负样本对构建、预训练模型选择、损失函数优化等关键步骤。最终微调后的模型准确率从88.1%提升至100%,验证了该方法在领域适配中的有效性。文章强调微调技术能显著提升语义检索的精准度,为RAG系统等应用提供优化方案。

文章图片
#人工智能#自然语言处理#深度学习 +4
​​告别通用模型局限:5步微调实战指南​

本文探讨了文本嵌入模型微调的技术方法,针对通用模型在特定领域表现不佳的问题,提出基于对比学习的五步微调流程。通过AI招聘案例演示了从数据收集到模型评估的全过程,包括正负样本对构建、预训练模型选择、损失函数优化等关键步骤。最终微调后的模型准确率从88.1%提升至100%,验证了该方法在领域适配中的有效性。文章强调微调技术能显著提升语义检索的精准度,为RAG系统等应用提供优化方案。

文章图片
#人工智能#自然语言处理#深度学习 +4
​突破RAG知识库中的PDF解析瓶颈:从文本错乱到多模态处理的架构跃迁​

本文探讨了RAG系统中PDF文档解析的质量问题及其解决方案。作者指出,使用LangChain默认工具处理企业级PDF时,回答质量低下的根本原因在于上游数据处理不足。文章提出构建专业级文档处理管道的三大原则:视觉感知、多模态处理和类型自适应,并推荐不同场景下的工具选型策略。重点分析了表格和图像内容的工程化处理方案,包括双路径表格处理和混合内容索引机制。最后建议将文档解析作为独立子系统持续优化,强调其

文章图片
#人工智能#语言模型#自然语言处理 +3
如何实施智能体工作流:企业必知的5个步骤

摘要:本文系统介绍了AI智能体工作流(Agentic Workflow)的核心概念与应用。智能体通过结合LLM的推理能力、工具交互和记忆机制,实现复杂任务的半自主执行,其核心模式包括规划分解、工具调用和反思迭代。相比传统工作流,智能体工作流更具动态适应性,可应用于智能RAG、研究助理、编码辅助等场景,显著提升复杂任务处理能力。文章同时指出需权衡其复杂性增加和可靠性风险,建议根据任务复杂度选择适合的

文章图片
#人工智能#机器学习#深度学习 +3
如何实施智能体工作流:企业必知的5个步骤

摘要:本文系统介绍了AI智能体工作流(Agentic Workflow)的核心概念与应用。智能体通过结合LLM的推理能力、工具交互和记忆机制,实现复杂任务的半自主执行,其核心模式包括规划分解、工具调用和反思迭代。相比传统工作流,智能体工作流更具动态适应性,可应用于智能RAG、研究助理、编码辅助等场景,显著提升复杂任务处理能力。文章同时指出需权衡其复杂性增加和可靠性风险,建议根据任务复杂度选择适合的

文章图片
#人工智能#机器学习#深度学习 +3
AI大模型开发全攻略:从数据预处理到模型部署的完整指南

分析式AI基础1.数据进行决策的常用思维2.机器是如何进行决策的3.十大经典机器学习

文章图片
#人工智能#机器学习#transformer +3
​​余弦相似度实战:向量数据库的精准匹配艺术​

本文深入解析向量数据库在AI应用中的核心作用。与传统数据库不同,向量数据库专为处理高维向量嵌入设计,支持相似性搜索、元数据过滤和水平扩展,成为AI系统的关键"记忆引擎"。文章对比了向量索引与向量数据库的差异,详细阐述了无服务器架构如何通过几何分区和新鲜性层优化性能与成本,介绍了HNSW、PQ等核心算法及其适用场景,并探讨了相似性度量和元数据过滤的应用策略。最后强调向量数据库通过

文章图片
#数据库#人工智能#机器学习 +4
    共 55 条
  • 1
  • 2
  • 3
  • 6
  • 请选择