Samooyou 个人主页

@Samooyou

Samooyou

2022-09-29 17:26:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

RAG项目案例--01离线数据治理流水线

本文介绍了一个基于LangGraph框架构建的知识库导入系统，采用"状态驱动、节点无状态"的设计理念实现高并发和容灾能力。系统核心流程包括：数据治理与标准化通过PDF高保真重构解决传统RAG的语义坍塌问题多模态处理将图片转换为可检索文本双阶复合切片算法优化文本分块业务语义富化使用LLM提取文档主体名称并注入所有切片构建混合数学引擎（稠密+稀疏向量）数据持久化自

#数据库 #python #人工智能 +1

大模型微调(Fine Tuning)

文章摘要：本文系统阐述了大语言模型（LLM）的核心原理、结构及微调方法。大模型本质是千亿级参数的数学函数，通过自回归生成文本。模型发展形成预训练-监督微调-对齐三阶段范式。适配方法包括提示词工程、微调和检索增强生成（RAG），需根据场景渐进式选择。微调流程涵盖模型选择、数据准备、训练和验证，重点介绍了LoRA和QLoRA等高效微调技术。文章还提供了基于LLaMA-Factory的实操指南，包括环境

#python #人工智能 #语言模型

大模型微调(Fine Tuning)

#python #人工智能 #语言模型

RAG项目案例--02在线检索&过滤流水线

本文详细介绍了基于LangGraph的工业级RAG（检索增强生成）系统开发流程与架构设计。系统采用自顶向下的开发模式，通过四路并发检索（精准向量流、假设文档流、知识图谱流、网络扩展流）构建全面的知识召回网络，并创新性地实现了以下技术亮点：商品确认机制：通过LLM语义重写和Milvus向量对齐，从源头解决代词指代问题，防止跨型号信息污染。混合检索策略：精准向量流：使用BGE-M3模型结合商品名

#人工智能 #python #全文检索

工业级RAG检索

工业级RAG系统已从简单拼装发展为高并发、高可用的微服务架构，通过严密工程管道确保输出确定性。其架构分为离线数据治理和在线检索生成两大核心流程：离线阶段通过分布式解析、语义切片和混合向量化构建高保真知识资产；在线阶段采用多路并发检索（稠密/稀疏向量、知识图谱、实时网络）和双阶裁决（RRF融合+Cross-Encoder精排）获取精准证据。最终通过上下文优化编排、流式防护机制确保大模型生成高可信结果

#python #人工智能 #全文检索

mac本地部署大模型：oMLX +open claw

摘要：oMLX是专为Apple Silicon芯片优化的本地大语言模型推理服务器，基于MLX框架深度开发。该商业增强版支持文本生成、多模态视觉等任务，通过分层KV缓存、连续批处理等技术提升性能，并具备内存保护机制。安装流程简单，下载.dmg安装包后与OpenClaw生态集成即可使用。该系统特别适合作为ClaudeCode等编程助手的本地后端，在保持高性能的同时显著降低内存占用，避免系统卡死问题。

#macos #机器人

mac本地部署大模型：oMLX +open claw

#macos #机器人

Hbase遇到的问题

1、CallTimeoutExceptionjCaused by: java.net.SocketTimeoutException: callTimeout=60000, callDuration=60101: Call to host:60020 failed on local exception: org.apache.hadoop.hbase.ipc.CallTimeoutException

#hbase #hadoop #big data

到底了