luguochang 个人主页

@luguochang

luguochang

2023-01-09 10:31:38 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【AI应用开发实战】00_StockPilotX技术博客专栏：从零构建生产级AI金融分析系统

《StockPilotX：生产级AI金融分析系统开发指南》专栏介绍了一个基于大语言模型的智能金融分析平台。该系统通过8个专业Agent协作（包括量化分析、风险管理、宏观研究等），提供多维股票分析和投资建议。技术架构采用混合决策模式（规则引擎+LLM推理），集成实时行情、财务数据等多源信息，支持RAG检索增强。工程实践涵盖流式响应、中间件防护、全链路监控等生产级特性。技术栈包括Python/Fast

#人工智能 #金融 #语言模型 +2

【AI应用开发实战】00_StockPilotX技术博客专栏：从零构建生产级AI金融分析系统

#人工智能 #金融 #语言模型 +2

SmartArchitect：AI 驱动的设计平台，让想法秒变流程图

SmartArchitect 是一个 AI 驱动的可视化架构设计平台，通过自然语言对话快速将想法转化为流程图和架构图。核心功能包括： AI 对话生成：3 秒将描述转换为流程图双画布系统：规范图与手绘风自由切换图片智能识别：白板照片转可编辑流程图多格式导出：支持 PPT、Slidev 等多种格式多 AI 集成：可选 Gemini、GPT-4 等模型技术栈采用 Next.js + FastA

#人工智能 #流程图 #设计模式 +1

【大模型基础】第三阶段：分词与嵌入 (Tokenization & Embedding)

摘要本文深入探讨了大型语言模型(LLM)处理文本的两大核心技术：分词(Tokenization)与嵌入(Embedding)。分词部分详细比较了字符级、词级和子词级三种分词方案，重点分析了BPE、WordPiece和SentencePiece三种主流分词算法的原理及优劣。嵌入部分则阐述了如何将分词结果转化为高维向量表示，并介绍了嵌入空间的几何特性。文章还包含代码实战环节，演示了使用TikToke

#算法 #语言模型 #人工智能

【大模型基础】第一阶段：初识大语言模型

定义：模型规模达到某个临界点后，突然出现的新能力。案例# 参数量 < 10B模型: "1 + 1 =?输出: "2" # 只是记忆模型: "小明有5个苹果，给了小红2个，还剩几个？输出: "3个苹果" # 错误或不稳定---# 参数量 > 100B (如GPT-3)模型: "1 + 1 =?输出: "2"模型: "小明有5个苹果，给了小红2个，还剩几个？输出: "让我逐步思考：初始：5个给出：2个

#语言模型 #人工智能 #自然语言处理 +2

【LangChain1.0】第九阶段：文档处理工程 (LlamaIndex)

在RAG（检索增强生成）系统中，文档处理质量直接决定了最终效果。LlamaIndex作为专为LLM应用设计的数据框架，提供了强大的文档处理能力，特别是其旗舰产品LlamaParse——世界首个GenAI原生文档解析平台。LlamaIndex文档处理的核心优势LlamaParse：专为LLM优化的高精度PDF解析LlamaHub生态：700+数据加载器，覆盖几乎所有数据源：一行代码加载多种格式智能N

#python #人工智能 #算法 +1

超越 RAG：构建具备“自我进化”能力的 Agentic Memory 系统

检索增强生成（RAG）让 AI 拥有了“图书馆”，可以查阅资料；而 Agentic Memory（代理记忆）则赋予了 AI “海马体”，让它拥有了长期记忆、行为习惯和自我进化的能力。

#后端 #人工智能 #python +1

【LangChain1.0】第八阶段：文档处理工程(LangChain篇)

本文深入探讨了LangChain生态下的文档处理方案，针对RAG系统中的PDF处理痛点提供了系统解决方案。主要内容包括： PDF分类与工具选择：将PDF分为原生PDF、扫描PDF和混合PDF三类，并推荐相应处理工具（PyPDFLoader、PDFPlumberLoader、UnstructuredPDFLoader等）性能对比：详细比较了主流PDF处理工具的速度、文本质量和表格支持等指标 OCR

#人工智能 #算法 #语言模型 +2

【LangChain1.0】第七阶段：RAG高级篇 (LlamaIndex)

本文深入探讨了LlamaIndex在构建高级RAG系统中的关键技术，包括混合检索（BM25+向量检索）、查询优化、重排序和知识图谱集成等核心功能。重点介绍了如何实现BM25检索器、向量检索器及其混合使用，展示了元数据过滤和查询引擎集成等实用技巧。文章通过代码示例详细说明了从基础检索到高级混合检索的实现方法，为构建高效RAG系统提供了实用指导。

#python #开发语言 #后端 +2

测试集数据泄露问题：解析数据泄露及其治理机制

在参数规模突破万亿的大模型时代，评估基准（Benchmarks）的客观性正面临前所未有的挑战。当“刷榜”成为常态，高分背后的“数据泄露”问题逐渐浮出水面。本文基于前沿研究报告，从机理、检测到工程实践，深度剖析大模型如何通过“记忆”而非“推理”获取高分，并为开发者提供构建可信评估体系的工程指南。

#人工智能 #后端 #python +1

共 27 条

请选择