
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
SmartArchitect 是一个 AI 驱动的可视化架构设计平台,通过自然语言对话快速将想法转化为流程图和架构图。核心功能包括: AI 对话生成:3 秒将描述转换为流程图 双画布系统:规范图与手绘风自由切换 图片智能识别:白板照片转可编辑流程图 多格式导出:支持 PPT、Slidev 等多种格式 多 AI 集成:可选 Gemini、GPT-4 等模型 技术栈采用 Next.js + FastA
摘要 本文深入探讨了大型语言模型(LLM)处理文本的两大核心技术:分词(Tokenization)与嵌入(Embedding)。分词部分详细比较了字符级、词级和子词级三种分词方案,重点分析了BPE、WordPiece和SentencePiece三种主流分词算法的原理及优劣。嵌入部分则阐述了如何将分词结果转化为高维向量表示,并介绍了嵌入空间的几何特性。文章还包含代码实战环节,演示了使用TikToke
定义:模型规模达到某个临界点后,突然出现的新能力。案例# 参数量 < 10B模型: "1 + 1 =?输出: "2" # 只是记忆模型: "小明有5个苹果,给了小红2个,还剩几个?输出: "3个苹果" # 错误或不稳定---# 参数量 > 100B (如GPT-3)模型: "1 + 1 =?输出: "2"模型: "小明有5个苹果,给了小红2个,还剩几个?输出: "让我逐步思考:初始:5个给出:2个
本文探讨了基于Agent的RAG架构如何突破传统RAG的局限性,实现从简单检索到认知推理的跃升。传统RAG面对复杂问题时存在检索粒度失效、推理能力缺失等痛点,而Agentic RAG通过三层架构(感知规划层、工具执行层、反思生成层)赋予系统思考能力。文章详细解析了Self-RAG、CRAG等进阶模式,并通过金融分析、编程助手等场景展示其优势。同时指出生产环境中的四大挑战:死循环、延迟爆炸、上下文污
在RAG(检索增强生成)系统中,文档处理质量直接决定了最终效果。LlamaIndex作为专为LLM应用设计的数据框架,提供了强大的文档处理能力,特别是其旗舰产品LlamaParse——世界首个GenAI原生文档解析平台。LlamaIndex文档处理的核心优势LlamaParse:专为LLM优化的高精度PDF解析LlamaHub生态:700+数据加载器,覆盖几乎所有数据源:一行代码加载多种格式智能N
检索增强生成(RAG)让 AI 拥有了“图书馆”,可以查阅资料;而 Agentic Memory(代理记忆) 则赋予了 AI “海马体”,让它拥有了长期记忆、行为习惯和自我进化的能力。
本文深入探讨了LangChain生态下的文档处理方案,针对RAG系统中的PDF处理痛点提供了系统解决方案。主要内容包括: PDF分类与工具选择:将PDF分为原生PDF、扫描PDF和混合PDF三类,并推荐相应处理工具(PyPDFLoader、PDFPlumberLoader、UnstructuredPDFLoader等) 性能对比:详细比较了主流PDF处理工具的速度、文本质量和表格支持等指标 OCR
本文深入探讨了LlamaIndex在构建高级RAG系统中的关键技术,包括混合检索(BM25+向量检索)、查询优化、重排序和知识图谱集成等核心功能。重点介绍了如何实现BM25检索器、向量检索器及其混合使用,展示了元数据过滤和查询引擎集成等实用技巧。文章通过代码示例详细说明了从基础检索到高级混合检索的实现方法,为构建高效RAG系统提供了实用指导。
在参数规模突破万亿的大模型时代,评估基准(Benchmarks)的客观性正面临前所未有的挑战。当“刷榜”成为常态,高分背后的“数据泄露”问题逐渐浮出水面。本文基于前沿研究报告,从机理、检测到工程实践,深度剖析大模型如何通过“记忆”而非“推理”获取高分,并为开发者提供构建可信评估体系的工程指南。
一个健壮的 Agent 系统,其 Prompt 是模块化的。我们需要针对System(系统层)Planner(规划层)Executor(执行层)和Reflector(反思层)分别定义指令。这是 Agent 的“宪法”。在生产中,单纯的“你是一个助手”是无效的,必须包含任务目标行为约束和输出协议。优化策略:使用XML 标签隔离上下文,防止指令漂移。生产级示例(SQL 数据分析 Agent)<role







