青火coding 个人主页

@qq_41762594

青火coding

2023-08-28 11:22:16 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

向量检索优化与内容生成策略

本文探讨了向量检索优化的关键技术与策略。首先指出单纯依赖语义匹配的不足，提出结合BM25关键词检索与向量检索的混合方案，通过RRF算法融合两种检索结果。进一步介绍了重排序(reRank)的必要性，强调大模型在精细排序中的优势。最后详细分析了内容生成环节的Prompt设计要点，包括角色定义、任务明确、约束条件、输入结构化和输出格式要求，并通过法律咨询案例展示了优质Prompt的构建方法。全文系统性地

#人工智能 #java #RAG

文本分块Chunk策略

文章摘要：文档分块是处理大文本输入的必要步骤，主要解决大模型处理长文本时的性能限制和上下文长度问题。核心参数包括分块大小(chunkSize)和重叠区域(overlap)。主流分块策略包括固定分块、重叠分块、递归分块、语义分块和混合分块，各适用于不同文档类型。递归分块适用于结构化文档，语义分块适合法律合同等精确文本，混合分块则适合企业级RAG系统。实际应用中需结合文档特点选择策略，并可能需要人工二

#java #RAG

从Vibe Coding到Spec Coding：AI编程的演进之路

文章摘要：本文探讨了AI编程的两种方法——Vibe Coding和Spec Coding。Vibe Coding通过自然语言描述让AI生成代码，适合小功能开发但存在幻觉、无状态等问题。Spec Coding则强调结构化需求定义，通过详细规格说明提升AI生成代码的质量，更适合复杂项目。作者推荐使用OpenSpec工具实现Spec Coding，并分享了大模型使用经验。最后提供了经济实惠的GPT5-c

#人工智能 #tdd

AI大模型原理概述

模型的训练通常包含三个关键阶段：预训练（无监督学习，奠定通用知识基础）、监督微调（SFT，教会模型遵循指令执行特定任务）以及基于人类反馈的强化学习（RLHF，使模型输出更安全、可靠且符合人类偏好）。文章还阐释了Token、向量嵌入、Transformer架构（特别是自注意力机制）等技术细节，说明了模型如何理解上下文、处理一词多义，并逐词生成文本。最后，文章也客观讨论了当前大模型可能产生“幻觉”（即

#人工智能 #语言模型

ai时代下的RPC传输——StreamObserver

StreamObserver是现代RPC框架中的关键设计，通过异步和流式能力解决传统RPC的痛点。相比传统RPC的同步阻塞模式，StreamObserver支持多种流式通信，实现数据分块传输、实时处理和全双工异步通信。它特别适用于大模型输出、数据流处理等场景，通过长连接复用提高性能，底层基于Netty实现HTTP/2协议栈。流式RPC在单个流上进行持续双向对话，与普通RPC的独立请求-响应模式形成

#rpc #qt #microsoft +1

Skipped breakpoint because it happened inside debugger evaluation

在debug项目时总是会莫名其妙的多出system.out的数据，莫名其妙，搜到这篇文章，帮助很大，转载一下解决Skipped breakpoint at %code reference% because it happened inside debugger evaluat

#java #idea

到底了