logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

向量检索优化与内容生成策略

本文探讨了向量检索优化的关键技术与策略。首先指出单纯依赖语义匹配的不足,提出结合BM25关键词检索与向量检索的混合方案,通过RRF算法融合两种检索结果。进一步介绍了重排序(reRank)的必要性,强调大模型在精细排序中的优势。最后详细分析了内容生成环节的Prompt设计要点,包括角色定义、任务明确、约束条件、输入结构化和输出格式要求,并通过法律咨询案例展示了优质Prompt的构建方法。全文系统性地

文章图片
#人工智能#java#RAG
文本分块Chunk策略

文章摘要:文档分块是处理大文本输入的必要步骤,主要解决大模型处理长文本时的性能限制和上下文长度问题。核心参数包括分块大小(chunkSize)和重叠区域(overlap)。主流分块策略包括固定分块、重叠分块、递归分块、语义分块和混合分块,各适用于不同文档类型。递归分块适用于结构化文档,语义分块适合法律合同等精确文本,混合分块则适合企业级RAG系统。实际应用中需结合文档特点选择策略,并可能需要人工二

文章图片
#java#RAG
从Vibe Coding到Spec Coding:AI编程的演进之路

文章摘要:本文探讨了AI编程的两种方法——Vibe Coding和Spec Coding。Vibe Coding通过自然语言描述让AI生成代码,适合小功能开发但存在幻觉、无状态等问题。Spec Coding则强调结构化需求定义,通过详细规格说明提升AI生成代码的质量,更适合复杂项目。作者推荐使用OpenSpec工具实现Spec Coding,并分享了大模型使用经验。最后提供了经济实惠的GPT5-c

文章图片
#人工智能#tdd
AI大模型原理概述

模型的训练通常包含三个关键阶段:预训练(无监督学习,奠定通用知识基础)、监督微调(SFT,教会模型遵循指令执行特定任务)以及基于人类反馈的强化学习(RLHF,使模型输出更安全、可靠且符合人类偏好)。文章还阐释了Token、向量嵌入、Transformer架构(特别是自注意力机制)等技术细节,说明了模型如何理解上下文、处理一词多义,并逐词生成文本。最后,文章也客观讨论了当前大模型可能产生“幻觉”(即

文章图片
#人工智能#语言模型
ai时代下的RPC传输——StreamObserver

StreamObserver是现代RPC框架中的关键设计,通过异步和流式能力解决传统RPC的痛点。相比传统RPC的同步阻塞模式,StreamObserver支持多种流式通信,实现数据分块传输、实时处理和全双工异步通信。它特别适用于大模型输出、数据流处理等场景,通过长连接复用提高性能,底层基于Netty实现HTTP/2协议栈。流式RPC在单个流上进行持续双向对话,与普通RPC的独立请求-响应模式形成

文章图片
#rpc#qt#microsoft +1
Skipped breakpoint because it happened inside debugger evaluation

在debug项目时总是会莫名其妙的多出system.out的数据,莫名其妙,搜到这篇文章,帮助很大,转载一下   解决Skipped breakpoint at %code reference% because it happened inside debugger evaluat

#java#idea
到底了