
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
**本文对比了主流AI编程工具(OpenAI Codex、GitHub Copilot、Google Cloud Code)的缓存机制,其中Copilot缓存最稳定透明,Codex缓存上限高但配置复杂,Cloud Code缓存策略未完全公开。同时分析了6款大模型的Token定价(截至2026-06-02),DeepSeek V4 Flash输入输出成本最低,GPT-5.3 Codex价格最高。最后
本文记录了在Tesla V100(4×32GB)环境下使用Docker和vLLM部署Qwen3-ASR-1.7B语音识别模型的过程。由于V100显卡的Compute Capability为7.0,不支持FlashAttention 2和bfloat16,需采用float16精度并调整参数。关键步骤包括:通过ModelScope或HuggingFace下载模型,配置Docker容器时指定显存使用率(
摘要:本文记录了在VS Code中配置MCP连接本地Java服务时遇到的Unrecognized field "form"序列化错误及其解决方案。通过分析发现,该问题源于VS Code客户端(新版本MCP协议)与服务端(旧版Java SDK 0.16.0)的协议不兼容,客户端发送的elicitation.form字段无法被服务端识别。最终通过升级Java服务端的MCP SDK至
本文介绍了langchain4j-spring-ai-swagger-mcp模块,该模块将OpenAPI/Swagger文档映射为MCP工具,使大模型能安全调用后端接口。核心功能包括:规范化接口为MCP工具、集中治理调用链、支持前端自动化生成。模块包含OpenApiLoader、OpenApiNormalizer等核心组件,支持SSE/stdio传输,提供工具列表查询和通用调用能力。通过集中处理鉴
摘要: gijela-core-chat 是一个专为 Java 大模型项目设计的联调工作台,解决了传统开发中模型切换混乱、RAG 验证分散、日志排障困难等问题。其核心价值在于整合了 LLM 调用、知识库管理、图谱抽取、附件处理等全链路能力,提供可视化操作界面,支持同步/流式验证、会话管理、实时预览等功能。通过自研 OkHttp 工具链替代第三方框架,实现了可控的模型调用与调试闭环,显著提升了开发效
本文介绍了企业级AI管理后台gijela中的gijela-core-llm模块,探讨了自建轻量级LLM SDK的工程化路径。针对Spring AI在复杂企业场景中的局限性,该方案采用零依赖设计(OkHttp + Jackson),通过接口先行、可插拔观测和灵活扩展机制(Tool Calling、MCP/Skill/Plugin)实现高效集成。模块化架构包含核心接口、OpenAI兼容实现、观测层及扩
文章摘要: 本文介绍了一个基于Vue3和TypeScript的可视化流程编排编辑器Demo,核心采用Vue Flow实现节点拖拽、连线编辑和Dagre自动布局功能。项目源自开源AI智能体管理平台gijela的工作流模块,现剥离为独立案例,包含JSON导入导出、坐标转换、连接点优化等完整前端实现。重点解决了四个技术难点:1)通过screenToFlowCoordinate实现精准落点;2)设计独立持
本文系统梳理了RAG系统中8种主流文档切割策略,从基础固定长度切割到前沿语义切割和Agent智能切割,并比较了各策略的优劣势及适用场景。文章指出文档切割质量直接影响80%的检索效果,关键要平衡信息碎片化与检索精度。推荐默认采用递归切割+重叠策略,结构文档用结构感知切割,高精度场景选用语义切割,高价值语料可考虑Agent智能切割。每种策略均提供代码示例和参数调优建议,帮助开发者根据项目需求选择最佳方
LangChain4j 1.7.1正式版发布,带来6大核心升级:1)支持类级@Agent注解,简化智能体开发;2)升级OpenAI SDK至4.0.0;3)Azure OpenAI新增maxCompletionTokens参数控制成本;4)统一HuggingFace接口;5)通过GPULlama3实现纯Java的GPU加速;6)支持ChromaDB V2提升向量检索性能。新增4款集成工具,包括Do
本文介绍了企业级AI管理后台gijela中的gijela-core-llm模块,探讨了自建轻量级LLM SDK的工程化路径。针对Spring AI在复杂企业场景中的局限性,该方案采用零依赖设计(OkHttp + Jackson),通过接口先行、可插拔观测和灵活扩展机制(Tool Calling、MCP/Skill/Plugin)实现高效集成。模块化架构包含核心接口、OpenAI兼容实现、观测层及扩







