logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ES批量写入性能调优:BulkProcessor 参数详解与实战案例

Elasticsearch BulkProcessor是Java客户端中用于高效批量处理文档的核心工具。它通过异步聚合、自动刷新和失败重试机制,解决了传统单条操作性能低下的问题。BulkProcessor支持三种触发条件:操作数量阈值(默认1000条)、数据大小阈值(5MB)和时间间隔阈值(5秒),并允许配置并发请求数。典型使用场景包括数据迁移、日志批处理和实时数据管道,相比单条操作能提升10-1

#jenkins#运维#java +1
Claude Code 扫描项目,原生能力还是 Skill?选错了 Token 能差 10 倍

本文探讨了AI工具在处理代码需求时的局限性,并提出了一种创新解决方案。作者指出,直接使用AI工具分析需求时存在业务语义缺失、token消耗大等问题,根本原因在于缺乏代码与业务逻辑的有效关联。为此,作者设计了一个Java代码语义知识库系统,通过AST解析、语义提取和向量嵌入等技术,将代码转换为可搜索的知识库。该系统采用混合语义提取策略,结合规则引擎和LLM增强,支持多维数据建模,并选用Qdrant作

#人工智能
MiniMax M2.7 上手体验:国产大模型的“推理派“选手

MiniMax M2.7大模型测试报告:该模型在推理和代码生成方面表现突出,能处理复杂逻辑任务并提供高质量解决方案,但在创意写作上存在明显短板,标题生成和内容创作缺乏"人味"。与同类国产模型相比,M2.7更适合技术开发场景,如代码重构、算法实现等,而不适合营销文案等创意型内容创作。测试表明其定位为"理科生"型AI,推理能力优于创意表达。

#语言模型
React深度实战:从虚拟DOM陷阱到Fiber架构的真相

本文深入剖析React开发中的核心问题与优化策略:1. 虚拟DOM性能代价:指出虚拟DOM在复杂场景下的性能瓶颈,强调合理使用key和组件扁平化的重要性;2. Fiber架构原理:解析可中断渲染机制,警示生命周期执行时机变化带来的问题;3. Hooks闭包陷阱:通过实例分析闭包问题,提出函数式更新、自定义Hook等解决方案;4. 状态管理演进:探讨状态提升与Context的优化使用,给出状态库选型

#react native#javascript#ecmascript +1
Flowable实战:从流程混乱到优雅编排的架构演进

摘要: 本文详细记录了一个供应链金融项目从传统硬编码审批流程迁移到Flowable工作流引擎的技术改造过程。项目原有的"大泥球"架构导致每次流程变更需要2个月开发周期,通过采用Flowable实现流程与业务解耦后,变更周期缩短至2天。文章重点阐述了技术选型考量、BPMN流程建模、事件驱动架构设计等核心改造环节,并分享了事务管理、性能优化等实战经验。最终系统实现了审批效率提升66

#java
Agent系统架构中的「注意力聚焦模式」:从理论到工程实践

注意力聚焦不是简单的信息过滤,而是一种系统性的架构哲学。它要求我们从“给Agent所有信息”转向“给Agent恰当的信息”,从“让模型自己找”转向“帮模型快速定位”。在这个信息过载的时代,能够精准聚焦的Agent,才是有价值的Agent。而构建这样的Agent,需要的不仅是更好的模型,更是更好的架构设计。(注:文中提到的技术细节和案例均来自公开资料和行业实践,具体实现可能因框架版本和业务场景而异。

#系统架构
Gemma4发布:开源AI的新标杆,普通人也能用的智能助手

谷歌DeepMind发布开源大模型Gemma4,采用Apache2.0许可证,支持完全免费、离线的本地部署。该系列包含从23亿到310亿参数的多个版本,适配不同设备需求。Gemma4在参数效率、多模态支持和商业授权方面具有显著优势,让个人用户能在手机、电脑等设备上获得接近顶级AI的能力。相比云端服务,本地运行Gemma4能确保数据隐私、降低成本并实现零延迟响应,适用于编程、文档处理、翻译等多种场景

#人工智能#AIGC
Claude Code源码泄露:AI编码时代的安全警钟与实战指南

AI不会让你更安全:它只是工具,安全要靠流程保障传统安全依然重要:构建配置、发布流程这些"老问题"照样能翻车审查不能放松:AI代码需要更多审查,而不是更少安全是系统工程:从代码生成到发布上线,每个环节都要管最后说句实在话:如果Anthropic这种以"安全"为核心卖点的公司都能连续犯低级错误,那普通团队更要小心。别太相信工具,多相信流程;别太相信AI,多相信人工审查。安全没有银弹,AI编码也不例外

LightGBM实战深潜:从梯度单边采样到直方图算法的工程陷阱

本文深入探讨了LightGBM在实际应用中的核心优化策略和常见陷阱。重点分析了梯度单边采样(GOSS)的权重补偿机制与学习率耦合效应,直方图算法的分桶优化与内存管理技巧,以及分类特征处理的高效策略。针对分布式训练场景,提出了数据并行与特征并行的负载均衡方案。此外,还分享了动态提前停止、多模型集成等高级技巧,以及生产环境中的模型监控和推理优化经验。文章强调LightGBM需要根据具体场景精细调优,特

#机器学习#人工智能
Elasticsearch分片设计:从数据分布失衡到集群稳定性实战

本文总结了Elasticsearch数据分布优化中的关键问题与解决方案。针对分片路由,指出Murmur3哈希在顺序ID场景下会导致数据倾斜,提出复合路由策略(业务ID+随机因子/时间感知路由)提升离散度。在分片分配方面,揭示了平衡算法在异构集群中的局限性,建议手动干预并合理配置感知分配。针对热点分片,强调预防优于治理,提出垂直/水平拆分、路由优化等根治方案。文章还总结了分片数量非线性关系、脑裂场景

#java
    共 24 条
  • 1
  • 2
  • 3
  • 请选择