登录社区云,与社区用户共同成长
邀请您加入社区
前面讲了那么多理论,这一篇来点实战。怎么用框架快速搭一个Agent?目前最流行的两个框架是**LangChain**和**LangGraph**。LangChain适合快速上手,LangGraph适合复杂工作流。这篇先讲LangChain,下一篇再对比LangGraph。
本文介绍了政策快报平台搜索模块从全文检索到语义理解的技术演进过程。最初采用Elasticsearch全文检索存在关键词匹配不精准问题,通过优化分词器、同义词配置和字段权重后准确率提升至82%。第三代系统引入语义理解能力,采用查询理解、双路召回(关键词+向量)和融合排序策略,准确率达到91%。案例显示新系统能识别"节水企业认定"与"水效领跑者申报"的语义关联。
TopBeeAI推出智能文献综述工具,帮助科研人员快速获取结构化文献综述。该工具通过自然语言输入自动转换为PubMed检索式,实时检索真实文献并生成可验证的综述报告。相比传统方式耗时数天,该工具可在3分钟内完成检索、筛选和总结全过程,所有引用文献均可溯源。新用户注册即赠20万Token免费额度,可进行10-30次文献总结。该工具特别适用于快速了解新领域、撰写论文引言和准备组会汇报等场景,实现人机协
Elasticsearch查询调试API详解 本文系统介绍Elasticsearch四大调试工具:Count API用于轻量级文档计数,Validate API验证查询语法合法性,Explain API分析文档评分细节,Profile API测量查询执行性能。通过实战演示如何利用这些工具定位慢查询问题,优化搜索性能。 核心要点: Count API:仅返回匹配文档数,比完整搜索更高效 Valida
这篇文章介绍了Elastic推出的开源工具example-mcp-dashbuilder,它能够通过自然语言指令快速创建Kibana仪表盘。该工具基于MCP架构,允许用户用简单英语描述需求,AI会自动探索Elasticsearch数据结构,编写ES|QL查询,生成交互式可视化图表,并组织成完整的仪表盘。支持6种图表类型,可自定义主题颜色,并能与现有Kibana工作流无缝集成——既可导出到Kiban
大模型知识体系全景图 本文系统梳理了大语言模型的技术知识体系,从基础数学到前沿应用,构建了一个层次分明的学习框架: 数学基础(线性代数、概率统计、微积分)构成理解模型的理论基石,重点掌握矩阵运算、概率分布和梯度优化等核心概念。 深度学习基础涵盖神经网络架构演变,重点分析Transformer如何通过注意力机制解决RNN的序列建模缺陷,以及正则化技术对模型泛化的影响。 Transformer核心架构
摘要 本文深入解析Elasticsearch搜索机制与API使用,涵盖分布式搜索的两阶段模型(Query Phase和Fetch Phase)、自适应副本选择机制以及路由优化策略。详细介绍了搜索API的多种调用方式(GET/POST方法、多索引搜索)和URI搜索模式的Lucene查询语法(字段查询、通配符、布尔运算、范围查询等)。重点讲解了关键URI参数的功能与用法,包括df默认字段、analyz
在分布式系统中,并发控制是保证数据一致性的关键。Elasticsearch作为分布式搜索引擎,提供了完善的并发控制机制来应对多线程、多节点环境下的数据竞争问题。本文深入解析了Elasticsearch并发控制的两大核心主题:**refresh参数**(控制数据可见性的三种模式——true立即刷新、false延迟刷新、wait_for等待刷新)的选择策略与性能影响,以及**乐观并发控制**(基于_s
摘要 本文深入解析Elasticsearch文档删除与更新API的核心功能。删除操作部分涵盖Delete API的单文档精确删除、响应码解析及版本控制机制。更新操作详细讲解Update API的三种实现方式:基于Painless脚本的灵活字段操作(包括计数器增减、列表元素增删、条件更新等)、部分文档字段合并更新、以及upsert的插入或更新条件操作。同时介绍了Delete by Query和Upd
摘要 Elasticsearch的REST API提供了强大的多索引操作、日期数学索引管理和通用查询参数功能。多索引操作支持通配符、排除语法和_all关键字,通过ignore_unavailable等参数实现灵活控制。日期数学格式允许在索引名中使用动态日期表达式(如<logs-{now/d}>),需注意URI编码要求。通用参数包括结果格式化(pretty/YAML)、可读输出(human)和信息过
Elasticsearch核心概念解析:从索引到集群的完整指南 本文系统性地介绍了Elasticsearch的核心概念体系,通过与传统关系数据库的类比帮助读者理解ES的数据模型。主要内容包括: 基本概念类比:将Index比作数据库,Document比作行记录,Field比作列,Mapping比作Schema 索引结构: 一个Index对应一类数据 由多个分片(Shard)组成,包含主分片和副本分片
一文搞懂 PPO、DPO、GRPO、KTO、ORPO 的核心原理与区别
人社部最新披露的数据让人心惊:我国人工智能相关人才缺口已突破500万,平均10个岗位在抢1个人。2026年春天,一边是考公大军挤破脑袋,另一边是大厂拿着月薪6万的支票本愁得睡不着觉。智能体开发岗位需求暴涨455%,就连零基础能做的AI训练师,月薪都能轻松过万。但问题来了:500万的缺口,到底哪些方向最适合你?零基础能不能入行?需要学什么?今天这篇文章,一次性给你讲清楚。
摘要 Elastic Cloud Serverless推出跨项目搜索(CPS)功能,允许用户通过单个查询跨隔离项目搜索数据,无需数据复制或网络对等连接。CPS采用简化的项目链接模型替代传统跨集群搜索的复杂配置,支持跨区域、跨云服务商查询,同时保持数据原始位置。新功能提供项目路由控制搜索范围,支持Kibana空间级默认设置,并通过统一身份管理确保访问安全。CPS显著降低了运维复杂性,使组织能够基于逻
本文系统梳理了Elasticsearch中Painless脚本的五大核心应用场景及其特性差异:1)script_fields查询临时字段(仅展示结果);2)runtime_mappings运行时字段(支持排序聚合);3)script_score评分脚本(支持_score/doc变量);4)update_by_query更新脚本(操作ctx._source);5)聚合脚本(数值统计运算)。重点解析了
HEIDENHAIN ID 605090-51 与 605090-01 是 ECN/EQN/ERN 1000 系列旋转编码器的标准输出电缆,在伺服驱动、数控机床(加工中心/数控车床)、机器人、印刷包装、注塑机、三坐标测量仪等高端制造领域有广泛应用。两者技术规格完全相同,仅包装方式不同,用户可根据采购量灵活选择。面对原厂交期长(4~8周)、价格高、停产风险等痛点,广东凌道工控技术有限公司提供电气完全
摘要 最新论文《Beyond Semantic Similarity》提出颠覆性检索范式DCI(Direct Corpus Interaction),主张抛弃传统RAG中的Embedding模型和向量索引,让Agent直接使用终端工具(grep、find等)搜索原始语料库。实验显示,在BrowseComp-Plus基准上,DCI将准确率从69.0%提升至80.0%(+11%),同时成本降低29%(
2019年双十一的那个凌晨,我正在公司值夜班,监控大屏上突然一片飘红——搜索服务响应时间从正常的50ms飙升到3秒以上,订单页面的搜索框彻底卡死。运营同事疯狂@我:“用户搜不了商品了!我手忙脚乱地登录服务器,发现问题比我想象的更严重:单节点ES集群的磁盘IO已经打满,查询队列堆积了上千个pending请求。更要命的是,那个只有500GB数据的索引,在双十一当晚硬是被塞进去了超过2TB的日志和数据,
支持通过Painless脚本,对同一个桶内的多个指标做自定义四则运算,是灵活性最高的数值聚合。可实现各类复杂业务指标计算,例如毛利率、转化率、客单价、增长率等衍生指标,解决固定聚合无法满足的个性化统计需求。"size": 0,"aggs": {// 按天做时间分桶(桶聚合,必须有桶才能用管道聚合)},"aggs": {// 先统计每个桶内 sales 的 min、max、avg、sum 等基础指标
本文介绍了一种通过Elastic AI Agent和专家K8s Troubleshooter agent协同排查EKS集群故障的方案。该方案将可观测性分析与集群操作分离:Elastic AI Agent负责基于Elasticsearch进行初步诊断,当需要集群操作时通过Workflow调用专门的K8s Troubleshooter agent(携带约20个EKS工具)。这种架构既保持了单一交互入口
AI 圈的信息流速,已经快到人类跟不上了。每天 Twitter 上几百条 AI 推文、GitHub 上几十个新项目、arXiv 上一篇篇论文——你刷一天也看不完,但不刷又怕错过大事。数字生命卡兹克做了三年 AI 自媒体,把这个痛点用自己的方式解决了:AIHOT,一个全自动的 AI 热点监控与信息分发平台。 168 个信源自动抓取,DeepSeek 两级 AI 筛选,5 大板块分类推送,还支持 Sk
Elastic社区行为准则旨在为所有成员创造安全友好的环境。准则适用于所有线上线下社区空间,要求成员保持尊重、友善和耐心,禁止任何形式的骚扰、歧视或暴力行为。鼓励有效沟通和及时提问,对不当行为可采取临时封禁或永久驱逐等措施。准则借鉴了多个开源项目经验,采用CC协议授权,强调包容性和文化差异理解。
Elasticsearch Serverless 引入项目标签和路由机制优化跨项目搜索。项目路由通过预过滤表达式高效排除不匹配项目,减少计算开销;项目标签则支持灵活查询,可进行过滤、聚合和排序操作。两种方法可结合使用:先用路由缩小范围,再用标签细化查询,兼顾性能与灵活性。该方案帮助用户摆脱运维负担,专注于构建AI驱动的搜索体验。
摘要:Elasticsearch 9.4引入ES|QL近似查询功能,通过在查询前添加"SET approximation=true"即可实现。该功能通过采样数据执行聚合运算,能提升查询速度10-400倍,同时提供置信区间和认证标志来评估结果可靠性。近似查询适用于AI代理、仪表盘、日志分析等场景,支持多种聚合操作且无需重写查询。性能提升取决于数据规模、查询类型等因素,未来还将扩展
《Claude-Code 开发者指南摘要》 本文是面向开发者的Claude-Code使用手册,涵盖从基础到进阶的完整工作流程。内容分为六章:快速入门介绍基本交互方式;常用命令章节详解Slash命令和工具调用;实战场景提供代码阅读、修改、调试等具体案例;进阶玩法包含批量重构、多任务协作等高级功能;项目工作流指导完整功能开发过程;最后是Prompt技巧章节。附录提供命令速查表。 关键亮点包括: 自然语
Ubuntu 22.04 安装 OpenGrok
如果你也维护过 Elasticsearch 集群,大概率会遇到这样的场景:客户报障 "集群慢",你需要在十几个节点之间逐一排查;上线前要做一次 "健康巡检",但官方只给了一个 support-diagnostics 工具,导出的是一坨 ZIP 文件;报告要写中文版给运维、英文版给海外客户、还要给一份 Word 给老板……为了把这件 "重复、枯燥、又必须做 "的事情自动化,上海悦高软件股份有限公司大
在科研与学术写作中,文献阅读、摘要提取与多语言翻译往往占据大量时间。借助本地部署的大语言模型(LLM)与 Zotero 的 Awesome GPT 插件,可在完全离线/局域网环境下实现文献的智能处理。本文以 DeepSeek-r1:32b 为主推理模型,结合 nomic-embed-text 向量模型,详细讲解无需代码基础即可完成的本地化配置流程,帮助研究者构建安全、高效的文献工作流。
在构建智能对话系统时,如何高效管理和检索非结构化的对话历史是一个基础且关键的技术挑战。传统方案通常面临上下文长度限制和检索效率低下的问题。本文介绍一种结合SQLite数据库与Markdown文件的“双轨制”存储架构,通过FTS5全文检索技术实现对中文内容的高效索引与查询。该方案的核心技术价值在于打通了机器可读的结构化存储与人类可读的文本格式,实现了数据的双向同步与冗余备份。在应用场景上,特别适用于
本文介绍了Elastic Agent Builder的核心概念和工作原理。Agent是基于AI模型的智能代理,通过自定义指令和工具集来执行任务。系统包含三个关键组件:Tools是模块化的原子操作,Skills是结合指令、工具和上下文的领域专业能力包,Plugins是可安装的能力扩展包。Agent通过分析用户请求、选择工具、执行操作并评估结果的迭代过程来完成任务。文章详细阐述了如何编写高效的Skil
ES 默认的分词器对中文很不友好,它会把 “我爱中国” 分成 “我”、“爱”、“中”、“国” 四个单字,完全不符合我们的搜索习惯。这时候就需要用到IK 分词器ik_smart:粗粒度分词,适合搜索时使用(比如 “清华大学” 会分成 “清华大学”):细粒度分词,适合写入数据时使用(比如 “清华大学” 会分成 “清华大学”、“清华”、“大学”)IK 分词器虽然强大,但还是会有一些网络热词或者专业术语识
摘要:本文探讨了2026年AI工具链的核心发展趋势,指出随着大模型能力的提升,开发者对工具链的依赖反而增强。文章从底层逻辑、架构全景、代码实战和避坑指南四个维度,系统介绍了AI工具链的三层进化体系(Tool→Skill→Agent),并提供了四大核心工具模块的实战代码,包括自主编程Agent、LLMGateway、Skill编排引擎和工程提效工具。同时总结了工具链落地的三大误区,强调在AI时代,搭
什么是商业中的人工智能 ?商业中的 AI 有助于提升生产力并简化运营,从而提升商业价值。像 machine learning、 deep learning 和 natural language processing (NLP) 这样的人工智能技术利用数据的力量,在解决问题和做决策方面实现了超越人类能力的规模。诸如 predictive analysis 这样的能力 —— 可以使用数据预测未来结果
Elastic Observability 提供日志聚合、指标分析、APM 和分布式追踪等功能,其机器学习能力可帮助分析问题根因,提升应用性能、运营效率和业务 KPI。面对海量遥测数据,传统告警和简单模式匹配方法已无法满足需求。Elastic 的 AIOps 和机器学习功能通过异常检测、时间序列分析和日志异常值检测等,精准定位根本原因,缩短分析时间。Elastic 平台内置适用于可观测性和安全场景
人工智能技术如和自然语言处理(- NLP )利用数据的力量,在超越人类能力的规模上增强问题解决和决策制定能力。预测分析等能力 —— 可以利用数据预测未来结果,并根据趋势建模可能性 —— 以切实方式体现了 AI 的优势。从日常生产力到推动创新,AI 也彻底改变了商业。而对于精明的组织来说,AI 能持续将业务运营提升到新高度。OpenAI 推广了生成式 AI() —— 依靠深度学习、神经网络、自然语言
通过集成博查,你实现了快速获取结构化数据,避免爬虫开发同时还可以在本项目的基础上集成语义排序(Semantic Reranker)、多模态搜索等更多功能,用NLP模型识别同义词(如“AI”高亮“人工智能”)等,赶快自己动手实践一下吧!前往博查AI开放平台领取API Key查看往期教程👇,构建完整RAG应用链《用Python玩转博查Web Search API》《Semantic Reranker
在人工智能(正文简称“AI”)技术深刻重构全球产业生态的当下,AI 搜索技术正以革新性力量驱动千行万业智能化跃迁。值此技术变革关键节点,业界领先的搜索分析引擎 Elasticsearch 也迎来了自己 15 年的里程碑,Elastic 公司宣布于 3 月 26 日在中国市场正式启动“Elastic Pioneer” 先锋者计划。这一计划,是 Elastic 中国精心筹备的 Elastic 推广大使
全文检索
——全文检索
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net