logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Jina Embeddings v4: 多模态多语言检索的通用向量

JinaEmbeddings v4是Jina AI最新发布的38亿参数多模态向量模型,支持文本和图像嵌入。该模型基于Qwen2.5-VL-3B-Instruct主干,采用任务专用LoRA适配器优化检索性能,支持单向量(2048维)和多向量(每个token 128维)输出。在MTEB、MMTEB等基准测试中,v4在多语言检索上比OpenAI text-embedding-3-large高12%,长文

文章图片
#jina#人工智能#elasticsearch +3
更高的吞吐量和更低的延迟: Elastic Cloud Serverless 在 AWS 上获得了显著的性能提升

Elastic宣布AWS上的Elasticsearch Serverless基础设施已完成重大升级,迁移至更新更快的硬件。此次升级带来显著性能提升:搜索延迟平均降低35%,索引吞吐量提高26%,尤其在向量搜索和AI应用场景表现突出。新硬件还增强了自动扩展能力,能更高效应对流量高峰。基准测试显示,各类搜索操作的吞吐量提升31-52%,延迟下降37-38%。升级完全自动完成,用户无需任何操作即可享受更

文章图片
#serverless#aws#云原生 +4
JINA AI 与 Elasticsearch 的集成

JinaAI与Elasticsearch深度整合,推出多款高性能AI模型:jina-embeddings-v4支持30种语言的文本/图像处理,具备单/多向量两种嵌入模式;v3专注于多语言文本嵌入;code-embeddings针对15种编程语言优化;clip-v2实现文本-图像跨模态检索;reranker系列提升搜索结果精度。这些模型支持从64到1536维的可调嵌入尺寸,在保持精度的同时优化存储和

文章图片
#jina#人工智能#elasticsearch +3
Elasticsearch:Jina Reader

Jina Reader提供两种核心服务:r.jina.ai可将网页/PDF转换为干净文本(Markdown/JSON),s.jina.ai实现结构化网页搜索。通过模拟浏览器渲染确保内容提取准确性,支持curl/wget/Python调用,认证用户享有更高优先级。该服务特别适合为RAG系统和AI代理提供预处理数据,与Elasticsearch等系统无缝集成,解决了从复杂网络内容中提取有效信息的难题。

文章图片
#jina#elasticsearch#大数据 +3
Elasticsearch:Jina Reranker v3

本文介绍了如何在Elasticsearch中使用JinaReranker v3优化搜索结果。首先注册JinaAI推理API端点,创建包含多语言文本和嵌入向量的索引,并设置自动生成嵌入的管道。通过对比BM25关键词搜索和向量搜索的差异,展示了混合检索方法(RRF)的优势。最后详细说明了如何将JinaReranker作为重排序层加入搜索流程,通过语义相关性分析优化结果排序,显著提升多语言搜索质量。整个

文章图片
#jina#elasticsearch#大数据 +3
使用 jina-embeddings-v3 和 Elasticsearch 进行多语言搜索

本教程介绍如何使用Jina AI的jina-embeddings-v3模型构建多语言语义搜索系统。主要内容包括:1)获取Jina API密钥;2)在Elastic Cloud注册模型并验证;3)创建支持1024维向量的索引;4)设置自动处理内容的ingest pipeline;5)添加英语、法语和西班牙语文档;6)使用德语查询演示跨语言搜索功能,通过kNN算法返回最匹配结果。该方案支持多种语言的高

文章图片
#jina#大数据#elasticsearch +4
jina-embeddings-v3 现已在 Elastic Inference Service 上可用

摘要:Elastic推出jina-embeddings-v3多语言嵌入模型,通过Elastic推理服务(EIS)提供高效语义检索。该模型支持32种语言、8192token上下文,具备参数效率高、维度可调等特点,特别适合RAG系统和多语言搜索。EIS提供完全托管的GPU推理服务,无需额外运维。未来将推出更多JinaAI模型,包括重排序器v2/v3,进一步优化检索精度。所有ElasticCloud试用

文章图片
#jina#elasticsearch#大数据 +2
使用 Elastic Agent 混合摄取加速 Otel 采用

摘要:Elastic推出混合ElasticAgent方案,支持在保留现有Elastic原生集成的同时引入OpenTelemetry(OTel)采集能力。该方案允许组织逐步迁移到OTel标准,无需中断现有日志管道和仪表板。通过Fleet集中管理,用户可并行运行两种采集方式,实现平滑过渡。文章详细介绍了混合模式的技术优势,包括运维连续性、渐进式迁移和厂商中立性,并以NGINX为例演示了具体部署流程。这

文章图片
#大数据#运维#elasticsearch +3
使用 Elastic Agent Builder 和 MCP 实现 Agentic 参考架构

本文介绍了基于Elastic Agent Builder、MCP和语义搜索构建安全威胁分析代理的参考架构。该架构以Elasticsearch为核心,通过Agent Builder提供AI驱动的工具集,并利用MCP协议实现外部系统交互。文章详细阐述了数据摄取层和Agent Builder层的设计,展示了一个结合内部知识库和外部情报的安全漏洞分析代理的实现过程。该方案采用模块化设计,支持使用LangC

文章图片
#架构#elasticsearch#大数据 +3
Elasticsearch Open Inference API 增加了对 Jina AI 嵌入和 Rerank 模型的支持

​探索如何使用 Elasticsearch Open Inference API 访问 Jina AI 模型。我们在 Jina AI 的朋友们将 Jina AI 的嵌入模型和重新排名产品的原生集成添加到 Elasticsearch 开放推理 API 中。这包括对行业领先的多语言文本嵌入和多语言重新排名的支持 —— 针对检索、聚类和分类进行了优化。此次集成为开发者提供了一套基于 Elasticsea

文章图片
#jina#elasticsearch#大数据 +3
    共 699 条
  • 1
  • 2
  • 3
  • 70
  • 请选择