logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

英伟达三大AI法宝:CUDA、NVLink、InfiniBand——构筑AI时代的算力基石

英伟达凭借CUDA、NVLink和InfiniBand三大核心技术构筑AI算力基石。CUDA突破GPU图形专用限制,建立庞大开发者生态;NVLink以900GB/s带宽实现多GPU高速互联,支持大模型训练;InfiniBand提供超低延迟网络连接,实现万卡集群高效协同。这三大技术形成从芯片到数据中心的完整AI加速闭环,使英伟达从GPU厂商转型为AI基础设施核心提供商。它们共同定义了AI时代的计算范

文章图片
#人工智能
RAG 文档嵌入到向量数据库FAISS

文档嵌入(Embedding)是将文本数据转换为向量的过程。这一过程的核心是使用一个预训练的嵌入模型(如 OpenAI 的 text-embedding-ada-002,或 BERT、SentenceTransformers 等)将文本映射到一个高维向量空间中。相似的文本在该空间中的距离较近,而不相关的文本距离较远。

文章图片
#数据库#faiss
让 Elasticsearch Delete By Query 请求立即生效

在 Elasticsearch 中,操作默认是近实时的(near real-time),这意味着删除操作可能不会立即对搜索可见。

文章图片
#elasticsearch#jenkins#大数据
什么是 LLMOps?

LLMOps 是一个涵盖了大型语言模型(如GPT系列)开发、部署、维护和优化的一整套实践和流程。LLMOps 的目标是确保高效、可扩展和安全地使用这些强大的 AI 模型来构建和运行实际应用程序。它涉及到模型训练、部署、监控、更新、安全性和合规性等方面。

#语言模型
基于百度地图 MCP Server规划规划一次青岛到北京旅行的详细行程实践

百度地图API现已全面兼容,是国内首家兼容MCP协议的地图服务商。百度地图提供的MCP Server,包含10个符合MCP协议标准的API接口,涵盖逆地理编码、地点检索、路线规划等。依赖和开发,任意支持MCP协议的智能体助手(如ClaudeCursor以及等)都可以快速接入。

文章图片
#dubbo
LoRA 模型微调框架核心原理及实现步骤

LoRA(Low-Rank Adaptation)模型微调框架通过低秩矩阵分解原理,实现了对大型预训练模型的高效微调。通过以上步骤,LoRA框架能够在保持模型性能的同时,显著降低微调成本和计算资源需求,成为资源受限场景下的首选方案。

#语言模型
还在到处找MCP资源?这11个MCP资源库收好!

2024年年底,Anthropic提出并开源的MCP(Model Context Protocol),如今已成为AI编程及AI Agent领域的热门概念。不少小伙伴在后台询问MCP资源,今天就为大家整理了11个实用的MCP资源库,涵盖服务器托管、客户端工具、社区交流等多个方面,一起来看看吧!

文章图片
1分钟从0到1完成dify的部署

Dify 是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。以下是其核心功能列表:1. 工作流: 在画布上构建和测试功能强大的 AI 工作流程,利用以下所有功能以及更多功能。2. 全面的模型支持: 与数百种专有/开源 LLMs 以及数十种推理提供商和自托管解决方案无缝集成,涵盖 GPT、Mistral

文章图片
大模型RAG使用sentence_transformers将文档存入向量数据库 pgvector

使用 `sentence_transformers` 库将文本转换为向量,并将这些向量存储到使用 `pgvector` 扩展的 PostgreSQL 数据库中,你可以按以下步骤操作。

文章图片
#数据库#语言模型#人工智能
RAG、大模型与智能体的关系

一句话总结:RAG(中文为检索增强生成) = 检索技术 + LLM 提示。

文章图片
#人工智能
    共 50 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择