logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

vLLM、Ollama、TGI三大模型推理框架对比

2.Ollama的独特优势。1.vLLM的杀手锏。3.TGI的核心能力。

#深度学习#机器学习#生成对抗网络
把大模型装进小水管——用自来水管的故事讲透 vLLM

vLLM:大模型推理的吞吐量革命 大模型推理常受限于显存瓶颈,导致GPU利用率低下。vLLM通过创新性技术PagedAttention(分页KV缓存管理),将显存碎片率降至1%以下,实现连续批处理和高效并行解码。相比传统框架,vLLM无需修改代码即可提升吞吐量3-10倍,如70B模型单机吞吐从300请求/分钟跃升至2000+。其优势包括: 显存优化:分块复用显存,支持更大模型(如70B)在有限GP

#架构#人工智能#大数据 +2
Embedding模型在电商推荐系统中的应用

),使计算机能通过向量计算理解商品之间的语义关系。电商场景下用户行为稀疏(如90%的商品无点击),Embedding通过聚合用户行为序列,挖掘潜在关联(例如“用户买奶粉后常买尿布”),解决传统协同过滤的冷启动问题。1.多任务联合训练:将点击率预测、购买转化、退货率预测等目标联合优化,生成更鲁棒的Embedding。2.因果推断嵌入:区分用户点击商品的真正兴趣与平台曝光偏差,提升Embedding的

#开发语言#知识图谱#自然语言处理 +1
大模型在问答系统中的应用:从技术到落地的深度解析

他们用了微调方案,用大量标注数据训练模型。智能体(Agent)框架复杂问题处理、多工具协同场景工具 API 数据 + 少量示例数据初始成本适中,运营成本较高能处理超复杂问题,多工具协同能力强系统复杂度高,出错排查难度大。微调(Fine-tuning)对回答风格、术语、深度领域知识要求极高的场景大量标注数据初始成本高,运营成本高回答风格统一,领域知识深度高部署和维护成本高,知识更新慢。我们有个客户,

#自然语言处理#人工智能#算法 +2
使用 LangChain 创建你的第一个智能体:从单 Agent 到多 Agent

本文介绍了LangChain框架下单Agent和多Agent的开发方法。单Agent基于REACT架构,通过思考-行动循环完成任务,核心组件包括大模型、提示词模板和调用工具,并以电影推荐系统为例展示实现流程。多Agent则依托LangGraph工作流系统,通过节点、边和条件分支实现复杂任务协同处理,文章详细阐述了电商订单处理工作流的设计与执行逻辑,展示了如何将多个智能体有机组合完成业务流程自动化。

#python#架构#语言模型
MCP系列第五集:从零开始构建MCP工具函数

在AI模型与外部世界的交互中,工具函数扮演着"智能体手脚"的关键角色。它们不仅是LLM调用外部能力的接口,更是打破数据孤岛、实现跨系统协作的桥梁。通过MCP协议标准化的工具函数定义,开发者可以像搭建乐高积木一样,将数据库查询、API调用、文件操作等能力模块化,让AI模型自主选择和组合这些工具完成复杂任务。当我们将这些工具函数部署到Cursor、Claude Desktop等MCP客户端时,AI模型

#人工智能#自然语言处理#语言模型 +2
Coze扫盲

字节跳动推出的无代码AI应用开发平台,支持通过插件、工作流、知识库等功能快速构建智能体(Bot)。进入,点击「创建Bot」→填写名称/头像→选择模型(推荐GPT-4o或豆包-pro系列)串联多个Bot分工处理任务(例:热点分析Bot→文案生成Bot→排版优化Bot)• 结构化描述身份/技能/限制(例:英语精读专家需指定输出格式)• Bot(机器人):AI交互核心,通过提示词定义角色和任务。• 工作

文章图片
#人工智能#机器学习#python
关于大语言模型的长期记忆

长期记忆指模型在超长上下文(如多轮对话、长篇文档)中持续关联和调用信息的能力。例如,它能记住用户10天前提到的偏好,或在分析整本书时理解首尾呼应的逻辑。当前技术以扩展窗口、外部存储和动态路由为主,未来需在效率、准确性和成本间寻求平衡。大语言模型(LLM)的长期记忆是其理解复杂任务、维持连贯交互的核心能力。3.复杂推理:支持多步骤任务(如编程调试),依赖上下文关联能力。1.类脑记忆分层:模拟人类记忆

#自然语言处理#人工智能#知识图谱 +1
MCP系列第十二集:MCP协议--重构多智能体协作的神经网络

MCP(Model Context Protocol)协议的出现,如同AI领域的USB-C接口,通过标准化通信机制实现智能体与外部世界的无缝连接。MCP协议正以“数字神经网络”的姿态重构多智能体系统。从汽车工厂的机器协同到跨境支付的毫秒级风控,这项技术证明:当智能体突破数据藩篱,其产生的群体智能将远超个体能力之和。未来,随着量子计算芯片与MCP协议的融合,我们或许将见证智能体网络实现真正意义上的“

#人工智能#自然语言处理#知识图谱 +1
MCP系列第三集:MCP协议--解锁AI与外部系统深度交互的万能钥匙

正是在这种背景下,由Anthropic主导研发的模型上下文协议(Model Context Protocol, MCP)应运而生,它正在重新定义AI与外部世界的交互规则。传统开发模式中,每个新工具的接入都需要修改智能体的源代码,这种"写死接口"的方式严重制约了系统的扩展性。例如,某电商平台引入新的物流查询系统后,只需部署对应的MCP服务器,现有的智能客服系统即可自动识别并调用新接口,无需任何代码改

#自然语言处理#知识图谱#人工智能 +1
    共 326 条
  • 1
  • 2
  • 3
  • 33
  • 请选择