logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

glip的修改

在import部分后添加一键迁移逻辑:import torch_npufrom torch_npu.contrib import transfer_to_npu修改“tools/test_grounding_net.py”脚本。在import部分后添加一键迁移逻辑:import torch_npufrom torch_npu.contrib import transfer_to_npu开启二进制说

文章图片
#深度学习#pytorch
LangChain 中 Prompt 模板

用于构建多轮对话式提示(聊天格式):用于构建简单的文本提示模板两者都支持变量填充和参数化处理,但适用场景不同。专为聊天机器人设计,遵循通用聊天消息格式(如 OpenAI API 格式)。每条消息必须包含role和content字段。支持多轮对话结构,适合复杂交互任务。适用于单次文本提示,不涉及对话历史。支持变量插值{variable},可动态替换内容。可显式声明变量,也可自动推断。特性用途多轮对话

文章图片
#人工智能
多轮对话历史管理

需求实现方式多用户隔离自动过期ttl=86400参数限制轮数继承LTRIM生产部署用长期记忆额外将问答存入 FAISS/Milvus建议:短期会话用 LangChain + Redis;长期语义记忆用 RAG + 向量库。两者互补!# 截断:只保留最近 max_messages 条。

文章图片
#transformer#人工智能
大模型推理model.generate()+tokenizer.decode() 、model(**input)

方法功能输入输出是否涉及GPU计算完整生成:一次性生成多token文本✅ 是单步推理:计算一次前向传播Logits(概率分布)✅ 是文本转换:将token ID转成文本字符串(String)❌ 否(CPU操作)model.generate() = 自动循环调用模型多次,生成一串token IDsmodel(**input) = 单次调用模型,返回概率分布(logits)tokenizer.deco

文章图片
#人工智能#深度学习
langgraph 构建一个带工具调用的简单 Agent 工作流

HumanMessage(content='今天上海的天气怎么样?', additional_kwargs={}, response_metadata={}, id='ef338c50-e6bf-4726-887e-7c4ad8699726')LangChain 的。

文章图片
create_tool_calling_agent、create_react_agent区别

如果你使用的是 GPT-3.5/4、Claude 3 等先进模型:请优先使用。它是现代的标准,错误率更低,体验更好。如果你使用的是早期的开源模型(如 Llama-2, Vicuna)或者模型不支持 API 级别的工具调用:你需要使用(或者),通过提示词技巧来强制模型调用工具。

文章图片
LangChain 中创建 Agent(智能体)方法

和是 LangChain 中用于创建的两个不同函数,它们代表了。

文章图片
LangChain 框架-短期记忆能力

是 LangChain 中实现短期对话记忆的最简单方式,适用于单次会话内的上下文保持。只需几行代码,就能让 AI 记住你说过的话!控制历史长度→ 用节省 token→ 用多用户持久化→ 用。

文章图片
LangChain 框架-长期记忆能力

特性Redis 示例MySQL 示例存储类型内存数据库(快速读写)关系型数据库(结构化、持久)适用场景缓存、实时性强的应用需要事务、备份、审计的场景部署要求安装 Redis 服务安装 MySQL 并配置权限扩展性易于集群扩展支持主从复制、分库分表数据结构简单键值对表格形式,支持 JOIN 查询自动建表❌✅(首次运行时自动创建)通过结合或,可以在 LangChain 中轻松实现基于会话的长期记忆功能

文章图片
    共 25 条
  • 1
  • 2
  • 3
  • 请选择