logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

使用vLLM部署大模型,如何调用本地部署大模型的API路由

摘要:vLLM本地部署后,可通过指令启动API服务并访问http://localhost:8000进行交互。支持两种调用方式:1)命令行方式,使用curl发送GET/POST请求获取模型信息或生成对话;2)Python脚本方式,通过requests库调用ChatCompletions接口,兼容OpenAI风格。两种方法均需指定模型名称、消息格式和生成参数,支持调整temperature等参数控制输

文章图片
#深度学习#人工智能
vLLM API 服务启动日志详解

本文解析了vLLM API服务启动日志的功能。当执行vLLM服务启动命令后,终端会输出服务地址(http://0.0.0.0:8000)和可用API路由列表,包括系统路由、基础功能、大模型接口等。日志显示服务进程ID(2520)和启动完成状态,表明API服务已就绪,可通过指定端口访问交互式文档或调用各类模型接口。这些日志信息帮助用户了解服务运行状态和可用功能。

文章图片
#人工智能
vLLM API 服务启动日志详解

本文解析了vLLM API服务启动日志的功能。当执行vLLM服务启动命令后,终端会输出服务地址(http://0.0.0.0:8000)和可用API路由列表,包括系统路由、基础功能、大模型接口等。日志显示服务进程ID(2520)和启动完成状态,表明API服务已就绪,可通过指定端口访问交互式文档或调用各类模型接口。这些日志信息帮助用户了解服务运行状态和可用功能。

文章图片
#人工智能
如何调用huggingface模型中Qwen3-0.6B模型搭建本地大模型助手(单次对话与多轮对话版),并且单样本调用和batch方式调用的对比

本文介绍了如何使用HuggingFace中的Qwen3-0.6B模型构建对话系统。主要内容包括:1)单次调用模型的方法,包括模型导入、提示词模板构建、tokenize处理和结果解码;2)构建支持多轮对话的QwenChatbot类,实现对话历史记录和响应生成;3)批量处理方法,通过设置batch_size提高处理效率,包括批量消息构建、模板转换、模型生成和结果解析。特别说明了在批量处理时需要使用pa

文章图片
#深度学习#人工智能
如何调用huggingface模型中Qwen3-0.6B模型搭建本地大模型助手(单次对话与多轮对话版),并且单样本调用和batch方式调用的对比

本文介绍了如何使用HuggingFace中的Qwen3-0.6B模型构建对话系统。主要内容包括:1)单次调用模型的方法,包括模型导入、提示词模板构建、tokenize处理和结果解码;2)构建支持多轮对话的QwenChatbot类,实现对话历史记录和响应生成;3)批量处理方法,通过设置batch_size提高处理效率,包括批量消息构建、模板转换、模型生成和结果解析。特别说明了在批量处理时需要使用pa

文章图片
#深度学习#人工智能
torch.tile 与 .repeat方法的区别

首先,从大体的功能上来看,两者均是相同的,能够按照一定维度对张量进行复制,但细微上还是有一定差距。

文章图片
#pytorch#人工智能#python
云平台显卡选型所需要注意的一些点:CPU、GPU、FLOPs 是什么?

本文将介绍什么是GPU、CPU以及这两者之间的关系以及参数,再结合FLOPs的知识告诉你如何对显卡进行选型。

文章图片
#硬件架构#云计算#深度学习
torch.sin( )参数详解

是 PyTorch 提供的一个函数,用于计算输入张量中元素的正弦值。它的功能非常简单,就是将输入张量中每个元素的值作为角度,计算其对应的正弦值。具体来说,函数接受一个张量作为输入,并返回一个张量,其中每个元素是输入张量中对应元素的正弦值。

文章图片
#pytorch#人工智能#python
torchvision.transforms中的Resize用法

本文主要介绍了pytorch中torchvision.transforms.Resize 的用法。

文章图片
#计算机视觉#人工智能#pytorch +2
一文教你搞懂K210中GPIO配置

K210分为外部I/O和内部I/O两种I/O接口模式,外部I/O表示的是硬件上固定连接好的I/O接口配置,例如本例中LED_B就连接到外部I/O中的IO12。而内部I/O也就是我们所说的GPIO口,GPIO是直接连接到单片机芯片上的,这个是我们可以直接操作的,我们可以在GPIO口上配置模式,输入输出状态,电平等。最后,总结一下:硬件所连接的外部I/O只是类似一个“死的东西”,我们要配置内部I/O口

文章图片
#python#嵌入式硬件#深度学习 +3
    共 11 条
  • 1
  • 2
  • 请选择