logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

llm模型计算显存大小

在部署大型(LLM)时,显存(VRAM)的合理规划是决定模型能否高效运行的核心问题。本文将通过详细的公式推导和示例计算,系统解析模型权重、键值缓存(KV Cache)、激活内存及额外开销的计算逻辑,并探讨并发场景下显存需求的变化规律。

AI:paddlepaddle2.6,paddleorc2.8,cuda12,cudnn,nccl,python10环境

1.安装英伟达显卡驱动首先需要到NAVIDIA官网去查自己的电脑是不是支持GPU运算。。打开后的界面大致如下,只要里边有对应的型号就可以用GPU运算,并且每一款设备都列出来相关的计算能力(Compute Capability)。如果是ubuntu系统:明确了显卡性能后,接下来就开始在ubuntu系统安装对应的显卡驱动。或者去官网下载驱动再手动安装的方式,命令官网上有。上图显示cuda最高支持12.

文章图片
#paddlepaddle#python#人工智能
tritonserver 推理框架

步骤 1:在 Python 后端中编写代码,解析请求中的图片 URL/Base64 数据,完成图片编码(如用 CLIP 视觉编码器);步骤 2:将编码后的视觉特征与文本特征融合,送入大模型推理;步骤 3:Triton 负责接收 / 返回请求,Python 后端处理核心多模态逻辑。Triton 不仅支持多模态模型,还是生产环境部署多模态大模型的主流选择(优势:高并发、动态批处理、多后端统一管理)。v

#人工智能
/bin/sh: warning: setlocale: LC_ALL: cannot change locale (zh_CN.UTF-8) centos7

最后的处理方案是dockerfile 构建过程执行警告的地方后 再执行一次。centos7是以后这种操作centos6及以下不一样。但是在Dockerfile 里面执行的时候 不太一样。在基础镜像的再安装软件的时候再次碰到这个异常提示。必须执行三个步骤才不会出错。这样才可以保证中文不会有问题。

#服务器#linux#运维
解决nginx使用proxy_pass反向代理时,session,cookie丢失的问题

https://www.cnblogs.com/zangdalei/p/6021352.html  这2天在测试Nginx作为反向代理到Tomcat应用时,session丢失的问题。经过一系列查看官方文档和测试,发现如下:1、如果只是host、端口转换,则session不会丢失。例如:      location /testwx {             proxy_pass   ...

kubernetes资源对象kind

PetSet首次在K8S1.4版本中,在1.5更名为StatefulSet。除了改了名字之外,这一API对象并没有太大变化。注意:以下内容的验证环境为CentOS7、K8S版本1.5.2,并部署SkyDNS。http://blog.csdn.net/liyingke112/article/details/76685794https://blog.csdn.net/liyingke112/artic

k8s的imagePullSecrets如何生成及使用

一、概述http://docs.kubernetes.org.cn/548.htmlhttps://kubernetes.io/docs/tasks/configure-pod-container/pull-image-private-registry/公司的docker仓库(harbor),是私有的,需要用户认证之后,才能拉取镜像。二、生成secret登录docker登录到k8s master节

利用ffmpeg录制rtsp流的方法总结(一)

致敬雷霄骅(已逝):https://blog.csdn.net/leixiaohua1020/article/details/18893769这里主要结合平时对音视频的学习,将ffmpeg录制rtsp的方法在这里记录下。因为下载的来源不同,这些电影文件有不同的格式,用不同的后缀表示:avi,rmvb,mp4,flv,mkv等等(当然也使用不同的图标)。在这里需要注意的是,这些格式代表的是封...

jenkins curl token api,通过API 执行 grovvy 脚本

老版本直接用户名和密码即可,新版要求是用户名和token方式,我的jenknis版本是Jenkins 2.303.1Build Authorization Token Root | Jenkins plugin在 全局安全配置中打开下面选项 首先在用户下面创建自己的API Token并保存,配置路径:系统管理->安全里面的管理用户 测试的job 执行curl 调用api 来build参数说明:-u

#jenkins#运维
    共 159 条
  • 1
  • 2
  • 3
  • 16
  • 请选择