扶摇升个人主页

@skyupward

扶摇升

2024-01-21 14:21:58 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大型语言模型（LLM）部署中的内存消耗计算

在部署大型语言模型（LLM）时，显存（VRAM）的合理规划是决定模型能否高效运行的核心问题。本文将通过详细的公式推导和示例计算，系统解析模型权重、键值缓存（KV Cache）、激活内存及额外开销的计算逻辑，并探讨并发场景下显存需求的变化规律。

#语言模型 #人工智能 #自然语言处理

Thymeleaf条件判断

th:ifth:if属性求Bool值，只有true的时候其所在的标签及该标签中的内容才会被渲染到输出结果中<a href="comments.html"th:href="@{/product/comments(prodId=${prod.id})}"th:if="${not #lists.isEmpty(prod.comments)}">view</a>th:if=“express

大型语言模型（LLM）部署中的内存消耗计算

#语言模型 #人工智能 #自然语言处理

linux上1024以下的端口

在Linux上，以一般用户身份执行一个需要占用小于1024端口的程序，会得到错误提示：Permission denied这是因为在Linux平台，小于1024的端口被认为是特殊端口。The TCP/IP port numbers below 1024 are special in that normal users are not allowed to run servers on t

#1024

到底了