logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

vLLM私有化部署大语言模型LLM

vLLM是一种用于大规模语言模型(LLM)推理的框架,旨在提高模型的吞吐量和降低延迟。vLLM通过优化内存管理和调度策略,显著提升了模型在高并发场景下的性能。vLLM利用了一种名为PagedAttention的注意力机制,该机制借鉴了虚拟内存和分页技术,以减少缓存内存(KV Cache)的浪费,并允许在请求之间灵活共享KV缓存。这种设计使得vLLM在保持与现有系统相同延迟水平的情况下,能够将吞吐量

文章图片
#人工智能#AI
Kubernetes(一):安装与集群构建

本文详细介绍了Kubernetes v1.34.1集群的安装与配置过程。主要内容包括:环境准备(服务器配置、网段规划)、安装Containerd容器运行时和Kubernetes软件(kubeadm、kubectl、kubelet)、构建集群(初始化控制平面、加入工作节点)、部署Calico网络插件等关键步骤。特别强调了使用最新版本、规范安装的重要性,并提供了国内镜像源配置、节点DNS设置等实用技巧

文章图片
#kubernetes#容器#网络 +2
Ollama私有化部署大语言模型LLM

是一个开源的大型语言模型(LLM)服务工具,旨在简化在本地环境中部署和运行这些模型的过程。它支持多种操作系统,包括Windows、macOS和Linux,并且可以通过Docker容器进行管理。Ollama封装了llama.cpp库,并提供与OpenAI兼容的API,支持多种语言模型如Llama3、Mistral和Gemma。此外,Ollama还支持并行请求和多线程操作,提高了效率。用户可以通过简单

文章图片
#AI#人工智能
vLLM私有化部署大语言模型LLM

vLLM是一种用于大规模语言模型(LLM)推理的框架,旨在提高模型的吞吐量和降低延迟。vLLM通过优化内存管理和调度策略,显著提升了模型在高并发场景下的性能。vLLM利用了一种名为PagedAttention的注意力机制,该机制借鉴了虚拟内存和分页技术,以减少缓存内存(KV Cache)的浪费,并允许在请求之间灵活共享KV缓存。这种设计使得vLLM在保持与现有系统相同延迟水平的情况下,能够将吞吐量

文章图片
#人工智能#AI
03:PostgreSQL逻辑结构(表空间、数据库、模式、表、索引)

本文假设已经掌握SQL基本语法和数据库基础概念。包括表空间、数据库、模式、表、索引、关闭自动提交AUTOCOMMIT

文章图片
#数据库#postgresql
JAVA线程状态(New、Runnable、Blocked、Waiting、Timed waiting、Terminated)

Java线程状态概述在Java中,线程可以有如下 6 种状态:New (新创建)Runnable (可运行)Blocked (被阻塞)Waiting (等待中)Timed waiting (计时等待)Terminated (被终止)具体见图(图来源:https://www.uml-diagrams.org/java-thread-uml-state-machine-diagram-example.

文章图片
#java
概念区分:CRI、OCI、containerd、Docker、CRI-O、runc、CNI、CSI等名词

CRI-O 是专门为 Kubernetes 设计的轻量级容器运行时,遵循 Kubernetes 的 CRI(Container Runtime Interface)规范,简化与 Kubernetes 的集成。特点:提供了丰富的开发工具,支持容器的构建、运行、网络、存储管理。如上图,在Kubernetes<1.24提供了丰富的工具,支持容器构建、运行、网络、存储管理。Container Networ

文章图片
#docker#容器#运维 +1
vLLM私有化部署大语言模型LLM

vLLM是一种用于大规模语言模型(LLM)推理的框架,旨在提高模型的吞吐量和降低延迟。vLLM通过优化内存管理和调度策略,显著提升了模型在高并发场景下的性能。vLLM利用了一种名为PagedAttention的注意力机制,该机制借鉴了虚拟内存和分页技术,以减少缓存内存(KV Cache)的浪费,并允许在请求之间灵活共享KV缓存。这种设计使得vLLM在保持与现有系统相同延迟水平的情况下,能够将吞吐量

文章图片
#人工智能#AI
03:PostgreSQL逻辑结构(表空间、数据库、模式、表、索引)

本文假设已经掌握SQL基本语法和数据库基础概念。包括表空间、数据库、模式、表、索引、关闭自动提交AUTOCOMMIT

文章图片
#数据库#postgresql
Elasticsearch及ELK使用(二):日志数据采集

上一篇结束了Elasticsearch和kibana的安装和基本使用。本文介绍日志数据采集(也叫日志采集),涉及filebeat的软件和logstash软件。本文分别介绍了从日志文件采集和从数据库(MySQL)中采集。

文章图片
#elasticsearch
    共 20 条
  • 1
  • 2
  • 请选择