logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何在 PostgreSQL 中实现高效的分页查询,特别是在数据量巨大的情况下?

在 PostgreSQL 中实现高效的分页查询,尤其是在数据量巨大的情况下,需要综合考虑数据的特点、查询条件和性能需求。

文章图片
#postgresql#数据库
mysql批量更新语句

本文总结了四种SQL数据更新方法

文章图片
#mysql#数据库#java +2
python绘制子图技巧——plt.subplot和plt.subplots、及坐标轴修改

偶然发现中绘制子图有两种方法,一种是,另一种是,这篇博客说一下这两种方法的区别,用法,以及常用的一些函数。的作用是定义一个大的图纸,可以设置图纸的大小、分辨率等,例如是直接在当前活跃的的axes上面作图,注意是当前活跃的知道这两点基础知识后,再来看和作用是指定子图的位置,比如说现在总共有1行10列,当前子图位于哪里;使用这个函数时需要先定义一个大的图纸,因为subplot函数无法更改图纸的大小和分

#python#开发语言#html +2
vLLM on Ascend 实战总结:从部署到性能调优的完整流程解析

昇腾平台以其完善的软件栈和高效的并行算子执行能力,为 vLLM 提供了新的运行后端。综合来看,vLLM 的轻量架构与昇腾平台的高性能算力是非常契合的一对组合 前者解决了推理内存瓶颈,后者在硬件层面提供了高吞吐支撑,两者结合能在。其中 VLLM_USE_ASCEND=1 用于显式启用昇腾推理模式,确保 vLLM 在加载模型时调用对应的算子库。以下数据来自昇腾社区公开测试结果,对比了 vLLM 在不同

文章图片
#昇腾
vLLM-ascend:昇腾NPU大模型推理讲解与性能调优

vLLM-ascend是昇腾NPU适配的高性能大模型推理框架,通过PagedAttention和Continuous Batching两大核心技术实现显著性能提升。PagedAttention借鉴操作系统内存管理,将KV Cache分块存储,内存利用率提升至89%;Continuous Batching实现动态请求调度,GPU利用率达92%。vLLM-ascend通过后端适配层实现CUDA到NPU

文章图片
#昇腾
仓颉生态工具新构想:智能包管理器 CangPkg 设计与实现展望

本文提出为华为仓颉语言设计智能包管理器CangPkg的构想,旨在解决依赖管理、性能优化和安全审查等生态建设关键问题

文章图片
#仓颉
vLLM on Ascend 实战总结:从部署到性能调优的完整流程解析

昇腾平台以其完善的软件栈和高效的并行算子执行能力,为 vLLM 提供了新的运行后端。综合来看,vLLM 的轻量架构与昇腾平台的高性能算力是非常契合的一对组合 前者解决了推理内存瓶颈,后者在硬件层面提供了高吞吐支撑,两者结合能在。其中 VLLM_USE_ASCEND=1 用于显式启用昇腾推理模式,确保 vLLM 在加载模型时调用对应的算子库。以下数据来自昇腾社区公开测试结果,对比了 vLLM 在不同

文章图片
#昇腾
vLLM-ascend:昇腾NPU大模型推理讲解与性能调优

vLLM-ascend是昇腾NPU适配的高性能大模型推理框架,通过PagedAttention和Continuous Batching两大核心技术实现显著性能提升。PagedAttention借鉴操作系统内存管理,将KV Cache分块存储,内存利用率提升至89%;Continuous Batching实现动态请求调度,GPU利用率达92%。vLLM-ascend通过后端适配层实现CUDA到NPU

文章图片
#昇腾
AI绘画开源最强软件SD WEBUI手把手使用教学!

帮助用户快速掌握Stable Diffusion WebUI的基础操作,为后续AI绘图创作打下基础。

文章图片
#AI作画
AI绘画开源最强软件SD WEBUI手把手使用教学!

帮助用户快速掌握Stable Diffusion WebUI的基础操作,为后续AI绘图创作打下基础。

文章图片
#AI作画
    共 21 条
  • 1
  • 2
  • 3
  • 请选择