社区云

Triton

HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2024-11-21 16:41:59

【Triton 教程】融合注意力 (Fused Attention)

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →https://triton.hyper.ai/这是根据 Tri Dao 的 Flash Attention v2 算法的 Triton 实现。致谢：OpenAI 核心团队特别鸣谢：Fl

#Triton #人工智能 #科技 +1

718 

20 
HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2024-10-31 12:36:32

【Triton 教程】矩阵乘法

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →在本教程中，您将编写一个非常简短的高性能 FP16 矩阵乘法内核，其性能可以与 cuBLAS 或 rocBLAS 相媲美。

#人工智能 #GPU #Triton +1

434 

5 
HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2024-11-07 16:29:09

【Triton 教程】低内存 Dropout

Dropout 是在中引入的一种技术，用于改善低数据条件下深度神经网络的性能，通常用于正则化。它接受一个向量作为输入，并生成相同 shape 的输出向量。输出中的每个标量都有概率 p 被设为零，否则直接从输入复制。这使得网络在仅有输入的 1−p 标量时也能表现良好。在评估阶段，为了充分利用网络的能力，将 p 设为 0。但是简单地将 p 设为 0 会增加输出的范数，可能会人为地降低输出的 softm

#人工智能 #Triton #科技

987 

14 
HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2024-10-24 19:36:17

【Triton 教程】融合 Softmax (Fused Softmax)

Triton 学习

#Triton #人工智能 #深度学习

681 

28 
上马定江山来自 Triton中文社区

triton.csdn.net · 2024-10-24 14:30:09

AI模型部署：Triton+Marker部署PDF转markdown服务

marker是github上一个一个基于Python语言实现的开源的项目，它基于多个OCR模型的组合流水线来完成PDF转Markdown的任务，模型包括ORC文字提取页面布局和阅读顺序识别分模块的清洗和格式化模型合并和后处理使用pip可以安装marker安装完之后在环境变量路径下会安装对应的转化工具marker_single。

#人工智能 #语言模型 #Triton

855 

18 
HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2024-10-17 16:49:39

【Triton 教程】向量相加

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。

#人工智能 #机器学习 #Triton

1355 

44 
HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2025-01-22 13:23:14

【Triton 教程】triton.jit

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。使用 Triton 编译器的 JIT 编译函数的装饰器。更多 Triton 中文文档可访问 →。

#人工智能 #python #GPU +2

282 

1 
JulyLi2019 来自 Triton中文社区

triton.csdn.net · 2021-08-12 20:30:09

Jetson调用triton inference server详细笔记

文章目录一、jetson安装triton-inference-server1.1jtop命名行查看jetpack版本与其他信息1.2下载对应版本的安装包1.3解压刚刚下载的安装包，并进入到对应的bin目录下1.4尝试运行一下tritonserver二、运行triton-inference-server2.1下载相关文件包2.2生成模型文件2.3启动tritonserver三、测试triton cl

#python #Jetson #Triton

4361 

6 
扫地的小何尚来自 Triton中文社区

triton.csdn.net · 2023-06-22 08:23:39

Triton教程 --- 自定义操作

Triton 推理服务器部分支持允许自定义操作的建模框架。自定义操作可以在构建时或启动时添加到 Triton，并可供所有加载的模型使用。

#python #人工智能 #深度学习 +3

1342 

1 
上马定江山来自 Triton中文社区

triton.csdn.net · 2024-10-19 10:25:55

AI模型部署：一文搞定Triton Inference Server的常用基础配置和功能特性

数据维度配置数据类型配置模型状态管理模型版本管理服务端前处理服务端后处理执行实例设置和并发、模型预热、动态批处理

#人工智能 #语言模型 #Triton

1843 

24 
HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2024-11-14 17:51:47

【Triton 教程】层标准化

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境，以高效编写自定义 DNN 计算内核，并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →在本教程中，你将编写一个比 PyTorch 实现运行更快的高性能层标准化 (layer normalization) 内核。

#Triton #人工智能 #深度学习 +1

1329 

24 
云樱梦海来自 Triton中文社区

triton.csdn.net · 2024-11-26 16:14:07

Windows系统下安装Triton 3.0.0预编译Triton 2.1.0

Triton是一个用于编写高效自定义深度学习原语的语言和编译器。它旨在提供一个开源环境，使得编写代码的速度比CUDA更快，同时比其他现有的DSLs（领域特定语言）更灵活。

#Triton

1256 

9 
HyperAI超神经来自 Triton中文社区

triton.csdn.net · 2024-10-14 14:25:41

首个完整 Triton 中文文档上线！开启 GPU 推理加速新时代

Triton中文百宝书上线啦

#人工智能 #科技 #Triton +1

1272 

22 
✦昨夜星辰✦ 来自 Triton中文社区

triton.csdn.net · 2024-10-17 16:01:37

Triton Inference Server 架构原理

我们在部署过程中需要进行的操作就是根据需要进行 config.pbtxt 配置和 model.py 脚本代码的修改，当然 triton_model_repo 仓库中并不是固定的上面这些 backend，而是可以根据需求自行增加或者删除。

#Triton #系统架构 #人工智能

1972 

52 
zhaotun123 来自 Triton中文社区

triton.csdn.net · 2024-09-10 10:11:28

NVIDIA Triton Inference Server 部署 yolov5

Nvidia Triton Inference Server 部署 yolov5

#Triton #docker

554 

4 
上马定江山来自 Triton中文社区

triton.csdn.net · 2024-10-20 08:00:00

AI模型部署：Triton Inference Server模型推理核心特性和配置汇总实践

执行实例设置并发请求测试模型预热请求合并动态批处理因为这个行业不同于其他行业，知识体系实在是过于庞大，知识更新也非常快。作为一个普通人，无法全部学完，所以我们在提升技术的时候，首先需要明确一个目标，然后制定好完整的计划，同时找到好的学习方法，这样才能更快的提升自己。这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费。

#人工智能 #语言模型 #Triton

1286 

30 
✦昨夜星辰✦ 来自 Triton中文社区

triton.csdn.net · 2024-10-15 19:50:58

TensorRT-LLM & Triton Server 部署过程记录

虽然理论上 Docker 方式部署不是必须，但在实践中发现如果不使用官方镜像，在配置 TRT 和 NTIS 环境的时候会出现各种由于版本 mismatch 的编译错误，比如 mpi4py api 的编译过程中，由于我们服务器的 os 版本（ubuntu24.04）与 os 对应的 openmpi 版本（4.1.6）超前导致编译失败等类似情况（在这个过程中就花费了大量的时间成本）。还是以上面的场景举

#Triton #人工智能

1946 

28 
嘉诩来自 Triton中文社区

triton.csdn.net · 2023-06-07 14:21:03

OpenAI Triton 初探

。Triton 2021年发布了1.0，我在调研GPU使用方法的时候知道了有这个东西，但是当时还不了解OpenAI，觉得这个项目太新太小众，并没有深究。Triton的概念模型相较于cuda的模型，把基于Thread的模型扩展为基于block的。我觉得从线性代数的观点来看，就是把基于矩阵元素的粒度，变成了分块矩阵的粒度。对于GPU这样的设备，每个SM是有局部缓存的。传统的写法是用三重循环。

#python #Triton #GPU

1174 

2 
geeksoarsky 来自 Triton中文社区

triton.csdn.net · 2024-04-08 14:13:22

Triton Server Python 后端优化

接上文。

#Triton

1259 

5 

标签介绍

Triton

——Triton

热门标签

本周

历史

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net