新兴ICT项目支撑个人主页

@firehadoop

新兴ICT项目支撑

2023-04-09 19:12:48 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

私有化部署大模型推理性能分析

从用户感知角度分析私有化部署的大模型推理性能，这里的用户感知包括响应速度、生成速度、系统可用性以及系统稳定性。核心性能指标对用户感知的影响包括1、延迟指标2、吞吐量指标3、资源利用4、并发能力性能指标与用户感知的映射关系从网上搜索了一些信息汇总，

#大数据

关于deepseek R1模型分布式推理效率分析

DeepSeek R1 采用了混合专家（Mixture of Experts，MoE）架构，包含多个专家子网络，并通过一个门控机制动态地激活最相关的专家来处理特定的任务。延迟是此阶段的关键问题。在分布式环境中，不同的节点可以并行处理输入的不同片段或不同的层，从而可能显着提高速度。在推理期间，当一个 token 被路由到一组特定的 8 个专家时，只有托管这些专家的节点才需要执行涉及其参数的大量计算。

#架构

天翼云910B部署DeepSeek蒸馏70B LLaMA模型实践总结

天翼云通过910b部署deepseek r1 70b蒸馏模型

#linux #运维 #服务器

deepseek大模型推理prefill/decode阶段研究分析

数据流向Prefill：所有输入token并行通过所有层Decode：一次只有一个新token通过所有层缓存使用Prefill：创建KV缓存Decode：利用已有KV缓存计算模式Prefill：批量处理Decode：自回归处理二、 Prefill阶段的目标与工作原理Prefill阶段的核心目标是将理解用户输入token的含义，生成输出第一个token，是后续decode阶段的首个输入。三、举例说明

#php #开发语言

docker容器安装开源运维系统zabbix

一、zabbix可以干什么Zabbix 是由 Alexei Vladishev 开发的一种网络监视、管理系统，基于 Server-Client 架构。可用于监视各种网络服务、服务器和网络机器等状态。Zabbix 使用 MySQL、PostgreSQL、SQLite、Oracle 或 IBM DB2 储存资料。Server 端基于 C语言、Web 前端则是基于 PHP 所制作的。Zabbix...

大数据-爬虫框架学习--scrapy

一、scrapy是什么 Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。 Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，也可以应用在获取API所返回的数据

#爬虫 #scrapy #大数据

天翼云应用实操-天翼云资源池间通过IPSEC实现高速互通

天翼云的资源池是2+31+N，分布在全国各地，每个省及大点的地市几乎都有资源池，如果你的客户在不同省份的资源池都部署了云上应用并且想把这些资源池共享数据，你可以首先通过互联网的EIP实现，其次如果想要数据安全传输，可以用天翼云云间高速产品通过专线实现不同云池间的高速安全连接，但是价格也非常感人，一般人是根本不敢用，那有么有既保障安全又可以高速连接的方法呢？下面的内容就是介绍如何实现在不同...

deepseek大模型推理prefill/decode阶段研究分析

#php #开发语言

私有化部署大模型推理性能分析

#大数据

deepseek大模型推理prefill/decode阶段研究分析

#php #开发语言

共 25 条

请选择