
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
引言本文主要梳理了ClickHouse分布式表,也就是是Distributed表引擎基本工作原理。主要内容有:分布式表分片算法规则分布式表写入基本流程分布式表读出数据流程非分布式表写入本地表一、分布式表分片算法规则使用分布式表时,数据应该落到哪个分片节点上呢?ClickHouse有一套自己的分片算法,下面从概念开始就一探究竟。分片键(sharding_key): 要求返回...
目录一、背景二、高性能、易扩展的大模型推理框架是什么样的1.大模型推理框架需要满足的基本条件2.大模型推理框架设计三、解决显存碎片问题,大幅提升吞吐—Paged Attention四、缓存之前请求的计算结果,减少重复计算—Radix Attention五、请求分块处理,避免单个请求卡顿 —— Chunked Prefill六、缩短输出长度,显著提升性能七、使用多卡推理,推理速度翻倍...
目录一、背景二、高性能、易扩展的大模型推理框架是什么样的1.大模型推理框架需要满足的基本条件2.大模型推理框架设计三、解决显存碎片问题,大幅提升吞吐—Paged Attention四、缓存之前请求的计算结果,减少重复计算—Radix Attention五、请求分块处理,避免单个请求卡顿 —— Chunked Prefill六、缩短输出长度,显著提升性能七、使用多卡推理,推理速度翻倍...
目录一、背景二、高性能、易扩展的大模型推理框架是什么样的1.大模型推理框架需要满足的基本条件2.大模型推理框架设计三、解决显存碎片问题,大幅提升吞吐—Paged Attention四、缓存之前请求的计算结果,减少重复计算—Radix Attention五、请求分块处理,避免单个请求卡顿 —— Chunked Prefill六、缩短输出长度,显著提升性能七、使用多卡推理,推理速度翻倍...
目录一、系统相关指标二、GC相关指标三、JVM相关指标四、Topic相关指标五、Broker相关指标六、系列文章一、系统相关指标1.系统信息收集java.lang:type=...
引言Apache Pulsar越来越多的公司使用,与Apache Kafka、Apache RocketMQ并列成为消息领域三家马车,有必要对其研究一番。下面以笔者曾在生产环境使用的配置梳...
一、情况分析1.客户端异常报警晚上10点20分接到使用方电话,日志持续报以下异常,持续时间已有10多分钟。ERROR 2019-05-15 23:05:23,221 [kafka-pro...
目录1.retries参数说明2.retries使用建议3.retries后续发展1.retries参数说明参数的设置通常是一种取舍,看下retries参数在版本0.11.3说明:S...
测试背景 当前小红书消息引擎团队与 AutoMQ 团队正在深度合作,共同推动社区建设,探索云原生消息引擎的前沿技术。本文基于 OpenMessaging 框架,对 AutoMQ 进行了全面测评。欢迎大家参与社区并分享测评体验。01测试结论本文主要测评云原生消息引擎 AutoMQ 和 Apache Kafka(3.4 版本)的性能对比。测试结论:实时读写:相同集群规模,AutoMQ 的极限读写吞吐是
01前言Kafka 作为流处理平台,在实时流计算和在线业务场景,追尾读追求端到端低延迟。在离线批处理和削峰填谷场景,数据冷读追求高吞吐。两个场景都需要很好的数据缓存设计来支撑,Apache Kafka 的数据存储在本地文件,通过 mmap 将文件映射到内存中访问,天然就可以依托操作系统来完成文件的缓冲持久化、缓存加载和缓存驱逐。AutoMQ 采用存算分离的架构,将存储分离至对象存储,本地没有数据文