relis 个人主页

@reekyli

relis

2024-01-19 17:34:11 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

PCIe 6.0 vs 5.0：带宽翻倍背后的技术革新与应用前景

PCIe 6.0相比5.0版本代表了互连技术的重大飞跃，不仅实现了带宽翻倍，更通过PAM4调制等创新技术为未来性能提升奠定了基础。这种演进并非孤立进行，而是与整个计算生态系统的发展紧密相连。从技术角度看，PCIe 6.0解决了高性能计算、人工智能和数据中心应用对带宽的迫切需求，同时通过先进的纠错和均衡技术克服了PAM4调制的信号完整性挑战。其广泛的应用场景支持和多种机械形态确保了这一标准能够在各个

解密大语言模型推理：输入处理背后的数学与工程实践

大语言模型推理中的输入处理是一个融合数学理论、算法设计和系统优化的复杂过程。从BPE分词到RoPE位置编码，从多头注意力到KV缓存，每一步都体现了深度学习领域的精妙设计。更高效的分词算法：减少词汇表大小同时保持表达能力线性注意力机制：将计算复杂度从On2O(n^2)On2降至OnO(n)On硬件感知优化：针对特定硬件（如TPU、NPU）定制推理流程动态模型架构：根据输入内容自适应调整计算路径理解大

#语言模型 #人工智能

大语言模型推理的幕后英雄：深入解析Prompt Processing工作机制

Prompt Processing作为大语言模型推理的核心环节，其效率直接决定了整个系统的性能和成本。通过PagedAttention等创新技术，我们能够更高效地管理KV缓存，实现更好的硬件利用率和更高的服务吞吐量。随着模型规模的持续增长和应用场景的不断扩大，Prompt Processing技术将继续演进，为更强大、更高效的AI系统奠定坚实基础。理解这一过程的技术细节，不仅有助于开发者优化模型服

#语言模型 #人工智能

PCIe 6.0 vs 5.0：带宽翻倍背后的技术革命

在数据中心、AI计算和高速存储需求爆炸式增长的今天，传统接口带宽已成为系统性能提升的瓶颈。PCIe 6.0的推出正是为了解决这一挑战，它通过革命性的技术创新，在保持向后兼容的同时实现了带宽的跨越式提升。

WiFi 基本概念（十五）（PHY的数据率）

起初看到到处在谈wifi rate，当然诧异，还以为可以直接配置PHY到某个rate,实际不是的。wifi的rate是一个结果。是一个综合了MCS(modulation & coding Scheme)，bandwidth(number of sub-carriers or tones), Spatial Stream(NSS) (NxN MIMO),以及symbol interval(d

杂谈：WiFi 芯片之软件和硬件接口

WiFi mac实在是一个很大的东西。中间从协议的角度来讲，可以分为加解密模块，protocol controller模块，data interface，其中protocol controller分为RX与TX，由于RX功能较单一，而TX涉及到priority queue以及parameterized queue,因此比较复杂。具体而言，TX分为和queue比较相关的Channel Access

了解Wi-Fi信号强度

目录了解信号强度读dBm理想信号强度了解信号强度Wi-Fi信号强度很棘手。最准确的表达方式与毫瓦（兆瓦），但你最终得到了吨由于Wi-Fi的超低发射功率，使得难以阅读。例如，-40 dBm为0.0001 mW，零信号强度下降得越多就越强烈。RSSI（接收信号强度指示器）是常见的测量方法，但大多数Wi-Fi适配器供应商都能处理不同的是，因为它没有标准化。一些适配器使用刻度0-60，其他0-255。最终

#数据库

杂谈：软件程序和芯片的区别

软件程序和芯片对于程序执行，核心是流水线，它是CPU的大脑，指示各个单元完成指令的取指，数据的搬移，数据的运算等。流水线是标准化的结构，因为CPU要做的事情只有一件，执行程序，产生结果。在硬件中，每个模块要做的事情，当然也是可以用程序+CPU来完成的。不过为了获得更好的性能表现，有时需要用硬件来做。而之所以硬件有更好的性能表现，在于它专业，和人是一样的，精力有限的情况下，要做得越多，那么就不大可能

DeepSeek有什么黑科技：搞懂它的混合专家(MoE)技术

稀疏层相对于密集层的优势在处理高维数据时最为明显，因为高维数据的模式和依赖关系通常很复杂且呈非线性：例如，在需要模型处理长文本序列的 NLP 任务中，每个单词通常仅与该序列中的一小部分其他单词相关。函数：对于每个专家，路由器会根据每个示例预测该专家产生给定输入的最佳输出的概率值（基于该专家与当前参数的连接的权重）；尽管在推理过程中仅使用参数的子集，但模型的所有参数都必须加载到内存中，这意味着 SM

如何看懂源代码--(分析源代码方法)

我们在写程序时，有不少时间都是在看别人的代码。例如看小组的代码，看小组整合的守则，若一开始没规划怎么看，就会“看得想哭 ”不管是参考也好，从开源抓下来研究也好，为了了解箇中含意，在有限的时间下，不免会对庞大的源代码解读感到压力。网路上有一篇关于分析看代码的方法，做为程序设计师的您，不妨参考看看，换个角度来分析。也能更有效率的解读你想要的代码片段。六个章节：（ 1 ）读懂代码，使心法皆为我所用。（

#人工智能

到底了