登录社区云,与社区用户共同成长
邀请您加入社区
2026年5月22日,鲲鹏昇腾开发者大会CANN技术论坛在北京举办,聚焦"硬件架构创新与编程体验升级"。华为昇腾计算基础软件总经理李守平介绍了CANN在算子性能、编程灵活性等方面的优化,包括开源AscendNPUIR、新增CCU通信能力等创新。论坛表彰了14位开源贡献者,并展示了TileLang、FlagOS等与昇腾生态的深度融合成果。北京大学Open-SoraPlan团队分享
从SAR ADC的微伏级建立精度,到三重隔离的电磁兼容设计,打造一块高精度工业数据采集卡,是对硬件工程师综合实力的极限考验。ZLinear开源电子通过开源的胸怀和硬核的技术,将原本高高在上的工业级方案拉下神坛。如果您正在寻找靠谱的数据采集方案,或者希望深入学习工业DAQ的底层设计,欢迎访问ZLinear官网获取全套资料,让我们共同推动工业测控技术的普及与进步!
昇腾 910 的硬件设计围绕两个核心:Cube Unit 做大矩阵乘法、HBM 存大模型权重和 KV Cache。理解了存储层次和计算单元的并行能力,就能推导出大部分优化手段——大 batch 打满 Cube、减少 HBM 搬运用 UB 缓存、HCCS 拓扑感知降低通信延迟。910 的绝对算力虽然不如 A100,但算力功耗比更优,加上国产供应链优势,大规模部署的性价比不输竞品。
CATLASS是昇腾面向矩阵乘算子的高性能模板库,通过五层抽象架构(Device-Kernel-Block-Tile-Basic)将AICore硬件特性封装为可复用组件。其核心优势包括:硬件感知优化(自动适配L0/L1缓存)、流水线自动化(双缓冲掩盖延迟)、模板元编程(零运行时开销)。开发者只需组合模板参数即可构建高性能算子,无需手动处理底层指令和同步,性能接近手写汇编。该架构显著降低了昇腾NPU
本文将带你从经典的8088/8086微处理器出发,系统掌握微处理器的体系结构核心知识点,为后续的汇编语言、接口技术和操作系统学习打下坚实的基础。
摘要:针对AI小智设备无法识别声源方向的痛点,提出采用AR1106声源定位模组的外接扩展方案。该方案通过独立双麦克风阵列和TDOA算法实现±10°精确定位,不占用主机算力,即插即用。AR1106独立完成指令触发、方向识别和舵机转向全流程,支持5米内180°范围定位,响应速度达毫秒级。方案保持AI小智原有功能不变,仅通过标准接口实现"指令识别+方向定位"协同,有效解决多人场景下的
A-59F是一款高集成语音处理模组,集AIENC降噪、AEC回音消除、防啸叫和BF波束拾音四大功能于一体。支持多种音频接口,体积小巧易嵌入,能有效解决噪音、回音等问题。核心性能包括45-90dB降噪深度、100dB回音消除和15ms低延迟防啸叫,适用于对讲门禁、车载通讯、会议教育等多种场景。该模组提供10种连接模式,支持单/双波束定向拾音,可大幅简化音频电路设计,是性价比高的一站式语音处理解决方案
AI推理会降价,这是确定的。但不会像CDN那样降两个数量级变成白菜价。GPU成本和电力成本是硬约束。
8nm制程 · 8核异构 · 4TOPS NPU · 8K解码瑞芯微 2026 中端 AIoT 旗舰芯片|全面拆解
本文介绍了Linux操作系统的基础知识,重点探讨了冯诺依曼体系结构和操作系统的核心概念。文章首先阐述了冯诺依曼体系的硬件组成(输入单元、CPU、输出单元和存储器)及其数据流动机制,解释了程序必须加载到内存才能运行的原因。随后分析了操作系统的定义与目的,指出其核心在于管理硬件资源并为应用程序提供执行环境。通过软硬件层状结构的案例(如printf函数的执行流程),详细说明了系统调用和驱动程序的作用机制
这篇短文探讨了如何通过STM32数据手册学习电路设计的方法。作者建议以手册中的参考电路为模板,结合自身学习3D建模的经验,制定循序渐进的学习计划:白天专注主业,晚上抽空撰写技术博客,每周固定练习原理图绘制,并借助AI工具进行分析交流。文章强调从基础做起("先解决1再解决100"),通过分解任务、持续实践来掌握电路设计技能。这种学习方法既系统又灵活,兼顾专业提升与知识沉淀。
《波束拾音技术:智能语音设备的革命性突破》 传统全向拾音技术存在环境噪声干扰、混响严重等问题,而波束拾音技术通过空间方向性处理实现了质的飞跃。该技术利用多麦克风的时空差计算声源方向,像聚光灯般聚焦目标声源,显著提升信噪比和语音清晰度。A-59F模组提供单/双波束两种模式:单波束增强特定方向人声,双波束可同时处理两个独立声源区域,使设备具备空间语音关系理解能力。这项技术对产品结构设计提出更高要求,需
《A-59F声学系统:解决扩音啸叫与通话回音的双重难题》 摘要: 现代语音设备面临的核心声学问题主要分为两类:扩音系统的声学正反馈啸叫和全双工通话中的回音循环失稳。A-59F创新性地通过数字信号处理技术同时解决这两大难题。其采用低延迟数字反馈抑制架构(15ms处理延迟),结合AI环境降噪算法,实现动态增益调节和自适应频率抑制。针对通话回音问题,系统集成高性能AEC全双工回音消除算法(100dB消除
说到GPU估计大家都不陌生,但是提起gpu底层的一些架构以及硬件层一些调度策略的话估计大部分人就很难说的上熟悉了。当然这个不是大家的错,主要是因为Nv gpu的整个生态都是闭源的,所以大家了解起来就会有一些障碍。最近这半年笔者有幸参与了一些gpu的项目,在这个过程当中也花了一些时间去理了一下gpu相关的东西,故借这篇文章给大家简单介绍一下。下面的行文将基于以下三个层面进行阐述:CUDA编程模型GP
一、自动驾驶整体架构1、车端系统2、云端系统3、硬件架构① 硬件接入方式② 硬件接入步骤③ 自动驾驶技术点4、软件架构5、开发方向6、高精地图 + 定位系统 重要性二、Autoware.Universe 开发文档1、Autoware 文档介绍① Autoware Universe 各组件文档② Autoware Core 文档③ Autoware Tools 各组件文档
作者个人认为学习工程类的项目,最好还是自己能够实际动手操作仿真软件,尝试自行搭建电路,许多问题都是在实际操作的过程中发现的,能力的提升与遇到问题再解决问题的宝贵经验息息相关,希望读者可以意识到这一点。电流源具有接近恒定的输出阻抗特性,使得整个系统的动态特性(如功率级的等效传递函数)得到简化和线性化,更容易为电压外环设计出具有高增益、宽带宽且相位裕度足够的补偿器,从而显著提升系统的稳定性。如图5是电
指定凡亿的路径,注意,路径的"\",要改成“/”默认的金百泽skill加载。指定第三方的skill路径。装载第三方skill。
GPU服务器与普通CPU服务器的核心差异在于硬件架构和计算模型。CPU采用少核心高主频设计,擅长串行复杂计算;而GPU拥有数千个低主频核心,专为并行简单计算优化。AI计算的核心——矩阵乘法特别适合GPU的并行架构,因此GPU服务器在AI任务上比CPU快10-100倍。关键硬件差异包括:GPU配备HBM高带宽显存(40-141GB/卡)、NVLink高速互联(比PCIe快28倍)以及更高的功耗(单卡
光模块用于光信号的传输,传输媒质为光纤。光纤传输方式损耗低,传输距离远。可根据需要选择合适的光模块,通过光纤进行数据传输。光模块4种类型:光发送器,光接收器,Transceiver(光收发一体模块)以及Transponder(光转发器)。Transceiver(光收发一体模块):H3C设备支持Transceiver,主要功能是实现光电/电光变换,包括光功率控制、调制发送,信号探测、IV转换以及限幅
本文深入解析英飞凌OptiMOS™5系列功率MOSFET BSC014N06NS的技术特性与应用。该器件具有1.45mΩ超低导通电阻、89nC栅极电荷和100A连续电流能力,特别适用于服务器电源同步整流、电机驱动等场景。通过对比分析显示,其在60V耐压器件中FOM值较竞品优化40%,在导通损耗与开关损耗间达到理想平衡。文章还提供了典型应用电路设计要点和选型建议,并推荐选择具备原厂授权、技术支持和现
本文将展望FMCW雷达的未来发展趋势,包括更高频段的应用、人工智能集成、新型天线技术,以及其在智能医疗、工业自动化和智能家居等新兴领域的潜在应用。
反无干扰模块,全频段SDR干扰源模块,反无干扰源,反无人机系统 RFSOC XCZU47DR XCZU49DR XCVU9P XCVU13P 采集存储回放 系统集成技术,RFSOC 47DR核心板,VU13P核心板,RFSOC XCZU47DR开发套件,信号处理技术,软件无线电技术解决方案,雷达模拟系统、电子对抗、复杂电磁环境构架、5G\6G通信、卫星通信、通信感知一体化应用场景。高速高带宽信号处
记录Dell PowerEdge R720服务器DIMM_B10内存故障的诊断过程,分析E5 v2内存控制器架构与非对称内存交错模式,测试Advanced ECC、Spare Rank和Mirroring三种容错模式,最终采用内存镜像模式恢复系统运行
2025年下半年起,全球存储市场迎来超级涨价周期,内存和SSD价格暴涨60%-200%。三大存储巨头(三星、SK海力士、美光)凭借技术垄断和产能调控收割丰厚利润,其中SK海力士2025年净利润达297亿美元。涨价主因包括AI服务器需求爆发、原厂减产DDR4转向高利润产品,以及恐慌性囤货。工业计算机领域同样受影响,施耐基科技等厂商被迫调整存储方案价格。这波涨价潮凸显存储行业高度集中的技术壁垒,预计将
硬件架构是电子设备的核心骨架,决定着设备的运算效率、功耗水平、适配场景和扩展能力。随着人工智能、物联网、云计算等技术的快速迭代,市面上的硬件架构呈现出“通用与专用并存、经典与新兴共生”的格局。用户搜索“目前市面上常用的硬件架构”,核心需求并非单纯罗列架构名称,而是希望了解各类架构的核心特点、实际应用场景、市场现状及核心优势,既能满足学习认知需求,也能为技术选型、产品研发提供参考。以下结合权威市场数
从计量学上说,OPS是最宽泛的母集合,表示“operations per second”;FLOPS是其中的浮点子集,强调 operation 的数据类型是 floating-point;GOPS和TOPS只是 OPS 的数量级前缀,分别对应 (10^9) 和 (10^{12}) operations per second。Google TPU 论文用描述 8-bit MAC 阵列的峰值吞吐,而
硬件架构
——硬件架构
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net