logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

内存带宽瓶颈在嵌入式翻译设备中的应对

嵌入式翻译设备中,尽管算力充足,但内存带宽不足常导致高延迟。ASR、MT、TTS模型间的大量中间数据频繁访问LPDDR,造成总线拥堵。通过NPU片上缓存优化、模型量化、任务调度与系统级协同设计,可显著提升数据搬运效率,降低端到端延迟。

Qwen3-32B镜像发布:320亿参数性能逼近700亿级别,AI算力新选择

通义千问发布的Qwen3-32B模型,以320亿参数实现接近700亿级别模型的性能,支持128K超长上下文和多任务处理,结合高效推理与低部署门槛,为中小企业和开发者提供高性价比的开源大模型解决方案。

音诺ai翻译机基于Da Vinci NPU加速翻译模型推理

音诺AI翻译机通过搭载华为Da Vinci NPU,结合模型压缩、量化与软硬协同优化,在端侧实现70ms级中英互译,支持23种语言离线切换。其核心技术包括知识蒸馏、混合精度计算与MindSpore Lite推理引擎,兼顾低延迟、低功耗与高隐私性,展现边缘智能的未来潜力。

轻量级LoRA权重独立保存,便于版本管理和共享分发

本文介绍如何利用LoRA与LLaMA-Factory实现大模型的轻量级微调,仅保存几MB增量权重,显著降低存储与算力开销。通过低秩适配技术,支持多任务切换、版本管理与安全共享,提升AI工程化效率。

#LoRA
PyTorch-CUDA开箱即用环境助力GPU算力高效利用

本文介绍PyTorch-CUDA开箱即用镜像如何解决深度学习环境配置难题,确保GPU算力高效利用。通过集成PyTorch、CUDA、cuDNN和NCCL等组件,实现多卡训练与跨平台部署的无缝衔接,提升开发效率并保障环境一致性。

#cuDNN
构建基于安卓的智能家居系统:设计与实现

安卓(Android)是由安迪·鲁宾(Andy Rubin)创立的公司开发的,该公司于2005年被谷歌收购。安卓平台的发展大致可以划分为以下几个重要阶段:2005年:安卓公司成立,安卓平台开始萌芽。2007年:首款安卓原型手机发布,标志着安卓平台进入移动设备领域。2008年:安卓SDK首次发布,开发者开始为安卓平台开发应用程序。2011年:谷歌宣布安卓激活设备数突破1亿台。2014年至今:安卓系统

比肩GPT-4体验:GPT-OSS-20B开源模型究竟有多强?

GPT-OSS-20B是一款开源大模型,通过参数激活优化、INT8量化和行为蒸馏技术,可在16GB内存设备上实现接近GPT-4的推理能力。支持私有部署、低延迟响应与低成本运行,适用于对数据安全和算力成本敏感的应用场景,推动平民化AI落地。

Qwen3-8B本地部署避坑指南:常见问题及解决方案

本文详解Qwen3-8B大模型在本地部署中的常见问题与解决方案,涵盖显存优化、Docker配置、推理加速及中文输出调优等关键环节,帮助开发者高效实现私有化AI服务。

OpenWrt固件转换为Img格式的全过程指南

OpenWrt 是一个针对嵌入式设备的开源固件项目,提供了一种高度可定制的操作系统,用于无线路由器和其他嵌入式设备。它由一套强大的软件包管理系统支持,允许用户根据需要添加或删除特定的功能模块。OpenWrt 的灵活性和广泛支持的硬件平台使其成为 IT 专家和爱好者中非常受欢迎的选择。在本文中,我们将探索 OpenWrt 固件的基本概念,并带领读者深入理解其内部结构以及如何操作 img 文件格式固件

深入理解USB与PCI总线:设计与源代码分析

简介:USB和PCI是广泛应用于计算机系统的接口技术,用于设备间通信。本文探讨了USB和PCI总线的设计原理、应用和相关源代码,包括USB的协议层、物理层、时序控制及主机/设备控制器,以及PCI总线的接口控制器、地址映射、中断处理和DMA等模块的实现。阅读和分析源代码可以学习到构建硬件接口和理解协议底层工作原理,为嵌入式系统、FPGA或ASIC设计提供宝贵资源。

    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择