logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ShaderNN 2.0 :基于GPU全图形栈的高效轻量移动端推理引擎

背景:近年来,深度学习研究和产业化得到迅猛发展。随着移动端算力提升,实时性需求,以及用户数据隐私方面的考量,导致越来越多的推理任务从云端转移到移动端。移动平台上深度学习推理需要解决硬件平台、驱动、编译优化、模型压缩、算子算法优化和部署等问题。许多企业正在开发面向移动端的开源深度学习框架,如小米MACE、腾讯优图NCNN/TNN、阿里MNN和谷歌TensorFlow Lite等。现有的推理平台通常.

文章图片
#智能电视
面向AI图形的轻量深度学习推理引擎 ShaderNN

背景:近年来,随着移动端算力的不断提升和深度学习研究的快速发展,特别是小网络模型不断成熟以及数据安全的要求越来越高,越来越多的原本在云端执行的推理转移到移动端上来实现。移动平台的深度学习推理涉及硬件平台、驱动、编译优化、模型压缩、算子算法优化以及部署,适合系统业务开发的高效推理框架成为业界迫切需求和开发重点。很多企业都在研发面向移动端的开源深度学习框架。当前国内外主流开源移动端推理框架:小米MAC

#人工智能#java#大数据 +2
FreeRTOS任务简介

一、FreeRTOS用途FreeRTOS一般被用于硬件设计上RAM大小存在一定限制(成本、资源、性能功耗比等)的平台之中,它是目前运用的比较多的实时操作系统之一。选用FreeRTOS作为项...

#java#操作系统#python
freeRTOS任务调度及其通信

一、FreeRTOS任务在多数通用操作系统(如Linux、Windows等)中,线程为系统的调度最小单元,进程为独立应用程序的最小运行过程。而在实时操作系统中,多数情况下不区分线程与进程进...

#操作系统#java#linux +1
面向AI图形的轻量深度学习推理引擎 ShaderNN

背景:近年来,随着移动端算力的不断提升和深度学习研究的快速发展,特别是小网络模型不断成熟以及数据安全的要求越来越高,越来越多的原本在云端执行的推理转移到移动端上来实现。移动平台的深度学习推理涉及硬件平台、驱动、编译优化、模型压缩、算子算法优化以及部署,适合系统业务开发的高效推理框架成为业界迫切需求和开发重点。很多企业都在研发面向移动端的开源深度学习框架。当前国内外主流开源移动端推理框架:小米MAC

#人工智能#java#大数据 +2
内核并发消杀器(KCSAN)技术分析

一、KCSAN介绍KCSAN(Kernel Concurrency Sanitizer)是一种动态竞态检测器,它依赖于编译时插装,并使用基于观察点的采样方法来检测竞态,其主要目的是检测数据竞争。KCSAN是一种检测LKMM(Linux内核内存一致性模型)定义的数据竞争(data race)的工具,同时它也可以控制报告哪种类型的数据竞争。KCSAN知道LKMM定义的所有标记原子操作,以及LKMM尚未

#linux#java#运维 +2
基于devfreq framework的GPU调频

AI时代已经来临,在日益增长的算力需求下,GPU已经成为AI世界不可或缺的工具,而移动端高渲染高帧应用也对移动端GPU提出越来越高的要求,本文将以高通的adreno gpu为例对GPU的调频进行介绍。在介绍之前,建议先阅读本文章《Linux devfreq framework剖析》,了解devfreq framework子系统中devfreq device的作用和governor的统一实现格式。G

机器学习如何影响系统设计:Learned Index Structures浅析

从刷脸打卡到各种应用的“猜你喜欢”,当前机器学习(特别是深度学习技术)已经广泛应用于我们日常生活的方方面面。深度学习框架(如:TensorFlow,PyTorch等)和 AI专用芯片(如:...

#数据结构#算法#python +2
屏下指纹介绍

一、光学指纹问题现状光学指纹当前随着成本的下降,各大厂商都在低中高端旗舰用上了光学指纹。有别于传统的电容指纹,光学指纹在解锁性能上目前都进行了优化,性能接近电容指纹。二、光学指纹电容指纹...

#人工智能#python#机器学习 +2
Vold原理介绍

一、 Vold简介Android中Vold是volume Daemon,即Volume守护进程,用来管理Android中存储类的热拔插事件。这里的热插拔涉及的场景如:1. 手机usb以MT...

#java#linux#android +1
    共 47 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择