logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

旷视天元 MegEngine 开源 CUDA INT4 量化源码实现

当下人工智能技术正加速发展,渗透到云、边、端和应用的各个层面,与海量IoT设备进行深度融合,不断拓展应用场景。然而在AIoT场景中,嵌入式设备往往算力有限,难以承载庞大的AI模型。如何在资源有限的终端场景实现 AI 模型的有效部署,是加速AI落地的重要问题。AI 工程师们研发了各种试图缩小模型大小并保持性能的办法,例如量化和蒸馏。其中,模型量化是将浮点计算转成低比特定点计算的一种模型压缩技术,可以

#人工智能#网络#java +2
mperf:移动/嵌入式平台算子性能调优利器

快速了解mperf在移动/嵌入式平台,为了最大程度发挥硬件算力,对算子极致性能的追求变成必然,不同于桌面/服务器平台,移动/嵌入式平台在算子性能调优方面可选择的工具很少。MegEngine 团队一直在探索什么样的工具能够在算子调优流程中带来助益,来帮助达成如下的算子性能调优反馈回路,这也是 mperf 诞生的背景。图1 算子性能调优反馈回路mperf 是一个微架构层次的算子性能调优工具箱,主要面向

#java#人工智能#算法 +2
如何写一个深度学习编译器

编译器本质上是一种提高开发效率的工具,将高级语言转换为低级语言(通常是二进制机器码),使得程序员不需要徒手写二进制。转换过程中,首要任务是保证正确性,同时需要进行优化以提升程序的运行效率。传统意义上的编译器的输入通常是某种高级语言,输出是可执行程序。在实际工作中接触到了深度学习编译器开发,其设计思想与传统编译器非常类似,所以本文以深度学习编译器的开发、结合我们实际开发的深度学习编译器 MegCC

#深度学习#人工智能
AI当自强:独家揭秘旷视自研人工智能算法平台Brain++

随着深度学习逐渐从实验室走向工业应用,各大企业都在探索构建算法架构、实现模型的工具和平台。和使用 TensorFlow 或 PyTorch 等开源框架的公司不同,旷视走向...

CVPR 2021论文解读Vol.4 | OTA: 依靠最优传输理论提升标签分配质量的一阶段目标检测算法...

收录会议:CVPR 2021论文单位:旷视研究院论文链接:https://arxiv.org/abs/2103.14259论文代码: https://github.com/Megvii-B...

#算法#计算机视觉#机器学习 +2
青源LIVE|YOLOX,高性能目标检测的最新实践

在目标检测领域中,YOLO系列以其一贯以来的高速度、高精度和算子简单、易部署的特性,在工业界中得到广泛的好评和应用。近两年来,学术界在Anchor Free和样本匹配(Label Assi...

#人工智能#计算机视觉#大数据
炼丹心得 | 根深方能叶茂,“爆款”不是碰运气

去年夏天,旷视开源高性能检测器 YOLOX,凭借极具竞争优势的“性能+速度”,为工业界提供了目标检测模型的新范式。迄今为止,一条题为《如何评价旷视开源的 YOLOX,效果超过 YOLOv5?》的知乎帖子,吸引了 80 余万浏览量。YOLOX 的“爆款”属性,由此可窥得一二。面对外界如潮的好评,旷视研究院基础检测组负责人黎泽明似乎并不很想“接茬”。他给出解读这些评论的另一种...

#算法#神经网络#人工智能 +2
预告 | 旷视成都研究院负责人刘帅成:图像对齐技术及其应用

北京时间12月18日(周三)晚8点,旷视成都研究院负责人刘帅成博士,将在将门技术社群在线进行技术分享,主题为“图像对齐技术及其应用”。这次分享中,他将会介绍图像对齐领域的发展现状和主要面...

CVPR 2021论文解读Vol.4 | OTA: 依靠最优传输理论提升标签分配质量的一阶段目标检测算法...

收录会议:CVPR 2021论文单位:旷视研究院论文链接:https://arxiv.org/abs/2103.14259论文代码: https://github.com/Megvii-B...

#算法#计算机视觉#机器学习 +2
聊聊旷厂黑科技 | 动作识别与检索带你体验视频时代“人工智能”新玩法

北京冬奥会正在展开激烈的赛事角逐,与体育相关的话题持续刷屏,全民健身也蓬勃发展。那么大家是否想象过,当人工智能与体育相遇,会碰撞出怎样的火花呢?其实,在很多日常的体育锻炼和健身场景中,已经...

#算法#人工智能#大数据 +2
    共 23 条
  • 1
  • 2
  • 3
  • 请选择