旷视个人主页

@Megvii_tech

旷视

2023-05-17 15:26:22 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

ICCV 2019 | 旷视研究院推出基于深度强化学习的绘画智能体

两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于...

深度学习算子优化-FFT

背景在数字信号和数字图像领域，对频域的研究是一个重要分支。我们日常“加工”的图像都是像素级，被称为是图像的空域数据。空域数据表征我们“可读”的细节。如果我们将同一张图像视为信号，进行频谱分...

#算法 #机器学习 #人工智能 +1

聊聊旷厂黑科技 | 室内视觉定位导航，补齐导航的最后一块拼图

“路线规划成功，开始导航”，“前方十字路口请沿最右侧道路行驶”......这些导航语音已经成为了很多人依赖的信息播报。面对每天层出不穷的城市新坐标，手机地图导航拯救了迷茫的路痴，成为了车主...

#人工智能 #大数据 #物联网 +1

人体姿态估计的过去，现在，未来

因为在ICIP2019上面和两位老师搞了一个关于人体姿态估计以及动作行为的tutorial，所以最近整理了蛮多人体姿态估计方面的文章。所以做了一个总结和梳理，希望能抛砖引...

深度学习算子优化-FFT

#算法 #机器学习 #人工智能 +1

AI当自强：独家揭秘旷视自研人工智能算法平台Brain++

随着深度学习逐渐从实验室走向工业应用，各大企业都在探索构建算法架构、实现模型的工具和平台。和使用 TensorFlow 或 PyTorch 等开源框架的公司不同，旷视走向...

R Talk | 旷视研究院姚聪：深度学习时代的文字检测与识别技术

本文是旷视云服务事业部（CSG）算法负责人姚聪博士应邀在雷锋网 AI 研习社做的一次主题为自然场景文字检测与识别的线上报告：《Scene Text Detection a...

ICLR 2023 | RevCol：可逆的多 column 网络，大模型架构设计新范式

我们给神经网络架构增加了一个维度！自 ViT 时代到来之后，由一叠 blocks 堆起来构成的基础模型已经成为了广泛遵循的基础模型设计范式，一个神经网络的宏观架构由width宽度（channel 数）和 depth 深度（block 数）来决定。有没有想过，一个神经网络未必是一叠 blocks 组成的？可能是 2 叠，4 叠，或者…16 叠？介绍一下我们最新的工作“Reversible Colum

mperf：移动/嵌入式平台算子性能调优利器

快速了解mperf在移动/嵌入式平台，为了最大程度发挥硬件算力，对算子极致性能的追求变成必然，不同于桌面/服务器平台，移动/嵌入式平台在算子性能调优方面可选择的工具很少。MegEngine 团队一直在探索什么样的工具能够在算子调优流程中带来助益，来帮助达成如下的算子性能调优反馈回路，这也是 mperf 诞生的背景。图1 算子性能调优反馈回路mperf 是一个微架构层次的算子性能调优工具箱，主要面向

#java #人工智能 #算法 +2

如何写一个深度学习编译器

编译器本质上是一种提高开发效率的工具，将高级语言转换为低级语言（通常是二进制机器码），使得程序员不需要徒手写二进制。转换过程中，首要任务是保证正确性，同时需要进行优化以提升程序的运行效率。传统意义上的编译器的输入通常是某种高级语言，输出是可执行程序。在实际工作中接触到了深度学习编译器开发，其设计思想与传统编译器非常类似，所以本文以深度学习编译器的开发、结合我们实际开发的深度学习编译器 MegCC

#深度学习 #人工智能

共 24 条

请选择