
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
点击上方“机器学习与生成对抗网络”,关注"星标"获取有趣、好玩的前沿干货!三维重建意义三维重建作为环境感知的关键技术之一,可用于自动驾驶、虚拟现实、运动目标监测、行为分析...
本文来源 新机器视觉数据压缩是保留相同或绝大部分数据前提下减小文件大小的过程。它的原理是消除不必要的数据或以更高效的格式重新组织数据。在进行数据压缩时,你可以选择使用有损方法或无损方法。有损方法会永久性地擦除掉一些数据,而无损方法则能保证持有全部的数据。使用哪类方法取决于你要让你的文件保持多大的精准度。本文会为你介绍6种不同的无损数据压缩算法,以及4种基于深度学习的图像/视频压缩算法。六款无...
本文来源 机器之心 编辑:杨文、亚鹂有了 StoryDiffusion,更加一致性的图像和视频生成得到了保障。两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画,引起了网友的热议。其实,产出这些漫画的研究出自南开大学、字节跳动等机构。在《StoryDiffusion:Consistent Self-Attention for long-range image an..
本文转载自 机器之心本文作者来自字节跳动智能创作数字人团队,介绍了名为「INFP」的交互式人像生成技术。利用该技术生成的智能体能像真人一样在多轮对话中实现自由的听说行为以及无缝的状态切换。在大语言模型和 AIGC 的热潮下,科研人员对构建「视觉对话智能体」(Visual Chat Agent)展现出极大兴趣。其中,可实时交互的人像生成技术(Audio-Driven Real-Time Inter.
机器之心编辑部来自微软亚洲研究院的研究人员发现对 Token 进行傅里叶变换数学上等价于用超大尺寸自适应卷积核进行 Token 融合,而前者的计算代价远低于后者。基于该核心发现,研究员设计了一种名为 Adaptive Fourier Filter(AFF)的轻量高效 Token Mixer,将 Token 融合的计算复杂度从 O (N^2) 降低到 O (N log N),并以此为基础算子构建了轻
欢迎点击上方蓝字,关注啦 ~相关阅读:【1】GAN在医学图像上的生成,今如何?虚拟换衣!速览这几篇最新论文咋做的!脸部妆容迁移!速览几篇用GAN来做的论文GAN整整6年了!是时...
文章来源 新智元 编辑:LRS【新智元导读】人脸识别技术最近又有新的破解方式!一位斯坦福的学生使用GAN模型生成了几张自己的图片,轻松攻破两个约会软件,最离谱的是「女扮男装」都识别不出来。真的有人能模仿你的脸,还绕开了人脸识别系统!最近斯坦福大学的研究人员在arxiv上发布了一篇论文,虽说是斯坦福CS236G的课程作业,不过论文中提出了一个非常有趣的思路,用对抗生成网络G...
点击上方“机器学习与生成对抗网络”,关注星标获取有趣、好玩的前沿干货!公众号文章标题“提升”应该为“解决”。1 A 3D GAN for Improved Large-pose Faci...
本文 新智元 编辑:如願 拉燕 桃子AI在画画这块儿,已经拿捏的死死的。近日,Meta也整了一个AI「画家」——Make-A-Scene。还以为只是用文字生成画作就这么简单吗?要知道,仅是靠文字描述还有时候会「翻车」,就比如谷歌前段时间推出的「艺术家」Parti。「一个没有香蕉的盘子,旁边有一个没有橙汁的玻璃杯。」这次,Make-A-Scene可以通过文本描述,再加上一...
作者丨小小理工男@知乎来源丨https://zhuanlan.zhihu.com/p/264887767写在前面这里对我最近的研究领域——工业图像上的异常检测中最新的一些进展做一个总结。主...







