QbitAl 个人主页

@QbitAI

QbitAl

2022-06-08 23:22:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

YOLO之父退出CV界表达抗议，拒绝AI算法用于军事和隐私窥探

晓查发自凹非寺量子位报道 | 公众号 QbitAI今天，AI学术界发生了一场大地震。YOLO算法作者Joseph Redmon在个人Twitter上宣布，将停止一切CV研究，原因...

谷歌又买算法送手机了，最新方法让背景虚化细节到头发丝，真有单反的感觉了...

明敏发自凹非寺量子位 | 公众号 QbitAI当真是买算法送手机！这不，谷歌又给“亲儿子”Pixel 6塞福利了，让手机抠图也能细节到头发丝。看这效果，原本模糊的头发轮廓，咻地一下，就...

#网络 #算法 #人工智能 +2

可生成高清视频的Stable Diffusion来了！分辨率提升4倍，超分算法来自腾讯，支持Colab在线试玩...

明敏发自凹非寺量子位 | 公众号 QbitAI免费玩的Stable diffusion，又出新变种了！古典人像丝滑切换，还都是4倍超分辨率水平，细节也就多了亿点点吧，眉毛发丝都根根分明。还能从一盘草莓意大利面，丝滑变成一份蓝莓面。这就是最近在推特上火了Stable Diffusion视频版2.0.它能够通过Real-ESRGAN进行上采样，让生成画面达到4倍超分。要知道，之前Stable Di

#算法 #人工智能 #机器学习 +2

颜水成发了个「简单到令人尴尬」的视觉模型，证明Transformer威力源自其整体架构...

梦晨发自凹非寺量子位报道 | 公众号 QbitAITransformer做视觉取得巨大成功，各大变体频频刷榜，其中谁是最强？早期人们认为是其中的注意力机制贡献最大，对注意力模块做了很...

#人工智能 #java #机器学习 +2

马化腾首谈腾讯开源时，鹅厂已在Github上放出82个项目，标星24万+ | 附AI项目链接...

乾明发自凹非寺量子位报道 | 公众号 QbitAI“腾讯希望在科研领域投入更多力量，把‘科技向善’纳入公司新的使命与愿景。我们将通过内外部开放源代码等方式，积极参...

吴恩达经典ML课全面升级！更新为Python实现，加入更直观的视觉教学

丰色发自凹非寺量子位 | 公众号 QbitAI吴恩达的机器学习课程要推出全新版本了！就在Coursera成立十周年之际，他在推特上宣布了这一重大惊喜：一时之间，评论区刷满了网友的期待和兴奋：蹲！我先蹲了！其中还不乏从二零一几年就开始跟他一系列课程的老粉“趁机”表达感谢之情：值得一提的是，今天也是吴恩达46岁的生日。就在几个月前，吴恩达得了新冠，所幸很快康复；一周多前，...

#人工智能 #机器学习 #python

ICML 2022 | 字节跳动 AI Lab 提出多模态模型：X-VLM，学习视觉和语言的多粒度对齐...

写在前面视觉语言预训练提高了许多下游视觉语言任务的性能，例如：图文检索、基于图片的问答或推理。有朋友要问了，除了在公开的学术任务上使用更大的模型/更多的数据/技巧把指标刷得很高，多模态预训练模型有什么实际应用呢？为此，字节跳动 AI Lab Research 团队提出了X-VLM，首次提出学习多粒度的视觉和语言对齐。实验证明，这种预训练方法十分高效，模型规模无需很大，预训...

#大数据 #编程语言 #python +2

「背叛」激光雷达第三年：百度纯视觉无人驾驶技术迈入产品化阶段

贾浩楠发自凹非寺量子位报道 | 公众号 QbitAI2019年，当百度自动驾驶工程师为Mobileye纯视觉DEMO效果惊叹不已时，不会想到一切来得这么快。2021年，百度纯视觉L4...

#百度 #算法 #大数据 +2

字节发布视觉基础模型ViTamin，多项任务实现SOTA，入选CVPR2024

允中发自凹非寺量子位 | 公众号 QbitAI视觉语言模型屡屡出现新突破，但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin，专为视觉语言时代设计。在使用相同的数据集和训练方案时，ViTamin在ImageNet零样本准确率上比ViT提高了2.0%。此外在分类、检索、开放词汇检测和分割、多模态大语言模型等60个不同基准上都表现出了良好的结果。当进一步扩展参数规模时，Vi

听声辨物，这是AI视觉该干的？？？｜ECCV 2022

衡宇发自凹非寺量子位 | 公众号 QbitAI听到“唔哩——唔哩——”的警笛声，你可以迅速判断出声音来自路过的一辆急救车。能不能让AI根据音频信号得到发声物完整的、精细化的掩码图呢？来自合肥工业大学、商汤、澳国立、北航、英伟达、港大和上海人工智能实验室的研究者提出了一项新的视听分割任务（Audio-Visual Segmentation, AVS)。视听分割，就是要分...

#计算机视觉 #机器学习 #人工智能 +2

共 1576 条

请选择