
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文 新智元 编辑:如願 拉燕 桃子AI在画画这块儿,已经拿捏的死死的。近日,Meta也整了一个AI「画家」——Make-A-Scene。还以为只是用文字生成画作就这么简单吗?要知道,仅是靠文字描述还有时候会「翻车」,就比如谷歌前段时间推出的「艺术家」Parti。「一个没有香蕉的盘子,旁边有一个没有橙汁的玻璃杯。」这次,Make-A-Scene可以通过文本描述,再加上一...
人工智能发展至今,各种热门话题层出不穷,新技术、新SOTA、新方向,每天的变化日新月异。这之中,强化学习应该算是其中相当热门的领域了。作为近些年创新的热点领域,不仅控制领域的大拿在关注强化学习,计算机大类的导师们也在积极利用强化学习来完成一些场景创新。(百说不厌的创新点)不难看出,强化学习的研究现阶段在学术界还很热门,毕竟通俗一点说,深度学习总需要一个应用场景,而RL可以拓展DL的场景有很多。作为
作者丨林大佬@知乎编辑丨极市平台来源丨https://zhuanlan.zhihu.com/p/561181890最近stablediffusion大火,但很多人都只是吃瓜,最多也就是在huggingface网站上试一下,这其实并不够,作为一个富有商业嗅觉的AI从业者,我嗅探到的更多的是他的商业能力,不得不说,现在生成类的AI模型,已经越来越来接近甚至超越人类水平。今天就来一探究竟,看看Sta..
本文来源 机器之心编辑部来自 Salesforce AI、东北大学、斯坦福大学的研究者提出了 MOE-style Adapter 和 Task-aware HyperNet 来实现 UniControl 中的多模态条件生成能力。UniControl 在九个不同的 C2I 任务上进行训练,展示了强大的视觉生成能力和 zero-shot 泛化能力。论文地址:https://arxiv.org/abs.
作者丨Lilian Weng编译丨丛末编辑丨陈彩娴来源 AI科技评论现实应用中,数据易得,而有标签的数据少有。一般而言,当监督学习任务面临标签数据不足问题时,可以考虑以下四种解决办法:1.预训练+微调:首先在一个大规模无监督数据语料库上对一个强大的任务无关模型进行预训练(例如通过自监督学习在自由文本上对语言模型进行预训练,或者在无标签图像上对视觉模型进行...
本文来源 机器之心编辑部大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点:统一性:OmniGen 天然地支持各种图像生成任务,例如文生图、图像编辑、主题驱动生成和视觉条件生成.
来源:PaperWeekly上海交通大学人工智能研究院杨小康、沈为团队联合华为田奇团队共同发布了非完全监督(即标签有限)下的图像分割方法最新综述“A Survey on Label-efficient Deep Segmentation: Bridging the Gap between Weak Supervision and Dense Prediction”。该工作...
本文来源 机器之心 编辑:蛋酱如何衡量一个视觉模型?又如何选择适合自己需求的视觉模型?MBZUAI和Meta的研究者给出了答案。一直以来,ImageNet 准确率是评估模型性能的主要指标,也是它最初点燃了深度学习革命的火种。但对于今天的计算视觉领域来说,这一指标正变得越来越不「够用」。因为计算机视觉模型已变得越来越复杂,从早期的 ConvNets 到 Vision Transformers,可用.
Datawhale开源贡献者:Datawhale开源项目组作为人工智能里最受关注的领域之一,强化学习的热度一直居高不下,但它的学习难度也同样不低。在学习强化学习的过程中,遇到了有无数资...
2020年让我们不断见识到“后浪”的超强力量,也让世界看到了瞩目的华人新星。在今年6月举办的CVPR中,年龄最小的一位一作获奖者甚至还在本科阶段。他就是来自康奈尔大学的四年级学生、98年...