logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Nijijourney V6版本动漫图像生成模型发布

这是一个最先进的AI,可以绘制任何二次元风格的绘画!无论您是在寻找可爱的Q版角色还是充满动感的动作场景,niji・journey 都能将您的想象变为现实。计划在2月底的全面发布中引入一系列新功能,如vary(Region 调整图片的某个部分)、pan(移动)和zoom(缩放),进一步增强用户体验和创作灵活性。Niji V6致力于理解并将各种主题转化为动漫风格的视觉作品,即使是一些平时动漫里不常见的

文章图片
#人工智能#AIGC
加利福尼亚大学|3D-LLM:将3D世界于大规模语言模型结合

为了有效地训练 3D-LLM,我们首先利用 3D 特征提取器从渲染的多视图图像中获取 3D 特征。尽管这些模型非常强大,但它们并不以 3D 物理世界为基础,而 3D 物理世界涉及更丰富的概念,例如空间关系、可供性、物理、布局等。此外,对我们保留的 3D 字幕、任务组合和 3D 辅助对话数据集进行的实验表明,我们的模型优于 2D VLM。具体来说,3D-LLM 可以将 3D 点云及其特征作为输入,并

文章图片
实时“秒回”,像真人一样语音聊天,GPT-4o模型强到恐怖

从多模型到单一模型:与之前版本相比,GPT-4o 通过单一模型端到端训练,处理所有输入和输出。多模态输入与输出:GPT-4o是第一个将文本、音频和图像输入整合的模型,可以生成文本、音频和图像的任意组合输出。这种设计显著提高了与计算机的自然交互能力。根据传统的基准测试,GPT-4o 在文本、推理和编码智能方面的性能达到了 GPT-4 Turbo 的水平,同时在多语言、音频和视觉功能方面也创下了新高。

文章图片
#AIGC#人工智能
重磅,新GPT-4-Turbo重新夺回大模型第一名

上下文长度128k 输出速度更快。GPT-4 Turbo的模型大小为100B参数,这意味着它可以处理更多信息,生成更复杂和细腻的输出,而GPT-4的模型大小为10B参数。GPT-4 Turbo的训练数据包含到2023年4月的信息,而GPT-4的数据截止于2021年9月,后来扩展到2022年1月。GPT-4 Turbo拥有更大的上下文窗口,可以处理高达128K个token,而GPT-4的上下文窗口较

文章图片
#AIGC#人工智能
DALL·E3-会画画的Chatgpt,出图效果炸裂

眼见为实,我们来看以下 DALL・E 3 与 DALL・E 2 的生成效果比较,同样的 prompt :An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.(一幅描绘篮球运动员扣篮的油画,并伴以爆炸的星云),左图 DALL・E 2 在细节、清晰度、明亮度等方面

文章图片
#人工智能#AIGC
LLaVA:大型语言和视觉助手,图片识别和理解能力让人惊叹

如果您使用的是带有 M1 或 M2 芯片的 Apple 设备,则可以使用标志指定 mps 设备--device:--device mps。

文章图片
#AIGC#人工智能
全网最全的TTS模型汇总,电商人、自媒体人狂喜

以上就是小编给大家整理汇总的主流的TTS模型以及对应传送门,如果大家有云部署的需求,可以点击下方链接,查看GPU特惠活动:https://www.ucloud.cn/site/active/gpu.html?支持多种语言包括英语、中文,能够进行同语言生成和跨语言生成,能处理各种文本,叙述性文本、情感表达、描述性文本等,能根据不同的情感和语境生成相应的语音。原生支持英语、西班牙语、法语、中文、日语和

文章图片
#AIGC#人工智能#科技
“欧洲OpenAI”开源新模型,实现更快、更长的代码生成

Mistral 测试了该模型,测试结果显示该模型可以在 Mistral 的 l a Plateforme API上免费使用,可处理多达 256,000 个令牌的输入——是 OpenAI 的 GPT-4o 的两倍。Mistral 表示,该模型的表现优于所有为数学推理设计的模型。而就在今天,MistralAI在其不断壮大的大语言模型(LLM)家族中增添了两名新成员:一位是名为Mathstral的基于数

文章图片
#人工智能
大模型技术实践(五)|支持千亿参数模型训练的分布式并行框架

右图是MP+DP模式,64个GPU(可理解为64台机器,1台机器1个GPU,此时相当于DP模式)的计算效率有96%之高,是由于DP在计算梯度时,可一边继续往下做Backward,一边把梯度发送出去和DP组内其他GPU做All-Reduce。同理,当GPU个数增多,GPU的计算效率也会下降。All-Reduce操作包括Reduce-Scatter操作和All-Gather操作,每个操作的通讯量都相等

文章图片
#语言模型#人工智能
Mistral联合英伟达开源12B小模型:碾压Llama 3,单张4090可跑

这将如何影响更广泛的 AI 生态系统还有待观察,但可以肯定的是:将 AI 能力更接近最终用户的竞赛正在升温,Nvidia 和 Mistral AI 已经在这一方向上迈出了大胆的一步。与动辄上千亿参数的大模型相比,小模型的优势是显而易见的:它们不仅计算成本更低,训练和部署也更为便捷,可以满足计算资源受限、数据安全级别较高的各类场景。Mistral NeMo瞄准企业用户的使用,采用属于NVIDIA A

文章图片
#人工智能#语言模型
    共 62 条
  • 1
  • 2
  • 3
  • 7
  • 请选择