logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

更高效!更准确!YOLOE 实现实时目标检测

在「Visual Type」一栏中选择视觉类型,在「Intra/Cross Image」一栏中选择模式,在「Model」一栏中选择好模型并设置好参数后,点击「Detect & Segment Objects」开始检测。masks:例如上传一个包含很多人的图像,想检测人的图像,使用 masks 将一个人涂抹,推理时模型就会根据 masks 的内容识别图像中所有的人。待系统分配好资源,当状态变为「运行

文章图片
#目标检测#目标跟踪#人工智能 +2
高效语言模型 Parler-TTS 上线,一键完成文本转语音

平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 RTX 4090 的算力和 PyTorch 的镜像,根据需求选择「按量付费」或者「包日/周/月」,点击「审核并执行」。Parler-TTS 是一种轻量级的文本转语音 (TTS) 模型,可以生成具有给定说话者风格的高质量、自然语音,自由度及创新性非常高,并且可以通过 Prompt 控制说话者的性别、音色、语调以及所处的场景(室内、室外、马路

文章图片
#人工智能#语言模型#深度学习 +3
DeepSeek 开源多模态大模型 Janus-Pro-7B,一键完成图像理解 & 文生图

Janus-Pro 是一种新颖的自回归框架,它统一了多模态理解和生成,由中国 AI 企业 DeepSeek 于 2025 年开发的开源多模态大模型,它通过将视觉编码解耦到单独的路径来解决以前方法的局限性,同时仍然使用单一的、统一的转换器体系结构进行处理。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择

文章图片
#人工智能#机器学习#深度学习 +2
文档解析神器 Docling 上线,快速转换文件格式

选择「NVIDIA RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。进入模型后,上传我们的文件(支持的文件类型有:PDF、DOCX、PPTX、MD、ASCIIDOC),然后选择目标文件类型(Text、Markdown、Doctags、Json、Yaml),点击「Docling」转换。登录

文章图片
#人工智能#深度学习#机器学习 +1
超越 SD3的文生图神器!FLUX.1-schnell 一键部署教程,效果太牛了

FLUX.1 [schnell] 是迄今为止最先进的 few-step 模型,其表现不仅优于同类竞争对手,还优于 Midjourney v6.0 和 DALL·E 3 (HD) 等强大的非蒸馏模型。可以看到生成的图片质量还是很高的。平台会自动选择合适的算力资源和镜像版本,这里使用的是英伟达 A6000的算力和 PyTorch 的镜像,点击「审核并执行」。Advanced Settings 提供了一

文章图片
#人工智能#深度学习#语言模型 +4
DeepSeek 开源多模态大模型 Janus-Pro-7B,一键完成图像理解 & 文生图

Janus-Pro 是一种新颖的自回归框架,它统一了多模态理解和生成,由中国 AI 企业 DeepSeek 于 2025 年开发的开源多模态大模型,它通过将视觉编码解耦到单独的路径来解决以前方法的局限性,同时仍然使用单一的、统一的转换器体系结构进行处理。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择

文章图片
#人工智能#机器学习#深度学习 +2
InstantStyle 图像生成器使用教程

InstantStyle 是一款更加强大的风格迁移模型,以往基于扩散模型的方法(比如 Lora)需要大量的数据进行训练,并且无法迁移到新的风格上。而 InstantStyle 完成了多用途图像风格注入,可以实现风格与内容的有效分离,输入任意一种图像即可提取对应的风格,无需重新训练即可进行风格迁移。跳转页面后,在 Style Image 上传一张风格参考图片,生成的图片会和这个图片保持一致的风格;右

文章图片
#python#开发语言#人工智能 +4
使用 GTZAN 数据集预处理音频数据

色谱图是一系列色度特征,每个特征表示在时间窗口内音频的音调内容在 12 个色度频带/音高之间的分布,在色谱图中,通常使用不同的颜色或灰度来表示不同音高的能量。频谱中心表示频谱的质心位置,在感知上,它与声音亮度的印象具有牢固的关联,频谱中心是通过使用傅立叶变换确定信号中存在的频率,并将它们的幅度作为权重计算的加权平均值。感兴趣的可以听一下它给出的各种流派的音乐。频谱图表示了信号在不同频率上随时间变化

文章图片
#人工智能#机器学习#迁移学习 +3
DeepSeek 开源多模态大模型 Janus-Pro-7B,一键完成图像理解 & 文生图

Janus-Pro 是一种新颖的自回归框架,它统一了多模态理解和生成,由中国 AI 企业 DeepSeek 于 2025 年开发的开源多模态大模型,它通过将视觉编码解耦到单独的路径来解决以前方法的局限性,同时仍然使用单一的、统一的转换器体系结构进行处理。选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择

文章图片
#人工智能#机器学习#深度学习 +2
vLLM 教程:使用 vLLM 加载大模型进行少样本学习

选择「NVIDIA GeForce RTX 4090」以及「vLLM」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。进入到工作空间后,打开左侧目录中的「README.ipynb」文件即可查看教程的运行步骤。,在「公共教程」页面,选择「使用 vLLM 加载大模型进行少样本学习」教程。稍等片刻,待系统分配好资源,当状态变为「运行

文章图片
#人工智能#深度学习#机器学习
    共 28 条
  • 1
  • 2
  • 3
  • 请选择