logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从生成到编辑一体化,Capybara 实现高保真视觉创作;覆盖九大领域的预训练语料,千万条教学记录的Sutra 10B Pretraining数据集上线!

OpenBayes平台最新发布8个公共数据集和7个AI教程,涵盖求职、灾害、教育、健康等多领域。数据集包括大学生求职数据、全球洪水事件记录、中文网络热梗库等;教程包含Slime强化学习框架、Capybara视觉创作模型等前沿工具。所有资源均支持在线使用,为研究者和开发者提供便捷的一站式AI开发解决方案。访问openbayes.com即可快速调用这些优质资源。

文章图片
#语言模型#人工智能#机器学习 +1
参与 OpenBayes 创作者激励计划,最高可得 100h 算力奖励!

为了发掘更多优质的内容创作者,助力更多优质案例的产出,OpenBayes 平台现开启「创作者激励计划」,凡加入「创作者激励计划」的用户,发布视频、文字等创作内容后,根据内容质量可获得 10 - 100 小时不等的算力奖励!

文章图片
#人工智能
OpenBayes 一周速览|TripoSR 开源:1 秒即 2D 变 3D、经典 GTZAN 音乐数据集上线

TripoSR 由 Stability AI 和 Tripo AI 合作开发,可在 1 秒钟内根据单张图像生成高质量的 3D 模型,并且对算力的需求很低,因此普通用户也可以轻松在本地设备上使用它。该数据集包含大约 30,000 张不同表情的面部 RGB 图像,图像的尺寸均为 48×48 像素,主要标注了 7 种类型的表情:0 = 愤怒,1 = 厌恶,2 = 恐惧,3 = 快乐,4 = 悲伤,5 =

文章图片
#人工智能#深度学习#数据库 +2
Nemotron Speech ASR低延迟英文实时转写的语音识别服务;GLM-Image开源混合自回归与扩散解码架构的图像生成模型

通过在流式推理过程中复用历史上下文的中间状态,实现对连续音频流的高效处理,保持识别精度的同时显著降低了端到端延迟,支持在推理阶段动态选择不同的延迟与精度权衡点。Fun-ASR-Nano 是由阿里巴巴通义实验室推出的面向低算力部署的端到端大模型 ASR 方案:由 Transformer 音频编码器、连接编码器与 LLM 的 音频适配器、用于生成初始假设的 CTC 解码器,以及最终输出文本的 LLM

文章图片
#语音识别#架构#人工智能 +2
最高可得 300 元现金奖励!第二期创作者激励计划现已上线

为了帮助大家快速上手,小贝不仅为大家准备了文字教程,还手把手录制了超详细的视频教程,B 站关注「OpenBayes」即可观看~点击下方邀请链接注册,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费算力时长,永久有效!无论你是深度学习、数据科学或大模型的资深玩家,还是刚入门技术小白;OpenBayes贝式计算平台第二期「创作者激励计划」上线啦!无论你是拥有丰富创作经验的老手,还是刚

文章图片
#人工智能#机器学习#数据库 +2
教程上新|低门槛部署英伟达最新 Physical AI 模型,覆盖人形机器人/人体运动生成/扩散模型微调等

NVIDIA在GTC2026大会上重点推出PhysicalAI概念,强调AI与物理世界的深度融合。大会发布了Isaac GR00T(人形机器人基础模型)、SOMA-X(统一人体建模框架)、Kimodo(动作生成模型)三大开源项目,分别从决策、建模和运动层面提升机器人的实际应用能力。同时推出的FDFO训练方法优化了扩散模型性能。这些技术共同推动机器人从"能动"向"好用&

文章图片
#人工智能#机器人#深度学习 +4
教程上新|低门槛部署英伟达最新 Physical AI 模型,覆盖人形机器人/人体运动生成/扩散模型微调等

NVIDIA在GTC2026大会上重点推出PhysicalAI概念,强调AI与物理世界的深度融合。大会发布了Isaac GR00T(人形机器人基础模型)、SOMA-X(统一人体建模框架)、Kimodo(动作生成模型)三大开源项目,分别从决策、建模和运动层面提升机器人的实际应用能力。同时推出的FDFO训练方法优化了扩散模型性能。这些技术共同推动机器人从"能动"向"好用&

文章图片
#人工智能#机器人#深度学习 +4
教程上新|低门槛部署英伟达最新 Physical AI 模型,覆盖人形机器人/人体运动生成/扩散模型微调等

NVIDIA在GTC2026大会上重点推出PhysicalAI概念,强调AI与物理世界的深度融合。大会发布了Isaac GR00T(人形机器人基础模型)、SOMA-X(统一人体建模框架)、Kimodo(动作生成模型)三大开源项目,分别从决策、建模和运动层面提升机器人的实际应用能力。同时推出的FDFO训练方法优化了扩散模型性能。这些技术共同推动机器人从"能动"向"好用&

文章图片
#人工智能#机器人#深度学习 +4
教程上新丨基于 GPU 部署 OpenClaw,轻松接入飞书/Discord 等社交软件

3. 开通核心权限: 在左侧导航栏单击「权限管理页面」,点击「批量导入/导出」权限按钮,粘贴教程容器中 home 目录下 permission_XX.txt 文件中的内容来配置,单击下一步,确认新增权限后,单击申请开通。可以说,OpenClaw 不再满足于让大模型「生成内容」,而是试图让模型真正参与执行,从调用 API 到串联工作流,把「AI 能力」转化为「可落地的行动」创建版本并发布:进入左侧导

文章图片
#人工智能#机器学习#深度学习
4B 参数规模,13 种语言,Voxtral 多语言实时语音转录模型;含数理化 8 大学科,CHIMERA 合成推理数据集上线

【公共资源速递】开放4个数据集和4个实用教程:数据集包含Open-RL推理问题集(多学科STEM问题)、CHIMERA合成推理集(9,225个跨学科问题)、肺癌临床数据(1,500条患者记录)及天线性能数据集(1,107条可穿戴天线参数);教程涵盖腾讯图生视频模型HunyuanVideo-1.5、字节GUI智能助理UI-TARS、实时世界建模系统HY-World1.5及MistralAI多语言语音

文章图片
#人工智能#语言模型#机器学习 +1
    共 48 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择