logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GLM-4.7-Flash:高性能、高吞吐轻量化的 MoE 推理模型;Delhi Pollution AQl:超过二十万条小时环境观测样本

该数据集包含多种环境、光照条件和视角下的车辆图像,图像预处理为 416×416 分辨率,适用于 YOLO、SSD 和 RetinaNet 等现代目标检测模型提供COCO、YOLO、Pascal VOC 和 TensorFlow 格式的多种注释格式,兼容多种机器学习框架,包含平衡的训练/验证/测试分割,以评估模型性能。该数据集通过将每张图像转化为结构化的数值特征,包括全局强度统计、纹理描述符(GLC

文章图片
#语音识别#架构#人工智能 +3
一键移除复杂物体!Netflix VOID 让视频消除拥有「物理直觉」;告别乱码与解析难题,MDPBench 数据集为「真实复杂场景」文档解析而生

OpenBayes发布11个公共数据集和6个公共教程资源。数据集涵盖医疗健康(StrokeRisk中风风险)、多语言处理(MDPBench)、文化研究(CHOCLO)、金融安全(CreditCardFraud)等多个领域,包含结构化数据和标注样本。教程资源包括DeepTutor学习助手、Gemma-4-31B-it模型部署、Chandra-ocr-2文本识别等实用工具,涉及教育、生物工程、视频编辑

文章图片
#人工智能#深度学习#机器学习 +1
教程上新|微信AI团队提出扩散语言模型WeDLM,相较vLLM部署AR模型实现3倍推理加速

腾讯微信AI团队推出WeDLM扩散语言模型,突破传统自回归模型在推理速度上的瓶颈。该模型通过拓扑重排技术保持严格因果掩码,实现并行解码而不破坏KV缓存机制,在数学推理等任务上比AR模型快3-10倍。WeDLM已在OpenBayes平台提供部署教程,支持用户快速体验这一高效解码框架。实验表明,该方案在保持生成质量的同时显著提升推理效率,为大规模语言模型部署提供了新的技术路径。

文章图片
#人工智能#语言模型#机器学习 +3
教程上新丨基于500万小时语音数据,Qwen3-TTS实现3秒语音克隆及精细调

3.选择「NVIDIA GeForce RTX 5090」以及「PyTorch」镜像,按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。目前,「Qwen3-TTS:高质量可控多语言语音合成 Demo」已上线 OpenBayes 官网的教程版块,点击下方链接即可体验一键部署教程 ⬇️。1.登录 OpenBayes.com,在「公共教程」页面,选择「Qwen3-TTS:高质量可控多语言语音

文章图片
#人工智能#深度学习#语音识别 +2
低功耗实时交互:Granite 4.0 轻量级语音模型新基座;OmniCoder-9B 跨语言映射,实现补全一致性

OpenBayes平台推出7款前沿AI工具教程:1)LTX-2.3-turbo视频生成器,支持多分辨率视频创作;2)Voxtral-4B-TTS多语言语音合成;3)CohereTranscribe轻量语音识别模型,支持14种语言;4)IBMGranite4.0离线语音识别翻译工具;5)Fun-CineForge影视配音模型;6)OmniCoder-9B智能编程助手;7)Qwen3.5-27B增强版

文章图片
#人工智能#机器学习#深度学习
教程上新|低门槛部署英伟达最新 Physical AI 模型,覆盖人形机器人/人体运动生成/扩散模型微调等

NVIDIA在GTC2026大会上重点推出PhysicalAI概念,强调AI与物理世界的深度融合。大会发布了Isaac GR00T(人形机器人基础模型)、SOMA-X(统一人体建模框架)、Kimodo(动作生成模型)三大开源项目,分别从决策、建模和运动层面提升机器人的实际应用能力。同时推出的FDFO训练方法优化了扩散模型性能。这些技术共同推动机器人从"能动"向"好用&

文章图片
#人工智能#机器人#深度学习 +4
OpenBayes 一周速览丨中文理解能力登顶!「小红书味」超重的大模型 dots.llm1 开源;单图重建三维场景,UniDepthV2 助力3D场景设计

6 个公共数据集:* LEXam 法律推理基准数据集* Llamg-Nemotron 推理数据集* DeepTheorem 定理证明数据集* Eye Detection 眼睛检测数据集* OpenCodeReasoning 编程推理数据集* GeneralThought-430K 大规模推理数据集2 个公共模型:11 个公共教程:深度估计 * 2语音生成与理解 * 2多模态理解与生成 * 7。

文章图片
#图像处理#人工智能#机器学习 +1
强化文字渲染与海报排版:百度开源文生图模型 ERNIE-Image-Turbo;告别大模型「遗忘」:微软 OpenMementos 上下文压缩训练数据集上线

本文介绍了5个公共数据集和5个AI相关教程资源。数据集包括遥感图像、智能体推理、文档解析、记忆压缩和食品检测等专业领域,涵盖多模态数据和应用场景。教程资源覆盖神经网络构建、视频目标跟踪、大模型应用、图像生成和扩散模型等热门AI技术,提供从基础到进阶的学习路径。

文章图片
#百度#开源#深度学习 +2
一键移除复杂物体!Netflix VOID 让视频消除拥有「物理直觉」;告别乱码与解析难题,MDPBench 数据集为「真实复杂场景」文档解析而生

OpenBayes发布11个公共数据集和6个公共教程资源。数据集涵盖医疗健康(StrokeRisk中风风险)、多语言处理(MDPBench)、文化研究(CHOCLO)、金融安全(CreditCardFraud)等多个领域,包含结构化数据和标注样本。教程资源包括DeepTutor学习助手、Gemma-4-31B-it模型部署、Chandra-ocr-2文本识别等实用工具,涉及教育、生物工程、视频编辑

文章图片
#人工智能#深度学习#机器学习 +1
OpenBayes 一周速览丨3B参数多模态统一模型Ovis-U1-3B开源,实现单一框架完成多模态任务;Magenta RT实时音乐生成,可动态调整乐曲风格

Ovis-U1-3B 模型集成多模态理解、文本到图像生成和图像编辑三种核心能力,基于先进的架构和协同统一训练方式,实现高保真图像合成和高效的文本视觉交互。Kimi-Dev-72B 在 SWE-bench Verified 编程基准测试中达到 60.4% 的性能,凭借其仅 72 亿的参数量,一举夺魁,超越了近期发布、参数量高达 671 亿的新版 DeepSeek-R1,成为当前开源模型中的 SOTA

文章图片
#人工智能#深度学习#机器学习
    共 57 条
  • 1
  • 2
  • 3
  • 6
  • 请选择