logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

通义开源端到端语音模型 Fun-Audio-Chat 8B;OpenTable 与 Yelp 竞速餐饮语音 AI丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示:个人观点,仅供参考。

#人工智能
如何将「语音克隆同意验证机制」嵌入 AI 工作流丨Voice Agent 学习笔记

在这篇博客文章中,我们介绍了“语音同意验证机制 (voice consent gate)”的概念,支持通过明确同意来进行语音克隆。我们还提供了一个示例 Space 应用和相关代码,帮助大家快速上手这一想法。示例 Space 应用https://hf.co/spaces/society-ethics/RepeatAfterMe相关代码https://hf.co/spaces/society-ethi

#人工智能#学习
如何将「语音克隆同意验证机制」嵌入 AI 工作流丨Voice Agent 学习笔记

在这篇博客文章中,我们介绍了“语音同意验证机制 (voice consent gate)”的概念,支持通过明确同意来进行语音克隆。我们还提供了一个示例 Space 应用和相关代码,帮助大家快速上手这一想法。示例 Space 应用https://hf.co/spaces/society-ethics/RepeatAfterMe相关代码https://hf.co/spaces/society-ethi

#人工智能#学习
ICASSP2026 类人语音对话系统(HumDial)挑战赛结果公布丨社区来稿

从简单的指令执行到具备“心智”的情感共鸣,AI 语音交互正在经历怎样的蜕变?在人工智能飞速发展的今天,我们渴望的不再仅仅是一个“有问必答”的助手,而是一个能听懂弦外之音、能接住突发话茬的“知心伙伴”。最近,ICASSP 2026 发起,旨在推动语音对话模型在“”情感感知与“”流式交互两大核心维度的技术跃迁。目前赛事已经告一段落,现正式揭晓比赛结果。

文章图片
#人工智能
ICASSP2026 类人语音对话系统(HumDial)挑战赛结果公布丨社区来稿

从简单的指令执行到具备“心智”的情感共鸣,AI 语音交互正在经历怎样的蜕变?在人工智能飞速发展的今天,我们渴望的不再仅仅是一个“有问必答”的助手,而是一个能听懂弦外之音、能接住突发话茬的“知心伙伴”。最近,ICASSP 2026 发起,旨在推动语音对话模型在“”情感感知与“”流式交互两大核心维度的技术跃迁。目前赛事已经告一段落,现正式揭晓比赛结果。

文章图片
#人工智能
INNOSpark Vol.4 开放招募:路演直通 VC,入驻智慧谷,抱走算力券丨社区伙伴活动推荐

在这个由AI浪潮主导的时代,创新需要的不仅仅是技术,更需要高能级的生态支持和精准的资本助推。我们在此正式发布邀请,寻找最具技术创新性和市场的AI硬科技项目,共同在杭州这片创新热土上,实现同频共振,生态共生。

#人工智能
字节预热智能硬件 Ola Friend,预计为智能耳机;鸿蒙 NEXT 公测正式开启,微信邀请内测丨RTE 开发者日报

开发者朋友们大家好:这里是,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的」、「有态度的」、「有意思的」、「有思考的」、「有看点的」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。本期编辑:@SSN,@鲍勃。

文章图片
#智能硬件#harmonyos#微信
李飞飞世界模型 RTFM:单个 H100 GPU 跑出实时 3D 宇宙;PaddleOCR-VL:0.9B 多模态文档解析|日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。素材来源官方媒体/网络新闻。

文章图片
#人工智能
亚马逊推出对话式 AI 门铃,识别访客并代为应答;Vocu V3 语音模型登顶 HF TTS Arena 榜丨日报

用户可为不同类型访客设置具体指令,例如:指示快递员放置包裹的位置、提供饮水零食、处理签收事宜;礼貌拒绝推销人员;或让亲友留言。

#人工智能
Grok 发布语音 API,支持实时 X 数据搜索;腾讯发布混元实时世界模型 1.5,开放个人体验丨日报

Unicorn Blocks 是一家以 AloT 为核心产品形态的创新科技公司,致力于通过人工智能技术定义积木机器人的未来。我们的使命是「和孩子一起创造童话世界」,《玩具总动员》中的角色来到我们的世界。

#人工智能
    共 255 条
  • 1
  • 2
  • 3
  • 26
  • 请选择