logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

球星 C 罗投资 AI 初创 Perplexity;微软开源 VibeVoice-Realtime,低延迟流式输出丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示: 个人观点,仅供参考​。

#人工智能#microsoft#开源
构建拥有记忆的端到端实时语音助手:TEN Framework + memU 教程丨社区来稿

实时语音模型让我们可以轻松构建能即时响应的语音助手Agent。但如果想让一个语音助手真的有“用”,仅仅能听和说还不够——它必须。在本教程中,你将使用构建一个具备与的智能Agent,它可以记住和你发生的一切对话内容。基于本教程的实时语音 + 记忆 Pipeline,你可以将 Agent 扩展为:AI 伙伴 / 情感陪伴 Agent语言学习或口语练习 Tutor客服 / 销售语音 AgentVTube

#人工智能
构建拥有记忆的端到端实时语音助手:TEN Framework + memU 教程丨社区来稿

实时语音模型让我们可以轻松构建能即时响应的语音助手Agent。但如果想让一个语音助手真的有“用”,仅仅能听和说还不够——它必须。在本教程中,你将使用构建一个具备与的智能Agent,它可以记住和你发生的一切对话内容。基于本教程的实时语音 + 记忆 Pipeline,你可以将 Agent 扩展为:AI 伙伴 / 情感陪伴 Agent语言学习或口语练习 Tutor客服 / 销售语音 AgentVTube

#人工智能
在元宇宙中搭建语聊房,设计思路和实现方法分享

本文为声网 RTE 开发者社区作者投稿,作者为@arige。

文章图片
#unity#游戏引擎
声网 X Yalla:面对面不如线上见,中东年轻人最偏爱的语聊房是怎样“炼”成的?

“实时互动的本质是服务,而非功能。”这是声网一直以来坚信的理念。功能上线之后,服务才真正开始。实时互动的每一秒,甚至每一毫秒的体验都需要得到稳定、可靠的保证。而广大用户之所以能够在诸多创新应用中与好友语音开黑、与主播随时随地连麦畅聊、与千里之外的名师实时互动问答等,皆是源于声网与客户、开发者一起亲密无间的悉心打磨。基于此,我们正式推出【看见技术的价值】系列策划,聚焦全球范围内的创新场景及优秀应用,

#人工智能
米哈游联创推出可对话「猫猫」AI,具备情绪与独立思考;微软研究发现空间音频可将 AI 同传理解度翻倍丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示: 个人观点,仅供参考。

#人工智能#microsoft#音视频
Step-Audio-R1:音频深度推理模型;Soul 冲刺港交所,「AI+沉浸式社交平台」,累计注册用户达 3.9 亿丨日报

我们欢迎更多的小伙伴参与**「RTE 开发者日报」**内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。作者提示: 个人观点,仅供参考。

#音视频#人工智能
    共 218 条
  • 1
  • 2
  • 3
  • 22
  • 请选择