logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Amphion 推出开源 TTS 模型 MaskGCT,5 秒克隆声音;神秘文生图模型「小熊猫」登顶竞技场丨 RTE 开发者日报

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。素材来源官方媒体/网络新闻。

文章图片
#实时互动
11Labs 支持打造对话 AI 智能体;阿里推出大模型 Qwen2.5-Turbo 速度提升 4.3 倍丨 RTE 开发者日报

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。素材来源官方媒体/网络新闻。

文章图片
#人工智能#实时互动
MiniMax 首个文生视频模型发布,可生成 6s,限时免费;阿里 Qwen2-VL 第二代视觉语言模型开源丨RTE 开发者日报

开发者朋友们大家好:这里是,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的」、「有态度的」、「有意思的」、「有思考的」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。本期编辑:@SSN,@鲍勃。

文章图片
#语言模型#开源#实时互动
当基础设施故障后,声网 SD-RTN 如何保障 RTE 服务的高可用性

云计算的出现为企业的管理、业务开展、资源整合等带来了极大的便利性,也是数字化建设的核心基建之一,然而局部宕机或者大面积宕机事件对于云厂商来说却也无法避免,全球领先的计算平台也不例外。例如,美国东部时间12月7日上午10点45分,亚马逊 AWS 遭遇宕机,导致了迪斯尼+、奈飞等一些网站的在线服务受到影响,此次故障也在业内引发了较大的关注。之所以说云厂商的宕机故障无法 100% 避免,核心在于造成的原

#云计算#人工智能
音频技术及行业的发展

音频技术的重要性:在当今社会,工业科技革命的迅速崛起,大数据分析技术、物联网技术、音频技术等的相互融合快速发展,在生物、化学、人工智能等领域有了较大的市场和研究价值。对于音频技术在这之中起到了承上启下、不可或缺的一部分。对于音频技术在这之中起到了承上启下、不可或缺的一部分。虽然音频技术不是当下最热门、最主流的前沿技术,但在其前沿相关技术的使用,甚至是生活的方方面面都有音频技术的体现。一、音频技术的

阿里 Qwen2.5 开源发布;YouTubeVeo 引入 Google DeepMind Veo 模型丨 RTE 开发者日报

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。素材来源官方媒体/网络新闻。

文章图片
#开源#实时互动
音视频编解码流程与如何使用 FFMPEG 命令进行音视频处理

一、前言FFMPEG 是特别强大的专门用于处理音视频的开源库。你既可以使用它的 API 对音视频进行处理,也可以使用它提供的工具,如 ffmpeg, ffplay, ffprobe,来编辑你的音视频文件。本文将简要介绍一下 FFMPEG 库的基本目录结构及其功能,然后详细介绍一下我们在日常工作中,如何使用 ffmpeg 提供的工具来处理音视频文件。二、FFMPEG 目录及作用libavcodec:

#音视频
RTC月度小报5月 |教育aPaaS灵动课堂升级、抢先体验VUE版 Agora Web SDK、声网Agora与HTC达成合作

本月亮点速览产品与技术:声网Agora 教育 aPaaS 灵动课堂升级 视频通话/语音通话/互动直播 Native SDK 升级上线 3.4.2 版本视频通话/语音通话/互动直播 Web SDK 升级至 4.5.0 版本 互动白板本月发布了四个版本,最新版本为 2.12.29本地服务端录制 SDK 已更新至 3.0.6 版本RTC 社区动态:QCon 实时音视频专场:实时互动的最佳实践与未来展望

Deep-Live-Cam:只需单张图像即可实现人脸替换;零一万物、月之暗面再掀国产大模型资本战丨 RTE 开发者日报

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。素材来源官方媒体/网络新闻。

文章图片
#实时互动
基于容器环境的1-1课堂的开发部署

作者:申屠鹏会近年来,容器化已经是业界的共识了,不仅可以减少运维的成本,也有助于进行产品的快速迭代,同时,本地也可以利用容器,搭建出和生产几乎一样的环境,很方便的进行开发demo或者进行小功能的测试部署。接下来,我将从产品的需求分析,设计,业务编码,集成测试,到正式上线,利用声网强大的SDK,全程用容器化的思想,完成一个一对一课堂软件的开发。(因为资源关系,开发时候的容器环境只用Docker,而非

#容器#实时音视频
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择