社区云

实时音视频

广州灵眸科技有限公司来自 AI编程社区

aicoding.csdn.net · 2026-07-01 13:55:03

瑞芯微RV1126B开发板（EASY-EAI-PI2）人员检测

人员检测是一种基于深度学习的对人进行检测定位的目标检测，能广泛的用于安防、生产安全等多种场景，是周界入侵检测、越界识别、聚众识别、徘徊识别、摔倒识别等多种算法的基石算法。

#实时音视频 #单片机 #物联网 +2

228 

8 
广州灵眸科技有限公司来自 AI编程社区

aicoding.csdn.net · 2026-07-03 16:46:38

瑞芯微RV1126B开发板（EASY-EAI-PI2）车辆检测

车辆检测是一种基于深度学习的对人进行检测定位的目标检测，能广泛的用于园区管理、交通分析等多种场景，是违停识别、堵车识别、车流统计等多种算法的基石算法。

#实时音视频 #单片机 #物联网 +2

189 

9 
weixin_54681086 来自智能体开发者社区

adg.csdn.net · 2026-07-27 16:56:29

《AI Agent + 实时音视频：让企业产品 Demo 从“观看”变成“对话”》

本文介绍一种面向企业软件的新型 Demo 演示方式：通过语音交互和 AI Agent 控制 Demo 页面，实现自动点击、输入、切换模块和流程讲解。文章结合官网自助 Demo、售前远程演示、客户培训试用等场景，分析语音交互控制 Demo 如何提升 SaaS 产品转化效率，并说明实时音视频 SDK 在其中的基础设施价值。

#实时音视频

153 

9 
sqmeeting 来自乐奇 Rokid 开放社区

openrokid.csdn.net · 2025-05-07 21:01:14

神旗视讯3.4.2版本发布：100%安全自主的国产信创会议系统

神旗视讯的演进之路，印证了中国技术厂商在“安全可控”与“全球兼容”之间的平衡智慧。：提供开源SDK与API接口，支持与企业OA、CRM系统深度集成，并支持界面主题、功能插件的个性化开发，实现“一企一策”。，实现H.323协议下最大9路画面交互，并与华为、宝利通、思科等传统会议系统无缝互通，助力企业平稳过渡至国产化平台。：支持从公有云、私有云到NUC迷你主机的多形态部署，3分钟快速搭建专属会议系统，

#实时音视频

719 

15 
音视频牛哥来自 2048 AI社区

2048ai.net · 2026-07-27 13:50:32

为什么做一个优秀的视频直播系统这么难？从 SmartMediaKit 实践看实时音视频工程挑战与技术演进

视频直播已经从单纯的视频传输，发展为融合实时互动、智能分析、多终端覆盖和行业应用的一套复杂音视频系统。真正优秀的视频直播模块，不仅需要解决低延迟播放问题，还需要面对弱网环境、编码效率、协议兼容、跨平台适配、长时间稳定运行以及智能化扩展等工程挑战。本文从大牛直播SDK（SmartMediaKit）的研发实践出发，系统分析当前视频直播技术发展的关键瓶颈，包括端到端延迟优化、多协议融合、音视频质量平衡、

#音视频 #实时音视频

228 

7 
ZEGO即构科技来自即构开发者社区

zego.csdn.net · 2026-07-24 15:44:27

无人店零售额增速超20%，RTC为何成为交易闭环的关键？

随着“云值守”模式普及，超65%的24小时便利店已采用“白天人工+夜间云端”的混合运营方式，带动无人零售业态呈现多元化发展。从扫码购物的1.0版本到骑手拣货的“闪电仓”，各类无人零售方案均依赖实时音视频技术（RTC）作为兜底保障，通过云端客服与现场人员的实时交互完成交易闭环。

#实时音视频

218 

7 
miao200101 来自 AI Agent技术社区

agent.csdn.net · 2026-07-24 13:46:26

免费语音转文字软件哪个好用？2026年实测推荐，准确率、稳定性、功能全面对比

经过这次测评，我对免费语音转文字软件有了更深入的了解。总的来说，市面上没有一款完美的产品，每个产品都有自己的优势和不足。但如果你需要一款功能全面、免费额度充足、准确率高的录音转文字工具，智在记录确实是一个很值得尝试的选择，尤其是它的AI智能梳理和多端协同功能，能大幅提升工作效率。当然，如果你已经是某款产品的深度用户，比如飞书用户，那飞书妙记也不错；如果你是开发者，腾讯云语音识别会更适合你。关键是要

#语音识别 #安全 #实时音视频

462 

17 
weixin_54681086 来自智能体开发者社区

adg.csdn.net · 2026-07-24 11:11:00

《从排障会议到 AI Skill：实时音视频如何沉淀企业运维经验？》

本文介绍一种新的 AI 运维协作方式：通过实时音视频交互，让运维专家边讲解、边共享屏幕、边演示排障过程，由 AI 自动生成可复用的运维工具 Skill。文章结合 K8s Pod 异常重启、数据库慢查询、线上告警回滚等场景，分析如何将专家经验沉淀为 AI Agent 可调用的组织能力。

#kubernetes #实时音视频

191 

4 
Multipath712 来自 DAMO开发者矩阵

damodev.csdn.net · 2026-07-23 14:54:28

智能巡检机器人多链路聚合路由解决方案

在综合管廊等狭长密闭、电磁干扰强的场景中，传统Wi-Fi切换延迟甚至可达秒级，导致视频断流“黑屏”、远程控制指令延迟甚至丢失。随着电力、石油、交通、安防、管廊等行业加速推进“机械化、自动化”，智能巡检机器人已成为常态化作业标配。同时捆绑起来，在终端侧把数据包切片，按实时丢包/时延/抖动拆分到各链路并行传输，再经过云端聚合节点重组还原。漫游切换可达毫秒级，视频画面无卡顿。在Wi-Fi信号弱、蜂窝网络

#网络 #实时音视频 #安全

244 

5 
电子科技圈来自 DAMO开发者矩阵

damodev.csdn.net · 2026-07-22 13:21:23

XMOS发布可在嘈杂环境中仍能清晰拾音的新一代AI语音处理器VocalFusion® XVF3620

XMOS推出新一代VocalFusion® XVF3620智能语音处理器，集成AI降噪、声学回声消除、双麦克风波束成形等核心技术，专为消费电子和工业机器人设计。该芯片能在复杂噪声环境中实现清晰人声拾取，支持全双工通信和打断唤醒功能，并通过单芯片集成简化开发流程。经测试，XVF3620在车流、雷雨等多种噪音场景下表现优异，可广泛应用于智能家电、服务机器人等领域，显著提升语音交互质量。

#人工智能 #mcu #音视频 +3

157 

3 
ez在线工具网来自 AI编程社区

aicoding.csdn.net · 2026-01-18 01:06:37

手把手教你搭建 Nginx-RTMP 流媒体服务器（Ubuntu/Windows）

介绍如何在 Ubuntu 和 Windows 平台上从零开始搭建 Nginx-RTMP 流媒体服务器的技术教程，涵盖了从编译安装到配置使用的全流程。

#服务器 #nginx #ubuntu +3

1347 

29 
音视频牛哥来自 AtomGit AI 社区

tianqi.csdn.net · 2026-07-20 22:26:54

AI浪潮下，实时音视频SDK正在经历怎样的价值重构？

随着生成式AI、多模态大模型和边缘推理快速发展，实时音视频SDK的价值正在被重新定义。AI降低了基础播放器、推流器和视频分析Demo的开发门槛，但真实项目中的低延迟、跨平台一致性、异常码流兼容、弱网恢复、多路并发和长期稳定运行，仍依赖长期工程积累。对大牛直播SDK（SmartMediaKit）而言，未来不应转型为通用算法平台，而应继续强化实时媒体内核，并通过统一视频帧接口、异步推理调度、事件录像、

#人工智能 #实时音视频 #音视频

360 

7 
明月心952 来自 AI编程社区

aicoding.csdn.net · 2026-02-26 17:02:10

WebSocket 、 RTC 和 HTTP 实现实时通信的技术

WebSocketWebSocket 是一种全双工通信协议，基于 TCP 建立持久化连接，允许服务器与客户端实时双向通信。客户端通过 WebSocket 协议与服务器握手建立连接。RTC集成了火山引擎实时音视频 RTC 的音视频通信能力，基于优质的全球传输网络实现超低延时，支持自动噪声抑制，以更低的功耗实现更好的音视频通话效果。HTTP基于成熟的 HTTP 协议，开发相对简单，不需要处理复杂的实时

#websocket #实时音视频 #http

556 

13 
音视频牛哥来自人工智能6S服务平台

ai6s.net · 2026-07-20 17:42:48

为什么 SmartMediaKit 要全面支持 HarmonyOS NEXT？从平台适配到实时音视频能力底座

HarmonyOS NEXT正在加速进入移动终端、行业设备和全场景智能生态。大牛直播SDK（SmartMediaKit）全面支持鸿蒙NEXT，并非简单移植单一播放器，而是围绕采集、编码、RTMP推流、RTSP/RTMP低延迟播放、轻量级RTSP服务、GB28181接入、录像与快照，构建完整实时音视频能力底座。通过ArkTS、NAPI与Native C/C++分层架构，SmartMediaKit兼顾

#harmonyos #实时音视频 #华为 +1

679 

22 
Multipath712 来自亚马逊云科技技术品牌专区

devpress.csdn.net/awstech · 2026-07-20 09:50:16

破解无人巡检“连接难”——端到端高可靠通信解决方案

随着人工智能、自动驾驶和物联网技术的快速发展，无人巡检已成为电力、石油、交通、安防、园区管理等行业的标准作业方式。无人巡检车搭载L4级自动驾驶、高精度地图、多传感器融合感知等前沿技术，可在公共道路、封闭园区实现完全无人驾驶，集立体化巡防、智能预警于一身。高速移动过程中，网络频繁切换基站，易出现丢包、抖动、延迟增加等问题，直接影响远程操控安全性和数据完整性。巡检车在偏远地区、地下管廊、隧道、山区等场

#网络 #实时音视频 #安全 +1

172 

2 
qq_34993647 来自 AI硬件创业社区

aiot.csdn.net · 2026-02-09 10:45:11

手把手教你一步步使用基于HAL库STM32的RTC时钟

打开STM32CubeMx，选择RCC的配置，将外部低速时钟LSE设置为外部晶振模式，使用外部的32.768KHz的时钟，这个比较精准。也可以选择内部的时钟LSI是40KHz的时钟，但是这个不太精准，这里我们选择外部晶振。点开时钟配置界面，选择LSE为RTC时钟源下面进行配置RTC的一些设置，选择Timers下面的RTC选项，点击Activate Clock Source选项，使能我们的实时时钟(

#stm32 #实时音视频 #单片机

1417 

33 
FreeIPCC 来自 AI Agent技术社区

agent.csdn.net · 2025-07-07 12:48:17

大语言模型呼叫中心场景分享之五十：机械制造领域应用场景

机械制造领域大模型呼叫中心应用场景摘要：机械制造行业具有设备复杂、故障影响大、服务响应要求高等特点。大模型技术为行业数字化转型提供了智能化解决方案，其呼叫中心系统具备四大核心能力：机械知识中枢、智能交互系统、预测性维护平台和全渠道协同中心。在生产制造、售后服务和供应链协同等场景可实现智能工艺咨询、设备异常诊断、AR远程指导等功能。通过构建专业知识库和系统集成，大模型正重塑机械制造服务体系，推动向

#语言模型 #人工智能 #自然语言处理 +1

962 

24 
FreeIPCC 来自 AI Agent技术社区

agent.csdn.net · 2025-07-07 12:50:11

大语言模型呼叫中心场景分享之五十一：纺织服装领域的应用场景

摘要：大语言模型在纺织服装行业的应用正推动全产业链智能化转型。FreeAICC系统构建了包含行业知识中枢、智能交互系统等核心能力的呼叫中心体系，覆盖设计研发（面料推荐、版型优化）、零售服务（尺码推荐、穿搭顾问）和供应链协同（异常处理、物流调度）三大场景。关键技术包括纺织专业知识库构建、多模态模型训练及企业系统集成。未来将向虚拟时尚顾问、AI协同设计等方向发展，成为行业"数字时尚大脑&qu

#语言模型 #人工智能 #自然语言处理 +3

1056 

16 
FreeIPCC 来自 AI Agent技术社区

agent.csdn.net · 2025-07-08 10:24:32

大语言模型呼叫中心场景分享之五十二：食品加工领域的应用场景

食品加工行业借助大语言模型实现全流程智能化升级。系统构建食品安全法规库、生产工艺知识图谱等核心知识体系，支持工艺咨询、质量诊断、配方优化等生产制造场景。在供应链管理中实现智能审核、异常处理及冷链监控，质量服务方面提升投诉处理、安全咨询和产品追溯效率。关键技术包括行业知识库构建、多模态交互和系统集成，未来将向数字孪生工厂、预测性质控等方向发展。该解决方案正重塑食品行业"生产-供应链-质量&

#语言模型 #人工智能 #自然语言处理 +2

693 

10 
FreeIPCC 来自 AI Agent技术社区

agent.csdn.net · 2025-07-17 14:14:34

大语言模型呼叫中心场景分享之六十：玩具行业的应用场景

摘要：大语言模型在玩具行业呼叫中心的应用显著提升了服务效率与体验。该系统构建了包含产品安全标准、适龄推荐、AR组装指导等功能的智能交互体系，解决了传统玩具行业在咨询、使用指导及售后服务中的痛点。通过多模态接入、教育价值评估和全渠道协同，实现精准适龄推荐、安全疑问解答、可视化故障诊断等场景化服务。未来将向元宇宙玩具屋、成长型AI玩伴等方向发展，推动玩具服务向安全化、教育化、情感化升级，成为企业的“

#语言模型 #人工智能 #自然语言处理 +1

634 

7 
FreeIPCC 来自 AI Agent技术社区

agent.csdn.net · 2025-07-18 09:21:30

大语言模型呼叫中心场景分享之六十二：办公用品行业的应用场景

摘要：办公用品行业正通过大语言模型呼叫中心实现数字化转型，解决产品品类繁杂、采购需求多样等痛点。系统构建了产品知识中枢、智能交互系统等核心能力，应用于采购咨询、使用支持等场景，如智能推荐办公套装、AR指导设备操作等。未来将向数字孪生办公、预测性采购等方向发展，成为"智能采购中枢"，推动行业服务向精准化、自动化升级。

#语言模型 #人工智能 #自然语言处理 +1

941 

23 
FreeIPCC 来自 AI Agent技术社区

agent.csdn.net · 2025-07-18 09:18:22

大语言模型呼叫中心场景分享之六十一：体育用品行业的应用场景

AI赋能体育用品行业服务升级体育用品行业正借助大语言模型实现智能化转型。该系统构建了包含运动知识库、智能交互平台和个性化服务的核心架构，可提供专业装备推荐、AR使用指导、训练计划生成等场景化服务。通过整合运动生物力学数据、装备技术参数和用户画像分析，大模型实现了从选购到售后全流程的精准服务。关键技术包括运动知识图谱构建、多模态交互优化和可穿戴设备数据对接。未来将向数字孪生训练、AI运动教练等方

#语言模型 #人工智能 #自然语言处理 +1

865 

18 
开发小师妹来自亚马逊云科技技术品牌专区

devpress.csdn.net/awstech · 2025-09-11 16:27:41

多方言语音识别技术拆解：从单模型架构突破到场景落地优化

在语音识别技术普及过程中，“方言壁垒” 始终是下沉场景落地的关键阻碍。我国方言体系复杂，仅汉语方言就涵盖官话、吴语、粤语等十大方言区，不同方言的音素结构、词汇表达差异显著，传统通用语音模型在面对 “小众方言识别不准”“普方混说语义断层” 等问题时往往力不从心。本文将从技术原理、算法优化、工程落地三个维度，系统拆解多方言语音识别的核心难点与解决方案，结合真实测试数据提供可复用的技术思路，为开发者提供

#人工智能 #语音识别 #实时音视频 +1

1467 

13 
ZEGO即构开发者来自亚马逊云科技技术品牌专区

devpress.csdn.net/awstech · 2025-09-16 15:42:42

【ZEGO即构开发者日报】OpenAI 推出 GPT‑5‑Codex；MiniMax发布音乐生成模型Music 1.5；2025年8月越南、泰国、马来西亚市场中国出海应用畅销榜 Top30……

OpenAI发布专为Agent编程优化的GPT-5-Codex；MiniMax推出音乐生成模型Music1.5；即构科技联合谷歌等将举办AIGC应用出海直播；东南亚市场观察：越南偏好策略游戏与本地化内容，泰国由字节系主导娱乐生态，印尼则呈现MOBA与社交深度融合趋势，宗教场景本地化应用表现突出。

#人工智能 #社交电子 #深度学习 +2

1237 

7 
m0_61005534 来自快递鸟社区

kdniao.csdn.net · 2026-07-10 10:34:36

电商直播怎么选？网页直播和直播 SDK 推流、播放和互动能力拆解

电商直播选型需根据业务阶段选择网页直播或直播SDK，考虑因素包括推流、播放、互动、连麦、商品转化和数据链路等完整能力。网页直播适合轻量活动，触达快但功能有限；App直播适合长期业务，能深度整合登录态、商品体系等。直播SDK需覆盖推流、播放、互动消息等基础模块，并关注电商所需的商品链路和内容安全。选型时应评估直播在业务中的角色，选择匹配的技术方案。

#实时音视频 #教育电商 #实时互动

292 

9 
m0_37126428 来自 AI Agent技术社区

agent.csdn.net · 2025-10-05 07:05:31

C#中的yield关键字简化迭代器实现的利器

在C#编程语言中，yield关键字是一个强大的特性，它极大地简化了迭代器的实现过程。通过使用yield，开发者可以更简洁、更直观地创建枚举器，而无需手动实现完整的IEnumerable或IEnumerator接口。yield关键字是C#中简化迭代器实现的强大工具，它通过自动生成状态机代码，让开发者能够更专注于业务逻辑而不是迭代机制本身。例如，yield不能用在匿名方法中，也不能在包含catch块或

#实时音视频

311 

8 
wei1368177 来自 AI Agent技术社区

agent.csdn.net · 2025-10-06 06:32:04

[Java]深入解析Java17中的密封类（SealedClasses）增强代码安全性与可维护性的新特性

Java 17中的密封类是一项强大的特性，它通过为类层次结构提供精细化的访问控制，有效地增强了代码的安全性和可维护性。它将运行时可能出现的类型错误转化为编译时错误，迫使开发者更严谨地处理所有情况。同时，它通过使设计意图显式化，提升了代码的表达能力和文档价值。对于构建健壮、清晰且易于维护的大型应用程序或公共API而言，密封类是一个不可或缺的工具，标志着Java语言在现代化道路上的又一座里程碑。随着开

#实时音视频

767 

13 
ynwxyuan 来自 AI Agent技术社区

agent.csdn.net · 2025-10-11 23:00:19

C++编程实战利用智能指针优化内存管理的十大技巧

智能指针是C++11及后续标准中引入的核心组件，用于自动化资源管理，特别是动态内存的分配与释放。它们通过RAII（资源获取即初始化）理念，将资源（如动态分配的内存）与对象的生命周期绑定，当智能指针对象离开其作用域时，会自动释放其管理的内存，从而有效避免内存泄漏。C++标准库主要提供了三种智能指针：`std::unique_ptr`、`std::shared_ptr`和`std::weak_ptr`

#实时音视频

547 

19 
Jacky0898_ 来自 AI Agent技术社区

agent.csdn.net · 2025-11-19 16:11:14

体育直播站：告别 3 个月基础开发！Vue+Java 全栈商用源码，让项目周期直接缩短 70%

针对技术团队面临的基础开发耗时长、多端协调效率低、工期紧张等痛点，本文推出「Vue+Java全栈商用源码解决方案」。该方案提供：1）四端同源架构，统一API降低维护成本60%；2）完整可二次开发的源码，7天交付可上线产品；3）内置用户体系、权限管理等企业级通用模块。适用于创业者、中小企业、外包公司和技术学习者，帮助团队跳过基础开发阶段，快速聚焦核心业务，抢占市场先机。方案实现从"0到1&

#vue.js #java #前端 +1

739 

18 
ZEGO即构科技来自即构开发者社区

zego.csdn.net · 2026-07-09 11:32:25

千万级并发赛事直播如何避免“卡、慢、糊“？即构赛事直播方案的技术解法

世界杯赛事直播面临卡顿、延迟、画质模糊三大挑战。即构科技推出「赛事直播方案」，通过自研技术实现超低卡顿（<1%）、毫秒级延迟（<1000ms）和4K HDR高清画质。方案还提供互动观赛模式，如云解说、主播陪看和好友连麦，增强参与感。同时支持高并发、版权保护及成本优化，帮助平台稳定承接流量高峰，提升用户体验。

#音视频 #实时音视频

250 

3 
阿拉斯攀登来自 EazyDevelop社区

eazydevelop-community.eazytec-cloud.com · 2026-07-08 23:31:15

FFmpeg 性能优化最佳实践：多线程、零拷贝与流水线

本文总结了FFmpeg性能优化的8个关键策略，按投入产出比排序：优先使用流复制（-c copy）代替重新编码，适用于不改动视频内容的情况，速度可提升数十倍充分利用硬件加速编解码（如NVIDIA NVENC、RK3588 RKMPP），性能提升3-10倍合理配置多线程参数（-threads），平衡CPU核心利用率减少不必要的像素格式转换（如YUV↔RGB），避免性能损耗优化滤镜处理顺序，先

#实时音视频 #视频编解码 #webrtc +1

342 

6 
御坂10101号来自 AI Agent技术社区

agent.csdn.net · 2026-03-05 14:44:48

树莓派也能实时语音识别，Moonshine 流式架构降低 98% 延迟

Moonshine 是一款开源语音识别工具，专为边缘设备优化，实现实时转录。其准确率超 OpenAI Whisper v3，延迟低至 237 毫秒，支持离线使用。采用流式编码架构与缓存机制，兼顾隐私保护与资源效率，已在消防、直播等场景落地，轻量化设计使其成为低功耗设备的实用之选。

#语音识别 #人工智能 #开源 +2

325 

4 

标签介绍

实时音视频

——实时音视频

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net