登录社区云,与社区用户共同成长
邀请您加入社区
通过视觉、语言、视频与动作的联合建模,融合视频模型、VLA、世界模型等等路线,从而实现对真实环境的感知、规划、预测、执行和跨任务泛化,典型代表是去年 12 月发布的 Motus。目前关于 MotuBrain 的公开信息寥寥无几,但从这次双榜的成绩结构来看,它背后大概率不是传统的视频模型,也不是单纯的 VLA 或 policy model。这是预测世界的能力。,比方说模型能否在多任务、多环境下稳定执
本文介绍了基于虹软人脸识别SDK实现多路网络摄像头实时人脸检测的技术方案。文章首先分析了城市安防、智慧园区等场景对多路视频流人脸检测的需求背景,阐述了ONVIF协议和RTSP流媒体的关键技术。随后详细说明了开发前的准备工作,包括RTSP流获取、SDK申请和环境搭建。项目采用Spring Boot+Vue3架构,通过FFmpeg解码、OpenCV转码实现多路RTSP流并行处理,利用线程池确保虹软SD
最近在折腾工业质检项目,手头刚撸完一套PCB基板瑕疵检测系统。这套玩意儿用C#搭框架,Halcon做核心视觉处理,外挂OpenCV打辅助,实测效果比纯传统方案提升30%检测效率。这套系统踩过的坑比深圳电子厂的PCB板还多,但最终实现99.2%的检出率。工业相机的SDK能把人整疯,我们封装了个万用控制层。功能统计:多种缺陷检测、IO控制、相机控制、灯光控制、TCP/IP、视觉定位、激光校正。功能统计
PyVideoProc 是一个基于 CUDA 加速的 Python SDK,用于高效处理多路视频流分析。它通过多进程绕过 GIL 限制,减少主机-设备数据传输,并尽可能在 GPU 上计算以提升性能。项目支持多卡、多模型推理,提供开箱即用的解决方案,适合中小型项目快速部署。安装需满足 Docker、显卡驱动和 NVIDIA 容器工具版本要求,支持模型权重转换和 TensorRT 优化。项目开源且开发
通过采用SPWM调制方式和电压电流双闭环控制方式带前馈的控制策略,本模型实现了对电力系统的有效控制和稳定输出。本文将介绍在plecs(Power Electronics Control Simulation)仿真软件中建立的三相六开关PFC模型,并详细阐述其平均电流调制方式为SPWM及电压电流双闭环控制方式带前馈的控制策略。在plecs版本8.2的仿真环境中,我们成功构建了该模型,并通过仿真得到了
音视频技术涉及采集、编码、传输、解码、播放等全链路流程,涵盖网络优化、设备兼容、安全加密等多个专业领域,自主开发门槛高、周期长、成本高。从日常的视频通话到企业的数字化转型,音视频SDK作为实时互动的“技术底座”,正在重塑人与人、人与设备、设备与设备之间的沟通方式。同时,成熟的音视频SDK具备跨平台适配能力,可无缝兼容iOS、Android、Windows、Mac、Web及微信小程序等主流终端,覆盖
YUVview (YUV/RGB 播放、帧对比(PSNR/SSIM/ 差分)、像素级检视、H.265/HEVC 比特流直接解码与内部信息可视化、参考软件(HM/JEM)集成)perf (Linux):系统级性能分析,支持事件采样、调用图追踪,适合 Linux 平台编码器优化。Valgrind:内存泄漏检测、缓存命中率分析,适合编码器内存优化。核心功能:CPU/GPU 性能采样、瓶颈定位、缓存优化、
在永磁同步电机控制中,BP神经网络根据转速与给定值的误差,自动调整速度环PI的参数,以实现更优的控制效果。基于BP神经网络PI的永磁同步电机控制是一种先进的电机控制技术,其核心在于利用BP神经网络对永磁同步电机的速度环PI进行动态调整,从而增强控制的抗干扰性。在永磁同步电机控制中,除了BP神经网络PI控制外,还存在许多其他的控制策略,如传统PI控制、模糊控制、自适应控制等。BP神经网络采用梯度下降
智联视频超融合平台通过GB/T28181-2011/2016/2022、国网B接口、RTSP、RTMP、ONVIF、GB/T35114、GA1400、海康大华SDK/API等方式,接入海康、大华、宇视等各个厂家的摄像机、录像机,接入直播手机,接入下级平台,提供web客户端进行视频预览、录像回放、配置管理和智慧运维。提供标准RESTful格式的HTTP API,提供web播放器demo,满足二次开发
gpu读取速度344fps,不过这里是时间计算我感觉是有问题的,不知道gpu解码的时间有没有同步在gpu_times中,而且这里仅仅是解码的时间,如果在加上从显存到内存的时间,速度是很慢的。不过硬解码的视频本身就是为了送给ai预测的,所以没必要拷贝到内存。在此之前需要基于msvc编译器来编译gpu版opencv,详细内容请查看。可以看到gpu执行的速度还是非常快的,我这里是8k的视频,gpu设备是
mediamtx官方作者提供了docker的镜像,如下图,但是现在想要使用ffmpeg+RPI的版本无法下载,本文介绍使用ubuntu镜像运行mediamtx。刚开始想在创建的ubuntu18.04的镜像中使用systemctl做开启自启动mediamtx,但是镜像的目的是隔离,镜像中不支持systemctl,因此可以写启动脚本,在容器运行是执行开启脚本。
目前市场上音视频技术方案大致分为以下几类,WebRTC因其超低延时、集成音视频采集传输等优点,是在线教育、远程会议等领域首选技术。前言目前市场上音视频技术方案大致分为以下几类,WebRTC因其超低延时、集成音视频采集传输等优点,是在线教育、远程会议等领域首选技术。方案优势劣势应用场景基于浏览器插件的flash播放RTMP即将淘汰即将淘汰传统直播跨平台的HLS/DASH 播放方案- 跨端广泛支持:苹
ISCAS 宣布将于 2023 年 5 月 21 日 - 5 月 25 日在美国加州蒙特雷举办。作为 IEEE 旗下电路与系统学会旗舰会议,本届 ISCAS 将继续联合字节跳动多媒体实验室,举办第二届神经网络视频编码竞赛。
实时音视频(RTC)即基于IP技术实现的实时交互的音视频通信技术
多方音视频通信三种架构方案一、Mesh 方案即多个终端之间两两进行连接,形成一个网状结构。这种方案是1v1 WebRTC 通信模型的扩展版,任何两个结点都可以看成一个1v1 WebRTC 通信模型。优势:不需要服务器中转数据,STUN/TUTN 只是负责 NAT 穿越,这样利用现有 WebRTC 通信模型就可以实现,而不需要开发媒体服务器。劣势:需要给每一个参与人都转发一份媒体流,这样对上行带宽的
什么是 WebRTC ?WebRTC(Web Real-Time Communication)是 Google于2010以6829万美元从 Global IP Solutions 公司购买,并于2011年将其开源,旨在建立一个互联网浏览器间的实时通信的平台,让 WebRTC技术成为 H5标准之一。我们看官网(https://webrtc.org)的介绍其中:Web Real-Time Commun
本文深入探讨HarmonyOS 6.0中AVCodec Kit新增的同步模式视频编解码功能。同步模式允许开发者主动控制编解码流程,与传统的异步回调模式形成互补。文章从技术演进角度分析同步模式的设计哲学,比较其与异步模式的本质差异及适用场景,指出同步模式特别适合需要精确控制buffer生命周期、简化工具类应用逻辑等场景。详细介绍了开发环境配置、编码器创建与参数设置等实战内容,并提供了CMake配置示
MS2108是一款高集成度USB2.0数字视频采集芯片,支持BT601/BT656/BT1120等数字音视频信号转换,集成USB2.0控制器、数据处理模块等,实现全链路处理。芯片特性包括:支持1080P@60Hz输入,YUV/MJPEG输出模式,最高1920×1080@30Hz分辨率;支持I2S音频输入,96KHz单声道输出;符合UVC1.0/UAC1.0协议,适配Windows/Android/
MS2131S是一款高性能USB3.0音视频采集芯片,支持4K@60Hz高清采集与环出功能。其核心特性包括:支持4096×2160分辨率输入/环出,集成3路I2S音频接口和S/PDIF输出,可实现多音源混音处理;通过USB3.0接口实现4K@60Hz(MJPEG)或3840×2160@30Hz(YUV420)视频传输;兼容Windows、Android、Linux等多系统,并支持二次开发。该芯片集
在探讨 “How to build an AI camera” 时,明确其核心功能定位是关键。AI 相机的应用场景广泛,无论是智能安防中的实时监控,还是工业质检里的细节捕捉,亦或是家庭看护时的动态记录,RTSP 推流、拍照及录视频这三大功能都是核心支撑,直接决定了 AI 相机在不同场景下的实用价值。当前,不少相关产品和项目在实际应用中面临显著痛点:RTSP 推流易出现不稳定、延迟过高的问题,在需
核心升级,产品炸裂QuarkPi-CA2卡片电脑搭载瑞芯微RK3588S芯片,采用8nm制程工艺,搭载4核Cortex-A76+4核Cortex-A55,6.0Tops NPU支持INT4/INT8/INT16/FP16,支持TensorFlow、PyTorch等主流框架,支持8K@60fps视频解码和8K@30fps视频编码,H.265/H.264/VP9/AV1等格式,满足专业级多媒体需求,最
最近几天嵌入式的性能提高了非常多,一般基于Armv8架构,可以达到8核,并且自带强大的视频编解码能力。得益于这些新的平台都采用了Linux发行版,不像以前一个Kernal加上busybox就是全部。这些芯片一般基于Ubuntu或者Debain,部署软件 升级OS组件都非常方便。USC ArmV8版本支持基于多款平台运行,今天我们来测试RK3588。总体测试一下性能不错。
可切换外部 MIPI 输入与内部视频流,简化硬件调试与验证流程。:智能手机、平板电脑的 MIPI 至 LVDS 信号转换。:动态通道交换功能减少布局限制,降低开发难度。:支持 4K 级分辨率传输,确保画面流畅性。:工控机、医疗设备的超高清显示接口扩展。:1/2 链路 LVDS TX,支持。,适用于移动设备、工业显示屏等场景。:4 通道 MIPI RX,支持。低功耗设计,满足移动设备能效要求。:仪表
支持 S/PDIF 输入(最高 192kHz),兼容 HDMI 1.3 高比特率(HBR)音频,通过 I2S 或 S/PDIF 接口实现最高 768kHz 帧率。内嵌 CEC PHY 层,支持 HDMI 设备间联动控制(如一键遥控多设备),通过高层软件 API 简化操作,减轻 MCU 负担。集成预编程 HDCP 密钥 ROM,确保数字内容传输安全,用户无需自行管理密钥。消费电子、PC 设备及多屏互
RV1126 核心板是常州海图电子科技有限公司推出的一款以瑞芯微 RV1126处理器为核心的通用产品,其丰富的设计资源、稳定的产品性能、强力的设计支持,为客户二次开发快速转化产品提供强有力的技术保障。RV1126 核心板集多种优势于一身,具有强劲的处理器性能以及强悍的视频处理、视频分析与编解码能力。
视频编解码
——视频编解码
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net