社区云

音视频

嘀咕博客来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 7小时前

Kimi-Audio：Kimi开源的通用音频基础模型，支持语音识别、音频理解等多种任务

Kimi - Audio 确实为开发者提供了领先的音频处理基础设施，其多任务整合与开源策略极大推动了技术民主化。虽然它在轻量化部署和长音频处理上还有优化空间，但作为完全开源的通用音频模型，已经足够惊艳。在 AI 音频技术快速发展的 2025 年，这种能让开发者免费使用的强大工具，正在加速音频 AI 应用的创新和普及。多语种音频训练的大模型，整合了语音识别、音频理解与语音对话三大能力，堪称音频界的

#音视频 #语音识别 #人工智能

474 

9 
vpmu1 来自魔乐社区

modelers.csdn.net · 2024-09-09 13:19:44

petalinux 加入gstreamer应用程序

petalinux 加入gstreamer应用程序

#嵌入式硬件 #音视频

302 

2 
企业软件定制来自魔乐社区

modelers.csdn.net · 2022-01-10 17:13:10

JAVA版B2B2C商城源码多商家入驻商城系统直播带货新零售商城 o2o商城电子商务拼团商城分销商城直播商城短视频商城 springboot商城 spring boot商城

JAVA版B2B2C商城源码

#java #音视频 #spring boot +1

2008 
java之书来自魔乐社区

modelers.csdn.net · 2022-10-16 00:03:15

springboot整合海康视频到websocket接口前端显示

整体思路是在PS流中解析出H264的裸流然后通过websocket传给前端，前端基于wfs.js进行h264的裸流播放。最近进行项目开发时遇到了需要前端直接调用摄像头，并直接进行播放的需求。

#音视频 #前端

2175 

1 
搜索引擎技术来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 14小时前

AI原生应用让视频生成更智能

你是否遇到过这样的困扰？想做一条短视频，但剪辑软件太复杂，特效需要逐帧调整；想生成动画，但建模渲染要等几小时；想让视频“听懂”你的创意，却只能靠手动输入关键词……传统视频生成工具的痛点，正在被“AI原生应用”逐一解决。本文将聚焦“AI原生应用如何让视频生成更智能”，覆盖技术原理、实战方法与行业影响。本文从“什么是AI原生应用”讲起，用“做蛋糕”类比解释核心概念；接着拆解多模态大模型、扩散模型等技术

#音视频

580 

9 
qq_duhai 来自魔乐社区

modelers.csdn.net · 2023-03-08 16:14:22

ZLMediaKit在linux上（CentOS7）部署与启动

2、进入解压后目录,输入如下命令/usr/local/ffmpeg为自己指定的安装目录。

#linux #音视频

4987 

2 
酷瓜云课堂来自魔乐社区

modelers.csdn.net · 2024-08-12 07:49:30

5分钟教会你 linux 命令行下载油＞管＞视频

有了这个命令行工具用户可以毫不费力地下载视频，播放列表，甚至整个频道。

#linux #音视频 #运维

1060 
李郭涛来自魔乐社区

modelers.csdn.net · 2021-08-09 10:14:47

亚马逊云主机linux密钥登陆改为密码登陆

1.拿着官网给的密钥文件用ec2-user默认用户登录2.创建root密码sudo passwd root3.切换到root身份su root4.使用root身份编辑亚马逊主机的ssh登录方式vi /etc/ssh/sshd_config把 PasswordAuthentication no 改为 PasswordAuthentication yes如果没有则新插进去5.重启sshd使修改生效su

#音视频 #nginx #windows

1307 
程序员笑武来自魔乐社区

modelers.csdn.net · 2025-01-31 10:45:00

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

来了，来自微软研究院！在相同超参数的设置下，可以达到。这意味着。用这种方法训练的模型规模最高可达130亿参数规模，训练Tokens数量也达到千亿级别。而且用的还不是真·FP4，而是通过FP8来模拟，如果采用真的FP4，效果还能进一步提升。（注：研究开展时，尚未有原生支持FP4的硬件，故作者通过在FP8的TensorCore上模拟实现）网友评论说，效率更高质量却没什么损失，FP4真的是个game c

#人工智能 #深度学习 #音视频 +2

1020 

24 
哈~~哈~ 来自魔乐社区

modelers.csdn.net · 2024-08-16 10:58:06

linux下QOS：应用篇

Linux采用了基于对象的实现方法，qos还能保证对不同接口采用不同的策略，TC QOS有很多拥塞控制的机制默认的是FIFo还有其他PQ、CQ、WFQ等.策略类用结构体：Qdisc_ops表示。每个设备可以采用不同的策略对象，在设备和对象的关联需要到Qdisc结构体。并且在上一节我们已经讲了tc的三级树型组织.这里不再贴图. 还有一点注意的就是tc控发不空收.

#linux #网络 #运维 +2

1482 

13 
澳鹏Appen 来自魔乐社区

modelers.csdn.net · 2023-07-26 17:31:12

视频标注是什么？和图像数据标注的区别？

是对视频剪辑进行标注的过程。进行标注后的视频数据将作为训练数据集用于训练深度学习和机器学习模型。这些预先训练的神经网络之后会被用于计算机视觉领域。

#音视频 #人工智能 #大数据 +2

1857 
小敢摘葡萄来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 18小时前

AI大模型学习宝典（全面详解）零基础到实战应用

本文核心观点及图示解读，引自InfoQ研究中心与中欧AI与管理创新研究中心联合发布的《中国大模型落地应用研究报告 2025》。

#人工智能 #学习 #大数据 +3

553 

8 
ismycsdn 来自魔乐社区

modelers.csdn.net · 2023-02-24 02:13:14

linux v4l2架构分析之v4l2_ctrl_handler初始化及添加v4l2_ctrl的过程分析

详细分析handler初始化和v4l2 向handler添加新的v4l2_ctrl控件的过程，中间也会涉及到相应结构体v4l2_ctrl_handler、v4l2_ctrl、v4l2_ctrl_ref的讲解和关系介绍，以及对v4l2_ctrl_handler_init、v4l2_ctrl_new_std、v4l2_ctrl_new、handler_new_ref、v4l2_ctrl_handler

#linux #驱动开发 #c语言 +2

2323 

1 
迷茫的蜉蝣来自魔乐社区

modelers.csdn.net · 2024-01-11 11:45:56

linux tcpdump能抓到包但是应用程序不能收到包

tcpdump命令能抓到过来的数据包，可是应用程序的recvfrom等套接字接收函数无法接收数据包；原因可能是各种各样的；由于疏忽不用时没有关闭所有的套接字，导致套接字越来越多，系统和单个进程都是有文件描述符上限的；太多的文件描述符就会导致应用程序的recvfrom等套接字接收函数出现问题；在网络编程项目中会遇到各种各样的网络问题，原因往往是多种多样的，在网上不会找到一个满意的答案；由于我的项目中

#linux #音视频 #网络

3071 

13 
Sheleon953 来自魔乐社区

modelers.csdn.net · 2022-08-09 10:52:59

linux下使用vlc命令行推流

Linux使用VLC命令行推流桌面RTSP

#linux #音视频

3717 

1 
Chasing x 来自广州城市开发者社区

devpress.csdn.net/guangzhou · 19小时前

用Coze(扣子)一键生成爆款历史人物的一生视频，首尾帧衔接0破绽！

摘要：本文介绍了一种利用Coze工作流快速生成"历史人物一生"视频的方法。该方法仅需输入人物名称，即可自动完成文案生成、历史场景图片制作、首尾帧过渡处理等全流程，最终输出可直接导入剪映的草稿文件。核心解决了视频画面无缝衔接的技术难点，使原本需要数天的手工制作简化为自动化流程，大幅提升爆款历史视频的制作效率。

#音视频 #人工智能

690 

6 
18538162800余+ 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 19小时前

打造 AI 数字人分身数字人短视频：源码开发技术揭秘与实践

当前 AI 数字人分身短视频开发正朝着 “更轻量、更定制、更智能” 的方向演进：一方面，端侧模型（如手机端实时生成数字人）将成为新热点；另一方面，结合 GPT 等大模型实现 “数字人自主生成脚本与互动”，将进一步降低开发门槛。对于技术开发者而言，掌握本文拆解的 “形象建模 - 动作驱动 - 内容合成” 核心源码逻辑，不仅能快速落地数字人短视频项目，更能在技术迭代中抢占先机。建议从简单案例入手（如生

#人工智能 #音视频

496 

14 
leafff123 来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 19小时前

AI研究必看：AIGC在做短视频时的算力要求？

AIGC（生成式人工智能）在短视频创作中的算力要求并非固定值，而是受技术路径（模型类型）、短视频内容复杂度（分辨率 / 时长 / 特效）、生产效率（实时性 / 批量生成）三大核心因素影响，不同场景下的算力需求可相差数个数量级。以下从技术分类、关键影响因素、典型场景算力参考三个维度，系统解析其算力要求。

#人工智能 #AIGC #音视频

753 

23 
yly.py 来自魔乐社区

modelers.csdn.net · 2023-05-25 11:37:36

llinux使用opecv保存视频无法在浏览器播放怎么办（mp4v -＞avc1)

修改``cv2.VideoCapture(0) 为 cv2.VideoCapture(0, cv2.CAP_V4L2)解决方法, 好像是ubantu系统的问题，我也没看明白。这个是python不能访问系统lib64解码器问题？我这个是fish语法，

#音视频 #python #opencv

951 

2 
暖阳 (*◎ｖ◎*) 来自魔乐社区

modelers.csdn.net · 2023-04-10 15:36:51

jquery 图片或者视频加载完成事件

【代码】jquery 图片或者视频加载完成事件。

#jquery #音视频 #javascript

1012 
程序猿李巡天来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 1天前

Agent升级必看！从ReAct到Plan-Driven演进全解析，核心逻辑拆解，收藏这篇就够了！

在构建智能运维（AIOps）Agent的初期，ReAct（Reasoning and Acting）框架提供了一个优秀的起点，它通过“思考-行动-观察”的循环，让Agent具备了基础的问题分解和工具调用能力。然而，面对复杂的、多因果关联的生产环境故障，纯粹的响应式（Reactive）方法会暴露其局限性。

#react.js #javascript #前端 +4

624 

13 
Ai工具分享来自 2048 AI社区

2048ai.net · 1天前

曝光不足视频的救星！用AI画质增强还原真实夜景

总的来说，到底哪款工具最适合解决夜晚拍摄视频曝光不足的问题呢？Topaz Video Enhance AI 修复能力强大，可将视频智能升级至 8K，但操作复杂且对硬件要求高；AVCLabs Video Enhancer AI 操作简单，能自动分析并修复画质问题，在便捷性和效果间取得平衡；HitPaw 牛小影则具有快速处理能力和用户友好的界面，能自动识别视频问题并应用针对性修复，性价比高。相比下来，

#音视频 #人工智能

398 

17 
无敌的六边形狗勾战士来自北京朝阳AI社区

devpress.csdn.net/aibjcy · 1天前

Vulnerability-Aware Spatio-Temporal Learning for Generalizable Deepfake Video Detection（针对可泛化的深度伪造视频

深度伪造视频的检测是非常有难度的，。现有的方法大多都是用真实和伪造图片序列的二元分类器，这限制了他们的泛化性。并且随着生成式人工智能的不断发展，深度伪造的伪影再空间和时间层面更加难以察觉。。我们引入了一个多任务学习框架，包含两个辅助分支，专门观察时间伪影和空间伪影。。我们的模型泛化下很好。

#音视频 #人工智能 #深度学习

669 

17 
坑货两只来自魔乐社区

modelers.csdn.net · 2023-01-04 16:23:52

linux中c语言实现实时视频传输完整代码

这是一个使用 C 语言在 Linux 系统下实现实时视频传输的完整代码：```#include <stdio.h>#include <stdlib.h>#include <unistd.h>#include <string.h>#include <sys/types.h>#include <sys/socket.h&g...

#linux #c语言 #音视频 +2

840 
季风来自魔乐社区

modelers.csdn.net · 2022-05-10 11:00:40

【exp-linux】用aplay直接播放音频文件（mp3，wav）

// 用audacity 将mp3转换成wav格式文件，就可以直接用aplay播放了：// aplay播放MP3文件是杂音aplay -l 可以查看音频播放设备有哪些aplay xxx.wav 用默认设备播放aplay -D plughw:1,0 xxx.wav // 用指定的设备播放参考：使用aplay实现音频播放 - kay880 - 博客园...

#音视频 #语音识别 #人工智能

8883 

2 
m0_59169364 来自 2048 AI社区

2048ai.net · 2025-01-06 18:04:47

基于SSM+JSP的学习视频资源库的系统的设计与实现

摘要：视频资源库课题基于信息技术与数字化教育的发展需求，旨在解决海量视频资源的存储、检索与智能管理问题。研究涉及Java+SpringBoot技术栈（MySQL5.7数据库），通过AI与大数据技术优化资源分类、检索及个性化推荐功能。系统开发采用Maven3.3.9管理依赖，提供管理员后台管理界面，支持视频资源上传（核心代码包含文件处理模块）、分类存储与多维度检索。该课题响应在线教育爆发式增长的需

#java #学习 #音视频 +4

892 

23 
dax eursir 来自魔乐社区

modelers.csdn.net · 2023-02-14 09:04:19

matlab提取振动视频中结构的位移时程曲线的代码？

下面是一个基于 MATLAB 的代码，用于提取振动视频中结构的位移时程曲线：% 读入视频文件video = VideoReader('vibration.avi');% 获取视频中帧数numFrames = video.NumberOfFrames;% 初始化位移矩阵displacement = zeros(numFrames, 1);% 循环读取每一帧for i = 1 :...

#matlab #音视频 #开发语言

544 
川川菜鸟来自魔乐社区

modelers.csdn.net · 2021-10-28 13:18:03

matlab音频水印算法研究+代码

%加入白噪声的音频水印程序clear;[y ,fs] = audioread('mei.wav');%读入原始音频文件[c,l]=wavedec(y,3,'db4');%三级小波分解ca3=appcoef(c,l,'db4',3);%提取3级近似系数，绘制原始信号和近似系数。cd3=detcoef(c,l,3);%提取 3 所指定的级别上的细节系数cd2=detcoef(c,l,2);%提取 2

#matlab #音视频 #算法

3325 

1 
亚马逊云开发者来自魔乐社区

modelers.csdn.net · 2024-06-27 13:18:48

典型应用场景和核心特性：针对智能摄像头与智能家居厂商的视频分析

背景随着 AI 技术的快速发展，视频分析在智能摄像头和智能家居等领域得到了广泛应用。在过去，视频分析通常依赖于传统的计算机视觉算法和机器学习模型，这些方法需要依赖训练数据集或者手工设计特征提取器和分类器。这种方法存在一些固有的缺陷和局限性：依赖训练数据集。对于传统机器学习模型，需要一定量的数据去学习特定的分类或目标位置信息，构建足量的训练数据集是一个耗时的过程，且在一些场景中，数据也难以收集。特征

#智能家居 #音视频 #人工智能 +1

532 
JOJO-XU 来自魔乐社区

modelers.csdn.net · 2022-06-28 16:20:32

【CVPR2022】基于视频的人体姿态估计中的时间特征对齐和互信息最大化

Temporal Feature Alignment and Mutual Information Maximization forVideo-Based Human Pose Estimation多帧人体姿态估计是具有挑战性的，因为快速运动和姿态遮挡经常发生在视频中。最先进的方法努力结合来自邻近帧（支持帧）的额外视觉证据，以促进对当前帧（关键帧）的姿态估计。到目前为止已经排除的一个方面是，当前的

#音视频 #机器学习 #人工智能

3201 

1 
耿直学编程来自魔乐社区

modelers.csdn.net · 2024-06-19 17:27:13

大模型如何解决企业知识管理难题？极氪、哈啰等4家企业实践案例

知识管理是对企业知识资产进行规范化管理和使用的一种业务流程，是企业发展的基础。优秀的企业一定非常擅长做知识管理，善于将业务高手脑子里的隐性知识提炼成企业的显性知识，将标杆的成功要素解构出来，提炼成标准化的“套路”，并存进企业的“知识银行”。大模型与企业知识管理场景之间存在天然的契合度，大模型的核心能力——处理、理解和生成大量数据信息，恰好满足了企业知识管理的需求。大模型技术的不断进步使得知识管理成

#人工智能 #产品经理 #音视频

1245 

10 
数据派THU 来自魔乐社区

modelers.csdn.net · 2025-07-24 17:03:21

从零复现Google Veo 3：从数据预处理到视频生成的完整Python代码实现指南（下）

Google 并未公开 Veo 3 评估所用的全部确切指标，但在其模型介绍中提及 Veo v3 是在 Meta 发布的 MovieGenBench（包含视频和视频+音频两种任务）基准数据集上进行评估的。这些数据集分别包含 1,003 个视频生成提示和 527 个视频+音频生成提示，并附带了由其他主流模型生成的对应视频，例如 Meta 的 MovieGen（视频及视频+音频）、Kling 2.0（仅

#音视频 #python #开发语言

127 
调味盐来自魔乐社区

modelers.csdn.net · 2021-12-16 11:39:05

在matlab gui中播放视频的方法

这个项目仅仅作为gui播放视频的验证视频文件前处理：讲要播放的视频用视频剪辑软件调整到合适的时长，注意这个视频的时长不是在gui界面上的播放时长，因为imshow函数会有可观的运行时间，导致在gui中播放的时长要比视频实际时长要长，这个问题暂时还没有找到解决方法首先利用guide把界面画好，如下图所示：注意：要想不在gui界面中隐藏坐标轴，将坐标轴属性中的‘vision’置为‘off’，如下图，然

#matlab #音视频 #开发语言

7413 

4 
qq_52259359 来自魔乐社区

modelers.csdn.net · 2023-07-26 18:28:22

视频异常检测2

②卷积神经网络（CNN）或循环神经网络（RNN）来学习视频的时空特征，并进行视频事件的表示和分类,基于重构，基于预测。分类：单分类（单分类器）、多分类（自编码器的特征向量来表示全局特征，再将特征送入高斯分类器进行二分类异常检测）⑥IITB-Corridor：数据多，回归+弱监督（视频级别、视频片段级别），目前使用少，异常数量、种类多。①②依赖特征、适合异常少的视频、使用于视频少的数据集，检测+定

#音视频

782 

1 
L1783516140 来自魔乐社区

modelers.csdn.net · 2024-06-30 22:43:59

【视频异常检测】Cross-Modal Fusion and Attention Mechanism for Weakly Supervised Video Anomaly Detection

近年来，弱监督视频异常检测(WS-VAD)成为仅使用视频级标签识别视频中暴力、裸露等异常事件的当代研究方向。然而，这项任务面临着巨大的挑战，包括处理不平衡的模态信息和一致地区分正常和异常特征。在本文中，我们针对这些挑战，提出了一个多模态WS-VAD框架来准确检测暴力和裸露等异常。在提出的框架内，我们引入了一种新的融合机制，称为跨模态融合适配器(CFA)，它能够动态选择并增强与视觉模态高度相关的视听

#音视频 #论文阅读

2247 

49 
美狐美颜sdk 来自魔乐社区

modelers.csdn.net · 2023-01-17 17:47:12

第三方美颜sdk人脸识别的流程以及代码分析

我们可以将人脸识别算法分为基础层算法与应用层算法，开头提到的人脸检测，实际上是人脸识别的基础层算法。基础层算法，相当于人脸的预处理。一张人脸，首先要经过人脸检测、特征关键点处理，质量模型过滤之后，才能到应用层算法做处理，并应用到实际场景中。人脸处理：美颜sdk应用中的贴纸等人脸特效，需要检测到人脸特征关键点后，再对关键部位进行针对性处理。将人脸照片的关键点都坐上标记，通过深度学习、分类模型，让算法

#算法 #人工智能 #计算机视觉 +2

1063 
不朽の燃梦来自魔乐社区

modelers.csdn.net · 2024-11-24 11:41:34

OpenCV图像视频分析（1）

在上述代码当中，labels输出的标签图像，每个像素点都有一个标签值，在正常情况下，标签值大于0且相同的像素点属于同一个连通组件。标签的数据类型默认为整数类型（CV_32S）；在进行轮廓绘制时，将thickness设置为-1就能完成轮廓填充，并生成轮廓对象所对应的掩膜，然后用mean函数实现对掩膜区域的均值求解，最终得到每个对象的轮廓所占区域的像素均值。轮廓外接矩形的横纵比（宽度/高度），外接矩形

#opencv #音视频 #计算机视觉

1261 

28 
CocoLiu2004 来自魔乐社区

modelers.csdn.net · 2024-05-14 17:17:20

GPT-4o：融合文本、音频和图像的全方位人机交互体验

GPT-4o的问世标志着人机交互领域迈向了一个新的里程碑。其全方位的输入输出能力、快速的响应速度以及优秀的视觉和音频理解能力，将为用户带来更加自然、智能的交互体验，推动人机交互技术向更高水平迈进。

#音视频 #人机交互

690 

8 
何大春来自魔乐社区

modelers.csdn.net · 2024-09-04 22:31:13

【视频异常检测】Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts 论文阅读

当前的弱监督视频异常检测（WSVAD）任务旨在仅利用粗粒度的视频级别标注来实现帧级别的异常事件检测。现有工作通常涉及从全分辨率视频帧中提取全局特征，并训练帧级别分类器以在时间维度上检测异常。然而，大多数异常事件往往发生在局部空间区域而非整个视频帧中，这意味着基于现有帧级别特征的工作可能会被主导的背景信息误导，且缺乏对检测到的异常的解释能力。

#音视频 #论文阅读 #人工智能 +2

2426 

17 
EasyDarwin 来自魔乐社区

modelers.csdn.net · 2024-11-22 14:58:08

AI智能检测视频分析网关烟火检测工厂智慧化AI视频分析方案

在工业4.0和智能制造的浪潮下，现代工厂正经历着前所未有的变革。智慧工厂的概念不再局限于自动化和信息化，而是向着更加智能化、集成化和科学化的方向发展。AI智能分析视频分析网关作为这一转型中的关键技术之一，通过整合AI智能分析技术，正在重塑安全生产流程，提升生产效率，同时确保员工和设施的安全。以下是对视频分析网关在智慧工厂中应用的详细介绍，包括其解决的难题、AI算法的具体应用以及带来的显著优势。

#人工智能 #大数据 #音视频 +1

292 

5 
不是乖小孩来自魔乐社区

modelers.csdn.net · 2022-11-29 23:33:43

数据存储——存储视频

简要介绍视频数字化的原理

#音视频 #经验分享

2182 
一蓑烟雨任平生的峰来自魔乐社区

modelers.csdn.net · 2025-03-09 23:16:16

空间域图像增强_实验报告(附带matlab程序代码)_数字图像处理

由于原图像目标物的灰度主要集中于低亮度部分，而且像素总数比较多，经过直方图均衡化后，目标物所占的灰度等级的到扩展，对比度加强，使整个图像得到增强。（2）对原图像加入点噪声，用4-邻域平均法平滑加噪声图像（图像四周边界不处理，下同）同屏显示原图像、加噪声图像和处理后的图像。（2）对原图像加入点噪声，用4-邻域平均法平滑加噪声图像（图像四周边界不处理，下同）同屏显示原图像、加噪声图像和处理后的图像。注

#matlab #算法 #图像处理 +2

1459 

8 
疯中骨骸来自魔乐社区

modelers.csdn.net · 2022-03-04 14:24:51

用matlab和霍夫变换检测视频中的圆

用matlab和霍夫变换检测视频中的圆

#matlab #音视频 #计算机视觉

870 

3 
何大春来自魔乐社区

modelers.csdn.net · 2023-12-17 18:02:17

【视频异常检测】多层记忆增强外观-运动对齐框架用于视频异常检测论文阅读

基于AutoEncoder的帧预测在无监督视频异常检测中发挥着重要作用。理想情况下，在正常数据上训练的模型可以产生更大的异常预测误差。然而，外观和运动信息之间的相关性没有得到充分利用，这使得模型缺乏对正常模式的理解。此外，由于深度AutoEncoder不可控制的可推广性，这些模型不能很好地工作。为了解决这些问题，我们提出了一个多级记忆增强外观运动对应框架。通过外观-运动语义对齐和语义替换训练，探索

#音视频 #论文阅读 #计算机视觉 +3

1495 

16 
TSINGSEE 来自魔乐社区

modelers.csdn.net · 2023-12-15 16:18:16

浅析AI视频分析与视频管理系统EasyCVR平台及场景应用

视频分析技术正在迅速流行，主要采用者包括那些甚至在人工智能(AI)出现之前就已经在操作传统视频监控系统的使用者，以及那些希望采用颠覆性自动化技术的人。

#人工智能 #音视频

519 
AI视觉网奇来自魔乐社区

modelers.csdn.net · 2024-04-03 01:01:03

CVPR 2024 | 让视频姿态Transformer变得飞速，北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速，北大提出高效三维人体姿态估计框架HoT

#音视频 #transformer #深度学习

696 

1 
Shawn Mendes 来自魔乐社区

modelers.csdn.net · 2022-09-01 15:52:59

视频异常检测综述（二）

基于距离、概率、重构的视频异常检测概述

#音视频 #机器学习 #深度学习

5821 

7 

标签介绍

音视频

——音视频

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net