logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenCV(五十三):Haar人脸识别

Haar 人脸识别算法是计算机视觉发展史上的重要里程碑,它通过Haar 特征、积分图、Adaboost 和级联分类器的巧妙结合,实现了高效、实时的人脸检测。虽然在精度和鲁棒性方面已不及现代深度学习方法,但其轻量、高效、易用的特性使其在特定应用中仍具生命力。

#opencv#目标跟踪#人工智能
音视频学习(九十九):QP

QP 是视频编码中连接“物理比特”与“主观感官”的桥梁。它通过量化步长控制信息丢失量。它通过码控算法实现从宏观带宽到微观像素的调节。它的未来演进在于AI 与感知量化的结合,例如通过深度学习预测人眼注意图(Saliency Map),从而实现比传统 AQ 更精准的差异化 QP 分配。

#音视频
OpenCV(五十):meanshift图像分割

MeanShift 是一种经典而优雅的图像分割算法无需指定类别数能在颜色与空间联合特征中进行自适应聚类分割结果自然、边缘友好在 OpenCV 中,提供了工程化实现,使其在实际项目中仍具有一定实用价值。但由于其计算复杂度较高,更适合离线图像处理、预处理阶段或对分割质量要求高的应用场景。

#opencv#人工智能#计算机视觉
OpenCV(五十二):图像修复

实时性要求高硬件资源受限修复区域较小工程稳定性优先Telea 算法适合大多数通用场景。Navier-Stokes 算法更适合结构修复。前景检测图像分割视频处理等模块结合,构成完整的视觉处理链路。

#opencv#人工智能#计算机视觉
OpenCV(五十一):视频前后景分离

背景(Background)前景(Foreground)本质是一个逐像素分类问题。实现简单性能稳定实时性强参数可控其中MOG2 和 KNN 是最推荐的通用方案。通过合理的参数设置与后处理策略,可以在大多数实际场景中取得较好的分离效果。候选区域生成前端轻量检测模块深度学习的前置过滤从而构建高效、可扩展的视频分析系统。

#opencv#音视频#人工智能
c++ 四叉树

四叉树是平衡“空间精度”与“计算效率”的经典工具。动态删除:当物体移动时,需要从旧节点删除并重新插入新节点。非均匀分布处理:如果所有点都在同一个位置,四叉树会深度退化。松散四叉树 (Loose Quadtree):为了处理边界上的物体,增加节点边界的重叠量。

#c++
卷积神经网络CNN(二):对于图像处理的意义

CNN之所以能在图像处理中脱颖而出,得益于其架构中包含的三大特性,这些特性专门解决处理大规模图像数据时面临的和问题。

#cnn#图像处理#人工智能
深度学习(十五):Dropout

Dropout作为一种简单而强大的正则化技术,通过随机丢弃神经元有效降低了深度神经网络的过拟合风险,提高了模型的泛化能力。其原理基于随机失活和集成学习的结合,实现在深度学习框架中简单高效。尽管Dropout存在训练时间长、超参数敏感等局限性,但其变体和改进方法不断扩展了其适用范围。在实际应用中,Dropout已成为深度学习模型设计中的标准组件,广泛应用于视觉、语言等多个领域。

#深度学习#人工智能
深度学习(十三):向量化与矩阵化

向量化和矩阵化是深度学习的性能基石充分利用 CPU 的 SIMD 指令集和 GPU 的大规模并行计算能力,将计算速度提升数十倍、数百倍甚至数千倍,使大规模模型的训练成为可能。将复杂的数学公式直接转化为简洁的代码,提升了代码的可读性、可维护性和去 Bug 效率。它们是所有现代深度学习框架(如 PyTorch/TensorFlow)的核心设计思想。掌握它们是理解和高效使用这些框架,乃至进行**模型部署

#深度学习#矩阵#人工智能
深度学习(九):逻辑回归

逻辑回归(Logistic Regression)是机器学习与深度学习中最经典、最基础的模型之一。虽然名字里带有“回归”,但它实际上是一个用于的线性模型,通常用于二分类任务。

#深度学习#逻辑回归#人工智能
    共 172 条
  • 1
  • 2
  • 3
  • 18
  • 请选择