logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

人工智能中的模型评估

人工智能(AI)模型评估是一个关键的过程,用于确定模型在特定任务上的性能和有效性。这个过程涉及使用各种技术和指标来衡量模型的准确度、可靠性、泛化能力以及其他重要特性。在不同的应用场景中,模型评估的具体细节和重点可能会有所不同,但总体目标是确保模型能够满足预定的标准和实际需求。

文章图片
#人工智能#深度学习
一场内容生产的革命 :从PGC、UGC到AIGC

UGC 是指用户生成内容,是一种用户使用互联网的新方式,是指用户在网络上向他人展示自己的原创作品或向他人提供内容,泛指用户以任何形式在网络上发表创作的文字、图片、音频、视频等内容。这种创作方式是由 Web 2.0 时代引起的,随着社交网络和博客的出现而流行起来。UGC 的应用场景包括社交网络、在线论坛、博客、知识共享平台等。UGC 可以是图片、视频、音乐、博客、评论等形式,它可以是个人的、团体的,

文章图片
#人工智能
使用opencv的Canny算子实现图像边缘检测

Canny边缘检测是一种经典的边缘检测算法,由John F.在1986年提出。它被广泛应用于计算机视觉和图像处理领域,是一种多阶段的边缘检测算法,能够有效地检测图像中的边缘并抑制噪声,得到清晰准确的边缘信息,并且对噪声具有一定的鲁棒性。Canny被认为是最优的边缘检测算法。

文章图片
#opencv#人工智能#计算机视觉
conda环境下TesseractNotFoundError: tesseract is not installed or it‘s not in your PATH问题解决

Conda是一个强大的工具,对于管理复杂的Python项目和环境至关重要。它简化了包管理和环境设置,使得Python开发更加容易和高效。通过使用Conda,开发者可以确保他们的项目在不同机器和操作系统上都能以相同的方式运行,大大提高了项目的可移植性和可复现性。

文章图片
#conda
conda环境下Tesseract:Failed loading language ‘eng‘问题解决

重新安装Tesseract程序,并安装到D盘(与python程序同一盘符下)目录下,重新设置TESSDATA_PREFIX系统变量和环境变量,问题解决。

文章图片
#文字识别
计算机视觉:使用opencv进行直线检测

霍夫变换(Hough Transform)是图像处理中的一种特征提取方法,可以识别图像中的几何形状。它将在参数空间内进行投票来决定其物体形状,通过检测累计结果找到一极大值所对应的解,利用此解即可得到一个符合特定形状的参数。

文章图片
#计算机视觉#opencv#人工智能
pytorch中nn.Sequential详解

nn.Sequential是一个序列容器,用于搭建神经网络的模块被按照被传入构造器的顺序添加到容器中。除此之外,一个包含神经网络模块的OrderedDict也可以被传入nn.Sequential()容器中。利用nn.Sequential()搭建好模型架构,模型前向传播时调用forward()方法,模型接收的输入首先被传入nn.Sequential()包含的第一个网络模块中。然后,第一个网络模块的输

文章图片
#pytorch#人工智能
深度学习中的Zero-shot(零次学习)

Zero-shot学习(ZSL)是机器学习领域的一种先进方法,它旨在使模型能够识别、分类或理解在训练过程中未见过的类别或概念。这种学习方法对于解决现实世界中常见的长尾分布问题至关重要,即对于一些罕见或未知类别的样本,传统的监督学习方法可能难以处理。

文章图片
#深度学习#人工智能
conda环境下ERROR: Cannot uninstall ‘TBB‘问题解决

Conda是一个强大的工具,对于管理复杂的Python项目和环境至关重要。它简化了包管理和环境设置,使得Python开发更加容易和高效。通过使用Conda,开发者可以确保他们的项目在不同机器和操作系统上都能以相同的方式运行,大大提高了项目的可移植性和可复现性。

文章图片
#conda
语音驱动数字人唇形模型:SadTalker-Video-Lip-Sync

本项目基于SadTalkers实现视频唇形合成的Wav2lip。通过以视频文件方式进行语音驱动生成唇形,设置面部区域可配置的增强方式进行合成唇形(人脸)区域画面增强,提高生成唇形的清晰度。使用DAIN 插帧的DL算法对生成视频进行补帧,补充帧间合成唇形的动作过渡,使合成的唇形更为流畅、真实以及自然。

文章图片
#深度学习
    共 119 条
  • 1
  • 2
  • 3
  • 12
  • 请选择