logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从“AI证件照”到“AI译制片”,爆款AIGC应用的商业化迷思

目前,已经有AI公司针对精品化视频译制的需求,推出了ToB的产品解决方案,训练跨语种 Voice Conversion模型,采集配音演员的口型,由人工控制,再经由VC模型生成配音结果,比TTS模型的表现力更强,细节保留更多。十月份,由HeyGen制作的各种明星跨语言翻译视频,在全网疯传,大家震撼于AIGC地道的中英文表达,完全没有译制片的腔调,惟妙惟肖的音色还原、高度对齐的口型声音,让不少人表示,

文章图片
#人工智能#AIGC
transformer中QKV的通俗理解(剩女与备胎的故事)

用vit的时候读了一下transformer的思想,前几天面试结束之后发现对QKV又有点忘记了, 写一篇文章来记录一下参考链接: 哔哩哔哩:在线激情讲解transformer&Attention注意力机制(上)在线激情讲解transformer&Attention注意力机制(上)_哔哩哔哩_bilibiliAttention is all you need介绍更具体的介绍可以去阅读论文在Atten

#深度学习#人工智能
计算机视觉专家:如何从C++转Python

有人说用 Python 编程很简单,6 岁小孩都能学会。计算机视觉专家和编程语言爱好者 asya f 刚开始上手 Python 时也这么想。但门槛低就仅意味着使用简单吗?经常调用 API 的人是不是一定比可以从零写出源码的人菜?在本文中,asya f 告诉我们,从 C++转向 Python,是一次「从个人到社区」的思维转变。转载自丨机器之心从 C++ 转 Python 的时候,我已经是一个有四年全

#python#c++#opencv +1
计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花

计算机视觉的GPT时刻,来了!最近,来自UC伯克利的计算机视觉「三巨头」联手推出了第一个无自然语言的纯视觉大模型(Large Vision Models),并且第一次证明了纯视觉模型本身也是可扩展的(scalability)。除此之外,研究人员还利用超过420B token的数据集让模型可以通过上下文学习来理解并执行下游任务,并且统一了图片/视频、有监督/无监督、合成/真实、2D/3D/4D等几乎

文章图片
AI神器之微软的编码助手Copilot

但GitHub Copilot却并没有这样的功能,某些我本地特有的代码模板,即使我敲了再多遍,下次再换一个文件输入时,GitHub Copilot依然不知道我想要的是什么,因为它的云端训练不到我本地特有的这些代码。但不得不说,虽然GitHub Copilot和ChatGPT背后对接的都是Codex,但GitHub Copilot还是有它的优势的,因为它会拥有更加充分的代码上下文环境,这是ChatG

文章图片
#人工智能#AIGC
机器视觉中的摄像机标定和自标定分析

所谓主动视觉系统,是指摄像机被固定在一个可以精确控制的平台上,且平台的参数可以从计算机精确读出,只需控制摄像机作特殊的运动来获得多幅图像,然后 利用图像和已知的摄像机运动参数来确定摄像机的内外参数。但在输入多幅图像并能得到一致射影重建的情况下,基于二次曲面的自标定方法会更好一些,其根源在于二次曲面包含了无穷远平面和绝对二次曲线的所有 信息,且基于二次曲面的自标定方法又是在对所有图像做射影重建的基础

超声波,红外线,超宽带,射频室内定位技术的比较

这种技术成本低,功耗小,精度高。ZigBee技术应用于较短距离无线通信,主要面向无线个人区域网(PAN),网络系统在应用中表现出近距离,低功耗,低成本等特征,这些都可以满足室内定位系统是通过在传感器网络中布置参考节点,移动节点构成系统的,参考节点为静态节点,它们发送位置信息和RSSI值给移动待测节点,该节点将数据写入定位模块,分析计算得到自身位置。超宽带技术是近年来新兴的一项无线技术,目前,包括美

#人工智能#深度学习
FLANN特征匹配

特征提取:寻找易于追踪和对比的特征————在图像所有区域中寻找向周围少量移动时变化最大的图像块————将这种操作映射到计算机语言中。特征描述:对提取的特征[特征周围的区域]用计算机的语言进行描述,使得其能够在其它图像中寻找到相似区域。特征匹配:根据特征描述,在其它图像中寻找所有相同的特征区域,以便进行需求的操作[如排列,整合等]。一个图像块取自原图像的边缘,其具有横向或纵向的差异性,而在与该方向垂

#计算机视觉#人工智能
OpenCV的solvePnP函数和Dlib估计头部姿势

例如,在虚拟现实应用程序中,可以使用头部的姿势来渲染场景的右视图。那个怎么样s在等式中?如果我们知道旋转R(一个 3×3 矩阵)和平移t(一个 3×1 向量),相对于相机坐标的世界坐标,我们可以计算位置(X, Y, Z)点的P在相机坐标系中使用以下等式。在这个问题中,目标是在我们有一个校准过的相机时找到物体的位姿,并且我们知道物体上n 个3D 点的位置以及相应的 2D 投影图片。我们知道 3D 模

#opencv#计算机视觉#unity
OpenCV的Rect 常用函数

/返回布尔true/false, 判断x,y是否在这个矩形中。例如我们画一个图 Rect(20,50,30,40),我用matlab画了一下,比较直观。// 返回左上角坐标(20,50)//返回右下角坐标(50,10)

#opencv
    共 101 条
  • 1
  • 2
  • 3
  • 11
  • 请选择