10.1 几何变换

几何变换学习目标掌握图像的缩放，平移，旋转等了解数字图像的仿射变换和透射变换1 图像缩放缩放是对图像的大小进行调整，即使图像放大或缩小。APIcv2.resize(src,dsize,fx=0,fy=0,interpolation=cv2.INTER_LINEAR)参数：src : 输入图像dsize: 绝对尺寸，直接指定调整后图像的大小fx,fy: 相对尺寸，将dsize设置为None，然后将f

开拖拉机的舒克。

427人浏览 · 2020-05-10 18:43:29

开拖拉机的舒克。 · 2020-05-10 18:43:29 发布

几何变换

学习目标

掌握图像的缩放，平移，旋转等
了解数字图像的仿射变换和透射变换

1 图像缩放

缩放是对图像的大小进行调整，即使图像放大或缩小。

API

cv2.resize(src,dsize,fx=0,fy=0,interpolation=cv2.INTER_LINEAR)

参数：
- src : 输入图像
- dsize: 绝对尺寸，直接指定调整后图像的大小
- fx,fy: 相对尺寸，将dsize设置为None，然后将fx和fy设置为比例因子即可
- interpolation：插值方法，
示例

import cv2 as cv

# 1. 读取图片

img1 = cv.imread("./image/dog.jpeg")

# 2.图像缩放# 2.1 绝对尺寸

rows,cols = img1.shape[:2]

res = cv.resize(img1,(2*cols,2*rows),interpolation=cv.INTER_CUBIC)



# 2.2 相对尺寸

res1 = cv.resize(img1,None,fx=0.5,fy=0.5)



# 3 图像显示# 3.1 使用opencv显示图像(不推荐)

cv.imshow("orignal",img1)

cv.imshow("enlarge",res)

cv.imshow("shrink）",res1)

cv.waitKey(0)



# 3.2 使用matplotlib显示图像

fig,axes=plt.subplots(nrows=1,ncols=3,figsize=(10,8),dpi=100)

axes[0].imshow(res[:,:,::-1])

axes[0].set_title("绝对尺度（放大）")

axes[1].imshow(img1[:,:,::-1])

axes[1].set_title("原图")

axes[2].imshow(res1[:,:,::-1])

axes[2].set_title("相对尺度（缩小）")

plt.show()

2 图像平移

图像平移将图像按照指定方向和距离，移动到相应的位置。

cv.warpAffine(img,M,dsize)

参数：

import numpy as np

import cv2 as cv

import matplotlib.pyplot as plt

# 1. 读取图像

img1 = cv.imread("./image/image2.jpg")



# 2. 图像平移

rows,cols = img1.shape[:2]

M = np.float32([[1,0,100],[0,1,50]])# 平移矩阵

dst = cv.warpAffine(img1,M,(cols,rows))



# 3. 图像显示

fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)

axes[0].imshow(img1[:,:,::-1])

axes[0].set_title("原图")

axes[1].imshow(dst[:,:,::-1])

axes[1].set_title("平移后结果")

plt.show()

3 图像旋转

图像旋转是指图像按照某个位置转动一定角度的过程，旋转中图像仍保持这原始尺寸。图像旋转后图像的水平对称轴、垂直对称轴及中心坐标原点都可能会发生变换，因此需要对图像旋转中的坐标进行相应转换。

那图像是怎么进行旋转的呢？如下图所示：

假设图像逆时针旋转\thetaθ，则根据坐标转换可得旋转转换为:

其中：

带入上面的公式中，有：

也可以写成：

同时我们要修正原点的位置，因为原图像中的坐标原点在图像的左上角，经过旋转后图像的大小会有所变化，原点也需要修正。

假设在旋转的时候是以旋转中心为坐标原点的，旋转结束后还需要将坐标原点移到图像左上角，也就是还要进行一次变换。

在OpenCV中图像旋转首先根据旋转角度和旋转中心获取旋转矩阵，然后根据旋转矩阵进行变换，即可实现任意角度和任意中心的旋转效果。

API

cv2.getRotationMatrix2D(center, angle, scale)

参数：
- center：旋转中心
- angle：旋转角度
- scale：缩放比例
- M：旋转矩阵
  
  调用cv.warpAffine完成图像的旋转

示例

import numpy as np

import cv2 as cv

import matplotlib.pyplot as plt

# 1 读取图像

img = cv.imread("./image/image2.jpg")



# 2 图像旋转

rows,cols = img.shape[:2]

# 2.1 生成旋转矩阵

M = cv.getRotationMatrix2D((cols/2,rows/2),90,1)

# 2.2 进行旋转变换

dst = cv.warpAffine(img,M,(cols,rows))



# 3 图像展示

fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)

axes[0].imshow(img1[:,:,::-1])

axes[0].set_title("原图")

axes[1].imshow(dst[:,:,::-1])

axes[1].set_title("旋转后结果")

plt.show()

4 仿射变换

图像的仿射变换涉及到图像的形状位置角度的变化，是深度学习预处理中常到的功能,仿射变换主要是对图像的缩放，旋转，翻转和平移等操作的组合。

那什么是图像的仿射变换，如下图所示，图1中的点1, 2 和 3 与图二中三个点一一映射, 仍然形成三角形, 但形状已经大大改变，通过这样两组三点（感兴趣点）求出仿射变换，接下来我们就能把仿射变换应用到图像中所有的点中，就完成了图像的仿射变换。

示例

import numpy as np

import cv2 as cv

import matplotlib.pyplot as plt

# 1 图像读取

img = cv.imread("./image/image2.jpg")



# 2 仿射变换

rows,cols = img.shape[:2]

# 2.1 创建变换矩阵

# 原图像设置3个点

pts1 = np.float32([[50,50],[200,50],[50,200]])

# 目标图像对应的3个

pts2 = np.float32([[100,100],[200,50],[100,250]])

M = cv.getAffineTransform(pts1,pts2)

# 2.2 完成仿射变换

dst = cv.warpAffine(img,M,(cols,rows))



# 3 图像显示

fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)

axes[0].imshow(img[:,:,::-1])

axes[0].set_title("原图")

axes[1].imshow(dst[:,:,::-1])

axes[1].set_title("仿射后结果")

plt.show()

5 透射变换

透射变换是视角变化的结果，是指利用透视中心、像点、目标点三点共线的条件，按透视旋转定律使承影面（透视面）绕迹线（透视轴）旋转某一角度，破坏原有的投影光线束，仍能保持承影面上投影几何图形不变的变换。

示例

import numpy as np

import cv2 as cv

import matplotlib.pyplot as plt

# 1 读取图像

img = cv.imread("./image/image2.jpg")

# 2 透射变换

rows,cols = img.shape[:2]

# 2.1 创建变换矩阵 # 原图像设置4个点

pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]]) # 目标图像对应的4个点

pts2 = np.float32([[100,145],[300,100],[80,290],[310,300]])



T = cv.getPerspectiveTransform(pts1,pts2)

# 2.2 进行变换

dst = cv.warpPerspective(img,T,(cols,rows))



# 3 图像显示

fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)

axes[0].imshow(img[:,:,::-1])

axes[0].set_title("原图")

axes[1].imshow(dst[:,:,::-1])

axes[1].set_title("透射后结果")

plt.show()

6 图像金字塔

图像金字塔是图像多尺度表达的一种，最主要用于图像的分割，是一种以多分辨率来解释图像的有效但概念简单的结构。

图像金字塔用于机器视觉和图像压缩，一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低，且来源于同一张原始图的图像集合。其通过梯次向下采样获得，直到达到某个终止条件才停止采样。

金字塔的底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似，层级越高，图像越小，分辨率越低。

API

cv.pyrUp(img) #对图像进行上采样

cv.pyrDown(img) #对图像进行下采样

示例

import numpy as np

import cv2 as cv

import matplotlib.pyplot as plt

# 1 图像读取

img = cv.imread("./image/image2.jpg")

# 2 进行图像采样

up_img = cv.pyrUp(img) # 上采样操作

img_1 = cv.pyrDown(img) # 下采样操作# 3 图像显示

cv.imshow('enlarge', up_img)

cv.imshow('original', img)

cv.imshow('shrink', img_1)

cv.waitKey(0)

cv.destroyAllWindows()

总结