Blog

Transformaciones geométricas de imágenes

Publicado por: Alberto Sosa-Costa
Categoría: Blog OpenCV Procesamiento de Imagenes

Objetivo:

Aprender a aplicar diferentes transformaciones geométricas a imágenes, tales como: traslación, rotación, transformación afín, etc.

Utilizar las funciones cv2.getPerspectiveTransform.

Transformaciones geométricas de imágenes con OpenCV

Una transformación geométrica de una imagen es una transformación en su sistema de coordenadas. OpenCV proporciona dos funciones de transformación, cv2.warpAffine y cv2.warpPerspective, con las que se pueden realizar todo tipo de transformaciones. Cv2.warpAffine toma una matriz de transformación 2×3 mientras cv2.warpPerspective toma una matriz de transformación 3×3 como entrada.

Redimensionalización

Para cambiar el tamaño de una imagen, OpenCV viene con la función cv2.resize(). El tamaño deseado de la imagen final se puede especificar manualmente, o se puede indicar especificando un factor de escala. La función usa diferentes métodos de interpolación, siendo los más usados: cv2.INTER_AREA, para contraer la imagen y cv2.INTER_CUBIC (suave) & cv2.INTER_LINEAR, para acercar la imagen. El método de interpolación utilizado por defecto es cv2.INTER_LINEAR, que sirve para cualquier cambio de tamaño que se desee realizar. Cualquiera de los métodos mostrados a continuación, pueden ser utilizados para cambiar el tamaño de una imagen:

import numpy as np
import cv2

img = cv2.imread('MotherofDragons.jpg')

#Indicando el factor de escala
res = cv2.resize(img,None,fx=2, fy=2, interpolation = cv2.INTER_CUBIC)

# Indicando manualmente el nuevo tamaño deseado de la iamgen
height, width = img.shape[:2]
res = cv2.resize(img,(2*width, 2*height), interpolation = cv2.INTER_CUBIC)

Traslación

Una traslación es el desplazamiento de la posición de un objeto. Si se conoce la magnitud del desplazamiento $(t_x,t_y)$ en las direcciones x e y, respectivamente, se puede escribir la matriz de transformación M como:

La matriz M se puede crear utilizando la función np.float32 de la librería Numpy (ver curso introductorio). Esta matriz luego se pasa como argumento a la función cv2.warpAffine(). Observa el siguiente ejemplo para un desplazamiento de (210, 20).

import cv2
import numpy as np

img = cv2.imread('MotherofDragons.jpg',0)
rows,cols = img.shape

M = np.float32([[1,0,210],[0,1,20]])
dst = cv2.warpAffine(img,M,(cols,rows))

cv2.imshow('img',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

? Nota
El tercer argumento de la función cv2.warpAffine () es el tamaño de la imagen de salida, que debe estar en forma de (anchura, altura). Recuerde, width = número de columnas y height = número de filas.

Vea el resultado a continuación:

Rotación

La rotación de una imagen, en un cierto ángulo θ, se logra aplicando la siguiente matriz de transformación:

Sin embargo, OpenCV permite además personalizar más la rotación multiplacando por un factor de escala. Por otra parte, también permite cambiar el centro de rotación. La matriz de transformación modificada, con estas dos nuevas opciones, tiene la forma:

donde

Para encontrar esta matriz de transformación, OpenCV proporciona la función cv2.getRotationMatrix2D. Compruebe a continuación un ejemplo en el cual se gira la imagen 45 grados con respecto al centro sin aplicar ningún factor de escala.

img = cv2.imread('MotherofDragons.jpg',0)
rows,cols = img.shape

M = cv2.getRotationMatrix2D((cols/2,rows/2),45,1)
dst = cv2.warpAffine(img,M,(cols,rows))

Transformación Afín

En una transformación afín todas las líneas paralelas en la imagen original seguirán siendo paralelas en la imagen de salida. Para encontrar la matriz de transformación, necesitamos tres puntos de la imagen de entrada y sus ubicaciones correspondientes en la imagen de salida. Luego cv2.getAffineTransform creará una matriz 2×3 que se pasará a cv2.warpAffine.

Compruebe a continuación el ejemplo, y observe los puntos que he seleccionado (marcados en color verde):

import numpy as np
import matplotlib.pyplot as plt #carga la librería para graficar
import cv2

img = cv2.imread('cuadricula.png')
rows,cols,ch = img.shape

pts1 = np.float32([[100,400],[400,100],[100,100]])
pts2 = np.float32([[50,300],[400,200],[80,150]])


M = cv2.getAffineTransform(pts1,pts2)
dst = cv2.warpAffine(img,M,(cols,rows))

plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()

Transformación de Perspectiva

Para realizar una transformación de perspectiva es necesario especificar una matriz de 3×3. Luego de aplicar este tipo de transformación, las líneas rectas permanecerán rectas. Para generar la matriz de 3×3 es necesario indicar cuatro puntos sobre la imagen de inicial y los correspondientes puntos sobre la imagen resultante. Tres de los cuatro puntos, tienen que ser no-colineales. De esta manera la matriz de transformación puede ser generada utilizando la función cv2.getPerspectiveTransform. Luego, para aplicar la transformación, se utiliza cv2.warpPerspective teniendo en cuenta la matriz de 3×3 generada con la función anterior.

A continuación, un ejemplo:

import numpy as np
import matplotlib.pyplot as plt
import cv2

img = cv2.imread('sudoku.png')
rows,cols,ch = img.shape

pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]])
pts2 = np.float32([[0,0],[300,0],[0,300],[300,300]])

M = cv2.getPerspectiveTransform(pts1,pts2)

dst = cv2.warpPerspective(img,M,(300,300))

plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()

Aprende muchísimo más de manejo y operaciones sobre
imágenes con nuestro Curso de OpenCV:

Curso de Procesamiento de Imágenes y Visión Artificial

Autor:drAlbert

Con un doctorado en física y varios años en la industria he acumulado una vasta experiencia en el análisis de datos y el procesamiento de imágenes. Soy competente en diferentes lenguajes de programación como MATLAB, R y Python, y a su vez en los más avanzados y recientes algoritmos de aprendizaje automático. Además, tengo amplia experiencia en la redacción de artículos e informes científicos, así como en presentaciones orales dirigidas a públicos con diferentes niveles académicos. Estoy muy entusiasmado con la idea de trabajar y colaborar en entornos multidisciplinarios e internacionales tales como Unipython. Puedes visitar mi perfil en <a href="https://www.linkedin.com/in/alberto-sosa-costa/">Linkedin.<a>

2 comentarios

Cambiando Espacios de Color - ® Cursos Python desde 0 a Experto ? garantizados

abril 5, 2018 a 9:30 am Responder

[…] ➡ Transformaciones geométricas de Imágenes […]
1000war

abril 17, 2019 a 9:41 pm Responder

muchas gracias por los tutoriales !!!

Iniciar sesión/Registrarse

Buscar

Menú