2022-2024
Uso de técnicas de aprendizaje de máquina, aprendizaje profundo, redes neuronales convolucionales y técnicas de procesado convencionales para el reconocimiento y procesado de patrones.
Responsable: Dr. Josué Álvarez Borrego, Investigador Titular D. CICESE.
Año de inicio: 2022
Participantes:
- Dra. Esperanza Guerra Rosas, Facultad de Ingeniería, Arquitectura y Diseño de la UABC.
- Dra. Selene Solorza Calderón, Facultad de Ciencias de la UABC.
- Dr. Josué López Leyva, Cetys Universidad.
- Dr. Héctor Alonso Echavarría Heras, Ecología Marina, CICESE.
- Dr. Luis Felipe López Ávila, Posdoctorado, CICESE.
Tipo de investigación: Básica y aplicada.
Resumen: En este proyecto se pretenden utilizar como clasificadores y analizadores de imágenes diferentes técnicas de aprendizaje de máquina, aprendizaje profundo y redes neuronales. Como datos de entrada en este tipo de sistemas, además de imágenes, se desea adentrar en la generación de diferentes tipos de firmas unidimensionales provenientes de imágenes formadas con miles o millones de pixeles. Para la generación de este tipo de firmas se utilizarán técnicas de diferentes transformadas integrales, así como el desarrollo de nuevas metodologías para este fin.
I. Antecedentes
Al día de hoy, debido a los grandes avances tecnológicos, los especialistas pueden apoyarse en un gran rango de aplicaciones basadas en modelos por computadora. Pero, a pesar de eso, existen aún retos significantes que hay que resolver. Esto viene al caso cuando uno desea clasificar de manera automática lesiones de piel, o imágenes de cáncer de mama, por ejemplo, como una aplicación biomédica. O cuando deseamos identificar cierto tipo de imágenes que vienen de diferentes tamaños, resoluciones, o son imágenes no muy representativas del problema a resolver.
En los últimos años, las redes neuronales han vuelto a tener un auge en una amplia variedad de aplicaciones. Al obtener resultados satisfactorios, estos se convierten en una herramienta prometedora para la clasificación de lesiones cutáneas o imágenes en general. Las redes neuronales convolucionales (CNN) se basan en la operación de convolución de la imagen con diferentes filtros, ofreciendo una amplia y variada información. En sus primeras capas, las CNN obtienen las líneas y las características de los bordes, mientras que, en las capas más profundas, se encuentran detalles más específicos de las imágenes.
Es bien sabido que la operación de convolución no es invariante a transformaciones geométricas como traslación, rotación y escala [1]. Es por eso que las redes neuronales requieren una gran cantidad de imágenes de entrenamiento para extraer todas las formas posibles que una imagen puede tener, de ahí su alto costo computacional. Además, algunas imágenes pueden tener poco contraste, por ejemplo, lesiones cutáneas que pueden tener poco contraste entre la lesión y la piel sana, que podría interferir con la correcta segmentación de la lesión [2]. Eso puede conducir a la pérdida de información valiosa que podría usarse para una clasificación adecuada de la imagen.
I.1 Algunos tipos de firmas
a) Firmas fractales:
El término fractal surgió de los trabajos de Benoit Mandelbrot cuando estudió estructuras geométricas irregulares repetidas a diferentes escalas [3]. Los objetos fractales tienen formas irregulares en las que las medidas estándar no pueden determinar su dimensión [4]. La dimensión fractal señala cómo el objeto fractal llena el espacio a medida que se refina la unidad de medida. Generalmente, la dimensión fractal es un número fractal en lugar de un número entero, ya que el punto, la línea recta, el cuadrado y el cubo tienen dimensiones cero, uno, dos y tres. Las lesiones cutáneas presentan bordes irregulares, por lo que es natural medir su tamaño con la dimensión fractal. Además, Wahba et al. [5] recomendó incluir la dimensión fractal en la regla ABCDE.
Recientemente, Backes et al. [6] propuso una firma de textura basada en la dimensión fractal volumétrica (descriptor Bouligand-Minkowski) para identificar plantas. Por otro lado, Florindo et al. [7] utilizaron los descriptores de Bouligand-Minkowski para identificar imágenes histológicas de queratoquiste odontogénico, un tipo de quiste de la mandíbula.
b) Firma espectral-correlación:
La obtención de esta firma se adquiere obteniendo información del módulo espectral de la imagen en los diferentes canales RGB de la imagen, así como de los valores de correlación existentes entre las diferentes clases de imágenes que se desean identificar [8].
c) Firmas Fourier:
Este tipo de firmas se obtienen en el plano de Fourier de la imagen utilizando diferentes condiciones para su procesamiento mediante vectores unitarios que generan círculos concéntricos [9].
d) Firmas fraccionales:
Este tipo de firmas se generan mediante la transformada fraccional de Fourier y utilizando diferentes máscaras concéntricas que, localizadas en diferentes planos entre el plano de la imagen y el plano de frecuencia, proporcionan mayor correlación [10].
e) Firmas radiales de Hilbert:
Este tipo de firmas se generan utilizando la transformada radial de Hilbert optimizada. Se puede lograr una buena eficacia mayor al 98% cuando se trata de identificar una imagen [11].
Justificación
Cuando queremos identificar diferentes clases de imágenes simultáneamente en tiempo real, debemos utilizar Machine Learning, Deep Learning o Redes Neuronales como clasificadores creando nuevas firmas unidimensionales que proporcionen información total sobre las diferentes clases de imágenes a analizar.
Hipótesis
Es posible identificar imágenes de diferentes clases simultáneamente en tiempo real.
II Objetivo
Desarrollar varios tipos de firmas unidimensionales mediante ciertas transformaciones integrales para utilizarlas como entrada en sistemas de Inteligencia Artificial para identificar multi-clases de imágenes en un sistema en tiempo real.
III Metas
Desarrollo de teoría e investigación aplicada utilizando nuevas firmas unidimensionales en sistemas de Inteligencia Artificial para clasificar imágenes. Artificial para clasificar imágenes.
IV Referencias
-
Folland, G.B. Fourier Analysis and Its Applications; American Mathematical Society: Providence, RI, EE.UU., 2000; pp. 314-318.
-
Al-masni, M.A.; Al-antari, M.A.; Choi, M.T.; Han, S.M.; Kim, T.S. Skin lesion segmentation in dermoscopy images via deep full resolution convolutional networks. Comput. Meth. Prog. Biomed. 2018, 162, 221-231.
-
Barnsley, M.F.; Devaney, R.L.; Mandelbrot, B.B.; Peitgen, H.O.; Saupe, D.; Voss, R.F. The Science of Fractal Images; Springer: Nueva York, NY, EE.UU., 1998; pp. 22-70.
-
Edgar, G. Measure, Topology, and Fractal Geometry, 2ª ed.; Springer: Nueva York, NY, EE.UU., 2000; pp. 165-224
-
Wahba, M.A.; Ashour, A.S.; Guo, Y.; Napoleon, S.A.; Abd-Elnaby, M.M. A novel cumulative level cumulative level difference mean based GLDM and modified ABCD features ranked using eigenvector centrality approach for four skin lesion types classification. Comput. Meth. Prog. Biomed. 2018, 165, 163-174.
-
Backes, A.R.; Casanova, D.; Bruno, M.O. Identificación de hojas de plantas basada en la dimensión fractal volumétrica. Int. J. Pattern Recog. 2009, 23, 1145-1160.
-
Florindo, J.B.; Bruno, O.M.; Landini, G. Morphological classification of odontogenic keratocyst using Bouligand-Minkowski fractal descriptors. Comput. Biol. Med. 2017, 81, 1-10.
-
J. A. López-Leyva, E. Guerra-Rosas and Josué Álvarez-Borrego, "Multi-Class Diagnosis of Skin Lesions Using the Fourier Spectral Information of Images on Additive Color Model by Artificial Neural Network," en IEEE Access, vol. 9, pp. 35207-35216, 2021, doi: 10.1109/ACCESS.2021.3061873
-
Eduardo Gessel-Pacheco, Isabel Israde-Alcántara y Josué Álvarez-Borrego, (2020). Binary Masks of Anillos Concéntricos como Método de Identificación Aproximada de Diatomeas Mediante Imágenes. Acceso IEEE, Volumen 8, ISSN electrónico: 2169-3536, DOI: 10.1109/ACCESS.2020.3013240
-
Esbanyely Garza-Flores y Josué Álvarez-Borrego (2018). Reconocimiento de patrones utilizando máscaras binarias basadas en la transformada fraccional de Fourier. Journal of Modern Optics, volumen 65, número 14, pp. 1634-1657. DOI: 10.1080/09500340.2018.1457186.
-
Alfredo Castro-Valdez, Josué Álvarez-Borrego y Selene Solorza-Calderón (2020). Correlación de imágenespor firmas unidimensionales invariantes a rotación, posición y escala utilizando la Transformada Radial de Hilbert. Optimizada. Óptica Aplicada. Vol. 59, No. 13/1 Mayo 2020/doi: https://doi.org/10.1364/AO.381574.