VISIÓN TRIDIMENSIONAL BASADA EN METROLOGÍA LÁSER Y ALGORITMOS DE INTELIGENCIA ARTIFICIAL

Cuadernos de Educación y Desarrollo

Vol 1, Nº 2 (abril 2009)

VISIÓN TRIDIMENSIONAL BASADA EN METROLOGÍA LÁSER Y ALGORITMOS DE INTELIGENCIA ARTIFICIAL

J. Apolinar Muñoz Rodríguez
Edgar Fernando Velázquez Pedroza
Diego Alonso Castañeda Aguilar
ixcoatl1@hotmail.com

Resumen

Se presenta una técnica de visión tridimensional basada en metrología láser y algoritmos de inteligencia artificial. En esta técnica, la visión se efectúa mediante proyección de una línea láser y procesamiento de imágenes. Mediante un arreglo óptico móvil, la línea láser barre la superficie bajo estudio. En base al comportamiento de la línea láser, una red de aproximación produce un modelo matemático para calcular la topografía del objeto. La arquitectura de la red se construye con imágenes de línea láser proyectada sobre objetos con dimensiones conocidas. El enfoque de esta red es evitar mediciones sobre el arreglo óptico. Además, esta red calcula los parámetros de visión en forma automática. Así, se mejora la precisión de los resultados y el manejo del sistema de visión. Esto se debe a que errores de medición no se pasan al sistema de reconstrucción tridimensional. Para describir la precisión de los resultados, se calcula el error cuadrático medio usando un método de contacto como referencia. Esta técnica es probada con objetos reales y se presentan resultados experimentales.

1. Introducción

En metrología óptica y visión por computadora se han desarrollado diversas técnicas para digitalización de objetos. La metrología es una herramienta muy valiosa en visión artificial, particularmente en reconstrucción de objetos. El uso de luz estructurada, permite que el sistema de visión sea confiable y los datos adquiridos son muy fáciles de interpretar. Así mismo, la incorporación de redes neuronales a los métodos ópticos permite la automatización del proceso de reconstrucción. Una técnica en particular para reconstrucción de objetos es la de proyección de una línea láser [1-3]. En esta técnica, se proyecta una línea de luz sobre la superficie del objeto. La línea se deforma en el plano de la imagen debido a la variación de la superficie del objeto. Con la posición de la línea y los parámetros del la geometría del arreglo óptico, se deduce la información de la topografía del objeto. En esta técnica, las distancias de la geometría del arreglo óptico se miden mediante un proceso externo al sistema de reconstrucción. Posteriormente estos parámetros son usados por el sistema computacional para calcular las dimensiones de la superficie del objeto.

En la técnica propuesta, la forma el objeto se obtiene detectando la línea láser mediante procesamiento de imágenes y redes de aproximación. En este caso, la posición de la línea láser es procesada por la red para obtener la superficie del objeto. Con la aplicación de la red se evitan mediciones de los parámetros de la geometría del arreglo óptico. La arquitectura de esta red neuronal se construye con imágenes la línea láser proyectada sobre patrones con dimensiones conocidas. En el arreglo experimental, el objeto se desplaza en el eje-x con lo que se barre la superficie de este. En cada paso del movimiento, se captura la línea láser mediante una cámara CCD. Mediante aproximación Gaussiana, se calcula la aposición de la línea láser. Posteriormente, la red neuronal calcula la dimensión del objeto en base a la posición de la línea láser. La información producida por la red se guarda en un arreglo de memoria para obtener la forma del objeto. La viabilidad del método es examinado en base a el error cuadrático medio. Este análisis se efectúa tomando como referencia un método de contacto.

2. Descripción del arreglo óptico

La configuración del arreglo óptico de ésta técnica incluye: un dispositivo electromecánico, un proyector de línea láser, una cámara CCD y una computadora. El arreglo experimental se muestra en la Figura 1. En este arreglo, el objeto se fija sobre una plataforma, la cual se mueve en el eje x. Este dispositivo esta controlado por computadora y su movimiento esta basado en un algoritmo computacional. Sobre el objeto se proyecta una línea vertical, la cual barre la superficie de éste. En cada paso del movimiento, la línea cambia de posición en el plano de la imagen de acuerdo a la topografía del objeto. Cada línea se captura mediante la cámara CCD. La topografía del objeto se obtiene mediante el procesamiento de la línea y la red de aproximación. La información producida por cada línea corresponde a una sección transversal del objeto. La forma completa del objeto se genera con la información de todas las líneas procesadas.

Para describir la relación entre la posición de la línea láser y la superficie del objeto, se usa la geometría del arreglo óptico mostrado en la Figura 2. En el plano de referencia están localizados el eje y, el eje x y la superficie del objeto se indica como h(x, y). Los puntos A y B corresponden a la línea láser proyectada sobre en el plano de referencia y sobre el objeto, respectivamente. Cuando una línea láser se proyecta sobre el objeto, esta se mueve en el plano de la imagen del punto xA al xB. Este desplazamiento se representado como:

s(x,y) = xA - xB (1)

El desplazamiento s(x,y) es directamente proporcional a la superficie del objeto h(x,y) [4]. Usando este desplazamiento, la superficie del objeto se determina mediante la red de aproximación. De esta manera, se obtiene la información de una sección transversal del objeto. El desplazamiento s(x,y) se obtiene midiendo la posición de la línea de luz en cada renglón de la imagen. Esta posición es obtenida con una resolución de fracción de píxel mediante el método de Aproximación Gaussiana.

La intensidad proyectada por un diodo láser es una distribución Gaussiana en dirección del eje x [5]. Los valores de intensidad de la línea láser son representados como (x0, z0), (x1,z1), (x2,z2),..., (xn, zn), donde xi es la posición del píxel y zi es la intensidad del píxel. Una manera de representar estos valores es una función Gaussiana, la cual se define como:

(2)

Donde Ni es el área bajo la curva,  es la media de la función, y  es la desviación estándar. Para determinar la posición de la línea láser se calcula la media , la cual representa el centro de la función Gaussiana. La expresión para calcular la media puede describirse como:

(3)

La Figura 3 muestra un conjunto de pixeles de un renglón de una línea láser. De estos pixeles se calcula la posición central µ para determinar la posición de la línea. Para efectuar este procedimiento, se sustituye la posición xi y la intensidad del pixel zi en la Eq. (3). En este caso, el resultado es =14.664. Por consiguiente, la posición de la línea de luz es xB=14.664 pixeles. También, el factor Ni y la desviación estándar son calculados para ajustar la función Gaussiana mostrada en la Figura 3.

El valor de la media se usa en la Ec.(1) para obtener el desplazamiento s(x,y). El procedimiento de calcular la posición de la línea, se aplica a todos los renglones de la imagen. Con esto, se obtiene el perfil del objeto de la región donde se proyecto la línea láser. Este perfil corresponde a los desplazamientos s1, s2, s3, .....,sn, que se procesarán por la red para obtener una sección transversal del objeto. En la Figura 4, se muestra una línea láser.

De cada renglón de esta imagen se calcula la media  mediante la Ec.(3) para obtener la posición de la línea láser a lo largo de esta. Usando la posición de la línea se calcula el desplazamiento s(x,y) mediante la Ec.(1). Este desplazamiento representa el perfil del objeto, el cual se muestra en la Figura 5. Este perfil es extraído de cada una de las imágenes capturadas en el movimiento del objeto.

3. Estructura de la red de aproximación

Las funciones de Bezier se han usado para representar curvas y superficies [6]. La red Bezier propuesta consta de un vector de entrada, una entrada paramétrica, una capa oculta y una capa de salida. La estructura de la red se muestra en la Figura 6. Los datos de entrada h1, h2, h3,..., hn son las dimensiones de objetos conocidos y los valores de entrada s1, s2, s3,..., sn son los desplazamiento de la línea. La entrada paramétrica u es un valor en proporcional al desplazamiento si. La capa oculta se construye con funciones de base Bezier. La capa de salida se forma con la sumatoria de las neuronas de la capa oculta, las cuales son multiplicadas por un peso. Cada capa de la estructura de la red se obtiene de la siguiente forma. El desplazamiento de la línea s1, s2, s3,...,sn, se obtiene mediante procesamiento de imágenes. La relación entre el desplazamiento y el valor u es representado por

La relación entre el desplazamiento y el valor parametrito se describe mediante la siguiente expresión:

u= a0 +a1s, (4)

donde ai son constantes a determinar y s es la posición del desplazamiento de línea. Usando s y su posición u, la ecuación (4) se puede determinar. Las funciones Bezier están definidas en el intervalo 0  u  1 [7]. Por lo tanto u = 0 para el primer desplazamiento s0 y u=1 para el ultimo desplazamiento sn. Sustituyendo los valores (s0, u=0) y (sn, u=1) en la ecuación (4), se obtienen dos ecuaciones con dos incógnitas. Resolviendo estas ecuaciones, se obtiene a0 y a1. Los datos h1, h2, h3,...,hn, se obtienen mediante un método de contacto. Las neuronas de la capa oculta se construyen mediante funciones de base Bezier, las cuales se describen como:

, 0u 1, , (5) La capa de salida se determina mediante la sumatoria de las neuronas, las cuales son multiplicadas por un peso. La respuesta de salida del la red es representada por

, 0  u  1, (6)

donde wi son los pesos, hi es la dimensión del objeto y Bi es la función de base Bezier Ec.(6). Para calcular los pesos wi se implementa un mecanismo de ajuste. Para efectuar este proceso, ui y hi se sustituyen en la Ec.(6). En esta forma se obtiene el sistema de ecuaciones:

h0 = w0 (1 - u)n u0 h0 + w1 (1 - u) n-1uh1 +,…..,+ wn (1 - u) 0 un hn, 0  u  1.

h1 = w0 (1 - u)n u0 h0 + w1 (1 - u) n-1uh1 +,…..,+ wn (1 - u) 0 un hn, 0  u  1. (7)

hn = w0 (1 - u)n u0 h0 + w1 (1 - u) n-1uh1 +,…..,+ wn (1 - u) 0 un hn, 0  u  1.

Este sistema de ecuaciones se puede representar como

h1 = w11,1 + w21,2+..........+wn1,n

h2 = w12,1 + w22,2+..........+wn2,n (8)

hn = w1n,1 + w2n,2+..........+wnn,n

Este sistema de ecuaciones a su vez se puede escribir en forma de matriz como W =H:

(9)

Resolviendo el sistema de ecuaciones (9), se obtienen los pesos wi. En esta forma la red Bezier ha sido completada. De esta manera para un si la red calcula una dimensión hi. El resultado de esta red es una función que calcula la dimensión del objeto en base al desplazamiento de línea láser.

4. Parámetros de visión

En visón tridimensional, las dimensiones de un objeto se determinan en base a los parámetros de la cámara y la geometría del arreglo experimental. Los parámetros de la cámara incluyen: distancia focal, orientación, centro de la imagen, factor de escala y distorsión. En la técnica propuesta, los parámetros de la cámara se calculan mediante la red y procesamiento de imágenes. La orientación de la cámara se determina en base al eje óptico. En este caso, el eje óptico es perpendicular al plano de referencia como se muestra en la Figura 7. La distancia entre el centro de la imagen y la línea láser se denota mediante a. La dimensión del objeto se indica mediante hi y D = zi + hi. De acuerdo a al eje perpendicular, la dimensión hi del objeto tiene una proyección ki en el plano de referencia. De la Figura 7, el desplazamiento se define como sij= (xc – xB) - (xc – xA). Así, la proyección ki en el plano de referencia se calcula mediante la siguiente expresión.

(10)

De la ecuación 10, F, xc, xA son constantes y hi es calculada por la red. En este caso, ki es una función lineal y la derivada dk/ds es una constante. Debido a la distorsión la derivada dk/ds no exactamente una contante. Pero la derivada es lo más aproximado a una constante.

Figura 7. Geometría de un eje óptico perpendicular al plano de referencia.

En base a un eje perpendicular, se deducen los parámetros de la cámara. Para efectuar el proceso, la red produce la dimensión del objeto hi. La geometría de la Figura 7, se describe mediante la siguiente expresión

, (11)

De esta ecuación,  es el factor de escala que convierte los pixeles en milímetros. Usando D = zi + hi y sij = (xc - xB) - (xc – xA), la ecuación (11) se reescribe como

(12)

Donde D es la distancia de la lente al plano de referencia. De la ecuación (12), las constantes D, a, F,  y xc deben ser determinadas. Esto se realiza reescribiendo la ecuación (12) como el siguiente sistema de ecuaciones

(13)

Los valores h1, h2,….,h5, son calculados mediante la red y se sustituyen en la ecuación (13). Resolviendo este sistema de ecuaciones, se obtienen las constantes D, a, F, , and xc. De esta manera, se obtienen los parámetros del sistema de visión en base a la red y procesamiento de imágenes. La distorsión del sistema se puede observar mediante la posición de la línea de luz en el plano de la imagen, la cual se describe mediante la siguiente expresión

(14)

En base a esta ecuación, el comportamiento de xB con respecto a hi debería ser una función lineal. Sin embargo, debido a la distorsión xB no es una función lineal. La red se construye mediante datos que se obtienen del desplazamiento si=(xc- xB) - (xc- xA). Por lo tanto, la red produce datos hi no lineales. Así, la distorsión es incluida en la red, la cual calcula la dimensión del objeto. Por medio de la información producida por la red de todas las imágenes, se reconstruye la forma del objeto.

5. Resultados experimentales

La Figura 1 muestra el arreglo experimental. El objeto se mueve en pasos de 1.27 mm a lo largo del eje x. Una línea láser vertical se proyecta sobre la superficie del objeto por medio de un diodo de láser de 5 mW. La línea láser se deforma de acuerdo a la topografía del objeto en el proceso de barrido. Estas líneas deformadas son capturadas por medio de una cámara CCD y se digitalizan con una resolución de 320 x 200 pixeles y 256 niveles del gris. El experimento es probado con dos objetos.

El primer objeto es un maniquí, el cual se muestra en la Figura 8. Este objeto es barrido por la línea láser para obtener la información de la superficie. El resultado de este paso son los datos s1, s2,...,sn, los cuales contienen los desplazamientos de cada renglón de la imagen de la línea. Estos datos son procesados por la red vía Ec.(8) para obtener los datos de la altura h(s) de la superficie.

Con el procesamiento de cada línea, se obtiene una sección transversal del objeto. Los datos de cada sección transversal se guardan en un arreglo de la memoria para construir la forma 3D completa del objeto. Para conocer la exactitud de los resultados obtenidos, se calcula la raíz media cuadrática (rms) del error [8]. El valor rms se describe como, (15) donde hoi son los datos obtenidos por un método de contacto, hci son datos calculados por la red Bezier y m es el número de datos analizados. El método de contacto consiste en una máquina de medición por coordenadas (MMC). El error obtenido para el maniquí mediante la red es un rms = 0.161 mm. Se procesaron setenta y dos líneas mediante la red Bezier para obtener la forma del maniquí, la cual muestra en la Figura 9. En esta Figura, la escala de los ejes está en mm.

El segundo objeto utilizado es una horma, la cual se muestra en la Figura 10. El procedimiento aplicado al maniquí se aplica a la horma. Con esto se obtiene la vista frontal de la horma, la cual se muestra en la Figura 11. En esta Figura la escala de los ejes esta en mm. En este caso, el error es rms =0.173 mm.

La computadora empleada en este experimento es una PC a 1 Ghz. Cada imagen se procesa en un tiempo de 0.023 seg. Este tiempo de proceso es mínimo ya que los datos de la imagen se extraen con pocas operaciones via Eq. (3). Usando la red Bezier en esta técnica, la forma del objeto es determinada sin el cálculo de las distancias de la geometría del arreglo óptico. Por consiguiente, el procedimiento es más fácil que las técnicas que usan las distancias de los componentes del arreglo óptico. En esta técnica todos los pasos se efectúan por proceso computacional y se evitando así mediciones sobre el arreglo experimental. De esta manera se logra buena repetitibilidad en cada medición.

6. Conclusiones

Se ha presentado una técnica para detección forma mediante una línea láser y una red Bezier. Esta técnica representa una valiosa herramienta para la detección de forma de objetos en inspección industrial. El método perfilométrico de la técnica es automático y evita mediciones de los componentes del arreglo experimental, como es común en los métodos de proyección de una línea láser. Estos parámetros son obtenidos por proceso computacional. Esto mejora la exactitud de los resultados obtenidos por la técnica, ya que los errores de mediciones físicas no se introducen en el sistema. En este trabajo, la habilidad de medir la posición de la línea de luz con resolución de subpixel se ha logrado de una manera muy rápida mediante aproximación de Gaussiana. Esto se logra ya que la posición de la línea de luz se determina con pocas operaciones. Usando este arreglo experimental se obtiene una buena repetitibilidad en cada medición, por consiguiente esta técnica es efectuada de buena manera.

Referencias

[1] L. Zagorchev and A. Goshtasby, “A paintbrush laser range scanner”, Computer vision and image understating, Vol. 10, p. 65-86 (2006).

[2] Z. Wei, G. Zhang and Y. Xu, “Calibration approach for structured–light-stripe vision sensor based on invariance of double cross-ratio”, Opt. Eng. Vol. 42 No. 10, p. 2956-2966 (2003).

[3] A. M. Mclvor, “Nonlinear calibration of a laser profiler”, Opt. Eng. Vol. 42 No.1, p. 205-212, (2002).

[4] J. A. Muñoz Rodríguez and R. Rodríguez-Vera, “Evaluation of the light line displacement location for object shape detection”, Journal of Modern Optics, Vol. 50 No.1, p. 137-154 (2003).

[5] F. Causa and J. Sarma, “Realistic model for the output beam profile of stripe and tapered superluminescent light–emitting diodes,” Appl. Optics, Vol. 42 No.21, p. 4341-4348, (2003).

[6] Y. J. Ahn, Y. S. Kim and Y. Shin, “Approximation of circular arcs and o set curves by Bezier curves of high degree”, Journal of Computational and Applied Mathematics, Vol. 167, p. 405 –416, (2004).

[7] M. E. Mortenson, Geometric Modeling, Willey, Second edition, U.S.A. (1997),

[8] T. Masters, Practical Neural Networks Recipes in C++, Academic Press, U.S.A 1993.