En la vida cotidiana utilizamos nuestro sentido de la vista, comúnmente sin detenernos a razonar cómo funciona y cuáles son los componentes y procesos puestos en juego entre nuestro cerebro y los ojos. Es noción aceptada y entendida que la vista se aplica desde un proceso cognitivo que recibe e interpreta señales del exterior. Hace muchos siglos, Aristóteles sostenía en su Metafísica que «la vista, mejor que los otros sentidos, nos da a conocer los objetos, y nos descubre entre ellos un gran número de diferencias». Así pues, aunque distinguir la constitución de las cosas pertenecientes a un espacio real y delimitado nos caracteriza como seres vivos, también obedecemos a una intuición superior que —en comunión con la memoria— nos define como entes racionales: en pocas palabras, nos humaniza.
Por otro lado, de unos años para acá, en el ámbito científico encontramos múltiples innovaciones que pretenden conferir cierta visión razonada a los distintos prototipos tecnológicos que comienzan a despuntar en el competitivo sistema de mercado actual. Algunas máquinas concebidas a partir de la inteligencia artificial ofrecen, entre sus otras muchas cualidades, la capacidad de estar a la mira del mundo real y palpable. De este modo, el aparato ejerce una especie de libertad para actuar y decidir convenientemente, conforme a la utilidad y el servicio que le ha conferido la sociedad. En síntesis, éste es el propósito de la visión computacional.
Un primer vistazo a la visión computacional
Esta disciplina prorrumpe en la década de 1960 con una idea preconcebida y un tanto equivocada por parte de los primeros científicos especializados en inteligencia artificial: ofrecer imágenes a una computadora para que las interpretara era relativamente fácil. En realidad resultó ser todo lo contrario. En ese tiempo, había multitud de asuntos por tomar en cuenta para conseguir avances significativos en la visión artificial.
En este sentido, la visión computacional sigue entendiéndose como una disciplina científica que estudia y promueve la capacitación de distintos dispositivos y computadores para la interpretación de imágenes del mundo real, de tal forma que tanto los procesos como los resultados se asemejen lo más posible a las capacidades humanas.
Visión y memoria: mirar desde la mente
Para tal caso, es necesario entender la relación que el proceso cognoscitivo guarda con la capacidad visual en un contexto informático. Existen interesantes postulados teóricos que abordan el problema de la memoria computacional (rama angular de la visión artificial) desde distintas aristas. Algunos defienden la necesidad de una aplicación exterior al dispositivo que realice los procesos memorísticos primordiales para su funcionamiento. Otros académicos creen válido esforzar las investigaciones desde una noción intrínseca, es decir, buscar definir una estructura cognitiva en la construcción misma del modelo electrónico. Así también, otros desarrolladores realizan un aporte desde una exploración más básica y rudimentaria, aplicando la simulación de tareas específicas de la memoria en algunos computadores.
Por consiguiente, es trascendental la conjunción entre memoria y visión en el ramo de la informática, para así poder permitirse rastrear a priori cierto almacenamiento de información que esté en constante revisión con las imágenes encontradas en la vida real. En pocas palabras, la máquina debe perseguir una serie de pasos para lograr su propósito: necesita aprender para ver.
Niveles de la visión computacional
El estudio de la visión artificial divide sus componentes en tres horizontes esenciales, desde el más elemental hasta el más complejo:
- Nivel 2D. Distinción de los rasgos básicos en una imagen superpuesta: líneas, trazos, bordes, arcos, ceros.
- Nivel 21/2D. Identificación en la imagen de matices propios de la estereoscopía (disciplina que estudia la ilusión tridimensional de los objetos), como la iluminación, la reflectancia y el sombreado, en conjunción con los rasgos elementales antes mencionados.
- Nivel 3D. Representación de los objetos en el espacio real. Esto permite las consiguientes clasificación y comparación de las imágenes con información previamente recopilada en el dispositivo.
De tal modo, distintos apartados teóricos de la informática defienden que estos tres niveles deben formar en conjunto una directriz adecuada en la experimentación y el desarrollo de la visión computacional.
Aplicaciones a la vista
La visión computacional ha presentado un auge extraordinario en distintos campos de la industria y la tecnología. Por citar algunos casos, es trascendental su uso en la metrología óptica: a partir de un sistema de visión artificial, es diseñado un objeto con las medidas y magnitudes físicas adecuadas; también tiene una aplicación significativa en la lectura de datos: aquí se concibe desde el reconocimiento y la comprobación de caracteres y códigos que permiten una correcta recopilación de información (archivos, documentos, productos) para su posterior almacenamiento y categorización (un ejemplo cotidiano de esta aplicación son las máquinas que detectan el código de barras de los productos disponibles en un supermercado); otros casos son los sistemas de control y vigilancia, que permiten detectar inconformidades en un espacio previamente trazado por el usuario; incluso, en el campo de la medicina son utilizados los rayos X y otros complejos sistemas para la detección de enfermedades a partir de las tomografías, radiografías, resonancias magnéticas, entre distintas utilidades a considerar.
Entre otras mercedes que ha ofrecido la visión computacional a la nueva tradición de la innovación y la competitividad, se encuentra su enfoque actual en la robótica. Así pues, son notables las investigaciones realizadas en el desarrollo de robots domésticos: se pretende innovar a partir de la creación de un modelo protohumano que realice labores de limpieza, cuidado de niños y adultos mayores. Uno de los investigadores entusiastas en este rubro es el científico mexicano José Martínez Carranza, doctor en Ciencias Computacionales por la Universidad de Bristol, quien ha dicho: «No sólo en México, en todo el mundo existe la necesidad de tener robots que nos puedan apoyar en la casa, robots que puedan limpiar. Hay empresas que ya venden robots que limpian el piso, por ejemplo. Entonces, es tener un robot que pueda cuidar a los niños, les pueda hacer compañía, pueda platicar contigo». En todo caso, materializar un producto que a todas luces ofrece una gran variedad de utilidades indispensables para las necesidades humanas, puede sonar fantasioso o lejano; las investigaciones, por el contrario, demuestran que este camino está pronto a recorrerse.
Encontramos así en el desarrollo de los nuevos modelos robóticos algunos intentos considerables en aras de la conquista de aquellas cualidades característicamente humanas —que pronto dejarían de serlo si las compartimos con productos informáticos— tan propias de nosotros como las emociones, la reflexión, el oído, el habla y hasta la vista.
Andrés Márquez (Comunicación y Difusión, PIT-UAS)