El herbario de la Universidad Autónoma de Sinaloa (UAS) cuenta con un extenso registro de plantas disecadas. Lamentablemente, el acceso a estos especímenes es restringido, priorizando su conservación y limitando su disponibilidad al público en general, reservándose principalmente para investigadores. Ante esta situación, en el Parque Científico Tecnológico se propuso un proyecto liderado por el Dr. Inés Fernando Vega López y supervisado por el doctorante Juan Augusto Campos Leal el cual consiste en la digitalización del herbario con el fin de democratizar el acceso a la información sobre especies y registros hallados en Sinaloa y otras regiones de México.
A su vez y mientras este proyecto busca la preservación y la accesibilidad a este tipo de información, también se intenta la integración de los estudiantes prestadores del servicio social para que puedan poner en práctica sus conocimientos y habilidades adquiridas durante sus estudios universitarios. En esta ocasión, el estudiante que acompañó esta investigación fue José Julián López Rodríguez, estudiante de la Facultad de Ciencias Fisicomatemáticas de la UAS.
Pero, ¿en qué consiste la digitalización del herbario? Primero que nada, se ha llevado a cabo la fotografía de cada una de las plantas o especímenes presentes en el herbario (más de 30,000 de alta resolución). El siguiente paso consiste en la extracción de la información de texto que incluye cada una de las especies que existen en el herbario. Estos datos incluyen información sobre las plantas, quién la identifico, su ubicación, entre otros antecedentes. Es decir, para crear un herbario completo es necesario la fotografía y la respectiva información de cada especie, esto para facilitar y hacer más eficiente la identificación y localización de la especie buscada por el público, estudiantes y/o investigadores.
Como extraer esta información de manera manual podría llegar a ser complicado, el plan tiene como objetivo desarrollar una herramienta de inteligencia artificial basada en técnicas de visión artificial. Esta herramienta se dedica a la detección de las etiquetas colocadas en las fotografías de los especímenes del herbario. Una vez que esta herramienta localiza esta etiqueta, se extrae de manera automática el texto que contiene dicha etiqueta. Es decir, la información detallada de la especie, como se comentó antes. Este enfoque basado en la herramienta de visión artificial permitirá agilizar y automatizar la extracción de información clave, reduciendo así la dependencia de la labor manual y optimizando el proceso de digitalización del herbario.
Entonces, un proyecto tan interesante no podía estar exento de dificultades; Durante la entrevista realizada al doctorante Campos Leal y al brigadista Julián López nos comentaron el bache más grande que tuvieron que sortear en la elaboración de este proyecto: la extracción del texto informativo que se incluía en las etiquetas. Para la realización de este procedimiento, se utilizó la herramienta Tesseract, el modelo OCR más popular en la actualidad. El problema es que, si bien es una herramienta eficiente, no es perfecta. En algunos momentos, a la hora de identificar y extraer el texto, ocurrían errores interpretativos, por ejemplo, palabras como “Autónoma” era tomada como “Autéfknoma”, “bosque” como “sosque”, “pedregosa” como “pedregosae”, y “Aviña” como “Avifia”. Además, las palabras escritas a mano presentaban desafíos adicionales a la herramienta y no podrán ser tratados de momento.
Sobre este tema, nos comenta Campos Leal lo siguiente: “Las dificultades surgieron a la hora de la interpretación de las palabras. Las letras que no son de molde, es decir, son escritas a mano, obviamente se vuelven más difíciles de reconocer para las técnicas OCR. También importa la orientación en la que se encuentren. Si están en una posición diferente a la que estamos tomando para el reconocimiento será muy difícil identificar las palabras.”
A su vez, nos comenta Campos Leal como estas herramientas se podrían incluir en otros proyectos: “Este tipo de técnicas se pueden utilizar en otro tipo de proyectos, como la clasificación de imágenes, en cámaras de vigilancia. Más que nada, se puede aplicar para reconocer algunos patrones en las imágenes que pueden ayudar en distintas disciplinas como medicina, biología, etc. “Y, por último, fiel a los intereses del PCT con los estudiantes, nos habla de los beneficios sociales que este tipo de proyectos acarrea:
“Primero que nada, crear un profesionista que pueda aplicar todos los conocimientos adquiridos durante sus estudios profesionales. ¿Cómo beneficia esto a la sociedad? Generando un individuo capacitado para integrarse de manera eficiente al mundo laboral. De igual manera, y como parte de los intereses que tenemos en el PCT, podemos permitir a la sociedad un acceso a este tipo de información. Estamos, a final de cuentas, realizando un trabajo de divulgación y difusión por y para la sociedad.”
De igual manera, el brigadista José Julián López Rodríguez quien nos comenta que significó para él participar en el desarrollo de este proyecto: “Se siente muy bonito porqué yo siempre había hecho proyectos individualmente, y esta es la primera vez trabajando en equipo y siento que es una manera completamente diferente de trabajar. De cómo aquí te pueden ayudar, asesorar, porque ellos tienen muchísima experiencia.” A su vez, encontrándose muy satisfecho con su experiencia en el PCT, recomienda y alienta a sus compañeros y demás estudiantes a animarse a elegir este lugar para brindar su servicio social: “Yo a mis amigos de la facultad siempre estoy recomendando que, si tienen pensado hacer el servicio social, tomen en cuenta el Parque, porqué es una experiencia completamente enriquecedora.”
Como se sigue viendo, el Parque Científico Tecnológico es firme en su postura de darle mayor difusión a las ciencias y la tecnología con distintos proyectos de lo más variados e interesantes, mientras ayuda que los jóvenes estudiantes puedan encontrarse en un espacio adecuado para poder poner en práctica sus capacidades y pulir sus habilidades, con la idea que puedan integrarse de la mejorar manera al mundo laboral, viéndose preparados para los nuevos retos que tengan que afrontar en un futuro cercano.
Comunicación y difusión PCT-UAS: Emmanuel Valenzuela