BBC Mundo
¿Pueden las computadoras reconocer imágenes como lo haría un humano?
Es el principal objetivo de un programa de la Universidad Carnegie Mellon en Estados Unidos, que está tratando que las computadoras adquieran la capacidad de asociación humana mediante el análisis de imágenes durante 24 horas al día.
El mundo visual es aún un enigma para las máquinas.
Hasta ahora, los motores de búsqueda basaban el rastreo de imágenes en la indexación de palabras que tuvieran asociadas.
En los últimos años, la investigación se ha centrado en conseguir que las computadoras reconozcan las formas, tamaños, colores, etc., mediante algoritmos y muestren resultados visuales asociados a la búsqueda.
El programa llamado "El eterno aprendiz de imágenes" o "Never Ending Image Learner" (NEIL) en inglés ya ha analizado tres millones de imágenes, desde julio.
Como resultado, la visión artificial de la computadora logró hacer 2.500 asociaciones, después de identificar 1.500 objetos entre medio millón de imágenes y 1.200 escenas en miles de imágenes.
Las computadoras ya consiguen identificar y etiquetar los objetos utilizando la visión artificial de la máquina, pero los investigadores esperan que NEIL aprenda las relaciones entre los diferentes elementos sin que hayan sido previamente enseñados.
Como ejemplos de los vínculos que NEIL ha conseguido hacer, comprenden el hecho de que los coches se encuentran en las carreteras y que los patos pueden parecerse a los gansos.
El proyecto está siendo financiado por el Departamento de la Oficina del Departamento de Defensa e Investigación Naval de Estados Unidos y Google.
Sentido común
"Las imágenes son la mejor manera de aprender las propiedades visuales", cuenta Abhinav Gupta, profesor asistente de investigación en el Instituto de Robótica de la Carnegie Mellon.
"Estas, además, incluyen una gran cantidad de información de ‘sentido común’ acerca del mundo. Las personas aprenden esto por sí solas y, con NEIL, esperamos que las computadoras puedan hacer lo mismo", explica Gupta.
El sentido común, en este caso, hace referencia a la capacidad de reconocer lo que no se ha enseñado de forma explícita.
Por ejemplo, explica la experta en tecnología de la BBC Hannah Fraser, "las personas aprendermos ciertas normas sociales pero a veces, nos encontramos en una situación para la que no se nos ha enseñado una respuesta".
"Es ahí cuando utilizamos lo que hemos aprendido y lo aplicamos a una nueva situación. Ocurre lo mismo con las computadoras, en el terreno de la asociación".