Andrew Fitzgibbon es experto en visión por computadora en 3D y gráficos, además de jefe del nuevo grupo All Data IA en Microsoft Research Cambridge. Ha sido instrumental en el desarrollo de Boujou, un rastreador de cámara 3D ganador del Premio Emmy, que permite a los cineastas colocar accesorios virtuales como las velas flotantes en la Escuela de Brujería y Hechicería de Hogwarts.
Fitzgibbon, desde los Emmys en 2002, ha estado trabajando en el seguimiento del cuerpo y las manos para las potentes tecnologías de Microsoft como Kinect, para Xbox 360 y HoloLens.
El experto ha explicado en un Podcast de Microsoft que su intención es hacer que las computadoras ayuden a los investigadores a cambiar el mundo. Además, cree que se puede cambiar el mundo de muchas maneras que son útiles para los humanos.
“Me gustaría pensar que trabajo en las tecnologías que sustentan las formas en que podemos hacer que las computadoras mejoren el mundo para nosotros”.
Mucho de lo que hace en lo que ahora se llama IA o Inteligencia Artificial (IA, la combinación de Aprendizaje Automático, visión por computadora, procesamiento del lenguaje natural) se trata de tomar información del mundo.
“Esa información proviene de sensores de alguna manera, ya sea que los sensores sean píxeles en una cámara o los sensores en un micrófono, o incluso, los sensores en su teclado cuando escribe un tweet. Todas estas son fuentes de información del mundo real con las que nos gustaría hacer algo bueno”.
Para él, algo bueno podría ser mejorar los gráficos de computadora en Harry Potter y, lo considera bueno, porque hace felices a muchos humanos. En cierto sentido, a su juicio, todo lo que se hace en la vida trata de hacer felices a los humanos.
Visión por computadora
Andrew Fitzgibbon comenzó a colaborar cuando estaba en Oxford con algunos de los neurocientíficos que trabajaban allí. Estaban interesados en una pregunta bastante simple: ¿Pueden los humanos señalar las cosas?
“Ahora, piensas, obviamente los humanos pueden señalar cosas, pero no tenemos una buena teoría sobre cómo el cerebro integra la información 3D. Por lo tanto, estaba interesado en proporcionar a los neurocientíficos una especie de respaldo matemático”.
Entonces, Fitzgibbon estaba diciendo que nadie piensa que el cerebro lo hace multiplicando matrices y vectores, pero si lo hiciera, vería este tipo de patrones de error.
“Y luego fuimos al mundo real y observamos a las personas que usan auriculares de realidad virtual y el tipo de errores de puntería que cometen. Y esos son diferentes de los patrones que una computadora haría usando la tecnología actual”.
Para el experto, la visión por computadora es uno de esos problemas más fáciles de enunciar. Por ejemplo, se podría preguntar ¿Esta imagen contiene un gato o no? Sin embargo, enfatizó que ha resultado ser increíblemente difícil.
“Incluso, en esta era de éxitos de Aprendizaje Profundo con visión por computadora, todavía sabemos que es increíblemente difícil. Entonces, mi abstracción de ‘reunir información de los fotones’ es simplemente dar un paso atrás y decir, ¿Por qué estamos tan entusiasmados con la visión por computadora? ¿Por qué estamos tan entusiasmados con estas capacidades?”.
En este sentido, justamente ha comentado que una de las cosas que hace la visión por computadora es que les permite adquirir información desde muy lejos y, por supuesto, el ser humano puede escuchar información desde muy lejos.
“Pero es una capacidad que nos permite hacer cosas como reconocer a personas lejanas o conducir un automóvil. Y quiero pensarlo en ese nivel de abstracción, porque siempre quiero entender que mi objetivo final es hacer algo real”.
Pensando en el objetivo final
Según su criterio, si se piensa siempre en el objetivo final, se hace un trabajo mejor para avanzar en la investigación fundamental. La alternativa es decir que su interés es comprender las redes neuronales profundas.
“Me encanta tratar de comprender las redes neuronales profundas y lo hago a nivel teórico. Pero también quiero saber cuál será la consecuencia práctica de ese entendimiento”.
Resolver problemas importantes que cambiarán el mundo, a su juicio, a veces es demasiado grande, y realmente no se tiene idea de cuáles son los grandes e importantes problemas.
“Una señal que me pareció valiosa es que, cuando escuchas una charla o lees un periódico, encuentras algo que te molesta. Encuentra algo donde piensas ¿En serio? Esa no puede ser la forma correcta de hacer esto. Entonces, esto es crucial, pregúntate de verdad, ¿por qué me molesta? y luego encuentra un ejemplo del mundo real donde lo que te molesta va a salir mal”.
Para Andrew Fitzgibbon, un ejemplo del mundo real sólo debe ser algo que todos saben que deberían poder hacer y que ninguna de las tecnologías existentes puede hacerlo; allí, entonces, se tendría una idea.
“Y creo que ha sido una fuente de inspiración muy valiosa para los momentos en que no tienes una gran idea. A veces sólo tienes una gran idea y eso es genial. Ve por ello”, señaló.