Algoritmo predice los temas que serán más comentados en Twitter


Ya es posible prever cuáles serán los temas del momento (o Trending Topics) de Twitter. Un profesor y un alumno del Massachussets Institute of Technology (MIT) elaboraron un algoritmo que puede indicar, con 95% de precisión, cuáles temas serán los más populares en el microblog con un promedio de una hora y media de anticipación a que el propio algoritmo de Twitter coloque ese tema en la lista TT. En algunos casos, el nuevo algoritmo puede anticiparse hasta cinco horas al de la red de 140 caracteres.

El trabajo del profesor Devavrat Shah y del estudiante Stanislav Nikolov puede ser de interés para Twitter, que podría entonces explorar posibilidades comerciales a partir de la anticipación de asuntos populares, como la venta de anuncios relacionados con el tema que entrará a la lista de los más comentados del momento.

El algoritmo también representa un nuevo abordaje de los análisis estadísticos, puesto que -al menos teóricamente- se puede aplicar a cualquier número que varíe a lo largo del tiempo como la duración de un viaje, la venta de entradas para el cine y probablemente hasta el precio de las acciones en la bolsa.

Como todo algoritmo, el que han desarrollado Shah y Nikolov requiere de un "entrenamiento"; vale decir, requiere que se le especifiquen padrones a ser considerados. "Es un modelo muy simple", dice el profesor, explicando que el proyecto busca "preparar" al algoritmo con base en datos para identificar un gran salto (de popularidad, en el caso de Twitter) y observar cómo ocurre ese gran salto.

El problema, agregó Shah, es que "hay mil cosas que podrían ocurrir". Es por ello que el profesor y su alumno han dejado que "los datos decidan".

En sus experimentos, el dúo realizó un entrenamiento del algoritmo definiendo 200 temas en Twitter que eran populares y otros 200 que no lo eran. En tiempo real, el sistema mostró un 95% de aciertos en referencia a las publicaciones.

Sin embargo, Shah dice que la precisión del sistema podrá mejorar en la medida en que se aumenten las especificaciones de preparación del algoritmo en cuanto a la cantidad de datos que deberá considerar, lo que significa más recursos de computación.