Ene 23 2013
761 lecturas

Ciencia y Tecnología

La primera victoria electoral del análisis de grandes volúmenes de datos

El análisis de las redes sociales y comportamientos en línea de los votantes le permitió al equipo de Barack Obama comprender y actuar sobre las elecciones de manera impensada. El Big Data llegó para explotarse.

Esta semana frente a la Casa Blanca se oficializó públicamente la primera victoria electoral del análisis de grandes volúmenes de datos. O sea, fue la primera victoria electoral del big data. La campaña de Barack Obama tuvo detrás una ingeniería jamás vista de conexión entre la información de los posibles votantes publicada en Internet, los perfiles de acceso, las posibilidades de encontrar donantes, metodología que sólo pertenecía a grandes corporaciones dedicadas a las finanzas.

El análisis de grandes volúmenes de información le permitió al equipo de campaña de Obama detectar rápidamente personalidades influyentes en las redes sociales (Facebook, Twitter, Google+, LinkedIn) y hacer campañas sobre estos perfiles para que influyan en los sectores donde los números estaban bajos, o enviar correos electrónicos diferenciados según posibilidades de colaborar con la campaña y hasta el mismo día de las elecciones, llamar por teléfono a las casas de los votantes que todavía no habían votado.

Estos detalles, y muchos otros que lamentablemente no pueden ser revelados por pedido expreso del autor, fueron contados por Harper Reed, jefe tecnológico de la campaña de Obama, en el encuentro News Foo en Phoenix al que asistió este cronista en noviembre pasado. Reed contó cómo combinaban información de evolución de las votaciones, y cómo se podía predecir unos días antes que la victoria iba a ser para Obama gracias al análisis de grandes volúmenes de información.

El crecimiento de la cantidad de información disponible en Internet se ha acelerado en los últimos tres años de forma exponencial. Según un estudio de EMC, mientras en 2010 había disponibles 1227 Exabytes (miles de millones de Gigas), en 2015 habrá 8591 Exabytes y en 2020 habrá disponibles 40 mil Exabytes. Esto se explica no sólo por la cantidad de información generada por usuarios cada vez más conectados, sino también por la nueva generación de Internet en la que “las cosas” generarán y publicarán su propia información.

Se calcula que contra los 7.6 mil millones de personas conectadas en 2020, habrá 200 mil millones de “cosas” conectadas. EMC considera que todavía hay un gran camino por recorrer en el mundo del big data: 23 por ciento del universo digital sería útil si fuera etiquetado y analizado, el 3 por ciento podría ser efectivamente analizado en la actualidad y considera que apenas el 1 por ciento del contenido es realmente analizado en realidad. De la información que debería estar protegida, apenas el 19 por ciento lo está.

El 68 por ciento de la información del universo digital es generada y usada por los mismos consumidores, en redes sociales, enviando imágenes y videos, entre dispositivos móviles. En 2012 se alcanzaron 400 millones de tweets por día, mil millones de usuarios de Facebook y 20 mil millones de mensajes de texto.

Y lo mejor es que hay “esperanza” para los países emergentes: para 2020 los mercados emergentes reemplazarán a los países desarrollados como los principales productores de datos mundiales. Tal evolución de los datos está generando una oportunidad para empresas, organizaciones, redacciones que están cambiando la forma de acceder a las noticias, a información sensible, a campañas de marketing y a las redes sociales.

La plataforma abierta Hadoop –que forma parte de la Fundación

Un presidente con mucha data

Un presidente con mucha data

Apache, servidor basado en Linux que se usa en el 70 por ciento de los web servers de Internet– está destinada a buscar, analizar e interpretar grandes volúmenes de datos. Nuevas imágenes tridimensionales se utilizan para comprender gráficamente evoluciones mundiales. Nuevas herramientas de visualización aparecen para comprender, por ejemplo, cómo viajan los aviones por el mundo, cómo se mueve una epidemia a nivel global con niveles de precisión y prevención notables, cómo se visualizan las relaciones de Facebook de manera geolocalizada.

El tema es el santo grial de la nueva economía de las grandes empresas, y hasta tiene una gran conferencia organizada por O’Reilly llamada Strata, “haciendo trabajar a los datos” es su slogan, y suele llevar la frase “únase a la revolución de los datos” (suena mejor en inglés, “Join the Data Revolution”) donde se proponen desafíos para resolver problemas de grandes volúmenes de datos.

En Argentina, por ejemplo, Level 3 –empresa que adquirió otro de los grandes carriers mundiales, Global Crossing y que administra cerca del 70 por ciento del tráfico global de Internet– centró en Buenos Aires su quinto foro sobre el tema de Big Data, también como una de las soluciones que ofrece la empresa.

El análisis de los grandes volúmenes de datos sirve para entender el sistema de salud, el procesamiento de las telecomunicaciones y comprender las utilidades. “No lo veo como un riesgo. El problema es el volumen de la información a guardar, los formatos de las bases de datos, que no haya cuellos de botella, tratar de que las aplicaciones de big data que requieren almacenamiento no se vean con cuello de botella”, dice Alejandro Girardotti, gerente de gestión de producto de Level 3 para América latina, dispuesto a defender la aplicación Smart One.

Entre las nuevas empresas que habrá que tener en cuenta este año están 10gen, BitYota, Clear Story o Zoomdata, emprendimiento que visualiza los intereses de sus clientes en tiempo real. La idea de analizar las actitudes de las personas en Internet está siendo muy utilizada por las grandes empresas que tratan de comprender qué quieren sus consumidores.

“Una de las aplicaciones más usadas es analizar el comportamiento de un consumidor mediante sus perfiles de compra y a través de la identificación de los compradores con programas de fidelidad, analizarlo lo más rápido posible. En fin, los datos llegaron al poder: ayer Harper Reed hizo check-in en Foursquare desde la Casa Blanca, alguien usará esa información cuando sea necesario, incluso sobre Reed, quien ya no trabaja para la campaña.

X

Envíe a un amigo

Su nombre (requerido)

Su Email (requerido)

Amigo(requerido)

Mensaje

Añadir comentario