¿Qué es y cómo funciona el «BIG DATA»? (1ra parte)
¿Qué es el Big Data?
¿Sabías que el motor de un avión es capaz de generar más de 10 terabytes de datos en solo 30 minutos de vuelo? ¿Y cuántos vuelos hay en un día? Esto da varios petabytes de información a diario. La Bolsa de Nueva York genera cada día alrededor de un terabyte de datos sobre nuevas operaciones. Las cargas de fotos y vídeos, los mensajes y los comentarios en Facebook crean más de 500 terabytes de datos nuevos diariamente. Todo eso hace un montón de datos, ¿verdad? Pues eso es lo que llamamos Big Data.
El Big Data se está convirtiendo en algo ya indisociable de nuestras vidas. Todo el mundo utiliza algún tipo de tecnología o se pone en contacto con productos y grandes empresas. Esas grandes empresas nos ofrecen sus datos y a la vez utilizan los datos que les ofrecemos. Los analizan constantemente para conseguir que su producción sea más eficaz y desarrollar nuevos productos.
Para entender bien el Big Data, resulta de gran ayuda conocer un poco su historia. Por definición, el Big Data son datos de gran variedad, que llegan en volúmenes cada vez mayores y, además, a una velocidad cada vez mayor. Por eso, cuando hablamos de Big Data, siempre hablamos de las grandes V del Big Data. Y ahora hay más de tres, porque el concepto de Big Data ha evolucionado.
Hoy en día, el almacenamiento de datos es más barato que hace unos años, así que resulta más rápido y barato almacenar más datos. ¿Pero para qué queremos tantos datos? En realidad, los datos sirven para lo que sea: ofrecerlos a otros clientes, usarlos para crear nuevos productos y funcionalidades, tomar decisiones comerciales y muchas cosas más.
El nombre de Big Data no es nuevo, pero el concepto de manejar una gran cantidad de datos está cambiando. Lo que hasta hace poco llamábamos «Big Data» eran muchos menos datos de lo que son ahora. En realidad, todo empezó en los años 60, cuando empezaron a abrirse los primeros almacenes de datos.
Cuarenta años después, las empresas vieron cómo podían recopilarse conjuntos de datos a través de servicios en línea, sitios web, aplicaciones y cualquier producto con el que interactúan los clientes. Así es como empezaron a popularizarse los primeros servicios de Big Data (Hadoop, NoSQL, etc.). Era imprescindible tener esas herramientas, porque simplifican el análisis de los Big Data y lo abaratan.
El Internet de las cosas ya no es solo un sueño. Ahora hay más dispositivos conectados a Internet, recopilando datos sobre patrones de uso de los clientes y eficacia de los productos. De repente alguien pensó: «¿Por qué no lo usamos para que las máquinas aprendan por sí solas?» Así es como nació el aprendizaje automático, o machine learning, y también se empezaron a generar datos con él.
¿Puedes hacerte una idea de cuántos datos significa eso? Y, además, ¿puedes imaginarte cuántos usos puedes darles a todos estos datos? Todos estos datos pueden ayudarte a tomar decisiones porque tienes toda la información que puedas necesitar. Puedes resolver cualquier problema o dificultad muy fácilmente.
Dicho de otro modo, el Big Data son unos conjuntos de datos más grandes y complejos, que se reciben sobre todo de nuevas fuentes de datos. Esos conjuntos de datos son tan grandes que a los programas de software tradicionales que se usaban para procesar los datos no les resultaba fácil gestionarlos, así que se crearon nuevas herramientas y nuevos programas de software.
¿Por qué es tan importante el Big Data?
El Big Data tiene un potencial enorme. Puedes usar la valiosa información que proporcionan estos datos para tomar decisiones de marketing sobre tu producto y tu marca. Las marcas que usan Big Data son capaces de tomar decisiones comerciales más rápido y con mejor criterio. Si usas toda la información que tienes sobre tus clientes, puedes hacer que el producto esté más centrado en el cliente y crear los contenidos que él quiere o personalizar sus itinerarios. Es más fácil tomar decisiones cuando tienes toda la información que necesitas, ¿verdad?
Por poner un ejemplo, ya sabemos lo útil que es el Big Data en la investigación médica, cuando se usa para identificar el riesgo de contraer determinadas enfermedades, según el historial médico del paciente o la forma de tratar algunas enfermedades. Este es solo un ejemplo del uso del Big Data, pero es uno de los más importantes.
Los sistemas de citas por Internet pueden ser un 90 % más precisos una vez que las máquinas aprenden cómo unir perfectamente a las parejas basándose en toda la información que tienen sobre dos personas. Los fallos o errores informáticos pueden minimizarse porque sabrás en qué condiciones pueden producirse. Un coche que conduzca solo puede ser más seguro que cualquier otro coche conducido por una persona porque no comete errores humanos. Analiza la información del Big Data en tiempo real y sabe cuál es la mejor ruta para llegar a tu destino a tiempo.
Basándose en toda la información que tienen sobre sus clientes, ahora las empresas pueden predecir con exactitud qué segmentos de sus clientes querrán comprar sus productos y en qué momento, y así sabrán cuál es el mejor momento para lanzarlos. El Big Data ayuda además a las empresas a desarrollar su actividad de una forma mucho más eficaz.
El Big Data es importante para el progreso de nuestra tecnología y puede facilitarnos la vida si lo utilizamos con acierto y de forma positiva. El potencial del Big Data es ilimitado, pero vamos a ver algunos casos prácticos de uso.