Big data se conoce como

Qué es el big data

En la antigüedad, gran parte del conocimiento registrado del mundo se encontraba en un solo lugar: la Biblioteca de Alejandría en Egipto. Casi todas las culturas e imperios de la época reconocían a la biblioteca como el epicentro de la erudición. Hoy, sin embargo, la información está cada vez más descentralizada. Los vastos depósitos de rollos de papiro de Alejandría podrían caber ahora en una sola unidad flash. En el siglo XXI, la información digital se crea, analiza y almacena a un ritmo asombroso. Pensemos que el 90% de los datos del mundo se han producido en sólo los dos últimos años. Esta explosión de información se conoce como “Big Data”, y está transformando completamente el mundo que nos rodea.

Los grandes datos son ya una parte integral de todos los sectores de la economía mundial, un factor de producción tan esencial como el capital físico y humano. Gran parte de nuestra actividad económica moderna simplemente no podría funcionar sin ellos. El principal motor del Big Data es la cantidad casi incalculable de datos transaccionales que producen las empresas, las instituciones financieras y los intermediarios en línea. Esto incluye billones de bytes de información sobre compradores, proveedores y operaciones de interés crítico para las empresas y los analistas financieros.

Big data wikipedia

En pocas palabras, los big data son conjuntos de datos más grandes y complejos, especialmente los procedentes de nuevas fuentes de datos. Estos conjuntos de datos son tan voluminosos que el software de procesamiento de datos tradicional no puede gestionarlos. Pero estos volúmenes masivos de datos pueden utilizarse para resolver problemas empresariales que antes no habrían podido abordarse.

La velocidad es la rapidez con la que se reciben los datos y (quizás) se actúa sobre ellos. Normalmente, la mayor velocidad de los datos se transmite directamente a la memoria en lugar de escribirse en el disco. Algunos productos inteligentes con acceso a Internet operan en tiempo real o casi en tiempo real y requerirán una evaluación y acción en tiempo real.

La variedad se refiere a los muchos tipos de datos disponibles. Los tipos de datos tradicionales estaban estructurados y encajaban perfectamente en una base de datos relacional. Con el auge del big data, los datos se presentan en nuevos tipos de datos no estructurados. Los tipos de datos no estructurados y semiestructurados, como el texto, el audio y el vídeo, requieren un preprocesamiento adicional para derivar el significado y soportar los metadatos.

En los últimos años han surgido otras dos V: valor y veracidad. Los datos tienen un valor intrínseco. Pero no sirven de nada hasta que se descubre ese valor. Igualmente importante es saber hasta qué punto los datos son veraces y hasta qué punto se puede confiar en ellos.

Historia del big data

Big Data es el océano de información en el que nadamos cada día: enormes zettabytes de datos que fluyen desde nuestros ordenadores, dispositivos móviles y sensores de máquinas. Las organizaciones utilizan estos datos para tomar decisiones, mejorar procesos y políticas y crear productos, servicios y experiencias centrados en el cliente. Los Big Data se definen como “grandes” no sólo por su volumen, sino también por la variedad y complejidad de su naturaleza. Normalmente, superan la capacidad de las bases de datos tradicionales para capturarlos, gestionarlos y procesarlos. Además, los Big Data pueden proceder de cualquier lugar o cosa de la Tierra que podamos controlar digitalmente. Los satélites meteorológicos, los dispositivos del Internet de las Cosas (IoT), las cámaras de tráfico, las tendencias de las redes sociales… son sólo algunas de las fuentes de datos que se extraen y analizan para hacer que las empresas sean más resistentes y competitivas.

El verdadero valor de los Big Data se mide por el grado de capacidad de análisis y comprensión de los mismos. La inteligencia artificial (IA), el aprendizaje automático y las modernas tecnologías de bases de datos permiten que la visualización y el análisis de los Big Data ofrezcan información práctica en tiempo real. El análisis de Big Data ayuda a las empresas a poner sus datos en funcionamiento, para aprovechar nuevas oportunidades y construir modelos de negocio. Como afirmó acertadamente Geoffrey Moore, autor y analista de gestión, “Sin la analítica de Big Data, las empresas están ciegas y sordas, vagando por la red como un ciervo en una autopista”.

Análisis de big data

La analítica de big data es el uso de técnicas analíticas avanzadas contra conjuntos de big data muy grandes y diversos que incluyen datos estructurados, semiestructurados y no estructurados, de diferentes fuentes y en diferentes tamaños, desde terabytes hasta zettabytes.

¿Qué son exactamente los big data? Puede definirse como conjuntos de datos cuyo tamaño o tipo supera la capacidad de las bases de datos relacionales tradicionales para capturar, gestionar y procesar los datos con baja latencia. Las características de los big data incluyen un alto volumen, una alta velocidad y una gran variedad. Las fuentes de datos se están volviendo más complejas que las de los datos tradicionales porque están siendo impulsadas por la inteligencia artificial (IA), los dispositivos móviles, los medios sociales y el Internet de las cosas (IoT). Por ejemplo, los diferentes tipos de datos proceden de sensores, dispositivos, vídeo/audio, redes, archivos de registro, aplicaciones transaccionales, web y medios sociales, muchos de ellos generados en tiempo real y a muy gran escala.

Con la analítica de big data, puede impulsar una toma de decisiones mejor y más rápida, la modelización y predicción de resultados futuros y la mejora de la inteligencia empresarial. A la hora de crear su solución de big data, considere el software de código abierto como Apache Hadoop, Apache Spark y todo el ecosistema Hadoop como herramientas de procesamiento y almacenamiento de datos rentables y flexibles, diseñadas para manejar el volumen de datos que se genera hoy en día.