Qué es big data

Tipos de big data

La recopilación de datos es diferente para cada organización. Con la tecnología actual, las organizaciones pueden recopilar datos estructurados y no estructurados de una variedad de fuentes, desde el almacenamiento en la nube hasta las aplicaciones móviles y los sensores de IoT en las tiendas, entre otros. Algunos datos se almacenarán en almacenes de datos donde las herramientas y soluciones de inteligencia empresarial pueden acceder a ellos fácilmente. A los datos crudos o no estructurados que son demasiado diversos o complejos para un almacén se les pueden asignar metadatos y almacenarlos en un lago de datos.

Una vez recogidos y almacenados los datos, deben organizarse adecuadamente para obtener resultados precisos en las consultas analíticas, especialmente cuando son grandes y no están estructurados. Los datos disponibles crecen exponencialmente, lo que convierte el procesamiento de datos en un reto para las organizaciones. Una opción de procesamiento es el procesamiento por lotes, que examina grandes bloques de datos a lo largo del tiempo. El procesamiento por lotes es útil cuando hay un tiempo más largo entre la recogida y el análisis de los datos. El procesamiento de flujos examina pequeños lotes de datos a la vez, acortando el tiempo de espera entre la recogida y el análisis para una toma de decisiones más rápida. El procesamiento de flujos es más complejo y a menudo más caro.

¿Qué es el análisis de big data?

¿Qué es el big data? Es una buena pregunta. Parece que hay tantas definiciones de big data como empresas, organizaciones sin ánimo de lucro, agencias gubernamentales y particulares que quieren beneficiarse de él.

Una interpretación popular de big data se refiere a conjuntos de datos extremadamente grandes. Un informe del Instituto Nacional de Estándares y Tecnología definió los big data como “conjuntos de datos extensos -principalmente en las características de volumen, velocidad y/o variabilidad- que requieren una arquitectura escalable para un almacenamiento, manipulación y análisis eficientes”. Algunos han definido los big data como una cantidad de datos que supera un petabyte -un millón de gigabytes-.

Estos datos proceden de innumerables fuentes: teléfonos inteligentes y publicaciones en las redes sociales; sensores, como señales de tráfico y contadores de servicios públicos; terminales de puntos de venta; dispositivos portátiles de los consumidores, como los medidores de peso; historiales médicos electrónicos; y un largo etcétera.

En las profundidades de estos datos hay inmensas oportunidades para las organizaciones que tienen el talento y la tecnología para transformar sus vastos almacenes de datos en una visión procesable, una mejor toma de decisiones y una ventaja competitiva.

Ejemplos de big data

El término big data se refiere a los grandes y diversos conjuntos de información que crecen a un ritmo cada vez mayor. Abarca el volumen de información, la velocidad o rapidez con la que se crea y recopila, y la variedad o el alcance de los puntos de datos que se abarcan (lo que se conoce como las “tres v” del big data). Los big data suelen proceder de la minería de datos y llegan en múltiples formatos.

Los big data pueden clasificarse como no estructurados o estructurados. Los datos estructurados consisten en información ya gestionada por la organización en bases de datos y hojas de cálculo; suelen ser de naturaleza numérica. Los datos no estructurados son información que no está organizada y no se ajusta a un modelo o formato predeterminado. Incluye datos recogidos de fuentes de medios sociales, que ayudan a las instituciones a recopilar información sobre las necesidades de los clientes.

Los big data pueden recopilarse a partir de comentarios compartidos públicamente en redes sociales y sitios web, recogidos voluntariamente en aparatos electrónicos y aplicaciones personales, mediante cuestionarios, compras de productos y registros electrónicos. La presencia de sensores y otras entradas en los dispositivos inteligentes permite recopilar datos en un amplio espectro de situaciones y circunstancias.

Cómo funciona el big data

Con la tecnología que ya ha alcanzado el pináculo de su más alta implementación de uso, usted sería bastante consciente de sus principales funcionalidades, procesos, usos y la importancia general. En agosto de 2015, se coló en el Hype Cycle 2015 de Gartner para las tecnologías emergentes y creó un gran revuelo en el mundo de la tecnología.

Si no has sido tan experto en tecnología y te has perdido información crucial sobre lo que es el Big Data, este artículo te proporcionará detalles sobre todo lo que necesitas saber desde el principio para entender mejor la tecnología.

Tal y como lo define Gartner, “los Big Data son activos de información de gran volumen, alta velocidad o alta variedad que requieren nuevas formas de procesamiento para permitir una mejor toma de decisiones, el descubrimiento de información y la optimización de procesos”.

El término “big data” se explica por sí mismo: una colección de enormes conjuntos de datos que las técnicas informáticas normales no pueden procesar. El término no sólo se refiere a los datos, sino también a los diversos marcos, herramientas y técnicas implicados. Los avances tecnológicos y la aparición de nuevos canales de comunicación (como las redes sociales) y de nuevos dispositivos más potentes han supuesto un reto para los agentes del sector en el sentido de que tienen que encontrar otras formas de manejar los datos.