big data analytics

¿Qué es Big Data? Hacia dónde se dirige el Big Data

 

Big data. Se estima que 5,9 millones de cámaras de vigilancia vigilan el Reino Unido. Si bien esto puede sonar mal para aquellos que no saben que están siendo vigilados, esta red de cámaras de circuito cerrado de televisión ayudó a las autoridades británicas a reconstruir el misterioso envenenamiento de Sergei Skripal, un ex agente de inteligencia ruso convertido en doble agente, y su hija, Yulia.

Todos los reconocimientos que se realizaron por personas contratadas por su capacidad superior a la media para reconocer rostros se clasificaron en miles de horas de metraje de vídeo y, finalmente, dieron con dos sospechosos en particular. Los dos habían volado al aeropuerto de Gatwick en Londres y luego viajaron a Salisbury, donde llevaron a cabo el ataque. A través de la investigación, la policía británica identificó y acusó a los hombres, agentes de inteligencia rusos, de intento de asesinato.

Tener una meta, un propósito explícito en la recolección y análisis de un conjunto de datos, es cómo los científicos pueden aprovechar el poder de los datos para resolver problemas y responder preguntas.

El público llamaría a estos grandes datos en acción: una masa de imágenes de vídeo analizadas por analistas policiales especialmente entrenados para resolver un crimen internacional. El caso es una historia de héroes y villanos que se resuelve con una minuciosidad propia de Sherlock Holmes. Pero cuando reducimos nuestro lenguaje al término big data, la historia cambia. Corremos el riesgo de olvidar por qué recopilamos datos en primer lugar: para mejorar nuestro mundo a través de detalles granulares, como un pintor al óleo con una espátula.

El nuevo lenguaje de los datos

bigdataConocer la historia hace que los datos sean valiosos. Tener una meta, un propósito explícito en la recolección y análisis de un conjunto de datos, es cómo los científicos pueden aprovechar el poder de los datos para resolver problemas y responder preguntas, que van desde la pregunta de quién envenenó a los Skripals hasta la pregunta banal de por qué las canciones veraniegas contemporáneas tienden a sonar similares.

La forma en que hablamos sobre los datos es importante, porque determina la forma en que pensamos sobre los datos. Y las formas en que aplicamos, financiamos y apoyamos los datos hoy en día determinarán el futuro de nuestra sociedad.

La analítica de datos moderna permite a los científicos responder a preguntas complejas utilizando técnicas altamente específicas. Sin embargo, el público continúa utilizando el término generalizado de big data y todas sus iteraciones – tecnología de big data, análisis de big data y herramientas de big data – para describir sus métodos.

Entonces, ¿por qué seguimos escuchando el término «big data»? 

¿Qué es Big Data?

 

Al principio de la era de la información, el big data parecían describir adecuadamente los cambios tecnológicos, culturales y económicos de principios de la década de 2000.

Empezamos a tener acceso a un montón de nuevas formas de datos: datos de la web, datos de dispositivos móviles y, más recientemente, datos de redes de sensores. Anteriormente, gran parte de los datos que utilizaban los académicos se basaban en encuestas y otros tipos de información administrativa. Las cifras se organizaron claramente en categorías predeterminadas: por ejemplo, el número de empleados que califican sus experiencias laborales como satisfactorias, o el número de graduados universitarios que ganan más de 50.000 euros al año.

Pero estos nuevos datos digitales eran diferentes y demostraron lo que los teóricos llaman las tres V: variedad, velocidad y volumen.

Big-DataLos datos de origen digital tienen una variedad en el sentido de que se recogen con diferentes grados de estructura. Los datos pueden estar muy desestructurados; los mensajes de audio, vídeo y medios sociales pueden considerarse datos no estructurados. Una empresa puede recopilar datos más estructurados sobre los clics de los clientes en su sitio web, o una persona puede hacer un seguimiento de su ritmo cardíaco y actividad física con un dispositivo portátil, pero los datos deben organizarse para que sean útiles. Los datos multiestructurados pueden incluir combinaciones de datos estructurados y no estructurados, organizados por atributos similares.

Nuevos datos con nuevas caracteríticas

Este nuevo tipo de datos tiene velocidad, lo que significa que los números entran rápidamente y pueden ser procesados muy rápidamente. Hoy en día, una empresa puede procesar en tiempo real los datos recogidos de los dispositivos móviles utilizando herramientas de análisis y minería de datos.

Estos datos también tienen un volumen. Las últimas tecnologías desarrolladas en el cambio de milenio dieron como resultado lo que se llama «una manguera de datos». Alrededor de esta época, nació el término «big data».

El concepto de big data se hizo popular porque captó el hecho de que sentíamos que estábamos inundados de datos de repente. Es difícil exagerar la magnitud de este momento. 

Hoy en día, el concepto de big data no sólo es menos convincente, sino que también es potencialmente engañoso.

Pero en las últimas dos décadas, el big data se han reducido al tamaño adecuado. Los científicos de datos han creado nuevas herramientas para recolectar, almacenar y analizar estas grandes cantidades de información. En cierto modo, la parte «grande» se ha vuelto menos preocupante.

Un paso más en la idea de big data

Hoy en día, el concepto de big data no sólo es menos preocupante, sino que también es potencialmente engañoso. El tamaño es sólo uno de los muchos aspectos importantes de un conjunto de datos. El término «big data» alude a la idea errónea de que un volumen elevado significa buenos datos y una sólida comprensión.

Hay que entender que el volumen no es suficiente para obtener buenas respuestas.

La historia que contamos sobre los datos – las preguntas que hacemos sobre los números y la forma en que los organizamos – importa tanto como, si no más, el tamaño del conjunto. Los profesionales que trabajan con datos deben concentrarse en limpiar bien los datos, clasificarlos correctamente y comprender la historia que los rodea.

que es big dataAl pensar sistemáticamente en los datos, desde nuestro idioma hasta nuestros métodos, podemos posicionarnos mejor para utilizar la ciencia de los datos para el bien de nuestras comunidades.

Llega la humanización de los datos

En la prestigiosa Berkeley hay un programa que desafía a los estudiantes a abordar los datos con intencionalidad, comenzando por la forma en que hablan de los datos. Aprenden a cavar más profundamente haciendo preguntas básicas: ¿De dónde provienen los datos? ¿Cómo se recolectó y si el proceso fue ético? ¿Qué tipo de preguntas puede responder este conjunto de datos y cuáles no?

Este proceso es parte de la ciencia de los datos. Una forma más útil de abreviar que los grandes datos, las palabras implican el riguroso enfoque de la analítica y la minería de datos.

La ciencia de los datos, al igual que las ciencias sociales y otras ciencias, no se trata sólo de utilizar las herramientas. También hay que usar las herramientas de una manera que permitan resolver problemas y dar sentido a los datos de una manera sistemática. En última instancia, un conjunto de datos no es tanto una pintura para admirar como una ventana para utilizar; los científicos utilizan los datos para ver el mundo y los problemas de nuestra sociedad con mayor claridad.

Al pensar sistemáticamente en los datos, desde nuestro idioma hasta nuestros métodos, podemos posicionarnos mejor para utilizar la ciencia de los datos para el bien de nuestro estilo de vida.

 

¿Te ha quedado más claro lo que significa el big data? ¿Crees que es necesaria esta humanización de los datos?

Si te ha gustado o te ha parecido interesante COMPÁRTELO



Pin It on Pinterest

Share This