Por qué la gestión de datos es clave en la era del big data

Big Data

Por qué la gestión de datos es clave en la era del big data

Publicado hace 2 meses

A medida que el volumen de datos que producimos aumenta en tamaño, exploramos los remedios con la información de representantes de Alteryx, Seagate, Segment y más.

A medida que los datos y su análisis han pasado de las manos de los científicos de datos especializados a entornos mucho más accesibles para toda la empresa, se ha vuelto cada vez más importante tener una idea clara de la estrategia de gestión de datos y las mejores prácticas que implica.

Uno de esos enfoques, DataOps, implica conectar a los creadores y consumidores de datos. De acuerdo aun informeEscrito por la empresa de almacenamiento de datos Seagate e IDC, la mayoría de las empresas consideran que DataOps es al menos muy importante, con un 71%, 72% y 73% de los que ven un aumento en la lealtad del cliente, los ingresos y las ganancias, respectivamente. Rose Hiu, vicepresidente de marketing global y relaciones públicas de Seagate, dice que DataOps “significa garantizar que la clasificación de datos sea sólida pero flexible, y que cada conjunto de datos tenga un propósito designado. Las empresas deben ver DataOps como el eslabón perdido en su gestión de datos, donde la integración ocupa un lugar central ”

Conclusiones clave de Informe de Seagate e IDC Rethink Data

“Todos los días, las empresas demuestran que los datos tienen un valor tremendo cuando se capturan, almacenan y aprovechan al máximo, una tarea cada vez más difícil en un mundo de múltiples nubes y bordes que cambia rápidamente. La explosión en la creación de datos, junto con la creciente necesidad de movilizarlos y analizarlos a un volumen y velocidad sin precedentes, proporcionan un telón de fondo complejo. Mientras tanto, la escasez de recursos y las limitaciones de la tecnología exacerban los puntos débiles de la empresa a medida que la arquitectura de TI y las prácticas de gestión de datos evolucionan para capitalizar la enorme oportunidad de poner más datos en funcionamiento ".

Cualquiera que sea el enfoque que se adopte, hay una serie de principios básicos compartidos para la gestión de datos, como garantizar que se mantenga un alto nivel de calidad. Sin embargo, no siempre fue así, como explica Jean-Michel, director senior de gobernanza de datos de Talend: “No hace mucho, la mayoría de las empresas creían que la calidad de los datos no era su preocupación. Sin embargo, ahora, las empresas no solo comprenden el valor de los datos, sino que también comprenden los riesgos y problemas que pueden surgir si los datos no se manejan correctamente. La idea de que los datos son un activo finalmente se está generalizando ".

Los protocolos adecuados
Ese nivel de cuidado debe estar presente desde el principio, de lo contrario todo el proyecto se construirá sobre cimientos inestables. Hiu dice: “Aconsejamos a las empresas que identifiquen y clasifiquen sus flujos de información de manera adecuada. Deben preguntar dónde se almacenarán los datos, qué tipo de datos adquirirán y si serán datos de ventas, registros de tiempo de los empleados o activos de IoT. Las soluciones de gestión de datos pueden ahorrar una cantidad significativa de tiempo mediante la automatización de estos procesos, pero sus decisores de TI vitales determinan los protocolos correctos desde el principio ". 

Eso se hace más fácil si se desmitifican las formas de interactuar con los datos, como explica Alan Gibson, vicepresidente de EMEA, Alteryx: “Sin ninguna duda, hacer que los datos y los análisis sean más accesibles e intuitivos debe ser la prioridad clave a medida que avanzamos en 2021 y más allá. Las organizaciones solo pueden lograr una transformación efectiva basada en datos cuando promueven una cultura analítica. Esto significa llevar a todos los miembros de la empresa en el camino mediante la democratización de los datos ".

Las organizaciones pueden ganar todo al dar ese salto y, de hecho, la gestión de datos adecuada puede ser un requisito previo para el éxito en economías cada vez más digitales. “El futuro está amplificando la inteligencia humana a través de plataformas de análisis de datos de autoservicio”, dice Gibson. “Al eliminar la necesidad de un título en ciencia de datos, estas plataformas significan que cualquiera puede ser elevado a analista de datos. Empoderar a los trabajadores de datos para crear rápidamente modelos predictivos repetibles basados ​​en inteligencia artificial sin la necesidad de codificar o realizar estadísticas complejas ".

Demanda de datos
El hecho de que demanda de científicos de datosSin embargo, está aumentando muestra que quedan muchos desafíos en la gestión de datos que requieren el ingenio humano para solucionarlos. Si bien las máquinas pueden volverse más inteligentes, solo son tan buenas como los datos en los que están capacitados, todo lo cual requiere un etiquetado adecuado. “El esfuerzo que se requiere en la actualidad para manipular los datos en un formato significativo y con capacidad de consulta es un desafío”, dice Simon Cole, CEO de Automated Intelligence. “El 80% de los datos que posee una empresa no están estructurados; estos datos son difíciles de examinar, estructurar y extraer valor ".

También está la cuestión de los llamados datos "heredados" que se encuentran en las organizaciones, que pueden diferir en formato y plantear el riesgo de hacer que los conjuntos de datos no sean confiables si no se limpian adecuadamente. De manera similar, las múltiples fuentes de datos disponibles para una empresa moderna deben reunirse para que sean de alguna utilidad. "Los mayores desafíos provienen de la fragmentación de datos", dice Tido Carriero, director de desarrollo de productos de Segment. "A medida que aumenta el número de puntos de contacto con los clientes, se vuelve más difícil para las empresas asegurarse de tener una comprensión completa y confiable de sus clientes".

Carriero enfatiza que los mayores desafíos caen bajo este paraguas de coordinación inadecuada. “De manera similar, los silos de datos pueden evitar que los equipos obtengan los datos que necesitan y crear puntos ciegos que pueden generar problemas de seguridad y privacidad. Otros desafíos comunes se relacionan con tener datos incompletos o poco confiables. Muchas empresas siguen utilizando métodos de captura de datos fortuitos que no se actualizan en tiempo real, mientras que otras no tienen un sistema claro para dar sentido a sus datos y ponerlos en práctica. A menos que se pueda activar, los datos son un recurso inútil, por lo que esta es una verdadera oportunidad perdida ".

A medida que la sociedad se vuelve cada vez más ávida de datos, la correcta gestión de dichos datos solo cobrará más importancia. Dominar los grandes volúmenes de datos que se producen diariamente será clave para la mejora continua de la inteligencia artificial, como explica Cole: “El 80% del tiempo que dedican los científicos de datos a manipular datos para convertirlos en una forma útil. Se requiere una capacidad repetible automatizada e inteligente en torno a la captura de datos, el rastreo de linajes, la calidad y el conocimiento para la inteligencia artificial y el aprendizaje automático para estandarizar la gestión de datos de una manera abierta y transparente ".

ARTÍCULOS RELACIONADOS
La marcha imparable de la analítica de datos
Novedad

La marcha imparable de la analítica de datos

  Publicado hace 5 meses

© 2021 Hub Digital, Todos los derechos reservados