03 Dic Diferencia entre Big Data y Data Science
La explosión de información derivada de Internet y ha generado que el volumen de datos generados supera a la comprensión humana. De hecho, Google estima que cada 48 horas generamos tantos datos en Internet como los que ha generado la civilización desde su inicio hasta el 2003. Este gran volumen de datos ha hecho necesaria la creación de nuevas estructuras que permitan su gestión para el análisis y la toma de decisiones adecuadas.
Convertir datos en algo de valor para el negocio, es el nuevo foco estratégico en el que las empresas están avanzando. Es por lo que el Big Data se ha convertido en un nuevo sector profesional por derecho propio.
Pero, ¿en qué se diferencia el Big Data del Data Science?
Big Data hace referencia a las estrategias de Ingeniería del Software para el diseño e implementación de sistemas escalables intensivos en datos. Por tanto Big Datase centra en el desarrollo de software capaz de gestionar grandes cantidades de datos (Volumen), datos que se generan en tiempo real y/o que necesitan ser procesados para dar una respuesta en tiempo real (Velocidad), y datos con una estructura diversa (Variedad).
El objetivo de Big Data es construir la infraestructura que soporte la escalabilidad horizontal y los tiempos de respuesta adecuados según el proyecto concreto. Sobre esas arquitecturas, se desarrollarán posteriormente los procesos analíticos de datos para extraer valor de los datos por parte de los Data Scientist.
Big Data y Data Science, por lo tanto, son dos campos diferentes y complementarios.
Existirán proyectos Big Data donde el objetivo será hacer escalable un sistema que actualmente no lo es y que por tanto no requiera estrategias de Data Science. También existirán proyectos donde será necesario analizar de forma inteligente ciertos datasets pero que no se requiera el potencial de las tecnologías Big Data. Y por último, existirán proyectos donde se necesite la construcción de sistemas Big Data escalables y aplicar sobre esas infraestructuras, algoritmos inteligentes de Data Science para extraer el auténtico valor de los datos.
Sin comentarios