Cuando escuchas el término Big Data o ciencia de datos, ¿qué te viene a la mente? Estos términos se filtran y se convierten en parte del mundo académico e industrial.

Es cierto que, aparentemente, son términos relativamente nuevos, sin embargo, la pregunta sigue siendo, ¿son realmente términos nuevos o existen desde hace un tiempo? Entonces, ¿qué es Big Data y qué hace exactamente un científico de datos?

Big Data puede definirse esencialmente como grandes volúmenes de datos online, asi como también actualmente datos offline. La mayoría concluiría que el inicio de big data comenzó con el inicio de Google. Sin embargo, big data es el comportamiento online de las personas, que se rastrea y recopila. Esto es lo que se denomina “dataficación”. Por lo tanto, los datos son recopilados por grandes empresas comerciales y luego se convierten en productos de datos. En otras palabras, tu conducta online dictará que tipo de producto pueden recomendarte. Por ejemplo, tus visualizaciones en YouTube dictarán las recomendaciones de YouTube, y lo mismo ocurre con Facebook y otras plataformas sociales.

Sin embargo, Big Data es más grande y desestructurado, y sin el conocimiento de cómo interpretarlo, es inútil intentarlo. Aquí es donde entra en juego la necesidad de un científico de datos. Esto nos remite a nuestra pregunta anterior: ¿qué es un científico de datos? Antes de que podamos definir qué es un científico de datos, quizás ayudaría si definiéramos primero qué es la ciencia de datos. Data science es un campo interdisciplinario que utiliza métodos científicos, procesos, algoritmos y sistemas para extraer conocimientos y un mejor entendimiento de los datos de diversas formas, tanto estructuradas como no estructuradas.

Por lo tanto, podríamos concluir en que un científico de datos participa en la ingeniería civil de datos, analiza, evalúa e interpreta datos grandes y complejos. Entonces, ¿son los científicos de datos solo estadísticos? En particular, todavía no hay un estudio formal de científico de datos en el mundo académico, sin embargo, es un puesto de trabajo muy codiciado actualmente. Hay una diferencia entre lo que aprendemos y lo que hacemos en los trabajos. Entonces, ¿los científicos de datos aprenden en el trabajo?

Si es así, ellos probablemente tienen la base práctica y teórica necesaria para tal trabajo, pero dados los requerimientos actuales para un científico de datos, podrían funcionar mejor en un equipo de trabajo. Se espera que esté familiarizado con múltiples campos, como la informática, las estadísticas, la comunicación y el aprendizaje automático, solo por mencionar algunos, entonces, armando un equipo de personas que poseen al menos una o dos de las habilidades requeridas, podría lograrse el objetivo común. Un científico de datos, como hemos mencionado, analiza e interpreta datos grandes y complejos, respaldados por sus habilidades de ingeniería de software, pero no solo hacen esa tarea, sino que también establecen la estrategia de datos para la empresa para la que trabajan y comunican los mismos visualizados en forma clara. Por lo tanto, ayudan a dirigir la toma de decisiones basada en datos para ofrecer mejores productos y servicios a sus clientes.