CIENCIA DE DATOS: TIERRA DE TODOS

En este episodio del podcast Aguacast entrevistamos a la Dra. Camila Rangel Smith, PhD en Física de Partículas, Universidad de París Diderot e investigadora científica de datos del Instituto Nacional de Ciencia de Datos Alan Turing del Reino Unido.

Ilustración de Ada Peña.

¿Qué es la ciencia de los datos? ¿Cuál es la diferencia entre las viejas y conocidas estadísticas y la naciente ciencia de los datos? ¿Para qué sirve y para qué no sirve la ciencia de los datos? ¿Es la ciencia de los datos una panacea que llegó para quedarse o una burbuja que puede desinflarse en cualquier momento? Diferencias entre ciencia de los datos en la academia y en la industria. No dejen de escucharlo, es realmente iluminante.

 

La ciencia de datos es la interdisciplinaridad entre distintas herramientas, la estadística es una, pero también implica moverte mejor con las herramientas computacionales que te permiten manejar grandes cantidades de datos. Está el machine learning o aprendizaje supervisado, algoritmos que te ayudan a sacar información de los datos dependiendo de la pregunta que te hagas.

(…)

La ciencia de datos es tierra de todos, todos podemos contribuir allí. Tenemos gente de ciencias de la computación comunicándose con gente que hace estadísticas puras y a gente que construye todos estos sistemas para manejar grandes datos.

(…)

Generalmente, en mi instituto, uno trabaja en dos proyectos a la vez. Uno de mis proyectos es aplicado a problemas de la economía. La idea es construir un modelo de la economía del Reino Unido, de las transiciones de los trabajadores de Reino Unido, por ejemplo en el caso de un choque a la economía como podría ser el Brexit, entonces este modelo nos podría permitir entender eso.

(…)

El algoritmo no sabe de sesgos, el algoritmo aprende de los datos. Uno de los problemas más grandes que enfrenta un científico de datos es entender los datos con los que está trabajando, limpiarlos y asegurarse que esos datos son una muestra representativa de lo que se quiere modelar en el futuro.

(…)

En la academia es más fácil ser honesto y salir desde el comienzo cuando empieza un proyecto, decir «hey! magia aquí no se hace», sabemos que todo tiene sus complicaciones. Pero ahora en la industria, donde muchos físicos, matemáticos y gente de ciencias de la computación son reclutados por estas grandes compañías, allí te llegan pidiendo magia desde el día uno, al científico de datos.

(…)

Lo más complicado es formular la pregunta correcta con los datos que la industria tiene. Lo más difícil es conseguir datos y entenderlos. En ese forcejeo con la industria es difícil  hacer aterrizar a los que están poniendo el dinero a qué es lo que realmente se puede hacer con machine learning y con estos algoritmos.

(…)

En unos años la burbuja y la moda ha de haber pasado y vamos a entender un poco mejor realmente qué es la ciencia de datos y cuál es su capacidad real de resolver problemas. Pero estamos todavía en el momento en el que todo se ve muy maravilloso maravilloso y el hype es muy alto.

(…)

Es importante que los entes regulatorios, los gobiernos, se pongan al día en la parte de las regulaciones sobre cómo funcionan los algoritmos, sobre la transparencia. O tienes un algoritmo muy bueno sin sesgo o uno que no puedes entender. Hasta qué punto estamos dispuestos a no entender algoritmos que pueden tomar decisiones de la vida, de salud o financieras.

 

 

Escucha completa esta fascinante entrevista.

 

El Aguacast es producido por Fundación Persea
Coordinación y montaje: Alexandra De Castro
Conducción: Jesús Pineda y Víctor Hernández
Edición y sonido: Víctor Hernández
Introducción: Briccyl Cova
Logo e ilustraciones: Ada Peña
Música: Trace Hunters Department (ID 281) by Lobo Loco.

AGRADECIMIENTOS

La Fundación Persea agradece la infinita generosidad de sus patrocinadores: Carlos Ortega Sr., Sobella Mejías, Solmar Valera, Jiří Svozilík, Leonardo Quevedo, Héctor Pittman Villarreal,  My fit body project y Vicente Di Clemente.

 

 

Conviértete en patrocinador de la fundación, sé partícipe activo de la creación de cultura científica en América Latina. Desde solo $1 mensual ya serás de gran apoyo.

Comparte tus pensamientos

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.