Ciencia de datos ágil: proceso de ciencia de datos

En este capítulo, entenderemos el proceso de ciencia de datos y las terminologías requeridas para comprender el proceso.

"La ciencia de datos es la combinación de interfaz de datos, desarrollo de algoritmos y tecnología para resolver problemas analíticos complejos".

Proceso de ciencia de datos

La ciencia de datos es un campo interdisciplinario que abarca métodos, procesos y sistemas científicos con categorías incluidas como aprendizaje automático, matemática y estadística con investigación tradicional. También incluye una combinación de habilidades de piratería con experiencia sustancial. La ciencia de datos extrae principios de las matemáticas, las estadísticas, la ciencia de la información y la informática, la minería de datos y el análisis predictivo.

Los diferentes roles que forman parte del equipo de ciencia de datos se mencionan a continuación:

Clientes

Los clientes son las personas que usan el producto. Su interés determina el éxito del proyecto y sus comentarios son muy valiosos en ciencia de datos.

Desarrollo de negocios

Este equipo de ciencia de datos se registra en los primeros clientes, ya sea de primera mano o mediante la creación de páginas de destino y promociones. El equipo de desarrollo empresarial ofrece el valor del producto.

Gerentes de producto

Los gerentes de producto toman la importancia de crear el mejor producto, que es valioso en el mercado.

Diseñadores de interacción

Se centran en las interacciones de diseño en torno a los modelos de datos para que los usuarios encuentren el valor apropiado.

Científicos de datos

Los científicos de datos exploran y transforman los datos de nuevas maneras para crear y publicar nuevas características. Estos científicos también combinan datos de diversas fuentes para crear un nuevo valor. Desempeñan un papel importante en la creación de visualizaciones con investigadores, ingenieros y desarrolladores web.

Investigadores

Como su nombre lo especifica, los investigadores participan en actividades de investigación. Resuelven problemas complicados, que los científicos de datos no pueden hacer. Estos problemas implican un enfoque intenso y tiempo de aprendizaje automático y módulo de estadísticas.

Adaptándose al cambio

Todos los miembros del equipo de ciencia de datos deben adaptarse a los nuevos cambios y trabajar de acuerdo con los requisitos. Se deben realizar varios cambios para adoptar una metodología ágil con la ciencia de datos, que se mencionan a continuación:

  • Elección de generalistas sobre especialistas.

  • Preferencia de equipos pequeños sobre equipos grandes.

  • Uso de herramientas y plataformas de alto nivel.

  • Intercambio continuo e iterativo de trabajo intermedio.

Nota

En el equipo de ciencia de datos ágil, un pequeño equipo de generalistas utiliza herramientas de alto nivel que son escalables y refinan los datos a través de iteraciones en estados de valor cada vez más altos.

Considere los siguientes ejemplos relacionados con el trabajo de los miembros del equipo de ciencia de datos:

  • Los diseñadores entregan CSS.

  • Los desarrolladores web crean aplicaciones completas, entienden la experiencia del usuario y el diseño de la interfaz.

  • Los científicos de datos deberían trabajar tanto en la investigación como en la creación de servicios web, incluidas las aplicaciones web.

  • Los investigadores trabajan en base de código, que muestra resultados que explican resultados intermedios.

  • Los gerentes de producto intentan identificar y comprender las fallas en todas las áreas relacionadas.