TL;DR

Elegir el rol equivocado en datos te costará tiempo y dinero. No son escaleras donde uno es más “avanzado” que otro, sino caminos paralelos: el Data Analyst traduce datos a decisiones de negocio (qué pasó), el Data Engineer construye la infraestructura para que fluyan (cómo llegan los datos) y el Data Scientist crea modelos predictivos (qué pasará). Todos usan Python y SQL, pero con objetivos distintos. Elige basándote en si te gusta comunicar/negocio, programar/sistemas o investigar/matemáticas.

Video en Youtube: click aquí

Intro

Si no sabes cuál elegir entre Data Analyst, Data Engineer o Data Scientist, estás destinado a perder meses aprendiendo las habilidades equivocadas. Muchos caen en la trampa de pensar que “todos hacen lo mismo” o que el Data Scientist es la meta final.

La realidad es que, aunque los tres trabajan con datos, ahí termina el parecido. Son roles con objetivos, mentalidades y herramientas muy específicas. Vamos a desglosar las diferencias reales, qué hace cada uno en un día típico y qué roadmap deberías seguir.

Diferencias Clave y Analogía

Para entender la distinción fundamental, usemos una analogía con el agua:

  • Data Engineer: Es el plomero. Se asegura de que el agua (datos) llegue a todas partes mediante tuberías (pipelines) y sistemas eficientes.
  • Data Analyst: Es quien te dice cuánta agua gastas y cómo ahorrar. Toma los datos, los analiza y genera decisiones de negocio.
  • Data Scientist: Es quien predice cuándo se va a romper una tubería antes de que suceda. Usa modelos y algoritmos para anticipar el futuro.

Si lo visualizáramos en un diagrama de Venn a alto nivel:

  • Analyst: Se enfoca en Reportes y Dashboards.
  • Engineer: Se enfoca en Pipelines e Infraestructura.
  • Scientist: Se enfoca en Machine Learning y Algoritmos.

La Intersección: Los tres roles, en algún momento, usan Python y SQL. Ese es el común denominador, pero cada uno lo utiliza de forma diferente.

El Mito de la Escala vs. Realidad

Existe el mito de que necesitas saber “un poco de todo” o que debes empezar como Analista para llegar a ser Científico. Falso. Son trayectorias paralelas, no una escalera jerárquica.

  • He visto gente gastar 6 meses aprendiendo Machine Learning cuando su trabajo solo requería SQL y Tableau.
  • También he visto a quienes les gusta la infraestructura perder tiempo en bootcamps de análisis de negocio.

Elegir mal no solo es una pérdida de dinero en cursos, sino de tiempo valioso que podrías haber invertido en especializarte.

Un Día en la Vida: ¿Qué hacen realmente?

Para que veas la diferencia práctica, así se ve un día típico de trabajo:

Data Analyst (Enfoque: Negocio y Comunicación)

  • 09:00 AM: Reunión con Marketing para analizar el rendimiento de una campaña.
  • 10:00 AM: Extrae datos usando SQL (Postgres).
  • 12:00 PM: Crea un dashboard en Tableau o Power BI.
  • 03:00 PM: Presenta insights a los stakeholders y responde preguntas de negocio.
  • 05:00 PM: Documenta los hallazgos en Confluence o plataformas similares.

Data Engineer (Enfoque: Sistemas y Optimización)

  • 09:00 AM: Revisa que los pipelines corrieron correctamente y valida los logs.
  • 10:00 AM: Debug de un pipeline: investiga el error y aplica rollback si es necesario.
  • 02:00 PM: Optimiza una query que tarda 3 horas en ejecutarse.
  • 03:00 PM: Diseña una nueva tabla en el Data Warehouse.
  • 05:00 PM: Configura una nueva estación en Airflow.

Data Scientist (Enfoque: Matemáticas y Predicción)

  • 09:00 AM: Evalúa el modelo del mes pasado: revisa métricas, drift y compara contra la línea base (baseline).
  • 10:00 AM: Feature engineering con nuevos datos.
  • 03:00 PM: Entrena un nuevo modelo (ej. XGBoost).
  • Validación: Verifica la precisión del modelo.
  • Final: Presenta los resultados al equipo de producto.

Nota: En empresas con baja madurez de datos, estos roles suelen mezclarse, pero en entornos ideales, estas son las funciones diferenciadas.

Roadmaps y Stacks Tecnológicos

¿Cómo elegir? Aquí tienes una guía general de herramientas y perfiles:

1. Data Analyst

  • Herramientas: SQL (Postgres), Excel (nunca falla), Tableau o Power BI, Python básico (Pandas).
  • Tiempo de aprendizaje: 4 a 6 meses.
  • Perfil ideal: Te gusta comunicar, entender el negocio y trabajar con personas (stakeholders).

2. Data Engineer

  • Herramientas: SQL Avanzado, Python, Apache Spark, Airflow, DBT (usado por Analytics Engineers), y Cloud (AWS, GCP o Azure). A veces Scala.
  • Tiempo de aprendizaje: 8 a 12 meses.
  • Perfil ideal: Te gusta programar, optimizar sistemas y resolver problemas técnicos complejos. Generalmente es un perfil más introvertido o enfocado en la infraestructura.

3. Data Scientist

  • Herramientas: Python, Scikit-Learn, Jupyter Notebooks, Estadística profunda, Algoritmos de Machine Learning.
  • Tiempo de aprendizaje: Largo (incluye matemáticas avanzadas).
  • Perfil ideal: Te gustan las matemáticas, experimentar, investigar y crear pruebas de concepto. Menos orientado a la producción (a diferencia del Machine Learning Engineer).

¿Cómo elegir tu camino?

Antes de decidirte, prueba pequeño:

  • Analyst: Intenta hacer una presentación y escribe unas cuantas queries de SQL.
  • Scientist: Juega experimentando con modelos de predicción (ej. predecir precios de casas).

Lo sorprendente es que muchas personas se van con el roadmap completo sin tener claro lo básico. El consejo más valioso que puedo darte es: Agrega bien las bases.

Python y SQL son los dos pilares fundamentales. He visto perfiles que por dominar bien estos dos, pueden saltar o cambiar de rol más adelante (de Analyst a Engineer o viceversa) con mayor facilidad.

Conclusión

Los tres roles tienen curvas de aprendizaje y objetivos diferentes, pero todos empiezan en el mismo lugar: un SQL sólido y un Python básico. Ahora que sabes qué hace cada uno en su día a día y qué tipo de perfil encaja contigo, la decisión depende de qué te apasione más: explicar la historia (Analyst), construir el escenario (Engineer) o predecir el futuro (Scientist).

No se trata de elegir el “mejor” rol según el salario o la jerarquía, sino el que va contigo. Recuerda: prueba rápido, empieza pequeño y construye sobre cimientos sólidos.