Ingeniería de Datos en Español

📊 Ingeniería de Datos en Español

Bienvenido/a a la documentación web del repositorio de Ingeniería de Datos en Español.

🚀 Inicio Rápido

Este repositorio está diseñado para aprender Ingeniería de Datos desde cero hasta un nivel profesional, con bases sólidas, ejemplos prácticos y un enfoque moderno donde la AI se usa como copiloto, no como reemplazo.

📚 ¿Qué vas a aprender?

A lo largo de esta ruta de aprendizaje, dominarás:

Fundamentos: Tipos de datos, pipelines, batch vs streaming, Git, Docker
SQL: Desde básico hasta avanzado, modelado relacional, PostgreSQL
Python: Fundamentos, Pandas, Jupyter Notebooks, storytelling
Modelado y Calidad: Star Schema, validaciones, Great Expectations, Pandera
Pipelines y Orquestación: Prefect, Dagster, Airflow, Luigi, orquestadores cloud
Inteligencia Artificial: Cursor IDE, prompts efectivos, buenas prácticas
Proyectos Prácticos: Proyectos end-to-end desde principiante hasta avanzado

🗺️ Ruta de Aprendizaje Visual

Para ver el diagrama completo de la ruta de aprendizaje con el flujo recomendado, visita:

📄 Ruta de Aprendizaje Visual

💡 El diagrama visual muestra cómo se conectan todos los módulos y cuál es el orden recomendado de aprendizaje.

🎯 Start Here

¿No sabes por dónde empezar? Elige una de estas opciones:

📖 Empieza aquí → Introducción

Conceptos básicos de Data Engineering para principiantes

🗺️ Ruta sugerida → Roadmap

Guía completa paso a paso para convertirte en Data Engineer

🚀 Primer proyecto → Principiante

Aprende haciendo: proyectos prácticos desde el primer día

🧭 Ruta de Aprendizaje

Leyenda:

✔️ = Contenido completo y listo para usar
🚧 = Contenido en progreso o parcial
📘 = Carpeta con múltiples archivos

🟩 Nivel 0 — Introducción ✔️

✔️ ¿Qué es Data Engineering?
✔️ Roadmap para convertirte en Data Engineer
✔️ Roles en datos

🟨 Nivel 1 — Fundamentos ✔️

📘 Fundamentos
- Tipos de Datos, Pipelines, Batch vs Streaming
- Git, .env, Docker
- Introducción a SQL
- Buenas Prácticas
- Data Engineering en la Nube

🟧 Nivel 2 — SQL ✔️

📘 SQL para Data Engineers
- SQL básico, intermedio y avanzado
- Modelado Relacional
- Ejercicios prácticos

🟦 Nivel 3 — Python ✔️

📘 Python aplicado
- Fundamentos Python
- Pandas para datos
- Storytelling con datos
- Ejemplos en Jupyter Notebooks

🟪 Nivel 4 — Modelado y Calidad ✔️

📘 Modelado y Calidad
- Modelado analítico (Star Schema)
- Calidad de datos
- Validaciones y Testing
- Great Expectations, Pandera

🟥 Nivel 5 — Pipelines y orquestación ✔️

📘 Pipelines y Orquestación
- Pipelines básicos con Python
- Orquestadores (Prefect, Dagster, Airflow, Luigi)
- Orquestadores Cloud (Step Functions, Composer, Data Factory)
- Ejercicios y Soluciones

🤖 Inteligencia Artificial como copiloto ✔️

📘 Inteligencia Artificial como Copiloto
- Cursor para Data Engineers
- Uso práctico de AI
- Buenas prácticas y límites

🚀 Proyectos End-to-End ✔️

📘 Proyectos End-to-End
- ✔️ Nivel Principiante: Proyecto 1 (ETL Simple) completo, Proyectos 2-3 con estructura completa
- ✔️ Nivel Intermedio: Todos los proyectos con estructura completa y templates
- 🚧 Nivel Avanzado: Estructura y READMEs completos, código en desarrollo

☁️ Data Engineering en la Nube ✔️

📘 Orquestadores Cloud
- Guía completa de orquestadores cloud y servicios principales
- AWS Step Functions, Google Cloud Composer, Azure Data Factory
✔️ Conceptos fundamentales

📚 Recursos

🔗 Enlaces Útiles

📬 Contacto

📖 Sobre esta página

Esta es la versión web (GitHub Pages) del repositorio, diseñada como un landing page y índice de navegación.

Todo el contenido completo (archivos .md, notebooks, código, ejemplos) está en el repositorio de GitHub.

¿Por qué usar esta página?

✅ Punto de entrada rápido al contenido
✅ Vista general de toda la ruta de aprendizaje
✅ Enlaces directos a cada sección
✅ Fácil de compartir y bookmark

Para el contenido completo y actualizado: 👉 Visita el repositorio en GitHub

💡 Tip: Puedes usar esta página como bookmark o landing page, y desde aquí navegar a cualquier sección del repositorio.

This site is open source. Improve this page.