📊 Ingeniería de Datos en Español
Bienvenido/a a la documentación web del repositorio de Ingeniería de Datos en Español.
🚀 Inicio Rápido
Este repositorio está diseñado para aprender Ingeniería de Datos desde cero hasta un nivel profesional, con bases sólidas, ejemplos prácticos y un enfoque moderno donde la AI se usa como copiloto, no como reemplazo.
📚 ¿Qué vas a aprender?
A lo largo de esta ruta de aprendizaje, dominarás:
- Fundamentos: Tipos de datos, pipelines, batch vs streaming, Git, Docker
- SQL: Desde básico hasta avanzado, modelado relacional, PostgreSQL
- Python: Fundamentos, Pandas, Jupyter Notebooks, storytelling
- Modelado y Calidad: Star Schema, validaciones, Great Expectations, Pandera
- Pipelines y Orquestación: Prefect, Dagster, Airflow, Luigi, orquestadores cloud
- Inteligencia Artificial: Cursor IDE, prompts efectivos, buenas prácticas
- Proyectos Prácticos: Proyectos end-to-end desde principiante hasta avanzado
🗺️ Ruta de Aprendizaje Visual
Para ver el diagrama completo de la ruta de aprendizaje con el flujo recomendado, visita:
📄 Ruta de Aprendizaje Visual
💡 El diagrama visual muestra cómo se conectan todos los módulos y cuál es el orden recomendado de aprendizaje.
🎯 Start Here
¿No sabes por dónde empezar? Elige una de estas opciones:
Conceptos básicos de Data Engineering para principiantes
Guía completa paso a paso para convertirte en Data Engineer
Aprende haciendo: proyectos prácticos desde el primer día
🧭 Ruta de Aprendizaje
Leyenda:
- ✔️ = Contenido completo y listo para usar
- 🚧 = Contenido en progreso o parcial
- 📘 = Carpeta con múltiples archivos
🟩 Nivel 0 — Introducción ✔️
🟨 Nivel 1 — Fundamentos ✔️
- 📘 Fundamentos
- Tipos de Datos, Pipelines, Batch vs Streaming
- Git, .env, Docker
- Introducción a SQL
- Buenas Prácticas
- Data Engineering en la Nube
🟧 Nivel 2 — SQL ✔️
🟦 Nivel 3 — Python ✔️
- 📘 Python aplicado
- Fundamentos Python
- Pandas para datos
- Storytelling con datos
- Ejemplos en Jupyter Notebooks
🟪 Nivel 4 — Modelado y Calidad ✔️
- 📘 Modelado y Calidad
- Modelado analítico (Star Schema)
- Calidad de datos
- Validaciones y Testing
- Great Expectations, Pandera
🟥 Nivel 5 — Pipelines y orquestación ✔️
🤖 Inteligencia Artificial como copiloto ✔️
🚀 Proyectos End-to-End ✔️
- 📘 Proyectos End-to-End
- ✔️ Nivel Principiante: Proyecto 1 (ETL Simple) completo, Proyectos 2-3 con estructura completa
- ✔️ Nivel Intermedio: Todos los proyectos con estructura completa y templates
- 🚧 Nivel Avanzado: Estructura y READMEs completos, código en desarrollo
☁️ Data Engineering en la Nube ✔️
📚 Recursos
🔗 Enlaces Útiles
📖 Sobre esta página
Esta es la versión web (GitHub Pages) del repositorio, diseñada como un landing page y índice de navegación.
Todo el contenido completo (archivos .md, notebooks, código, ejemplos) está en el repositorio de GitHub.
¿Por qué usar esta página?
- ✅ Punto de entrada rápido al contenido
- ✅ Vista general de toda la ruta de aprendizaje
- ✅ Enlaces directos a cada sección
- ✅ Fácil de compartir y bookmark
Para el contenido completo y actualizado:
👉 Visita el repositorio en GitHub
💡 Tip: Puedes usar esta página como bookmark o landing page, y desde aquí navegar a cualquier sección del repositorio.