Predicción automatizada de remuneraciones mensuales en el sector privado peruano
Aplicación web basada en inteligencia artificial que estima el sueldo mensual de un trabajador en función de características demográficas y laborales. Utiliza datos abiertos del Ministerio de Trabajo y Promoción del Empleo (MTPE) y un modelo de machine learning (XGBoost) entrenado con datos reales.
Módulo | Descripción | Repositorio |
---|---|---|
Frontend | Interfaz web en React + Tailwind para ingresar datos | mtpe-salary-predictor-react |
Backend | API REST en Flask con modelo XGBoost | mtpe-salary-predictor-flask |
Preprocesamiento | Limpieza, codificación y entrenamiento del modelo | Privado |
s
Diseñar un sistema que, a partir de atributos como edad, nivel educativo, ocupación, ubicación, tamaño de empresa, entre otros, pueda predecir el sueldo mensual de un trabajador formal privado en Perú.
- Frontend: React, TypeScript, TailwindCSS, Fetch API
- Backend: Python, Flask, XGBoost, Scikit-learn, Pandas, Joblib
- Preprocesamiento: OneHotEncoder, MinMaxScaler, Pipelines automáticos
- Dataset: MTPE Perú (2020-2023, datos semestrales)
- Carga de datos: CSV delimitado por
;
con +10 columnas relevantes. - Preprocesamiento:
- Imputación de valores "NO DETERMINADO"
- Codificación One-Hot para variables categóricas
- Normalización con MinMaxScaler
- Automatización: Pipeline con
ColumnTransformer
+ persistencia conjoblib
- Modelado: Entrenamiento con XGBoost (regresión) y validación con MAE y RMSE
- Evaluación: El error promedio entre la predicción y el valor real fue de aproximadamente 844.85 soles peruanos (PEN).
- Despliegue: Backend con API
/predict
y/get-options
+ frontend dinámico
Estos perfiles visuales ayudan a contextualizar los escenarios laborales representados en el modelo:
Imagen | Descripción |
---|---|
![]() |
Varón obrero en Lima |
![]() |
Mujer trabajadora en salud |
![]() |
Varón en sector minería |
![]() |
Técnico en industrias manufactureras |
![]() |
Varón obrero en construcción |
Este proyecto es de uso académico y de investigación. Los datos pertenecen al MTPE y están bajo licencias de uso abierto.