Alejandro Zakzuk

Clasificación de riesgo metabólico CDC BRFSS

Big DataCDCPythonMachine Learning
Clasificación de riesgo metabólico CDC BRFSS

Problema

Análisis masivo de 253.680 registros del CDC para clasificar perfiles de riesgo metabólico.

Solución

Pipeline de Big Data con Pandas/Scikit-learn, manejo de desbalance de clases y optimización de hiperparámetros.

Resultado

Identificación de patrones de riesgo a gran escala con alta precisión estadística.

Lecciones

Iteraciones, riesgos y aprendizajes clave.

Próximos pasos

Extensiones y roadmap sugerido.