Validar las asunciones de los algoritmos (como la normalidad de los residuos en una regresión). 2. Análisis Exploratorio de Datos (EDA) con Python
No basta con conocer el promedio. Es vital entender la dispersión: La mediana es robusta ante outliers .
from scipy import stats # Ejemplo de prueba T para comparar dos grupos grupo_a = [20, 22, 19, 24, 25] grupo_b = [28, 30, 27, 29, 31] t_stat, p_val = stats.ttest_ind(grupo_a, grupo_b) print(f"P-value: {p_val:.4f}") # Si p < 0.05, hay diferencia significativa Use code with caution. 5. Regresión y Correlación: Más allá de la Línea Recta
