InferentialStats — StatsLibX

Constructor

InferentialStats(data, lang)

data: pd.DataFrame | np.ndarray · lang: 'es-ES' | 'en-US' = 'es-ES'

Inicializa con un DataFrame de pandas o array numpy. Detecta automáticamente columnas numéricas y categóricas

Parámetro	Tipo	Default	Descripción
data	pd.DataFrame \| np.ndarray	—	Dataset de entrada (requerido)
lang	str	'es-ES'	Idioma de salidas: `'es-ES'` o `'en-US'`

Python

from statslibx import InferentialStats

from statslibx.datasets import load_iris



data = load_iris()

inf = InferentialStats(data)

Intervalos de Confianza

.confidence_interval(column, confidence, statistic)

column: str · confidence: float = 0.95 · statistic: 'mean'|'median'|'proportion'

→ tuple(lower, upper, estimate)

Calcula intervalos de confianza para la media (t-distribution), mediana (bootstrap) o proporción (z-test). Retorna una tupla (lower_bound, upper_bound, point_estimate).

Parámetro	Tipo	Default	Descripción
column	str	—	Columna a analizar
confidence	float	0.95	Nivel de confianza (ej: 0.95, 0.99)
statistic	str	'mean'	'mean', 'median' o 'proportion'

Python

# IC para la media (95%)

lower, upper, mean = inf.confidence_interval('sepal_length', confidence=0.95)

print(f"IC 95%: [{lower:.3f}, {upper:.3f}], media={mean:.3f}")



# IC para mediana (bootstrap)

lower, upper, med = inf.confidence_interval('petal_length', statistic='median')



# IC para proporción (datos binarios 0/1)

lower, upper, p = inf.confidence_interval('survived', statistic='proportion')

Pruebas de Una Muestra

.t_test_1sample(column, popmean, popmedian, alternative, alpha)

column: str · popmean/popmedian: float · alternative: str · alpha: float = 0.05

→ TestResult

Prueba t de una muestra (para media) o Wilcoxon signed-rank (para mediana). Especifica popmean o popmedian, no ambos.

Parámetro	Tipo	Default	Descripción
column	str	—	Columna a analizar
popmean	float \| None	None	Media poblacional hipotética (H₀: μ = popmean)
popmedian	float \| None	None	Mediana poblacional hipotética → usa Wilcoxon
alternative	str	'two-sided'	'two-sided', 'less' o 'greater'
alpha	float	0.05	Nivel de significancia

Python

# H₀: media de sepal_length = 5.0

result = inf.t_test_1sample('sepal_length', popmean=5.0)

print(result)   # Estadístico, p-value, interpretación



# Prueba unilateral: H₁: media > 5.0

result = inf.t_test_1sample('sepal_length', popmean=5.0, alternative='greater')



# Para mediana (Wilcoxon signed-rank)

result = inf.t_test_1sample('petal_length', popmedian=3.5)

Pruebas de Dos Muestras

.t_test_2sample(column1, column2, equal_var, alternative, alpha)

column1: str · column2: str · equal_var: bool = True

→ TestResult

Prueba t de dos muestras independientes (Student si equal_var=True, Welch si False).

Python

result = inf.t_test_2sample('sepal_length_a', 'sepal_length_b', equal_var=True)

print(result)



# Welch (varianzas desiguales)

result_w = inf.t_test_2sample('grupo1', 'grupo2', equal_var=False)

.t_test_paired(column1, column2, alternative, alpha)

column1: str · column2: str · alternative: str = 'two-sided'

→ TestResult

Prueba t pareada para muestras dependientes (mediciones antes/después sobre los mismos sujetos).

Python

result = inf.t_test_paired('peso_antes', 'peso_despues', alternative='two-sided')

print(result)  # Incluye diferencia de medias, p-value

.mann_whitney_test(column1, column2, alternative, alpha)

column1: str · column2: str · alternative: str = 'two-sided'

→ TestResult

Test de Mann-Whitney U. Alternativa no paramétrica al t-test de dos muestras. Usa medianas en lugar de medias.

Python

result = inf.mann_whitney_test('grupo_a', 'grupo_b')

print(result)  # Estadístico U, medianas, p-value

Pruebas para Múltiples Grupos

.anova_oneway(column, groups, alpha)

column: str · groups: str · alpha: float = 0.05

→ TestResult

ANOVA de un factor (One-Way ANOVA). Compara medias entre múltiples grupos. column es la variable numérica y groups la variable categórica de agrupación.

Python

result = inf.anova_oneway(column='sepal_length', groups='species')

print(result)  # F-estadístico, p-value, número de grupos

.kruskal_wallis_test(column, groups, alpha)

column: str · groups: str · alpha: float = 0.05

→ TestResult

Test de Kruskal-Wallis. Alternativa no paramétrica a ANOVA para datos que no cumplen normalidad.

Python

result = inf.kruskal_wallis_test(column='petal_length', groups='species')

print(result)

Variables Categóricas

.chi_square_test(column1, column2, alpha)

column1: str · column2: str · alpha: float = 0.05

→ TestResult

Prueba Chi-cuadrado de independencia entre dos variables categóricas. Incluye la tabla de contingencia en los parámetros del resultado.

Python

result = inf.chi_square_test(column1='sex', column2='survived')

print(result)  # Chi², grados de libertad, p-value, tabla de contingencia

Normalidad, Varianza y Pruebas Generales

.normality_test(column, method, test_statistic, alpha)

column: str · method: 'shapiro'|'ks'|'anderson'|'jarque_bera'|'all'

→ TestResult | dict

Prueba si los datos siguen una distribución normal. Con method='all' retorna un dict con los cuatro tests. Anderson-Darling retorna valores críticos en lugar de p-value.

Método	Descripción	n máximo
'shapiro'	Shapiro-Wilk. Recomendado para muestras pequeñas-medianas.	≤ 5000
'ks'	Kolmogorov-Smirnov contra distribución normal parametrizada.	cualquier n
'anderson'	Anderson-Darling. Más potente en las colas.	cualquier n
'jarque_bera'	Basado en asimetría y curtosis. Para muestras grandes.	cualquier n
'all'	Ejecuta los cuatro tests y retorna un dict.	—

Python

# Shapiro-Wilk

result = inf.normality_test('sepal_length', method='shapiro')

print(result)



# Todos los tests

results = inf.normality_test('petal_length', method='all', test_statistic='median')

print(results['shapiro'])

print(results['kolmogorov_smirnov'])

print(results['anderson_darling'])

print(results['jarque_bera'])

.variance_test(column1, column2, method, center, alpha)

method: 'levene'|'bartlett'|'var_test' = 'levene' · center: 'mean'|'median'|'trimmed'

→ TestResult

Prueba de igualdad de varianzas entre dos columnas. Levene es robusto a no-normalidad; Bartlett asume normalidad; var_test es el equivalente al var.test de R.

Python

result = inf.variance_test('grupo_a', 'grupo_b', method='levene', center='median')

print(result)

.hypothesis_test(method, column1, column2, pop_mean, ...)

method: 'mean'|'difference_mean'|'proportion'|'variance'

→ TestResult

Interface unificada para pruebas de hipótesis. Incluye test de homocedasticidad automático para comparación de medias.

Python

# Test de media

result = inf.hypothesis_test(method='mean', column1='sepal_length', pop_mean=5.0)



# Diferencia de medias (incluye Levene automático)

result = inf.hypothesis_test(method='difference_mean', column1='g1', column2='g2')



# Proporción

result = inf.hypothesis_test(method='proportion', column1='survived', pop_proportion=0.5)



# Varianza (F-test)

result = inf.hypothesis_test(method='variance', column1='g1', column2='g2')

Guía de Selección de Pruebas

Una Muestra vs Referencia

Datos normalest_test_1sample(popmean)

No normalest_test_1sample(popmedian)

Dos Grupos Independientes

Normalest_test_2sample()

No normalesmann_whitney_test()

Dos Grupos Pareados

Normalest_test_paired()

No normalesscipy.stats.wilcoxon()

Múltiples Grupos

Normalesanova_oneway()

No normaleskruskal_wallis_test()

Variables Categóricas

Independenciachi_square_test()

Verificar Normalidad

n ≤ 5000shapiro

n grandejarque_bera / ks