Cómo calcular los valores atípicos

Escrito por Kaylee Finn ; última actualización: February 01, 2018
Jupiterimages/BananaStock/Getty Images

Un valor atípico en un conjunto de datos es muy diferente de los demás valores. Los valores atípicos pueden producirse debido a errores experimentales o de medición, o de poblaciones envejecidas. En los primeros casos, puede ser deseable identificar los valores atípicos y quitarlos de los datos antes de realizar análisis estadísticos porque pueden arrojar resultados erróneos, ya que no representan la muestra de población con exactitud. La manera más simple de identificar los valores atípicos es usar el método cuartil.

Ordena los datos de menor a mayor. Por ejemplo, toma el conjunto de datos {4, 5, 2, 3, 15, 3, 3, 5}. Ordenado, quedaría así: {2, 3, 3, 3, 4, 5, 5, 15}.

Halla la media. Este es el número respecto del cual la mitad de los datos son mayores y la otra mitad son menores. Si los datos son impares, los dos del medio se promedian. Por ejemplo, en el conjunto de datos del ejemplo, los punto del medio son 3 y 4, entonces la media es (3 + 4) / 2 = 3.5.

Haya el cuartil mayor, Q2; este es el punto respecto del cual el 25 por ciento de los datos son mayores. Si el conjunto de datos es par, promedia los 2 puntos cercanos al cuartil. Para el conjunto de datos del ejemplo, esto es así: (5 + 5) / 2 = 5.

Halla el cuartil menor, Q1; este es el punto respecto del cual el 25 por ciento de los datos son menores. Si el conjunto de datos es par, promedia los 2 puntos cercanos al cuartil. Para el conjunto de datos del ejemplo, esto es así: (3 + 3) / 2 = 3.

Resta el cuartil menor del cuartil mayor para obtener el rango intercuartil o IQ. Para el conjunto de datos del ejemplo, esto quedaría así: Q2 – Q1 = 5 – 3 = 2.

Multiplica el rango intercuartil por 1,5. Suma el resultado al cuartil superior y réstalo del cuartil menor. Todo dato que quede fuera de estos valores es un valor levemente atípico. Para el conjunto del ejemplo, esto quedaría así: 1.5 x 2 = 3. 3 – 3 = 0 y 5 + 3 = 8. Entonces, todo valor menor que 0 o mayor que 8 sería un valor levemente atípico. Esto significa que 15 se considera un valor levemente atípico.

Multiplica el rango intercuartil por 3. Suma el resultado al cuartil superior y réstalo del cuartil menor. Todo dato que quede fuera de estos valores es un valor muy atípico. Para el conjunto del ejemplo, esto quedaría así: 3 x 2 = 6. 3 – 6 = –3 y 5 + 6 = 11. Entonces, todo valor menor que –3 o mayor que 11 sería un valor muy atípico. Esto significa que 15 se considera un valor muy atípico.

Consejos

Hay más probabilidades de que los errores estén representados por los valores muy atípicos que por los valores levemente atípicos. Estudia cuidadosamente las causas de todos los valores atípicos.

×