Fórmula de los valores atípicos (Tabla de contenidos)
- Fórmula de los valores atípicos
- Ejemplos de fórmula de los valores atípicos (Con plantilla de Excel)
Fórmula de los valores atípicos
En estadística, Los valores atípicos son los dos puntos inusuales de distancia extrema en los conjuntos de datos dados. El valor extremadamente alto y el valor extremadamente bajo son los valores atípicos de un conjunto de datos. Esto es muy útil para encontrar cualquier defecto o error que se haya producido. Simplemente, como su nombre indica, los valores atípicos son valores que se encuentran fuera del resto de los valores del conjunto de datos. Por ejemplo, consideremos a los estudiantes de ingeniería e imaginemos que tienen enanos en su clase. Los enanos son personas de estatura extremadamente baja en comparación con otras personas de estatura normal. Así que este es el valor atípico de esta clase. Los valores atípicos se pueden calcular utilizando el método de Tukey.
Comienza tu curso gratuito de Banca de Inversión
Descarga Valoración Corporativa, Banca de Inversión, Contabilidad, Calculadora CFA & otros
La fórmula de los valores atípicos –
Outlier superior= Q3 + (1,5 * IQR)
Ejemplos de la fórmula de Outliers (Con plantilla de Excel)
Vamos a poner un ejemplo para entender mejor el cálculo de la fórmula de Outliers.
Fórmula de Outliers – Ejemplo #1
Considere el siguiente conjunto de datos y calcule los outliers para el conjunto de datos.
Conjunto de datos = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23
Orden ascendente del conjunto de datos:
La mediana del Conjunto de Datos Ascendente se calcula como:
En este conjunto de datos, el número total de datos es 11. Por tanto, n= 11. Mediana = 11+1/2 = 12 / 2 = 6. Por lo tanto, el valor que está en la 6ª posición en este conjunto de datos es la mediana.
Así que el valor de la mediana = 34.
Dividir el conjunto de datos en 2 mitades utilizando la mediana.
Ver curso
La mediana del conjunto de datos de la mitad inferior y de la mitad superior se calcula como:
- En las mitades inferiores 2, 5, 6,7,23, si encontramos la mediana como la encontramos en el paso 2, el valor de la mediana sería 6. Así que Q1= 6.
- En la mitad superior 45, 56, 89, 98,309 si encontramos la mediana como la encontramos en el paso 2, el valor de la mediana sería 89. Así que Q3= 89.
El IQR se calcula con la fórmula que se da a continuación
IQR = Q3 – Q1
- IQR = 89 -6
- IQR = 83
- Factor atípico inferior = 6 – (1.5 * 83)
- Outlier inferior = -118,5
- Factor atípico superior = 89 + (1.5 * 83)
- Outlier más alto = 213,5
- Q1= 27.5
- Q3= 89
- IQR = 99.5 – 27.5
- IQR = 72
- Mortalidad inferior = 27.5 – (1,5 * 72)
- Outlier inferior = -80,5
- Factor atípico superior = 99,5 + (1.5 * 72)
- Outlier más alto = 207,5
El Outlier inferior se calcula mediante la fórmula que se indica a continuación
El Outlier inferior = Q1 – (1.5 * IQR)
El Outlier superior se calcula mediante la fórmula que se indica a continuación
Outlier superior = Q3 + (1.5 * IQR)
Ahora busca estos valores en el conjunto de datos -118,5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213,5, 309. Los valores que están por debajo del valor inferior y por encima del valor superior son los valores atípicos. Para este conjunto de datos, 309 es el valor atípico.
Fórmula de los valores atípicos – Ejemplo #2
Considere el siguiente conjunto de datos y calcule los valores atípicos para el conjunto de datos.
Conjunto de datos = 45, 21, 34, 90, 109.
Orden ascendente del conjunto de datos:
La mediana del conjunto de datos de orden ascendente se calcula como:
En este conjunto de datos, el número total de datos es 5. Por tanto, n = 5. Mediana = 5+1/2 = 6 / 2 = 3. Por lo tanto, el valor que está en la 3ª posición en este conjunto de datos es la mediana.
Así que el valor de la mediana = 45.
Dividir el conjunto de datos en 2 mitades utilizando la mediana.
La mediana del conjunto de datos de la mitad inferior y de la mitad superior se calcula como:
El IQR se calcula con la fórmula que se da a continuación
IQR = Q3 – Q1
El Outlier inferior se calcula mediante la fórmula que se indica a continuación
El Outlier inferior = Q1 – (1.5 * IQR)
El Outlier superior se calcula mediante la fórmula que se indica a continuación
Outlier superior = Q3 + (1.5 * IQR)
Explicación
Paso 1: Ordenar todos los valores del conjunto de datos dado en orden ascendente.
Paso 2: Encontrar el valor de la mediana de los datos ordenados. La mediana se puede encontrar utilizando la siguiente fórmula. El siguiente cálculo simplemente le da la posición del valor de la mediana que reside en el conjunto de datos.
Media = (n+1)/2
Donde n es el número total de datos disponibles en el conjunto de datos.
Paso 3: Encuentre el valor del Cuartil inferior Q1 del conjunto de datos. Para encontrarlo, utilizando el valor de la mediana divida el conjunto de datos en dos mitades. A partir del conjunto de valores de la mitad inferior, encuentre la mediana para ese conjunto inferior que es el valor Q1.
Paso 4: Encuentre el valor del Cuartil superior Q3 del conjunto de datos. Es exactamente como el paso anterior. En lugar de la mitad inferior, tenemos que seguir el mismo procedimiento el conjunto de valores de la mitad superior.
Paso 5: Encontrar el valor del Rango Intercuartil IQR. Para encontrar el Deducir el valor Q1 de Q3.
IQR = Q3-Q1
Paso 6: Encontrar el valor del Extremo Interior. Un extremo que cae fuera del lado inferior que también se puede llamar como un valor atípico menor. Multiplique el valor de IQR por 1,5 y deduzca este valor de Q1 para obtener el extremo inferior interior.
Ampliación inferior =Q1 – (1,5 * IQR)
Paso 7: Encuentre el valor del extremo exterior. Un extremo que cae fuera del lado más alto que también se puede llamar un outlier mayor. Multiplique el valor de IQR por 1,5 y sume este valor con Q3 para obtener el extremo superior externo.
Ampliación mayor = Q3 + (1,5 * IQR)
Paso 8: Los valores que caen fuera de estos extremos internos y externos son los valores atípicos para el conjunto de datos dado.
Relevancia y usos de la fórmula de los valores atípicos
Los valores atípicos son muy importantes en cualquier problema de análisis de datos. Los valores atípicos muestran la inconsistencia en cualquier conjunto de datos, ya que se definen como los valores distantes poco comunes en el conjunto de datos de uno a otro. Esto es muy útil para encontrar cualquier fallo que se haya producido en el conjunto de datos. Porque cuando se coloca un error en el conjunto de datos, afecta a la media y a la mediana, por lo que puede haber grandes desviaciones en el resultado si hay valores atípicos en el conjunto de datos. Por lo tanto, es esencial encontrar los valores atípicos del conjunto de datos para evitar problemas graves en el análisis estadístico.
Artículos recomendados
Esta ha sido una guía para la fórmula de los valores atípicos. Aquí hablamos de cómo calcular los Outliers junto con ejemplos prácticos y una plantilla de excel descargable. También puede ver los siguientes artículos para aprender más –
- Guía de la fórmula de los valores medios
- Ejemplos de la fórmula del salario
- Calculadora de la fórmula DPMO
- ¿Cómo calcular la distribución T?
- Fórmula de la desviación del cuartil | Ejemplos