Datos: media, mediana y moda

Estadística. Población. Muestra. Distribución de frecuencias. Promedio

  • Enviado por: Luli
  • Idioma: castellano
  • País: Argentina Argentina
  • 4 páginas

publicidad

DESCRIPCÍON DE LOS DATOS

(Capítulo 3)

Medida de Tendencia Central: Un único valor que resume un conjunto de datos. Señala el centro de valores.

No hay una sola medida de tendencia central, se consideran 5: la media aritmética, media ponderada, la mediana, la moda y la media geométrica.

  • Media de la población:

  • A partir de datos en vivo, los que no han sido agrupados en una distribución de frecuencias o en una representación de tallo y hoja, la media de una población es:

    Suma de todos los valores de la población  X

    Media de una población =  =

    Número de valores en la población N

    Donde:

    • representa la media de población

    N nº total de elementos en la población

    X cualquier valor en particular

    • sumatoria

    La media de una población es un parámetro (una característica medible de una población) , así como la amplitud de variación (la diferencia entre el valor más grande y el más pequeño en un conjunto de datos).

  • Media de una muestra:

  • Para datos en vivo, no agrupados la media es:

    Suma de todos los valores de una muestra  X

    Media de una muestra = X =

    Número de valores en la muestra n

    Donde:

    n número total de valores de la muestra

    La media de una muestra, o cualquier otra medida basada en datos muestrales, se denomina dato estadístico (una característica de una muestra).

    • Propiedades de media aritmética:

    La tasa de interés de la media aritmética es una medida de tendencia central ampliamente utilizada. Propiedades:

  • Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.

  • Al evaluar la media se incluyen todos los valores.

  • Un conjunto de datos sólo tiene una media. Esta es un valor único.

  • La media es una medida muy útil para comparar dos o más poblaciones.

  • La media es la única medida de ubicación donde la suma de las desviaciones de cada valor es con respecto a la media, siempre será cero.

  • LAS DESVIACIONES RESPECTO DE LA MEDIA SUMAN CERO  ( X - X ) = 0

    La media podría no ser un promedio adecuado para representar datos. La media se ve afectada de modo notable por valores extraordinariamente grandes o pequeños.

    No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y mayor).

  • Media ponderada:

  • Es un caso especial de la media aritmética. Se presenta cuando hay varias observaciones del mismo valor que pueden ocurrir si los datos se han agrupado en una distribución de frecuencias.

    Para determinar la media ponderada multiplicamos cada observación por el número de veces que aparece.

    w1X1 + w2X2 + w3X3 +...+ wnXn  (wX)

    Media ponderada = Xw =

    w1 + w2 + w3 +...+ wn w

  • Mediana:

  • Para datos que contienen 1 o 2 valores sumamente grandes o muy pequeños, la media aritmética puede no ser representativa. El punto central puede describirse mejor utilizando una medida de tendencia central denominada mediana.

      • Mediana: Punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor. Se tiene que 50% de las observaciones se encuentran por arriba de la mediana y 50% por debajo de ella.

      • Las propiedades de la mediana son:

      • Es única, sólo existe una mediana para un conjunto de datos.

      • No se ve afectada por valores muy grandes o muy pequeños.

      • Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la medina no se encuentra en una clase de tal extremo.

      • Puede obtenerse para datos de nivel de razón, de intervalo y ordinal(excepto para el nominal).

      • 5. Moda:

        El valor de la observación que aparece con más frecuencia.

        Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y de razón. No se ve afectada por valores muy altos o muy bajos. Al igual que la mediana, puede utilizarse como medida de tendencia central para distribuciones con clases de extremo abierto.

        • Desventajas de la moda:

      • Para muchos conjuntos de datos no hay valor modal porque ningún valor aparece más de una vez.

      • Para algunos conjuntos de datos hay más de una moda (bimodal = que tiene dos modas).

      • 6. Media geométrica:

        Útil para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento. Se utiliza ampliamente en los negocios y la economía porque frecuentemente interesa encontrar el cambio porcentual en ventas, sueldos o cifras económicas, como el Producto Nacional Bruto.

        MEDIDA GEOMÉTRICA MG = n (x1) (x2)...(xn)

        Siempre será menor o igual a (nunca mayor que) la media aritmética. Todos los valores de datos deben ser positivos.

        Una segunda aplicación de la media geométrica es encontrar un aumento porcentual promedio en un intervalo de tiempo:

        AUMENTO PORCENTUAL valor al final del periodo

        PROMEDIO EN UN MG = n - 1

        PERIODO DADO valor al principio del periodo

        7. Media, mediana y moda de datos agrupados:

        Con frecuencia los datos sobre ingresos, edades; etc, se agrupan y presentan en forma de una distribución de frecuencias. Resulta imposible obtener los datos originales. Para obtener un valor representativo para los datos, es necesario estimarlo con base en una distribución de frecuencias.

        • Media: las observaciones en cada clase son representadas por el punto medio de ésta. Se calcula con:

        fX

        MEDIA ARITMÉTICA DE DATOS AGRUPADOS X =

        n

        Donde:

        X designa la media aritmética.

        X es el valor central, o punto medio, de cada clase.

        f frecuencia de cada clase.

        fX frecuencia en cada clase multiplicada por el punto medio de ésta.

        n número total de frecuencias.

        Para encontrar el punto medio de una clase específica, se suman los límites superior e inferior de la clase y el resultado lo dividimos entre dos.

        Continuamos con el proceso de multiplicar el punto medio de la clase por la frecuencia para cada clase y después se suman estos productos.

        La media de datos agrupados en una distribución de frecuencias puede ser diferente de la de datos reales. La agrupación resulta en alguna pérdida de información.

        • Mediana: una vez que los datos originales se han organizado en una distribución de frecuencias, parte de la información nos es identificable. No es posible determinar la mediana exacta, puede estimarse:

      • Localizando la clase en la que se encuentra la mediana, y después,

      • interpolando dentro de esa clase para obtener tal valor.

      • Los elementos de la clase en que se encuentra la mediana están espaciados de manera uniforme por toda la clase. Su fórmula es:

        n _ FA

        2

        Mediana = L + (i)

        f

        Donde:

        L límite inferior de la clase que contiene a la mediana

        n nº total de frecuencias

        f frecuencia de la clase antes mencionada

        FA nº acumulativo de frecuencias en todas las clases que preceden inmediatamente a la clase en cuestión (con la mediana)

        i es el ancho de la clase en que se encuentra la mediana

        La mediana se basa sólo en las frecuencias y los límites de la clase que contiene la mediana, es posible determinarla si se dan frecuencias porcentuales en vez de las frecuencias absolutas. Puede determinarse para distribuciones con extremos abiertos.

        • Moda: el punto promedio de la clase modal es la moda estimada. Es el valor que ocurre con más frecuencia. Si el conjunto de datos tiene mas de dos modas, se llama distribución multimodal.

        8. Selección de un promedio para datos de una distribución de frecuencias:

        Distribución simétrica

        (sesgo cero)

        Frecuencias

        20 Años

        Moda = Media = Mediana

        Distribución con asimetría positiva

        Frecuencia

        Sesgo hacia la derecha

        (simetría positiva)

        Moda Mediana Media

        $300 a $500 $600

        Distribución negativamente asimétrica

        Frecuencias

        Sesgo hacia la izquierda

        (asimetría negativa)

        Media Moda Mediana

        1200 1800 3000

        4