Estadística


Estadística


Introducción

Medidas de centralización, parámetros estadísticos que marcan, bajo de distintos criterios, los valores en torno a los cuales se disponen los datos de una distribución. También de medidas de tendencia central, pues en torno a ella se disponen los elementos de las distribuciones. La más imponente son la media, mediana y moda.

La medida aritmética, promedio o, simplemente, media, de los valores x1, x2,..., xn, se designa por x y se obtiene así:

Estadística

La mediana (Me), es un numero que supera a la mitad de los valores de la distribución y es superada por la otra mitad.

Si el numero de términos de la distribución es impar, la mediana es el valor del individuo que ocupa el valor central cuando los datos están ordenados de menor a mayor. Por ejemplo, la distribución de edades 4,6,6,7,9,11,13, la mediana es Me = 7, pues hay tres datos menores que 7 y tres mayores que 7.

Si el numero de termino de la distribución es par, la mediana es el valor medio de los datos centrales. Así, en la distribución 4,6,7,8,9,11,13, los valore 7 y8 son los valores centrales. La mediana es Me = 7,5.

La moda (Mo), de una distribución estadística es el valor que más se repite. Una distribución puede tener mas de una moda o no tener ninguna. En la distribución 4,6,6,7,9,11,13, la moda es Mo = 6.

Historia de la Estadística

Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 a. C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a. C. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a. C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 a. C. para cobrar impuestos.

El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the Condón Bies Of. Mortalita (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales.

En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico.

Media aritmética o promedio

  • Llamando xl, ..., xk a los datos distintos de un carácter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos, y ni,..., nk a las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmética de la distribución de frecuencias a

  • Estadística

    en donde n es la frecuencia total.

     

    Ejemplo

    La media aritmética de las veinticinco familias encuestadas será:

    Estadística

    es decir, las familias encuestadas tienen un número medio de hijos de 1'68.

     Ejemplo 2: 

    Se midieron los niveles de colinesterasa en un recuento de eritrocitos en μmol/min/ml de 34 agricultores expuestos a insecticidas agrícolas, obteniéndose los siguientes datos:

    Individuo

    Nivel

    Individuo

    Nivel

    Individuo

    Nivel

    1

    10,6 

    13 

    12,2 

    25 

    11,8 

    2

    12,5 

    14 

    10,8 

    26 

    12,7 

    11,1 

    15 

    16,5 

    27 

    11,4 

    4

    9,2 

    16 

    15,0 

    28 

    9,3 

    5

    11,5 

    17 

    10,3 

    29 

    8,6 

    6

    9,9 

    18 

    12,4 

    30 

    8,5 

    7

    11,9 

    19 

    9,1 

    31 

    10,1 

    8

    11,6 

    20 

    7,8 

    32 

    12,4 

    9

    14,9 

    21 

    11,3 

    33 

    11,1 

    10

    12,5 

    22 

    12,3 

    34 

    10,2 

    11

    12,5 

    23 

    9,7 

     

     

    12

    12,3 

    24 

    12,0 

     

     

    La distribución de frecuencias las marcas de clase será:

    Intervalo

    Ii

    7'5-9

    9-10'5

    10'5-12

    12-13'5

    13'5-15

    15-16'5

     

    Marca de Clase

    xi

    8'25

    9'75

    11'25

    12'75

    14'25

    15'75

     

    Frecuencia 

    ni

    10 

    10 

    ?ni=25 

    la cual proporciona una media aritmética de

    Estadística

    Mediana

  • La mediana es otra medida de posición, la cual se define como aquel valor de la variable tal que, supuestos ordenados los valores de ésta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales

  • Así, si en la siguiente distribución de frecuencias,

    xi

    ni

    Ni

    0

    3

    3

    1

    2

    5

    2

    2

    7

    7

    ordenamos los valores en orden creciente,

    0   0   0   1   1   2   2

    el 1 será el valor que cumple la definición de mediana.

    Lógicamente, en cuanto el valor de la frecuencia total sea ligeramente mayor, este procedimiento resulta inviable. Por esta razón, daremos a continuación una fórmula que permita calcularla. No obstante, será necesario distinguir los casos en los que los datos vengan agrupados de aquellos en los que vengan sin agrupar.

      • Datos sin agrupar:
         

     

    Las gráficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen las dos situaciones que se pueden presentar:

    Estadística

    Si la situación es como la de la figura de la derecha, es decir, si

    Si la situación que se presenta es como la de la figura de la izquierda, entonces la mediana queda indeterminada, aunque en este caso se toma como mediana la media aritmética de los dos valores entre los que se produce la indeterminación; así pues, si

    Nj-1 = n/2 < Nj

    entonces la mediana es

    Estadística

     Ejemplo 1: 

    La distribución de frecuencias acumuladas del ejemplo del número de hijos era

    Nº de hijos(xi)

    Frecuencias Acumuladas(Ni)

    11

    19

    23

    25

    y como es n/2=12'5 y en consecuencia

    11 < 12'5 < 19

    la mediana será Me= 2.

      • Datos Agrupados
         

     

    Las gráficas siguientes, correspondientes a polígonos de frecuencias absolutas acumuladas, nos plantea de nuevo dos situaciones diferentes a considerar:

    Estadística

    El más sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Nj tal que n/2 = Nj, la mediana es Me = xj.

    Si la situación es como la que se representa en la figura de la izquierda, en la que

    Nj-l < n/2 < Nj

    entonces, la mediana, está en el intervalo [xj-1, xj), es decir entre xj-1 y xj, tomándose en ese caso, por razonamientos de proporcionalidad, como mediana el valor

    Estadística

    siendo cj la amplitud del intervalo [xj-1, xj).

     Ejemplo: 

    La distribución de frecuencias del ejemplo de los niveles de colinesterasa es:

    Intervalo

    Ii

    7'5-9

    9-10'5

    10'5-12

    12-13'5

    13'5-15

    15-16'5

    Frecuencia 

    ni

    10 

    10 

    Frecuencia Acumulada

    Ni

    11 

    21 

    31 

    32 

    34 

    Al ser n/2 = 17 y estar

    11 < 17 < 21

    la mediana estará en el intervalo [10'5 , 12), y aplicando la fórmula anterior, será

    Estadística

    Moda

  • La moda se define como aquel valor de la variable al que corresponde máxima frecuencia (absoluta o relativa). Para calcularla, también será necesario distinguir si los datos están o no agrupados.

    • Datos sin agrupar:
       

    •  

      Para datos sin agrupar, la determinación del valor o valores (ya que puede haber más de uno) modales es muy sencilla. Basta observar a que valor le corresponde una mayor ni. Ese será la moda.

      Así en el ejemplo del número de hijos, la simple inspección de la tabla siguiente proporciona como valor para la moda el Md = 2.

      Nº de hijos(xi)

      Nº de familias(ni)

      6

      8

      4

      2

      ?ni=25

        • Datos agrupados:
           

      Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si éstos tienen o no igual amplitud.

      Si tienen amplitud constante c, una vez identificado el intervalo modal [xj-1, xj), es decir el intervalo al que corresponde mayor frecuencia absoluta nj = max{nl, ..., nk}, la moda se define, también por razones geométricas, como

      Estadística

       Ejemplo: 

      Este ejemplo presenta un caso de distribución bimodal, ya que tanto el intervalo [10'5 - 12) como el [12 - 13'5) tienen frecuencia absoluta máxima. Deberíamos aplicar, por tanto, para cada uno de los dos intervalos la fórmula anterior, determinando así las dos modas de la distribución. No obstante, este ejemplo presenta además la peculiaridad adicional de ser ambos intervalos modales contiguos. En esta situación se considera la distribución unimodal, eligiendo como moda el extremo común, Md = 12.

      Si los intervalos tuvieran distinta amplitud cj, primeros debemos normalizar las frecuencias absolutas nj, determinando los cocientes

      Estadística

      y luego aplicar la regla definida para el caso de intervalos de amplitud constante a los lj. Es decir, primero calcular el lj = max{l1,...., lk} para determinar el intervalo modal [xj-1, xj) y luego aplicar la fórmula

      Estadística

      siendo cj la amplitud del intervalo modal [xj-1, xj).

       Ejemplo: 

      Las frecuencias normalizadas correspondientes al ejemplo de intervalos con distinta amplitud serán,

      Ii

      ni

      li

      0-20

      0'4 

      20-30 

      0'9 

      30-40 

      12 

      1'2 

      40-45 

      10 

      45-50 

      1'8 

      50-60 

      10 

      60-80 

      0'4 

      80-100 

      0'2 

      con lo que el intervalo modal es el [40 - 45) y la moda

      Estadística

      A diferencia de lo que ocurre con la media o con la mediana, sí es posible determinar la moda en el caso de datos cualitativos. Así, en el ejemplo del tratamiento de radiación seguido de cirugía puede afirmarse que la causa modal por la que no fue completado el tratamiento es Md = rehusaron cirugía.

      Contenidos

      • Introducción

      • Historia de la estadística

      • Media aritmética

      • Mediana

      • Moda

      • Conclusión

      • Bibliografía

      Conclusión

      Con este trabajo podemos concluir




    Descargar
    Enviado por:Maria Ignacia
    Idioma: castellano
    País: Chile

    Te va a interesar