Estadística


Estadística


TRABAJO DE ESTADÍSTICA

INTRODUCCIÓN

Si bien no hay una definición de estadística exacta, se puede decir  que  la "estadística es el estudio de los métodos y procedimientos para recoger, clasificar, resumir y analizar datos y para hacer inferencias científicas partiendo de tales datos".

Esta definición cubre gran parte de la actividad del científico. Es importante observar que el objeto del que realiza el análisis estadístico son los datos y las observaciones científicas por sí mismos, mas que el material químico que interviene en el estudio.

Para poder comprender eficientemente los procesos estadísticos, se realizará un trabajo completo con lo hecho en clases para poner en práctica los conceptos de población, muestra, inferencia, distribución de frecuencia, variable, moda, mediana, media, percentiles, etc.

Se tomará un curso de 50 personas (población) para estudiar las notas de un ramo llamado “Ingeniería del Software” de una Universidad y con esta información se obtendrán resultados que eventualmente podrían compararse con el mismo ramo de otras universidades.

Explicare también todos los pasos que se deben realizar para la confección de un informe adecuado y de fácil comprensión para el lector.

OBJETIVOS

  • Comprender los pasos necesarios para realizar un estudio de una población.

  • Ejercitar los procesos y los cálculos para obtener información de la población.

  • Entender los conceptos y definiciones que utiliza la estadística para el estudio de la población o muestra.

LA POBLACIÓN

La población consiste en 50 estudiantes que tuvieron las siguientes calificaciones en el ramo de “Ingeniería de Software” de una universidad.

45

61

38

31

45

51

47

29

32

44

43

47

58

54

46

28

40

36

51

49

65

52

18

33

43

40

51

62

68

46

37

48

56

54

29

22

64

45

34

66

43

70

52

31

46

44

67

24

41

40

La unidad de análisis es el estudiante y las variables son las calificaciones obtenidas en dicho ramo. Las calificaciones pueden ser de 10 a 70, siendo 10 la calificación mínima y 70 la calificación máxima.

Esta variable es de tipo cuantitativa - discreta, pues no pueden haber valores decimales y si los hubiese, el profesor está obligado a aproximar. También estas calificaciones están en una escala de razón.

Ahora bien, necesitamos tabular los datos, pero antes se podría haber realizado un cálculo que permite determinar el número de intervalos y la amplitud. Se sugiere que no sean más de 14 ni menos de 4. Pero en este caso es fácil realizar la tabulación sin la necesidad de hacer el cálculo.

Intervalos

fi

10 - 19

1

20 - 29

5

30 - 39

8

40 - 49

19

50 - 59

9

60 - 70

8

En la tabla 1 podemos observar que se divide en dos columnas, la primera son los intervalos y la segunda son las frecuencias absolutas que indican el numero de calificaciones que se encuentran en dicho rango. Una vez obtenida esta información se procederá a obtener mayor análisis de los datos obtenidos de la población.

Tabla 1

DISTRIBUCIONES Y GRÁFICOS

Una vez obtenida la población con sus respectivas frecuencias se podrá analizar más detalladamente los datos.

Vimos además que la tabla anterior estaba compuesta de 2 columnas. Sin embargo, ahora se agregarán columnas necesarias para un estudio más específico de la población.

Intervalos

Xi

fi

Fi

hi

Hi

10 - 19

15

1

1

0,02

0,02

20 - 29

25

5

6

0,1

0,12

30 - 39

35

8

14

0,16

0,28

40 - 49

45

19

33

0,38

0,66

50 - 59

55

9

42

0,18

0,84

60 - 70

65

8

50

0,16

1

Tabla 2

Se puede observar que la tabla 2 tiene más columnas que la tabla 1 y estas significan lo siguiente: ya he explicado lo que significa la primera y la tercera columna. La segunda columna Xi es el promedio del intervalo y se utiliza para hacer algunos cálculos más adelante. La cuarta columna Fi indica las frecuencias acumuladas, que sirve para interpretar algunos datos como lo siguiente: “14 estudiantes de un total de 50 reprobaron el ramo, pues han obtenido una calificación inferior a 40”. La quinta columna hi obtiene una proporción con respecto al total de la población para cada intervalo y se pueden interpretar los datos de la siguiente manera: “el 10% de los estudiantes han obtenido una calificación entre 20 y 29”. Finalmente la sexta columna indica la proporción acumulada de los estudiantes según sus calificaciones. Por ejemplo: “el 28% de los alumnos han reprobado el ramo”.

Estos datos se pueden graficar de distintas maneras para poder estudiarlos de una manera distinta.

La figura 1 representa la distribución de los alumnos según sus calificaciones.

Figura 1

'Estadística'
En la figura 2 podemos observar que el gráfico tiene un comportamiento similar al gráfico anterior, sin embargo este muestra los límites existentes entre las calificaciones. Estos intervalos tiene la misma amplitud y la altura de los rectángulos es igual a la frecuencia. Este gráfico recibe el nombre de Histograma.

Figura 2

Finalmente, en la figura 3 podemos observar el gráfico llamado ojiva. Esta representa la información similar a la figura 1 pero con las frecuencias acumuladas.

Figura 3

MEDIDAS DE RESUMEN

En esta sección utilizaremos las medidas de resumen para obtener mayor información a la obtenida anteriormente.

Estas medidas de resumen consisten en 3 grandes grupos:

  • Medidas de Posición

  • Medidas de Dispersión

  • Medidas de Forma

  • 1.- Dentro de las medidas de posición tenemos los siguientes resultados.

    1.1 Medidas de dependencia central:

    Media : 45,32

    Mediana : 45

    Moda : 40 43 45 46 51

    1.2 Medidas no centrales:

    Primer decil : 29

    Segundo cuartil : 45

    Tercer quintil : 47

    2.- Dentro de las medidas de Dispersión tenemos los siguientes datos.

    Rango : 52

    Desviación media : 9,73

    Varianza : 153,97

    Desviación Std. : 12,4

    3.- Finalmente, dentro de las medidas de Forma tenemos lo siguiente.

  • Medida de Asimetría:

  • Coef. de simetría : 0.03

    CONCLUSIÓN

    Hemos observado y estudiado las diferentes formas de estudiar los datos de una población. Hemos comprendido los pasos a realizar un estudio detallado de los datos, en este caso, las calificaciones de los alumnos del curso “Ingeniería de Software”.

    Lo más importante es la interpretación de estos datos con respecto a la población. Esto es por ejemplo, determinar el porcentaje de aprobados y reprobados con las frecuencias acumuladas o las proporciones acumuladas.

    Hemos observado también que el estudio de la información a través de los gráficos ayuda la comprensión de los datos con respecto a la población.

    Finalmente hemos omitidos los pasos para el calculo de las medidas de resumen, pues en cualquier parte se pueden encontrar las formulas correspondientes a cada tipo de dato.




    Descargar
    Enviado por:Ramzi Youssefi Vash
    Idioma: castellano
    País: Chile

    Te va a interesar