Coeficiente de la correlación de Pearson, Media, Moda y Mediana

Planteamiento del problema. Conclusión

  • Enviado por: Michel Parisca
  • Idioma: castellano
  • País: Venezuela Venezuela
  • 12 páginas
publicidad
publicidad

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD PEDAGÓGICA EXPERIMENTAL LIBERTADOR

INSTITUTO PEDAGÓGICO “RAFAEL ALBERTO ESCOBAR LARA”

COEFICIENTE DE LA CORRELACIÓN DE PEARSON, MEDIA, MODA Y MEDIANA

Maracay, septiembre de 2009

COEFICIENTE DE CORRELACIÓN DE PEARSON

Definición: Es un índice estadístico que mide la relación lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones estándar de ambas variables:

r = Sxy

Sx.Sy

Siendo:

Sx la covarianza de (X,Y)

Sx y Sy las desviaciones típicas de las distribuciones marginales.

El valor del índice de correlación varía en el intervalo [-1, + 1]:

  • Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total entre las dos variables, es decir, que la variación de una de ellas puede influir en el valor que pueda tomar la otra. Pudiendo haber relaciones no lineales entre dos variables. Estas pueden calcularse con la razón de correlación.

  • Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en idéntica proporción.

  • Si 0›r≥1, existe una correlación positiva.

  • Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en idéntica proporción.

  • Si -1≤ r›0, existe una correlación negativa.

PLANTEAMIENTO DEL PROBLEMA

El liceo privado “ Arco Iris”, que se encuentra ubicado en el Limón, estado Aragua, esta interesado en conocer la relación que existe entre el tiempo semanal (horas), que dedican los alumnos al estudio con el promedio de las calificaciones al final de los tres trimestre del año escolar 2008- 2009. Se eligieron al azar 11 alumnos para encontrar los resultados. Cacular el coeficiente de correlación de pearson, la media, la moda y la mediana de las variables.

Tabla # 1.- Datos no agrupados del promedio de las calificaciones trimestral y el promedio final de las calificaciones y la relación que existe entre el tiempo semanal (horas), que dedican los alumnos al estudio con los tres trimestres del año escolar 2008-2009. Con una muestra tomada al azar de 11 alumnos pertenecientes al liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua

1º trimestre

tiempo

2º trimestre

tiempo

3º trimestre

tiempo

Promedio de

Tiempo

notas

(horas)

notas

(horas)

notas

(horas)

las 3 notas

(horas)

17

8

18

8

15

8

17

8

13

5

15

5

16

5

15

5

12

6

10

6

13

6

12

6

9

9

10

9

12

9

10

9

5

8

9

8

8

8

7

8

20

7

18

7

17

7

18

7

10

9

15

9

16

9

14

9

11

5

14

5

18

5

14

5

8

4

12

4

9

4

10

4

15

6

13

6

11

6

13

6

16

9

18

9

20

9

18

9

El promedio de notas final de los 11 alumnos tomados al azar del liceo “Arco Iris”, se calculo de la siguiente manera:

Pnf= 1º trimestre (nota)+ 2º trimestre (nota)+3º trimestre (nota)

3

Ejemplo: Pnf= 17+18+15= 50 = 16.6 ≈ 17

  • 3

Tabla # 2.- Datos no agrupados del promedio de las calificaciones finales de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra de 11 alumnos al azar del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, en el año escolar 2008-2009.

X

Y

Xp. Yt

Promedio

Tiempo

 

final de notas

(horas)

 

17

8

136

15

5

75

12

6

72

10

9

90

7

8

56

18

7

126

14

9

126

14

5

70

10

4

40

13

6

78

18

9

162

148

76

1031

Para el cálculo de las medias (X, Y), se uso la formula de datos no agrupados:

X= ∑xpfn Y=∑yt

N N

X=∑xpnf= 17+15+12+10+07+18+14+14+10+13+18= 148= 13.45

N 11 11

Y= ∑yt= 8+5+6+9+8+7+9+5+4+6+9+=76= 6.90

N 11 11

Justificación de la X: La nota promedio de las calificaciones finales de los tres trimestres de una muestra tomadas al azar de 11 alumnos pertenecientes al liceo privado “Arco Iris”, es de 13.45.

Justificación de la media Y: El tiempo promedio que dedican una muestra de 11 alumnos al estudio del liceo privado “Arco Iris” es de 6.90.

Tabla # 3.- Datos no agrupados y las desviaciones a la media y la covarianza del promedio de las calificaciones finales de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra al azar de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua en el año escolar 2008-2009

X

Y

Xp . Yt

x

y

x.y

Promedio

Tiempo

 

 

 

 

final de notas

(horas)

 

 

 

 

17

8

136

3,55

1,1

3,905

15

5

75

1,55

-1,9

225

12

6

72

-1,45

-0,9

1,305

10

9

90

-3,45

2,1

7,245

7

8

56

-6,45

1,1

7,095

18

7

126

4,55

0,1

0,455

14

9

126

0,55

2,1

1,155

14

5

70

0,55

-1,9

1,045

10

4

40

-3,45

-2,9

10

13

6

78

-0,45

-0,9

0,405

18

9

162

4,55

2,1

9,555

148

76

1031

 

 

45,11

Se calculo la desviación de la media y su formula dice:

Dmx= |x - X|

Ejemplo: 17 - 13.45= 3.55

Dmy= |y - Y|

Ejemplo: 8 - 6.90= 1.1

Covarianza

La formula es la siguiente

SXpYt= ∑Xp. Yt - X.Y= 1031 - 13.45. 6.90

N 11

SXpYt= 93.72-92.80= 0.92

Justificación: El resultado de la covarianza es positiva, nos indica cierta tendencia a que un tiempo semanal (horas) de estudio esta por encima de la media corresponde calificaciones por encima de la media, y a un tiempo de estudio por debajo de la media corresponde calificaciones por debajo de la media.

Tabla # 4.- Datos no agrupados y las desviaciones respecto a la media, la covarianza y varianza del promedio de las calificaciones finales de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra al azar de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón estado Aragua, en el año escolar 2008- 2009.

X

Y

Xp . Yt

x

y

x.y

Xp²

Yt²

Promedio

Tiempo

 

 

 

 

 

 

final de notas

(horas)

 

 

 

 

 

 

17

8

136

3,55

1,1

3,905

289

64

15

5

75

1,55

-1,9

2.945

225

25

12

6

72

-1,45

-0,9

1,305

144

36

10

9

90

-3,45

2,1

7,245

100

81

7

8

56

-6,45

1,1

7,095

49

64

18

7

126

4,55

0,1

0,455

324

49

14

9

126

0,55

2,1

1,155

196

81

14

5

70

0,55

-1,9

1,045

196

25

10

4

40

-3,45

-2,9

10

100

16

13

6

78

-0,45

-0,9

0,405

169

36

18

9

162

4,55

2,1

9,555

324

81

148

76

1031

 

 

45,11

2116

558

Para calcular la varianza la formula es la siguiente:

S²Xp= Xp² - (X)²

N

S²Xp= ∑Xp²= 289+225+144+100+49+324+196+196+100+169+324 - 180.90

N 11

S²Xp= 196.36 - 180.90

S²Xp²= 11.46

SXp= √11.46

SXp= 3.38

Justificación: La dispersión promedio de las calificaciones finales de los tres trimestre de una muestra de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua del año escolar 2008- 2009 es de 3.38

Ahora la variación de Yt:

S² Yt= ∑Yt² - (Y)²

N

S² Yt²= ∑Yt²= 64+25+36+81+64+49+81+25+16+36+81 - 47.61

N 11

S²Yt²= 50.72-47.61

S²Yt= 3.11

SYt= √3.11

SYt= 1.76

Justificación: La dispersión promedio del tiempo semanal que dedican a los estudios una muestra de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, del año escolar 2008- 2009 es de 1.76

Calculo del coeficiente de la correlación de Pearson:

La formula es la siguiente:

rXpYt= SXpYt

SXp.SYt

rXpYt= 0.92

3.38.1.76

rXpYt= 0.154

Justificación: Viendo los resultados llegamos a la conclusión de que estamos ante una correlación positiva muy baja, pero como es positiva las dos variables correlacionan en el mismo sentido.

Tabla # 5.- Datos no agrupados de la mediana de los promedio de las calificaciones del final de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra al azar de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, en el año escolar 2008-2009.

N

X

Y

 

Promedio

Tiempo

 

final de notas

(horas)

1

7

4

2

10

5

3

10

5

4

12

6

5

13

6

6

14

7

7

14

8

8

15

8

9

17

9

10

18

9

11

18

9


Calculo para la mediana de Xp:

MeXp= X (n+1)

2

MeXp= X(11+1)

2

MeXp= X (12)

2

MeXp= X6

Xp= 14

Justificación: El 50% de los 11 alumnos, tienen un promedio de nota por debajo de 14 puntos y el otro 50% por encima de 14 puntos, de los alumnos pertenecientes al liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua en el año escolar 2008-2009

Calculo para la mediana de Yt

MeYt= Y(n+1)

2

MeYt= Y(11+1)

2

MeYt= Y(12)

2

MeYt= Y6

Yt= 7

Justificación: El 50% de los 11 alumnos que dedican tiempo semanal (horas) a estudiar esta por debajo de 7 horas y el otro 50% por encima de 7 horas.

La moda:

MoXp: Las calificaciones con mayor frecuencia son 10, 14, 18 pasando hacer esta una multimoda.

MoYt: Las horas que más se repite con mayor frecuencia es 9.

CONCLUSIÓN.

Con una muestra de 11 alumnos pertenecientes al liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, se conoció la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio y el promedio de las calificaciones al final de los tres trimestres del año escolar 2008-2009 y se calculo el coeficiente de correlación de Pearson de ambas variables incluyendo la moda y mediana, de los datos (notas, horas).

Resultando:

Tabla # 6.- Resultado de los cálculos realizados con la finalidad de encontrar la correlación que existe entre los resultados del promedio de las calificaciones finales de los tres trimestre y el tiempo semanal(h), que dedican 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua en el año escolar 2008-2209

∑Promedio de notas final

148

La suma del promedio de nota final de los 11 alumnos

∑Tiempo (horas)

76

Suma del tiempo seman.(h) que usan alumnos para estudiar

Media X

13,45

Nota promedio de las calificaciones finales de los tres trimes.

Media Y

6,9

El tiempo promedio que dedican los alumnos al estudio

∑Xp.Yt

1031

Suma de las desviaciones del producto notas y tiempo

Desviación media (x.y)

45,11

Suma de las dispersiones del promedio de notas y el tiempo

Covarianza SXpYt

0,92

Resultado positivo

 

 

 

Varianza

 

 

 

 

 

 

SXp

3,38

Dispersión promedio de las calificaciones finales

 

SYt

1,76

Dispersión promedio del tiempo semanal (horas)

 

Correlación de Pearson

 

Correlación positiva muy baja, pero correlacionan

rXpYt

0,154

en el mismo sentido

 

 

 

Mediana Xp

14

50% de las notas por debajo de 14 y 50% por encima de 14

Mediana Yt

7

50% del tiempo por debajo de 7 y 50% por encima de 7

Moda Xp

10,14,18

Es una multimoda con 3 jorobas

 

 

Moda Yt

9

Esta es la hora con mayor frecuencia

 

Viendo los resultados se puede decir que hay una correlación positiva muy baja, pero de las calificaciones obtenidas del promedio de los tres trimestres del año escolar 2008-2009 con el tiempo semanal (h) que dedican 11 estudiantes al estudio, las dos variables correlacionan en el mismo sentido.

BIBLIOGRAFIA

-Ibarra, R. manual de estadística básica.Edit.UPEL-Macaro.Venezuela.2005.Pág.167-173

-Enciclopedia multimedia Wikipedia. Coeficiente de correlación de Pearson. [Documento en línea].Disponible:

http://www.wikipedia.org.[consulta:2009 agosto 2]

AGRADECIMIENTO

A los profesores Rubén Maduro de la especialidad de Física y estudios en Estadística, el Profesor de Matemática Freddy Pacheco y al estudiante de Educación en la especialidad de Informática el Sr. Simón Bravo, por su colaboración prestada en la orientación y supervisión de mi trabajo.

Deseo expresar mi gratitud hacia ellos, pues me guiaron, asesoraron y supervisaron el trabajo que he realizado.

Muchas gracias.