Estadística
Coeficiente de la correlación de Pearson, Media, Moda y Mediana
REPÚBLICA BOLIVARIANA DE VENEZUELA
UNIVERSIDAD PEDAGÓGICA EXPERIMENTAL LIBERTADOR
INSTITUTO PEDAGÓGICO “RAFAEL ALBERTO ESCOBAR LARA”
COEFICIENTE DE LA CORRELACIÓN DE PEARSON, MEDIA, MODA Y MEDIANA
Maracay, septiembre de 2009
COEFICIENTE DE CORRELACIÓN DE PEARSON
Definición: Es un índice estadístico que mide la relación lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones estándar de ambas variables:
r = Sxy
Sx.Sy
Siendo:
Sx la covarianza de (X,Y)
Sx y Sy las desviaciones típicas de las distribuciones marginales.
El valor del índice de correlación varía en el intervalo [-1, + 1]:
-
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total entre las dos variables, es decir, que la variación de una de ellas puede influir en el valor que pueda tomar la otra. Pudiendo haber relaciones no lineales entre dos variables. Estas pueden calcularse con la razón de correlación.
-
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en idéntica proporción.
-
Si 0›r≥1, existe una correlación positiva.
-
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en idéntica proporción.
-
Si -1≤ r›0, existe una correlación negativa.
PLANTEAMIENTO DEL PROBLEMA
El liceo privado “ Arco Iris”, que se encuentra ubicado en el Limón, estado Aragua, esta interesado en conocer la relación que existe entre el tiempo semanal (horas), que dedican los alumnos al estudio con el promedio de las calificaciones al final de los tres trimestre del año escolar 2008- 2009. Se eligieron al azar 11 alumnos para encontrar los resultados. Cacular el coeficiente de correlación de pearson, la media, la moda y la mediana de las variables.
Tabla # 1.- Datos no agrupados del promedio de las calificaciones trimestral y el promedio final de las calificaciones y la relación que existe entre el tiempo semanal (horas), que dedican los alumnos al estudio con los tres trimestres del año escolar 2008-2009. Con una muestra tomada al azar de 11 alumnos pertenecientes al liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua
1º trimestre | tiempo | 2º trimestre | tiempo | 3º trimestre | tiempo | Promedio de | Tiempo |
notas | (horas) | notas | (horas) | notas | (horas) | las 3 notas | (horas) |
17 | 8 | 18 | 8 | 15 | 8 | 17 | 8 |
13 | 5 | 15 | 5 | 16 | 5 | 15 | 5 |
12 | 6 | 10 | 6 | 13 | 6 | 12 | 6 |
9 | 9 | 10 | 9 | 12 | 9 | 10 | 9 |
5 | 8 | 9 | 8 | 8 | 8 | 7 | 8 |
20 | 7 | 18 | 7 | 17 | 7 | 18 | 7 |
10 | 9 | 15 | 9 | 16 | 9 | 14 | 9 |
11 | 5 | 14 | 5 | 18 | 5 | 14 | 5 |
8 | 4 | 12 | 4 | 9 | 4 | 10 | 4 |
15 | 6 | 13 | 6 | 11 | 6 | 13 | 6 |
16 | 9 | 18 | 9 | 20 | 9 | 18 | 9 |
El promedio de notas final de los 11 alumnos tomados al azar del liceo “Arco Iris”, se calculo de la siguiente manera:
Pnf= 1º trimestre (nota)+ 2º trimestre (nota)+3º trimestre (nota)
3
Ejemplo: Pnf= 17+18+15= 50 = 16.6 ≈ 17
-
3
Tabla # 2.- Datos no agrupados del promedio de las calificaciones finales de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra de 11 alumnos al azar del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, en el año escolar 2008-2009.
X | Y | Xp. Yt |
Promedio | Tiempo |
|
final de notas | (horas) |
|
17 | 8 | 136 |
15 | 5 | 75 |
12 | 6 | 72 |
10 | 9 | 90 |
7 | 8 | 56 |
18 | 7 | 126 |
14 | 9 | 126 |
14 | 5 | 70 |
10 | 4 | 40 |
13 | 6 | 78 |
18 | 9 | 162 |
148 | 76 | 1031 |
Para el cálculo de las medias (X, Y), se uso la formula de datos no agrupados:
X= ∑xpfn Y=∑yt
N N
X=∑xpnf= 17+15+12+10+07+18+14+14+10+13+18= 148= 13.45
N 11 11
Y= ∑yt= 8+5+6+9+8+7+9+5+4+6+9+=76= 6.90
N 11 11
Justificación de la X: La nota promedio de las calificaciones finales de los tres trimestres de una muestra tomadas al azar de 11 alumnos pertenecientes al liceo privado “Arco Iris”, es de 13.45.
Justificación de la media Y: El tiempo promedio que dedican una muestra de 11 alumnos al estudio del liceo privado “Arco Iris” es de 6.90.
Tabla # 3.- Datos no agrupados y las desviaciones a la media y la covarianza del promedio de las calificaciones finales de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra al azar de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua en el año escolar 2008-2009
X | Y | Xp . Yt | x | y | x.y |
Promedio | Tiempo |
|
|
|
|
final de notas | (horas) |
|
|
|
|
17 | 8 | 136 | 3,55 | 1,1 | 3,905 |
15 | 5 | 75 | 1,55 | -1,9 | 225 |
12 | 6 | 72 | -1,45 | -0,9 | 1,305 |
10 | 9 | 90 | -3,45 | 2,1 | 7,245 |
7 | 8 | 56 | -6,45 | 1,1 | 7,095 |
18 | 7 | 126 | 4,55 | 0,1 | 0,455 |
14 | 9 | 126 | 0,55 | 2,1 | 1,155 |
14 | 5 | 70 | 0,55 | -1,9 | 1,045 |
10 | 4 | 40 | -3,45 | -2,9 | 10 |
13 | 6 | 78 | -0,45 | -0,9 | 0,405 |
18 | 9 | 162 | 4,55 | 2,1 | 9,555 |
148 | 76 | 1031 |
|
| 45,11 |
Se calculo la desviación de la media y su formula dice:
Dmx= |x - X|
Ejemplo: 17 - 13.45= 3.55
Dmy= |y - Y|
Ejemplo: 8 - 6.90= 1.1
Covarianza
La formula es la siguiente
SXpYt= ∑Xp. Yt - X.Y= 1031 - 13.45. 6.90
N 11
SXpYt= 93.72-92.80= 0.92
Justificación: El resultado de la covarianza es positiva, nos indica cierta tendencia a que un tiempo semanal (horas) de estudio esta por encima de la media corresponde calificaciones por encima de la media, y a un tiempo de estudio por debajo de la media corresponde calificaciones por debajo de la media.
Tabla # 4.- Datos no agrupados y las desviaciones respecto a la media, la covarianza y varianza del promedio de las calificaciones finales de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra al azar de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón estado Aragua, en el año escolar 2008- 2009.
X | Y | Xp . Yt | x | y | x.y | Xp² | Yt² |
Promedio | Tiempo |
|
|
|
|
|
|
final de notas | (horas) |
|
|
|
|
|
|
17 | 8 | 136 | 3,55 | 1,1 | 3,905 | 289 | 64 |
15 | 5 | 75 | 1,55 | -1,9 | 2.945 | 225 | 25 |
12 | 6 | 72 | -1,45 | -0,9 | 1,305 | 144 | 36 |
10 | 9 | 90 | -3,45 | 2,1 | 7,245 | 100 | 81 |
7 | 8 | 56 | -6,45 | 1,1 | 7,095 | 49 | 64 |
18 | 7 | 126 | 4,55 | 0,1 | 0,455 | 324 | 49 |
14 | 9 | 126 | 0,55 | 2,1 | 1,155 | 196 | 81 |
14 | 5 | 70 | 0,55 | -1,9 | 1,045 | 196 | 25 |
10 | 4 | 40 | -3,45 | -2,9 | 10 | 100 | 16 |
13 | 6 | 78 | -0,45 | -0,9 | 0,405 | 169 | 36 |
18 | 9 | 162 | 4,55 | 2,1 | 9,555 | 324 | 81 |
148 | 76 | 1031 |
|
| 45,11 | 2116 | 558 |
Para calcular la varianza la formula es la siguiente:
S²Xp= ∑ Xp² - (X)²
N
S²Xp= ∑Xp²= 289+225+144+100+49+324+196+196+100+169+324 - 180.90
N 11
S²Xp= 196.36 - 180.90
S²Xp²= 11.46
SXp= √11.46
SXp= 3.38
Justificación: La dispersión promedio de las calificaciones finales de los tres trimestre de una muestra de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua del año escolar 2008- 2009 es de 3.38
Ahora la variación de Yt:
S² Yt= ∑Yt² - (Y)²
N
S² Yt²= ∑Yt²= 64+25+36+81+64+49+81+25+16+36+81 - 47.61
N 11
S²Yt²= 50.72-47.61
S²Yt= 3.11
SYt= √3.11
SYt= 1.76
Justificación: La dispersión promedio del tiempo semanal que dedican a los estudios una muestra de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, del año escolar 2008- 2009 es de 1.76
Calculo del coeficiente de la correlación de Pearson:
La formula es la siguiente:
rXpYt= SXpYt
SXp.SYt
rXpYt= 0.92
3.38.1.76
rXpYt= 0.154
Justificación: Viendo los resultados llegamos a la conclusión de que estamos ante una correlación positiva muy baja, pero como es positiva las dos variables correlacionan en el mismo sentido.
Tabla # 5.- Datos no agrupados de la mediana de los promedio de las calificaciones del final de los tres trimestres y la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio. Tomando una muestra al azar de 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, en el año escolar 2008-2009.
N | X | Y |
| Promedio | Tiempo |
| final de notas | (horas) |
1 | 7 | 4 |
2 | 10 | 5 |
3 | 10 | 5 |
4 | 12 | 6 |
5 | 13 | 6 |
6 | 14 | 7 |
7 | 14 | 8 |
8 | 15 | 8 |
9 | 17 | 9 |
10 | 18 | 9 |
11 | 18 | 9 |
Calculo para la mediana de Xp:
MeXp= X (n+1)
2
MeXp= X(11+1)
2
MeXp= X (12)
2
MeXp= X6
Xp= 14
Justificación: El 50% de los 11 alumnos, tienen un promedio de nota por debajo de 14 puntos y el otro 50% por encima de 14 puntos, de los alumnos pertenecientes al liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua en el año escolar 2008-2009
Calculo para la mediana de Yt
MeYt= Y(n+1)
2
MeYt= Y(11+1)
2
MeYt= Y(12)
2
MeYt= Y6
Yt= 7
Justificación: El 50% de los 11 alumnos que dedican tiempo semanal (horas) a estudiar esta por debajo de 7 horas y el otro 50% por encima de 7 horas.
La moda:
MoXp: Las calificaciones con mayor frecuencia son 10, 14, 18 pasando hacer esta una multimoda.
MoYt: Las horas que más se repite con mayor frecuencia es 9.
CONCLUSIÓN.
Con una muestra de 11 alumnos pertenecientes al liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua, se conoció la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio y el promedio de las calificaciones al final de los tres trimestres del año escolar 2008-2009 y se calculo el coeficiente de correlación de Pearson de ambas variables incluyendo la moda y mediana, de los datos (notas, horas).
Resultando:
Tabla # 6.- Resultado de los cálculos realizados con la finalidad de encontrar la correlación que existe entre los resultados del promedio de las calificaciones finales de los tres trimestre y el tiempo semanal(h), que dedican 11 alumnos del liceo privado “Arco Iris”, ubicado en el Limón, estado Aragua en el año escolar 2008-2209
∑Promedio de notas final | 148 | La suma del promedio de nota final de los 11 alumnos | ||||
∑Tiempo (horas) | 76 | Suma del tiempo seman.(h) que usan alumnos para estudiar | ||||
Media X | 13,45 | Nota promedio de las calificaciones finales de los tres trimes. | ||||
Media Y | 6,9 | El tiempo promedio que dedican los alumnos al estudio | ||||
∑Xp.Yt | 1031 | Suma de las desviaciones del producto notas y tiempo | ||||
Desviación media (x.y) | 45,11 | Suma de las dispersiones del promedio de notas y el tiempo | ||||
Covarianza SXpYt | 0,92 | Resultado positivo |
|
|
| |
Varianza |
|
|
|
|
|
|
SXp | 3,38 | Dispersión promedio de las calificaciones finales |
| |||
SYt | 1,76 | Dispersión promedio del tiempo semanal (horas) |
| |||
Correlación de Pearson |
| Correlación positiva muy baja, pero correlacionan | ||||
rXpYt | 0,154 | en el mismo sentido |
|
|
| |
Mediana Xp | 14 | 50% de las notas por debajo de 14 y 50% por encima de 14 | ||||
Mediana Yt | 7 | 50% del tiempo por debajo de 7 y 50% por encima de 7 | ||||
Moda Xp | 10,14,18 | Es una multimoda con 3 jorobas |
|
| ||
Moda Yt | 9 | Esta es la hora con mayor frecuencia |
|
Viendo los resultados se puede decir que hay una correlación positiva muy baja, pero de las calificaciones obtenidas del promedio de los tres trimestres del año escolar 2008-2009 con el tiempo semanal (h) que dedican 11 estudiantes al estudio, las dos variables correlacionan en el mismo sentido.
BIBLIOGRAFIA
-Ibarra, R. manual de estadística básica.Edit.UPEL-Macaro.Venezuela.2005.Pág.167-173
-Enciclopedia multimedia Wikipedia. Coeficiente de correlación de Pearson. [Documento en línea].Disponible:
http://www.wikipedia.org.[consulta:2009 agosto 2]
AGRADECIMIENTO
A los profesores Rubén Maduro de la especialidad de Física y estudios en Estadística, el Profesor de Matemática Freddy Pacheco y al estudiante de Educación en la especialidad de Informática el Sr. Simón Bravo, por su colaboración prestada en la orientación y supervisión de mi trabajo.
Deseo expresar mi gratitud hacia ellos, pues me guiaron, asesoraron y supervisaron el trabajo que he realizado.
Muchas gracias.
Descargar
Enviado por: | Michel Parisca |
Idioma: | castellano |
País: | Venezuela |