Estadística
Relación entre Variables
Relación entre variables. Las correlaciones y la regresión. (7).
(Correlación de Pearson, el de contingencia, la correlación biserial-puntual; y otras de carácter secundario Phi, la tetracórica y la biserial más algunas nociones generales sobre regresión)
El concepto de correlación.
Nos indica la tendencia de dos o más conjuntos de datos a variar de forma conjunta; para cuantificar su intensidad, contamos con el coeficiente de correlación que nos mide el índice de covariación o variación conjunta de dos, o más, series de datos.
Relaciones.
Toma valores exclusivamente entre 1 y -1.
Formas típicas de la correlación: A) positiva, B) negativa, c) sin correlación y d) Curva.
- La correlación perfecta se representa numéricamente por 1, en el caso de correlación directa +1 y en el de inversa -1.(Imperfecta positiva entre 0 y +1; imperfecta negativa entre 0 y -1) .
En su interpretación, se toman en cuenta las siguientes pautas:
- Las variables que se relacionan, (Se toman en cuenta previamente otros índices de coeficientes en grupos de naturaleza similar) .
- La variabilidad del grupo; pues si esta es más elevada mayor será la correlación,
(de tal forma que de dos coeficientes con el mismo valor) el que corresponde al grupo más homogéneo es el que presenta una intensidad más elevada.
- La función a que se destinará el coeficiente hallado (Fiabilidad de una prueba > que su validez; predecir > probar hipótesis).
- Criterios generales:
-
-
Correlación
mBi
Bpa
Nma
Aef
Mame
-
mBi: muy Baja, indiferente. Bpa: Baja, poco apreciable. Nma: Notable, marcada.Aef: Alta, elevada, fuerte. Mame: Muy alta, muy elevada.
El coeficiente de correlación de Pearson.
Para llevar a cabo su cálculo pueden utilizarse:
Puntuaciones directas | |
Puntuaciones diferenciales |
Tabla (X, Matemáticas; Y, Física). 10 sujetos.
Sujetos | Var. X | Var. Y | X2 | Y2 | X.Y | x | x2 | y | y2 | x.y |
1 | 7 | 8 | 49 | 64 | 56 | 1,5 | 2,25 | 2 | 4 | 3 |
2 | 5 | 4 | 25 | 16 | 20 | -0,5 | 0,25 | -2 | 4 | 1 |
3 | 9 | 8 | 81 | 64 | 72 | 3,5 | 12,25 | 2 | 4 | 7 |
4 | 7 | 7 | 49 | 49 | 49 | 1,5 | 2,25 | 1 | 1 | 1,5 |
5 | 4 | 3 | 16 | 9 | 12 | -1,5 | 2,25 | -3 | 9 | 4,5 |
6 | 6 | 7 | 36 | 49 | 42 | 0,5 | 0,25 | 1 | 1 | 0,5 |
7 | 3 | 5 | 9 | 25 | 15 | -2,5 | 6,25 | -1 | 1 | 2,5 |
8 | 5 | 6 | 25 | 36 | 30 | -0,5 | 0,25 | 0 | 0 | 0 |
9 | 4 | 5 | 16 | 25 | 20 | -1,5 | 2,25 | -1 | 1 | 1,5 |
10 | 5 | 7 | 25 | 49 | 35 | -0,5 | 0,25 | 1 | 1 | -0,5 |
Total | 55 | 60 | 331 | 386 | 351 | 28,5 | 26 | 21 | ||
Coeficiente con puntuaciones directas:
Coeficiente con puntuaciones diferenciales:
El coeficiente de correlación ordinal de Spearman (rs).
En los casos en que dos variables tengan la misma naturaleza; y con estos sólo se garantiza un nivel de medida ordinal, importa el lugar que ocupa; no la puntuación obtenida. Es cuando recurrimos a este coeficiente.
Para proceder a la transformación de las puntuaciones obtenidas de la aplicación directa del instrumento,de recogida de datos en rangos se suele comenzar asignando el rango a la posición “1” a la posición más alta, la siguiente tendrá el rango “2”,…
Para su cálculo utilizaremos:
(Puntuaciones de 15 sujetos)
Suje. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
Va.X | 45 | 39 | 50 | 33 | 47 | 25 | 40 | 30 | 20 | 40 | 25 | 15 | 23 | 35 | 17 |
Va.Y | 38 | 35 | 45 | 30 | 50 | 28 | 35 | 35 | 15 | 40 | 32 | 15 | 14 | 30 | 12 |
Tabla (Nivel de comprensión oral; X y los de expresión escrita Y).
Sujetos | Var. X | Rango(X) | Var. Y | Rango (Y) | D | D2 |
3 | 50 | 1 | 45 | 2 | -1 | 1 |
5 | 47 | 2 | 50 | 1 | +1 | 1 |
1 | 45 | 3 | 38 | 4 | -1 | 1 |
10 | 40 | 4,5 | 40 | 3 | +1,5 | 2,25 |
7 | 40 | 4,5 | 35 | 6 | -1,5 | 2,25 |
2 | 39 | 6 | 35 | 6 | 0 | 0 |
14 | 35 | 7 | 30 | 9,5 | -2,5 | 6,25 |
4 | 33 | 8 | 30 | 9,5 | -1,5 | 2,25 |
8 | 30 | 9 | 35 | 6 | +3 | 9 |
11 | 25 | 10,5 | 32 | 8 | +2,5 | 6,25 |
6 | 25 | 10,5 | 28 | 11 | -0,5 | 0,25 |
13 | 23 | 12 | 14 | 14 | -2 | 4 |
9 | 20 | 13 | 15 | 12,5 | +0,5 | 0,25 |
15 | 17 | 14 | 12 | 15 | -1 | 1 |
12 | 15 | 15 | 15 | 12,5 | +2,5 | 6,25 |
43 |
0,92>0,90 (Relación muy alta)
Coeficiente de contingencia.
Se utilizan en aquellos supuestos en que se recogen datos de variables clasificadas en categorías. Así las tablas de contingencia reflejan una asignación de sujetosa grupos y categorías en cada una de las variables; (…nivel de estudios…).
Cuando nos interese conocer el grado de asociación entre dos variables de naturaleza nominal; categóricas; recurriremos a “C” (Coeficiente de contingencia) [Nunca alcanzará el valor de 1; ya que el denominador siempre será superior al numerador]
Donde
A su vez
-
-
-
-
-
nº total de sujetos de esa fila
nº de sujetos de esa columna
nº total de sujetos de la muestra
frecuencias observadas o empíricas
frecuencias esperadas o aleatorias
nº total de sujetos de la muestra
-
-
-
-
Tabla (Estudios elegidos por los sujetos y nivel socioeconómico) (320 sujetos).
Estudios Nivel sociocec. | Ciencias Sociales y Jurídicas | Ciencias | Humanidades |
Bajo | 20 | 40 | 60 |
Medio | 40 | 40 | 40 |
Alto | 20 | 20 | 20 |
Realizados los cálculos:
Estudios Nivel sociocec. | Ciencias Sociales y Jurídicas | Ciencias | Humanidades | Total |
Bajo | 20 (37,5) | 40 (37,5) | 60 (45) | 120 |
Medio | 40 (37,5) | 40 (37,5) | 40 (45) | 120 |
Alto | 40 (25) | 20 (25) | 20 (30) | 80 |
Total | 100 | 100 | 120 | 320 |
A partir de estos datos:
(Indica una relación aceptable )
El coeficiente de correlación biserial-puntual (rbp).
Cuando buscamos el grado de relación que se manifiesta entre una variable cuantitativa, continua o discreta y otra auténticamente dicotómica, debemos recurrir al coeficiente biserial – puntual.(En realidad nos encontramos ante una extensión del coeficiente de correlación de Spearman).Tenemos dos fórmulas para determinar el valor de este coeficiente:
o bien
- Calculo e interpretación del coeficiente de correlación biserial puntual (rbp).
- Se emplea cuando nos encontramos ante una variable cuantitativa continua o discreta y otra dicotómica; sólo admite dos valores.(En nuestro ejemplo, comprobar el nivel de rendimiento entre Lenguaje-50 ítems- y Sexo.).
I | fp(Alumnos) | fq(Alumnas) | ft | |||||
5-7 | 2 | 1 | 3 | -3 | -6 | -3 | -9 | 27 |
8-14 | 6 | 4 | 10 | -2 | -12 | -8 | -20 | 40 |
15-21 | 9 | 5 | 14 | -1 | -9 | -5 | -14 | 14 |
22-28 | 11 | 13 | 24 | 0 | 0 | 0 | 0 | 0 |
29-35 | 8 | 10 | 18 | +1 | 8 | 10 | 18 | 18 |
36-42 | 3 | 6 | 9 | +2 | 6 | 12 | 18 | 36 |
43-49 | 2 | 4 | 6 | +3 | 6 | 12 | 18 | 54 |
41 | 43 | 84 | -27 | -16 | -43 | 189 | ||
+20 | +34 | +54 | ||||||
-7 | +18 | +11 | ||||||
Para el cálculo de rbpexisten dos ecuaciones:
o bien
Operando con una de las fórmulas:
(Correlación muy baja; indica que .
Cálculo e interpretación del coeficiente de correlación biserial (rb).
- Se emplea cuando nos encontramos ante una variable cuantitativa y otra dicotomizada; sus ecuaciones de cálculo son:
(Ejemplo: Queremos estudiar la relación que existe entre el rendimiento de los alumnos de matemáticas (prueba de 40 ítems) y el nivel de razonamiento abstracto (en esta variable se han dicotomizado las puntuaciones sobre la base de la mediana; nivel de razonamiento alto (p); nivel de razonamiento bajo (q). )
I | fp | fq | ||||||||
1-5 | --- | 2 | 2 | --- | --- | -3 | -6 | -4 | -8 | 32 |
6-10 | 1 | 5 | 6 | -3 | -3 | -2 | -10 | -3 | -18 | 54 |
11-15 | 3 | 8 | 11 | -2 | -3 | -1 | -8 | -2 | -22 | 44 |
16-20 | 6 | 12 | 18 | -1 | -6 | 0 | 0 | -1 | -18 | 18 |
21-25 | 13 | 10 | 23 | 0 | 0 | +1 | 10 | 0 | 0 | 0 |
26-30 | 10 | 7 | 17 | +1 | 10 | +2 | 14 | +1 | 17 | 17 |
31-35 | 8 | 3 | 11 | +2 | 16 | +3 | 9 | +2 | 22 | 44 |
36-40 | 6 | --- | 6 | +3 | 18 | --- | --- | +3 | 18 | 54 |
47 | 47 | 94 | -15 | -24 | -66 | 263 | ||||
+44 | +33 | +57 | ||||||||
+29 | +9 | -9 |
=8,35
(Al ser la mediana el lugar que ocupa el lugar central, el número de sujetos de p y q ha de ser el mismo; por tanto las áreas correspondientes son idénticas (0,50); y en consecuencia la ordenada y corresponde a este punto – ver tabla de curva normal – vale 0,3989)
Así nos queda:
Cálculo e interpretación del coeficiente de correlación tetracórico (rt).
Se utiliza cuando las dos variables son de naturaleza cuantitativa, pero se dicotomizan tomando como punto de dicomotización la mediana.
(Deseamos conocer el nivel de relación existente entre calificaciones en lengua (1 a 10), y los resultados de un test de comprensión lectora (1 a 100) en un grupo de 34 alumnos).
Lugares | Mediana | |
Puntuaciones de Lengua | 17 (5) y 18 (6) | |
Test de comprensión lectora | 17 (50) y 18 (52) |
Se construye una tabla de contingencia de 2x2 sobre la que llevaremos las 34 parejas de puntuaciones.
Md=51 | |||||||
Md=5,5 | /// | 3 A | //// //// B | //// | 14 | 17 | |
//// //// | //// | C 15 | D // | 2 | 17 | ||
18 | 16 | 34 |
Una ecuación para resolver el cálculo de rt :
(Este valor (35) se situaría entre 33,61 y37,79 en la
tabla de valores estimados de rtlo que equivale a 0,90.)
Cálculo e interpretación del coeficiente de correlación phi ().
Se comprueba la relación entre dos variables dicotómicas (dos categorías);
(relación entre lugar de residencia (rural o urbano) y las respuestas a un determinado elemento(verdadero o falso).
Residencia | |||
Urbana | Rural | Total | |
F | 15 A | 17 B | 32 |
V | C45 | D23 | 68 |
Total | 60 | 40 | 100 |
Aplicando la ecuación siguiente:
-
-
-
-
-
-
-
(Nivel de correlación muy bajo; apenas existe influencia entre el lugar de residencia y la pregunta a la respuesta formulada)
-
-
-
-
-
-
Regresión lineal simple
La interpretación de los coeficientes de correlación se basa en la intensidad o el grado de esa relación, desde los valores próximos a “0” hasta los que se acercan a “1”, que indican una mayor intensidad. Esos valores permiten conocer la varianza compartida, o sea la parte de la variabilidad de una de ellas explicada por la otra. Para su cálculo se eleva el valor del coeficiente al cuadrado y se obtiene el denominado coeficiente de determinación.
Descargar
Enviado por: | El Bandoler De Segaria |
Idioma: | castellano |
País: | España |