Estadística


Relación entre Variables

Relación entre variables. Las correlaciones y la regresión. (7).

(Correlación de Pearson, el de contingencia, la correlación biserial-puntual; y otras de carácter secundario Phi, la tetracórica y la biserial más algunas nociones generales sobre regresión)

El concepto de correlación.

Nos indica la tendencia de dos o más conjuntos de datos a variar de forma conjunta; para cuantificar su intensidad, contamos con el coeficiente de correlación que nos mide el índice de covariación o variación conjunta de dos, o más, series de datos.

Relaciones.


Toma valores exclusivamente entre 1 y -1.

Formas típicas de la correlación: A) positiva, B) negativa, c) sin correlación y d) Curva.

  • La correlación perfecta se representa numéricamente por 1, en el caso de correlación directa +1 y en el de inversa -1.(Imperfecta positiva entre 0 y +1; imperfecta negativa entre 0 y -1) .

En su interpretación, se toman en cuenta las siguientes pautas:

  • Las variables que se relacionan, (Se toman en cuenta previamente otros índices de coeficientes en grupos de naturaleza similar) .
  • La variabilidad del grupo; pues si esta es más elevada mayor será la correlación,

(de tal forma que de dos coeficientes con el mismo valor) el que corresponde al grupo más homogéneo es el que presenta una intensidad más elevada.

  • La función a que se destinará el coeficiente hallado (Fiabilidad de una prueba > que su validez; predecir > probar hipótesis).
  • Criterios generales:

Correlación

mBi

Bpa

Nma

Aef

Mame

mBi: muy Baja, indiferente. Bpa: Baja, poco apreciable. Nma: Notable, marcada.Aef: Alta, elevada, fuerte. Mame: Muy alta, muy elevada.

El coeficiente de correlación de Pearson.

Para llevar a cabo su cálculo pueden utilizarse:

Puntuaciones directas

Puntuaciones diferenciales

Tabla (X, Matemáticas; Y, Física). 10 sujetos.

Sujetos

Var. X

Var. Y

X2

Y2

X.Y

x

x2

y

y2

x.y

1

7

8

49

64

56

1,5

2,25

2

4

3

2

5

4

25

16

20

-0,5

0,25

-2

4

1

3

9

8

81

64

72

3,5

12,25

2

4

7

4

7

7

49

49

49

1,5

2,25

1

1

1,5

5

4

3

16

9

12

-1,5

2,25

-3

9

4,5

6

6

7

36

49

42

0,5

0,25

1

1

0,5

7

3

5

9

25

15

-2,5

6,25

-1

1

2,5

8

5

6

25

36

30

-0,5

0,25

0

0

0

9

4

5

16

25

20

-1,5

2,25

-1

1

1,5

10

5

7

25

49

35

-0,5

0,25

1

1

-0,5

Total

55

60

331

386

351

28,5

26

21

Coeficiente con puntuaciones directas:

Coeficiente con puntuaciones diferenciales:

El coeficiente de correlación ordinal de Spearman (rs).

En los casos en que dos variables tengan la misma naturaleza; y con estos sólo se garantiza un nivel de medida ordinal, importa el lugar que ocupa; no la puntuación obtenida. Es cuando recurrimos a este coeficiente.

Para proceder a la transformación de las puntuaciones obtenidas de la aplicación directa del instrumento,de recogida de datos en rangos se suele comenzar asignando el rango a la posición “1” a la posición más alta, la siguiente tendrá el rango “2”,…

Para su cálculo utilizaremos:

(Puntuaciones de 15 sujetos)

Suje.

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Va.X

45

39

50

33

47

25

40

30

20

40

25

15

23

35

17

Va.Y

38

35

45

30

50

28

35

35

15

40

32

15

14

30

12

Tabla (Nivel de comprensión oral; X y los de expresión escrita Y).

Sujetos

Var. X

Rango(X)

Var. Y

Rango (Y)

D

D2

3

50

1

45

2

-1

1

5

47

2

50

1

+1

1

1

45

3

38

4

-1

1

10

40

4,5

40

3

+1,5

2,25

7

40

4,5

35

6

-1,5

2,25

2

39

6

35

6

0

0

14

35

7

30

9,5

-2,5

6,25

4

33

8

30

9,5

-1,5

2,25

8

30

9

35

6

+3

9

11

25

10,5

32

8

+2,5

6,25

6

25

10,5

28

11

-0,5

0,25

13

23

12

14

14

-2

4

9

20

13

15

12,5

+0,5

0,25

15

17

14

12

15

-1

1

12

15

15

15

12,5

+2,5

6,25

43

0,92>0,90 (Relación muy alta)

Coeficiente de contingencia.

Se utilizan en aquellos supuestos en que se recogen datos de variables clasificadas en categorías. Así las tablas de contingencia reflejan una asignación de sujetosa grupos y categorías en cada una de las variables; (…nivel de estudios…).

Cuando nos interese conocer el grado de asociación entre dos variables de naturaleza nominal; categóricas; recurriremos a “C” (Coeficiente de contingencia) [Nunca alcanzará el valor de 1; ya que el denominador siempre será superior al numerador]

Donde

A su vez

nº total de sujetos de esa fila

nº de sujetos de esa columna

nº total de sujetos de la muestra

frecuencias observadas o empíricas

frecuencias esperadas o aleatorias

nº total de sujetos de la muestra

Tabla (Estudios elegidos por los sujetos y nivel socioeconómico) (320 sujetos).

Estudios

Nivel sociocec.

Ciencias Sociales y Jurídicas

Ciencias

Humanidades

Bajo

20

40

60

Medio

40

40

40

Alto

20

20

20

Realizados los cálculos:

Estudios

Nivel sociocec.

Ciencias Sociales y Jurídicas

Ciencias

Humanidades

Total

Bajo

20

(37,5)

40

(37,5)

60

(45)

120

Medio

40

(37,5)

40

(37,5)

40

(45)

120

Alto

40

(25)

20

(25)

20

(30)

80

Total

100

100

120

320

A partir de estos datos:

(Indica una relación aceptable )

El coeficiente de correlación biserial-puntual (rbp).

Cuando buscamos el grado de relación que se manifiesta entre una variable cuantitativa, continua o discreta y otra auténticamente dicotómica, debemos recurrir al coeficiente biserial – puntual.(En realidad nos encontramos ante una extensión del coeficiente de correlación de Spearman).Tenemos dos fórmulas para determinar el valor de este coeficiente:

o bien

  • Calculo e interpretación del coeficiente de correlación biserial puntual (rbp).
  • Se emplea cuando nos encontramos ante una variable cuantitativa continua o discreta y otra dicotómica; sólo admite dos valores.(En nuestro ejemplo, comprobar el nivel de rendimiento entre Lenguaje-50 ítems- y Sexo.).

I

fp(Alumnos)

fq(Alumnas)

ft

5-7

2

1

3

-3

-6

-3

-9

27

8-14

6

4

10

-2

-12

-8

-20

40

15-21

9

5

14

-1

-9

-5

-14

14

22-28

11

13

24

0

0

0

0

0

29-35

8

10

18

+1

8

10

18

18

36-42

3

6

9

+2

6

12

18

36

43-49

2

4

6

+3

6

12

18

54

41

43

84

-27

-16

-43

189

+20

+34

+54

-7

+18

+11

Para el cálculo de rbpexisten dos ecuaciones:

o bien

Operando con una de las fórmulas:

(Correlación muy baja; indica que .

Cálculo e interpretación del coeficiente de correlación biserial (rb).

  • Se emplea cuando nos encontramos ante una variable cuantitativa y otra dicotomizada; sus ecuaciones de cálculo son:

(Ejemplo: Queremos estudiar la relación que existe entre el rendimiento de los alumnos de matemáticas (prueba de 40 ítems) y el nivel de razonamiento abstracto (en esta variable se han dicotomizado las puntuaciones sobre la base de la mediana; nivel de razonamiento alto (p); nivel de razonamiento bajo (q). )

I

fp

fq

1-5

---

2

2

---

---

-3

-6

-4

-8

32

6-10

1

5

6

-3

-3

-2

-10

-3

-18

54

11-15

3

8

11

-2

-3

-1

-8

-2

-22

44

16-20

6

12

18

-1

-6

0

0

-1

-18

18

21-25

13

10

23

0

0

+1

10

0

0

0

26-30

10

7

17

+1

10

+2

14

+1

17

17

31-35

8

3

11

+2

16

+3

9

+2

22

44

36-40

6

---

6

+3

18

---

---

+3

18

54

47

47

94

-15

-24

-66

263

+44

+33

+57

+29

+9

-9

=8,35

(Al ser la mediana el lugar que ocupa el lugar central, el número de sujetos de p y q ha de ser el mismo; por tanto las áreas correspondientes son idénticas (0,50); y en consecuencia la ordenada y corresponde a este punto – ver tabla de curva normal – vale 0,3989)

Así nos queda:

Cálculo e interpretación del coeficiente de correlación tetracórico (rt).

Se utiliza cuando las dos variables son de naturaleza cuantitativa, pero se dicotomizan tomando como punto de dicomotización la mediana.

(Deseamos conocer el nivel de relación existente entre calificaciones en lengua (1 a 10), y los resultados de un test de comprensión lectora (1 a 100) en un grupo de 34 alumnos).

Lugares

Mediana

Puntuaciones de Lengua

17 (5) y 18 (6)

Test de comprensión lectora

17 (50) y 18 (52)

Se construye una tabla de contingencia de 2x2 sobre la que llevaremos las 34 parejas de puntuaciones.

Md=51

Md=5,5

///

3

A

//// ////

B

////

14

17

//// ////

////

C

15

D

//

2

17

18

16

34

Una ecuación para resolver el cálculo de rt :

(Este valor (35) se situaría entre 33,61 y37,79 en la

tabla de valores estimados de rtlo que equivale a 0,90.)

Cálculo e interpretación del coeficiente de correlación phi ().

Se comprueba la relación entre dos variables dicotómicas (dos categorías);

(relación entre lugar de residencia (rural o urbano) y las respuestas a un determinado elemento(verdadero o falso).

Residencia

Urbana

Rural

Total

F

15

A

17

B

32

V

C

45

D

23

68

Total

60

40

100

Aplicando la ecuación siguiente:

(Nivel de correlación muy bajo; apenas existe influencia entre el lugar de residencia y la pregunta a la respuesta formulada)

Regresión lineal simple

La interpretación de los coeficientes de correlación se basa en la intensidad o el grado de esa relación, desde los valores próximos a “0” hasta los que se acercan a “1”, que indican una mayor intensidad. Esos valores permiten conocer la varianza compartida, o sea la parte de la variabilidad de una de ellas explicada por la otra. Para su cálculo se eleva el valor del coeficiente al cuadrado y se obtiene el denominado coeficiente de determinación.




Descargar
Enviado por:El Bandoler De Segaria
Idioma: castellano
País: España

Te va a interesar