Estadística
Metodología de la investigación
Clasificación de diferencias individuales
Se necesitan técnicas de medida que den respuestas numéricas a las preguntas de dichas diferencias.
Distribución de frecuencia
Una tabla de frecuencia, es aquella que nos dice la frecuencia con que ciertos valores se presentan. Cuando existe un gran número de medidas es necesario agrupar los valores individuales en intervalos de clases iguales y especificar el número de casos comprendidos en cada intervalo dado.
Una gráfica tiene muchas ventajas perceptivas sobre una tabla. Podemos transformar las tablas en gráficas de frecuencia. Existen dos tipos de éstas muy usados: los histogramas y las curvas de frecuencia.
Se dispone así de una herramienta útil para describir la distribución de las diferencias individuales. Los caracteres, capacidades y comportamientos humanos se distribuyen de modos muy diferentes. La forma de la curva de frecuencia puede decir varias cosas interesantes acerca de la naturaleza de las diferencias individuales representadas.
“La simetría o el grado de oblicuidad de una curva de distribución de frecuencia desempeña un cometido muy importante en el análisis estadístico de datos”. (cita textual escribir)
“Casi todas las mediciones de comportamiento, memoria, inteligencia y capacidad sensorial dan curvas de distribución de frecuencia oblicuas”. (cita textual escribir)
Mediciones de tendencia central
Media, moda y mediana
Hay tres medidas matemáticas de la tendencia central, usadas frecuentemente. La primera es la conocida media aritmética, que es la suma aritmética de todos los valores de una distribución dividida por el numero de casos. En términos matemáticos es:
M = SUMATORIA X
N
M representa la media aritmética, la letra griega “suma de”, X los valores individuales y N el número de casos.
La segunda medida de tendencia central es la moda, es el puntaje más común, el puntaje obtenido por el mayor número de personas.
La tercera medida se llama mediana que es simplemente el puntaje intermedio de una distribución, o el número que representaría un punto entre las dos mitades.
Por consiguiente, el significado de hombre medio o de inteligencia media puede referirse a cualquiera de estas tres medias diferentes de tendencia central, cada una con distinto valor y las tres matemáticamente correctas. Cada media tiene ciertas ventajas e inconvenientes. La media aritmética está muy influida por los valores de los elementos extremos, en tanto que la moda y la mediana no. A veces los valores extremos son innaturales y no se puede dejar que ejerzan toda su influencia.
Para tener un promedio que refleje todas las puntuaciones, incluyendo las extremas, se usa la media aritmética; para que no esté influido por las puntuaciones extremas, se usa la moda o la mediana.
Si todo lo que se conoce acerca de un grupo es su promedio, las mejores conjeturas de sus características tendrían que expresarse basándose en el mismo; pero ello da lugar, a veces, a serios errores.
Medidas de dispersión
Si se quiere expresar más precisamente el grado de dispersión en términos numéricos, se debe usar una de las muchas medidas cuantitativas de la dispersión de que se dispone.
Margen: el margen o distancia entre las puntuaciones más altas y más bajas es la medida numérica más simple de la dispersión.
Para muchos propósitos y en muchas distribuciones, el margen es una medida apropiada de la dispersión que nos dice lo que se quiere saber. No obstante, también puede estar influido, fácilmente por un solo valor extremo.
Es una medida de dispersión muy inestable.
Desviación media: esta medida de dispersión tiene en cuenta todas las puntuaciones de la distribución y no sólo los dos extremos. Para ello se determina antes en cuanto difiere cada puntuación de la media del grupo y luego se calcula la media de estas diferencias.
La fórmula de la desviación media es simplemente:
D.M = sumatoria d
N
D.M es la desviación media, sumatoria d la suma de desviaciones individuales de la media del grupo y N el número total de casos.
Desviación standard: la lógica de la desviación standard es semejante a la de desviación media. Se obtienen las desviaciones individuales de la media, pero esta vez se eleva al cuadrado cada una de ellas, se suman los cuadrados y se divide por el número de casos. La razón de elevar al cuadrado las desviaciones antes de media, estriba en ciertas consideraciones matemáticas que no interesan aquí. Este método da una medida de dispersión expresada en unidades cuadradas, en vez de en las unidades originales
Si se quiere expresar la medida de dispersión en unidades originales, todo lo que necesitamos hacer es sacar la raíz cuadrada del resultado.
El resultado final o desviación standard se simboliza generalmente, por las letras D.S o por la letra griega ( ) y su fórmula es:
D.S=RAÍZ2 d2
N
Unidades de medida
Cero absoluto: la longitud se mide con una regla graduada. Los números empiezan por supuesto por el cero.
Para hacer afirmaciones comparativas cuantitativas se necesitan instrumentos de medida que tengan como punto de partida el cero real (cero absoluto).
En los instrumentos de medida psicológica, se observa que poquísimas de las pruebas tienen como punto de partida el cero absoluto. No existen pruebas de que la puntuación 0 signifique que la persona no tiene absolutamente ninguna honestidad, cobardía, timidez o temperamento neurótico. Hasta es difícil concebir lo que pueda significar inteligencia u honestidad cero.
Por no tener cero absoluto las pruebas mentales y de personalidad, no se pueden obtener proporciones de las puntuaciones y decir que alguien es diez por ciento más inteligente que otro; no estando pues, justificadas las comparaciones directas de este género. En consecuencia en la medición psicológica surgen muchos problemas.
Unidades de medida
Otra importante característica de los instrumentos de medida física habituales es que todas las unidades son de igual magnitud. “En ninguna prueba de inteligencia ni de personalidad sabemos si las unidades de medida son de igual magnitud. Por ejemplo, en la mayoría de ellas es necesario sumar puntuaciones de muchas subpruebas para llegar a la puntuación total. Una prueba de aptitud de razonamiento consta de problemas de razonamiento verbal y de otros de razonamiento aritmético, pero no sabemos si cada problema aritmético es o no de igual dificultad de cada problema verbal”. (Krech, Cructcfield y Livson, 1969, p.738).
Con objeto de hacer frente a estos problemas y otros semejantes se han ideado varios recursos estadísticos que, dentro de ciertos límites permiten comparaciones numéricas entre puntuaciones obtenidas en diferentes subpruebas. Casi todos estos recursos exigen que las puntuaciones originales (llamadas a veces puntuaciones brutas) se cambien antes en puntuaciones convertidas. La clase más simple de puntuación convertida, la más generalmente usada, es la percentil.
Puntuación percentual
La puntuación percentual dice la posición de una persona en relación con el resto del grupo. Los puntos procentuales dividen la distribución total de puntuaciones en cien partes, cada una de las cuales contiene el uno por ciento de todos los casos. (Krech, Cructchfield y Livson, 1969).
Las puntuaciones procentuales varían de cero a cien, cualquiera que sea el margen de las puntuaciones brutas. En consecuencia, es posible comparar el rendimiento de diferentes personas en pruebas muy distintas y con unidades “brutas de medida muy diferentes”.
A pesar del indudable valor de las puntuaciones procentuales y de otras clases de puntuaciones convertidas (como puntuaciones standard), debemos tener presente que hay que tratar con mucha precaución todas las comparaciones de puntuaciones obtenidas en pruebas psicológicas. En el mejor caso, las comparaciones sólo son relativas (por ejemplo, relativas al grupo determinado que ha hecho el test). Cuando no se dispone de un 0 absoluto ni de unidades de medida iguales, no se puede hacer comparación en términos absolutos. (Krech et al, 1969).
Correlación
La descripción de diferencias individuales no sólo implica comparar una persona con sus semejantes, sino también comparar dos aspectos de la misma persona. Por ejemplo: ¿qué relación existe entre sobresalir en aritmética y sobresalir en música? ¿Puede haber una persona apta para todo, o la mayoría sobresale en algunas cosas, son corrientes en otras y hacen mal otras. Para responder esta y otras preguntas se necesita algún modo de expresar el grado de correlación de, supongamos por caso, la aptitud aritmética, con la musical.
Un trazado de correlación es un simple artificio gráfico que representa la relación entre dos conjuntos de puntuaciones.
Correlación positiva: se refiere a dos conjuntos de medidas cuyos valores discurren juntos.
Cuando la gráfica de correlación muestra tendencia a dirigirse del vértice inferior izquierdo al superior derecho, existe correlación positiva; pero es necesario establecer que hay algunas excepciones a esta tendencia. Podemos concluir, por consiguiente, aunque haya una correlación positiva, ésta no es perfecta.
Correlación negativa: Cuando la gráfica de correlación muestra tendencia a dirigirse del vértice superior izquierdo al inferior derecho, existe correlación negativa; pero tampoco existe una correlación negativa perfecta.
El signo positivo o negativo de una correlación, nos indica simplemente la relación entre las puntuaciones de las pruebas. El significado de la correlación depende del de las puntuaciones.
Correlación 0: Cuando los puntos de la gráfica de correlación no muestran una tendencia específica, sino que se hallan esparcidos al azar, existe correlación 0.
Una correlación positiva o negativa puede ser algo menos que perfectamente positiva o negativa. En muchos casos se necesita saber cuánto menos que perfecta es la correlación. Esta necesidad ha quedado satisfecha por la int del coeficiente de correlación, un índice único que nos da el signo y magnitud de la correlación.
Por acuerdo general, se ha decidido llamar a una correlación positiva perfecta +100 y a una correlación negativa -100. Por ejemplo: u coeficiente de correlación de +0,14 es más bajo y uno de 0,90 es negativo alto. La magnitud de la correlación se refiere a la distancia al cero(+ o -) no a su positividad o negatividad.
Así, la correlación de -0,90 se considera mayor que la de +0.14.
Correlación por rangos
Hay varios modos de determinar la magnitud de un coeficiente de correlación. El más sencillo es el coeficiente de correlación por rangos, cuyo símbolo es p, (la letra griega rho).
El primer paso para obtener p es ordenar a los sujetos por sus rendimientos en cada uno de los tests analizados. Luego se comparan los rangos y de esta comparación se deriva el valor de p.
Si hubiese correlación positiva perfecta, no habrá diferencia entre los dos conjuntos de rangos.
En cambio si la correlación fuese algo menos que perfecta, las diferencias entre los rangos no sería 0, en modo alguno. Cuanto mayores sean las disparidades de los rangos, menor será la relación positiva entre los dos conjuntos de puntuaciones. Por lo tanto, la medida de las diferencias del rango proporciona, evidentemente un modo de medir el coeficiente de correlación. Cuanto mayor sea la medida, menor será la correlación positiva.
Siendo + 100 la correlación positiva mayor posible, para obtener el coeficiente de correlación restaremos de cien la media de las diferencias entre los rangos. Cuánto más elevada sea la media de las diferencias entre los rangos, menor será el coeficiente de correlación.
Fórmula: la cuantía de la correlación es I menos la media de las diferencias entre los rangos, o
P = I - sumatoria D2
___________
N
Fórmula derivada por lógica, que es de estructura muy semejante a la obtenida matemáticamente.
Por diversas razones matemáticas, la verdadera fórmula es:
P = I -6sumatoriad2
________________
N(N2 - I)
El mismo razonamiento sirve para la correlación negativa por rangos.
Correlación de producto-momento
El coeficiente de correlación más frecuentemente usado es el coeficiente de correlación producto-momento.
La fórmula es: r =sumatoria xy
__________
Noxoy
X e y son las desviaciones de las puntuaciones individuales de las medias del grupo, ox es la desviación standard de las puntuaciones en el test x y oy la desviación standard de las puntuaciones en el test y.
Por regla general, se prefiere el coeficiente de correlación por rangos cuando el número de casos es pequeño (15 ó 20) y cuando hay poca ligazón entre los rangos. En otros casos, el coeficiente de correlación de p-m resulta más conveniente.
Un error lógico que frecuentemente se comete en la interpretación del coeficiente de correlación es el argumento de causa y efecto. Se admite a menudo que si dos variables están muy correlacionadas, una es la causa de la otra. No obstante, la correlación elevada entre dos fenómenos indica simplemente que ambos son causados por un tercer factor y no que un fenómeno cause o influencie el otro. En estadística se usa, a menudo el coeficiente de correlación en problemas de los que se sabe que no hay relación causal entre los dos conjuntos de medida que se correlacionan.
Errores de medida
El error se debe a un instrumento de medida inexacto, a un método imperfecto de aplicar el instrumento, a nuestra manera inadecuada de leerlo o registrarlo o a cualquier otro factor.
En la ciencia, por depender en gran parte del raciocinio de las mediciones, se tiene mucho cuidado con los errores de medida y se ha aprendido mucho acerca de su naturaleza, origen y control. En los casos que se ha sido incapaz de eliminarlos, se han desarrollado técnicas que permiten estimar el grado de error. Sabiendo la magnitud del error se puede enunciar el grado de confianza en las conclusiones basadas en las medidas. El estudio de los errores de medida es uno de los básicos de la estadística.
Fiabilidad
No existe un instrumento de medida absolutamente perfecto. Hasta el instrumento de medida más simple, la regla, no está libre de error. Algunos instrumentos de medida nos dan errores mayores que otros.
La fiabilidad de un aparato de medida(incluido su método de aplicación) puede definirse como el grado en que medidas repetidas de la misma cantidad, con el mismo instrumento de medida, dan las mismas lecturas.
La fiabilidad medida por correlación: el coeficiente de correlación nos da un índice numérico que expresa el grado de fiabilidad de una prueba. Cuando se usa con este fin, el coeficiente de correlación recibe el nombre de coeficiente de fiabilidad.
Veracidad de las formas comparables: La mayoría de las pruebas psicológicas constan de gran número de elementos, problemas y preguntas. La correlación de las dos formas comparables nos daría la fiabilidad de una y otra forma.
El método de las formas comparables evita el problema de la memoria y quizás el de fastidio, pero deja intacto el del tiempo. Las dos formas se aplican en tiempos diferentes, y durante el intervalo pueden suceder muchas cosas que dificultan la interpretación de la correlación entre las dos formas comparables.
Fiabilidad compartida: la base del método de fiabilidad bipartida es idéntica a la del de formas comparables. Este método suele llamarse del “ coeficiente de pares-impares” y cuenta con dos ventajas: primera, las dos subpruebas(pares y nones) se hacen a la vez, en las mismas condiciones de motivación, idénticas condiciones de examen y con el mismo grado de atención. Segunda, por haber divido la prueba de pares-impares, hemos garantizado la comparabilidad de formas, no sólo en cuanto al contenido, sino también en cuanto al contenido, sino también en cuanto al modo de administración.
Estos y otros métodos pueden proporcionarnos una valiosa información sobre la utilidad de una prueba como instrumento de medida. Sin embargo, saber que una prueba es fiable no basta para permitirnos apreciar su valor como instrumento de medición Puede ser muy fiable y por el contrario, constituir un mal instrumento de medida, por carecer de validez.
Validez
Los términos de “fiabilidad” y “validez” se usan indistintamente en el lenguaje vulgar. No obstante, en la teoría de la medición, tienen un significado distinto. El estadístico preocupado por el problema de la fiabilidad e un instrumento con lo que mide. Cuando le interesa la cuestión de la validez, pregunta si el instrumento mide lo que él quiere medir. Un instrumento puede hacer medidas acordes(puede tener fiabilidad), pero acaso no mide lo que se quiere medir(acaso tiene poca validez). Pero a la mayoría de los tests que tratan de medir fenómenos más complejos no se les adscribe la validez con tanta facilidad. En primer lugar, la validez, lo mismo que la fiabilidad, no es asunto de todo nada. Una prueba tiene grados de validez. El grado de validez de las preguntas de clase sólo estaría influido por la comprensión por parte del alumno de los principios psicológicos. En este caso diríamos que las preguntas tienen validez perfecta como medida de la comprensión de principios psicológicos; pero, más probablemente, la puntuación en las preguntas es la resultante de la comprensión psicológica, más la aptitud memorista. La prueba tiene alguna validez para la comprensión psicológica y alguna otra para la capacidad memorista, pero no es una prueba “pura” de ninguna de las dos. Como en la fiabilidad, necesitamos algún medio para expresar el grado de validez de un instrumento de medida de un instrumento de medida y, de nuevo como en aquella, el coeficiente de correlación nos facilita ese medio.
La validez medida por correlación: Es evidente que una prueba es válida en el grado en que sus medidas se correlacionan con lo que mide. Cuando se usa de este modo el coeficiente de correlación se llama coeficiente de validez.
El principio general para determinar la validez de una prueba es bastante simple, correlacionamos sus puntuaciones con su criterio. La dificultad consiste en que, frecuentemente, no podemos hallar un criterio con el que compararlas. Por ejemplo se quiere medir la validez de una prueba de inteligencia. Se pude obtener las puntuaciones del test con mucha facilidad, pero qué servirá de criterio de “inteligencia” ¿Las calificaciones escolares? ¿El dinero ganado en la vida real? ¿La originalidad y creatividad? ¿La primacía en cuestiones sociales? Personas diferentes sugerirían distintos criterios y algunos de ellos plantearían, por sí mismos, problemas e medida.
Se han hecho muchos intentos de resolver el problema del criterio. Entre las técnicas más corrientes está el llamado método del “grupo conocido”.
Grupos conocidos y validez: No hay puntuaciones-criterio de originalidad y creatividad fácilmente disponibles.
Una prueba puede tener gran fiabilidad y poca validez, en el sentido que no mida lo que intentábamos que midiese. En cambio, una prueba de mucha validez no puede tener poca fiabilidad. Las pruebas poco fiables no pueden compararse consecuentemente con n conjunto de puntuaciones-criterio, porque sus medidas son, en gran parte, erróneas y por consiguiente deben tener poca validez.
Fiabilidad y validez conciernen a errores de medida y de conceptualización; por eso surgen de la inadecuación del instrumento de medida, pero, completamente aparte de ello, aún hay otra fuente mayor de error en las investigaciones que utilizan medidas. Se puede cometer un error de selección.
Descargar
Enviado por: | Liza Toro |
Idioma: | castellano |
País: | Chile |