Muestreo en la investigación social

Estadística. Población. Muestra. Inferencia. Marco muestral. Tipos de muestreo: Aleatorio simple, Sistemático, Estratificado, Conglomerados

  • Enviado por: Vicky Izarzugaza
  • Idioma: castellano
  • País: España España
  • 7 páginas
publicidad
cursos destacados
Iníciate con Ableton Live
Iníciate con Ableton Live
El curso da un repaso general por las órdenes y menús más básicos, para poder generar...
Ver más información

Graba audio con Apple Logic Pro 9
Graba audio con Apple Logic Pro 9
En este curso aprenderemos a realizar grabaciones de audio de calidad utilizando Apple Logic Pro 9. Exploraremos todo...
Ver más información

publicidad

Tema 14: El muestreo en la investigación social.

1. Conceptos básicos: población, muestra, inferencia, marco muestral.

Muestreo es el proceso de selección de la muestra. Antes hay que hacer un diseño muestral en el que se decide qué tipo de muestreo se va a usar y el tamaño de la muestra.

No en todas las investigaciones es preciso el muestreo, pero sí en la mayoría de las investigaciones sociales por la imposibilidad de trabajar directamente con la población.

El objetivo de seleccionar una muestra es investigarla para extrapolar la población y hacer inferencias de la población en base a los resultados obtenidos en dicha muestra.

La muestra ha de ser representativa de la población para poder hacer inferencias válidas. Hay diversas formas de entender la representatividad de la muestra, dependiendo del tipo de muestreo.

El marco muestral es una operacionalización de la población, una concreción. Es un listado donde aparecen enumerados todos y cada una de las unidades que forman parte de la población investigada. Se elabora antes de proceder a la elección de la muestra.

POBLACIÓN MARCO MUESTRAL MUESTRA

Población cautiva es aquella que no aparece en los listados oficiales.

Cuando es imposible elaborar un marco muestral, es mejor no elaborarlo que hacerlo y que no refleje la realidad.

El marco muestral existe en la mayoría de los muestreos aleatorios. En los no aleatorios no es obligatorio.

2. Tipos de muestreo.

Primera distinción:

- Aleatorios; que son aquellos en los que la muestra se elige al azar (aleatoriamente), y tiene una confianza medible.

- No aleatorios; que son en los que la selección es por procedimientos no aleatorios. No tienen una confianza medible.

La principal diferencia es que en los aleatorios podemos dar a nuestras inferencias un nivel de confianza en términos de probabilidades.

2.1 MUESTREO ALEATORIO.

Su fundamento teórico es el del cálculo de probabilidades. Tienen una confianza medible.

Muestreo aleatorio simple.

Es un muestreo sencillo, en el cual:

- N es la población,

- n es la muestra: las n unidades muestrales se eligen aleatoriamente de una sola vez. En un ejemplo tal que N=15000 y n=1000, habría que dar los siguientes pasos:

1º/ Se necesita un marco muestral.

2º/ Numerar las unidades del marco muestral.

3º/ Elegir números desde el 1 hasta el 15000.

Una elección aleatoria es por sorteo, no basta con que el investigador diga los números que se le vayan ocurriendo, porque tenemos tendencias personales.

El sorteo se lleva a cabo bien por ordenadores o bien por libros donde vienen números escogidos aleatoriamente (página 1 de las fotocopias).

Es un muestreo que tiene enorme importancia teórica y práctica, porque sólo se utiliza con poblaciones pequeñas y bien identificadas, es decir, que esté el marco muestral perfectamente hecho para tener identificadas las unidades muestrales con sus nombres.

Es un muestreo prototípico, se usa como patrón de comparación para el resto de los muestreos aleatorios, porque en el muestreo aleatorio simple los cálculos del tamaño de la muestra y del error muestral son muy sencillos: E=b*e; l*E

En la práctica se compara el mustreo simple con los otros muestreos aleatorios. Se comparan para ver cuál es mejor. Un muestreo es mejor que otro cuando a una misma `n' corresponde un `E' menor; el intervalo de confianza es más pequeño y por eso el resultado es más preciso en la estimación.

Muestreo sistemático.

Es muy similar al anterior, y lo único que cambia es la manera de seleccionar las unidades muestrales. La elección se hace de la manera siguiente:

1º/ Calcular el coeficiente de elevación, que es un número que se obtiene dividiendo N/n.

2º/ Elegir aleatoriamente un número entre el 1 y el coeficiente de elevación.

3º/ La unidad corespondiente a ese número elegido aleatoriamente sería la primera unidad de la muestra, las siguientes se obtendrían sumándole a dicho número el coeficiente de elevación tantas veces como sea necesario (n-1) hasta completar las unidades muestrales.

ejemplo

N=10000 1º/ N/n=20; coeficiente de elevación.

2º/ Elegimos aleatoriamente el número 11 (p. ej.).

n=500 3º/ n1=11; n2=11+20; n3=51; n4=71; n500=9991.

Ventajas e inconvenientes del muestreo sistemático.

La principal ventaja es que las unidades muestrales se reparten uniforme y equilibradamente a lo largo de toda la población, por lo que podemos asegurarnos que está bien representada.

El principal inconveniente se produce en casos determinados. El muestreo sistemático tiene un problema que se produce cuando la población está ordenada por rachas y el tamaño de la dichas rachas coincide con el tamaño del coeficiente de elevación o un múltiplo del mismo. En este caso la muestra puede estar totalmente sesgada, es decir, se pueden cometer errores sistemáticos muy graves.

ejemplo

Población: personas que se casaron en la CC.AA. de Madrid en 1999.

Suponemos que me dan un listado y lo tienen ordenado por fechas:

- nº1: Pepe García

- nº2: su mujer

- nº3: paco González

-nº4: su mujer

La población está ordenada por rachas (de sexo en este caso), y son de tamaño 2. Usamos el muestreo sistemático y su coeficiente de elevación es 10. Si cogemos el número 7 p. ej., serían el 17, el 27, etc, por lo que en nuestra muestra sólo habría hombres y ninguna mujer >>> sesgado.

Este problema se soluciona desordenando la población para eliminar las rachas.

Muestreo estratificado. La afijación de la muestra. Tipos.

En este tipo de muestreo lo primero que hacemos es dividir la población investigada en varios estratos.

ejemplo

N=2000 alumnos matriculados en t. s. este año.

n=600

El objetivo es conocer la satisfacción de los alumnos sobre el plan de estudios. Hay una variable importante que es el curso.

N1: alumnos de 1º; N1=1000 >>> n1

N=2000 N2: alumnos de 2º; N2=500 >>> n2

N3: alumnos de 3º; N3=500 >>> n3

n = n1 + n2 + n3 = 600

Cogemos una muestra para cada estrato de la población, por lo tanto tendremos tres marcos muestrales.

Al procedimiento de repartir el tamaño de la muestra entre n1, n2 y n3 se le llama afijación de la muestra.

Se puede estratificar varias variables, si en este ejemplo estratificamos también el sexo, habría 6 submuestras.

Existen tres formas básicas de afijación (aunque luego se puedan hacer combinaciones):

Afijación uniforme (seguimos el mismo ejemplo).

El tamaño de todas las submuestras es exactamente igual; de tal forma que:

n1=n2=n3=200

Afijación proporcional. Hacemos que cada submuestra va a tener un tamaño directamente proporcional al peso que tenga el estrato en la población:

Nh Porcentaje Frec. relativa nh

N1=1000 50% 0'5 n1=300

N2=500 25% 0'25 n2=150

N3=500 25% 0'25 n3=150

nh= n(Nh/N).

Afijación óptima; no la va a pedir, solo que sepamos que existe, pero no calcularla. En esta afijación hacemos el tamaño de cada submuestra directamente proporcional al peso y a la varianza de dicho estrato de tal forma que cuanto mayor sea el tamaño de dicho estrato, mayor será el tamaño de la submuestra, y además cuanto mayor sea la varianza de un estrato, el tamaño de la muestra en dicho estrato va a ser mayor. Cuanto menor sea la varianza (S^2) en un estrato, menor será el tamaño de la submuestra.

Ventajas e inconvenientes del muestreo estratificado.

VENTAJAS

- Facilita la coordinación del trabajo de campo.

- Permite trabajar con cada estrato por separado siempre que el tamaño de cada muestra sea suficientemente grande.

- Cuando las variables de estratificación correlacionan con las variables objeto de estudio se puede reducir la varianza de la estimación con lo que aumente la precisión o se reducen los costes.

Reducir la varianza es lo mismo que reducir la desviación típica y el error de muestreo, por lo que aumenta la precisión.

Esto sucede siempre y cuando dentro de cada estrato haya mucha homogeneidad y que en un estrato y otro hay muchas diferencias.

Se trata de minimizar las varianzas intraestratos y maximizar las varianzas interestratos.

INCONVENIENTES

- Se dificulta el cálculo del tamaño y error muestral.

- Casi siempre es muy difícil saber a priori cuáles son las variables que correlacionan con el objeto de estudio.

Otros muestreos aleatorios.

MUESTREO POLIETÁPICO

Hay que distinguir los monoetápicos y los polietápicos. En estos últimos, la selección de las unidades muestrales se hace en dos o más etapas que se hacen con distintos tipos de muestreo aleatorio.

ejemplo

Conocer el nivel de adquisición de conocimientos matemáticos de los niños de 5º de la CC.AA. Obtenemos un listado de los colegios, suponemos que hay 2000:

N=2000

n=500; esta muestra se obtiene por muestreo aleatorio simple, sistemático

Listado con los niños de 5º de cada colegio de esos 50. Abarata el coste porque concentra la muestra en cada colegio.

En la práctica se usa mucho, porque al ser N grande, se elige el tamaño de n por etapas.

Ventajas

- No es necesario tener el marco muestral de toda la población.

- Facilidad del trabajo de campo.

- Abarata los costes.

La selección de las unidades se hace en 2 o más etapas y en cada uno se usa un muestreo aleatorio; en el ejemplo anterior:

1º/ Seleccionamos 50 colegios representativos de todo Madrid.

2º/ n= 2000; se encuesta por niños en cada colegio, consiguiendo el marco muestral de los 50 colegios >>> sólo hay que ir a 50 colegios, por eso abarata los costes.

Los muestreos polietápicos son muy complicados de hacer, es necesario el apoyo de un experto.

Muestreo por conglomerados.

Forma parte siempre de un muestreo polietápico, que se hace en una de sus etapas.

Lo que caracteriza a este muestreo es que no se seleccionan unidades sino conglomerados de dichas unidades (p. ej. la primera etapa del ejemplo anterior: seleccionamos colegios, conglomerados de unidades).

Cálculo del error y del tamaño muestrales para la media y la proporción.

¿X? >>> E=b(S/"n)

E= be

¿P? >>> E=b"(PQ/n)

En la práctica hay dos posibilidades:

1º/ Determinar n y averiguar el error.

2º/ Determinar el error y averiguar el tamaño de n que necesito para que el error sea el que yo quiero.

Primera posibilidad.

Muestreo aleatorio simple:

Los factores que inciden en la determinación de `n' son:

- Tipo de muestreo.

- Tamaño de la población. "n=bS/E >>> n= (b^1+S^2)/(E^2)

- Nivel de confianza.

- Error total.

- Varianza poblacional.

1º.- Tipo de muestreo; ejemplo:

n=2000 para m. aleatorio simple.

n<2000 para m. sistemático.

n<2000 para m. estratificado.

n>2000 para m. por conglomerados.

2º.- Tamaño de la población >>> depende de si N es finita o no lo es.

a) N=

(pag. 5 fotocopias)

b) N"

a) Cuando es este el caso, será de 100000 o más unidades. En la práctica el tamaño de n es independiente del tamaño de N. No influye.

b) En este caso sí influye el tamaño de la población en el tamaño de n.

A mayor N, mayor n.

3º.- Nivel de confianza (). Este nivel lo determina el investigador, cuanto más grande sea mejor.

A>B !>n; al aumentar  hay que aumentar también n.

4º.- Error total (E).

Lo determina también el investigador. Interesa que sea pequeño. Cuanto menor sea el error, mayor ha de ser n; a mayor error, mayor tamaño de la muestra.

5º.- Varianza poblacional (S^2).

Dependiendo de lo homogénea o heterogénea que sea N voy a necesitar n de distinto tamaño.

S^2 y n son directamente proporcionales. Cuanto más homogénea sea, mayor tamaño de S^2 y mayor tamaño de n.

6º.- Tamaño muestral. Cuando no se da información, para calcular la muestra se aplica la fórmula:

b^2PQ

n= , nos pondremos en el caso más desfavorable: P=Q=50

E^2

Página 2 fotocopias: tabla válida para población finita inferior a 100000 unidades.

La fórmula utilizada para hallar el tamaño de la muestra es la siguiente:

Nb^2PQ

n=

(N-1)E^2+b^2PQ

En un examen siempre usaremos tablas para determinar el tamaño de la muestra. Esta tabla es con un nivel de confianza del 95'5%. Cuando la cantidad de la muestra es casi igual al tamaño de la población no se hace.

Página 3 fotocopias. Tabla para poblaciones infinitas, más de 100000 unidades.

ejercicios

1º.-Siendo la población total de 250000 personas, queremos calcular mediante muestreo aleatorio simple, una muestra; el nivel de confianza es del 95'5% y el error máximo es del 2%.

N=250000

E=2%

= 95'5%

n=2500

2º.-Sea una población de 250000 personas. Se quiere calcular mediante muestreo aleatorio simple, una muestra en la que el nivel de confianza es del 97'7% y el error máximo es del 2%

N=250000

E= 2% n=5627

= 97'7%

3º.-Sea la población total 250000 personas, se quiere calcular mediante muestreo aleatorio simple una muestra en la que el nivel de confianza es de 95'5% y el error máximo es del 1%.

N=250000

E=1% n=10000

= 95'5%

4º.-Sea la población total 250000 personas, queremos n, mediante muestreo aleatorio simple y con un nivel de confianza del 95'5% y P=10%. El error absoluto es iguala 2%.

N=250000

=95'5% n=900

E=2%

P=10%

5º.-Sea una población de tamaño 5000. Hallar n cuando el nivel de confianza es del 95'5% y un error del 2%.

N=5000

E=2% n=1667.

= 95'5%

6º.-Sea la población total de 250000 personas y queremos una muestra mediante un m. aleatorio estratificado con un nivel de confianza del 95'5% y un error máximo del 2%

Como es m. estratificado, n>2500

2.2 MUESTREOS NO ALEATORIOS.

Muestreo por cuotas.

Es un muestreo de tipo cuantitativo (como el m. aleatorio), busca representaciones de tipo cuantitativo (estadística, etc.).

El m. por conglomerados es una especie de sucedáneo del m. aleatorio. Tiene una importancia de tipo práctico, porque en la práctica, si no se pueden usar muestreos aleatorios (fundamentalmente por no tener un marco muestral), se recurre al muestreo por cuotas. La mayoría de los casos de encuesta, usan el sistema de cuotas.

Su principal problema es que la muestra no se elige aleatoriamente, por lo que no tienen un nivel de confianza medible (teóricamente porque en la práctica se ha comprobado empíricamente que sí tiene el mismo error, pero esto no tiene ningún fundamento teórico).

El fundamento del muestreo por cuotas es que si yo pudiera elegir una muestra de tal forma que se respetasen las mismas proporciones para todas las variables que existen en la población, obtendría una especie de población en miniatura. El problema es que en la práctica es imposible hacer esto con todas las variables, y se hace habitualmente con 2, 3 o como muchísimo 4 variables. Se puede confundir con el muestreo estratificado con la fijación proporcional.

ejemplo

N=2000 alumnos de t.s.

n=600 sexo

Cuotas >>> 2 variables

curso

El sexo se mantiene constante en proporción en los tres cursos:

1º 1000

CURSO 2º 500

3º 500

1º 100h 900m

2º 50h 450m

3º 50h 450m

1º 2º 3º

H 30 15 15 60

M 270 135 135 540

300 150 150

En un estratificado elegiríamos a los 30 H de 1º en un marco muestral de todos los hombres de 1º, y se eligen aleatoriamente.

En el muestreo por cuotas no es así >>> se le deja libertad al encuestador para que cumpliendo unos requisitos elija los alumnos que él quiera entrevistar.

El principal problema de este tipo de muestreo es que la muestra está totalmente sesgada y queda parte de la población sin representar. Completar por la página 6 de las fotocopias.

El muestreo en la investigación cualitativa. Muestreo teórico. muestreo por saturación.

El objetivo es buscar, seleccionar alguna parte representativa para el muestreo. Varía de un muestreo a otro:

- En muestreo cualitativo no se busca una representatividad estadística ni numérica, sino una representatividad teórica.

- Frente a los muestreos cuantitativos el muestreo en la investigación cualitativa es un muestreo que no está estandarizado, se dan unos principios generales, pero dependen sólo del investigador.

- La investigación cualitativa busca más la intensidad que la extensión, es decir, estudiar pocos casos pero en profundidad.

Se han propuesto diversos criterios para hacer el muestreo. Los que más éxito han tenido son:

* Muestreo teórico, que proponen Glasser y Strauss.

* Muestreo estructural.

* Muestreo por saturación. Hay quien habla de ella como un tipo de muestreo, otros que es un criterio para elegir la muestra cualitativa.

P. ej. la vida de los ecuatorianos que trabajan como internas en hogares españoles. Se cogería a una de ellas y la entrevistaría. La primera información sería muy novedosa, después de varias hallamos unas pautas comunes, después se entrevista a otra y otra hasta p. ej. la décima que yo ya tengo unas pautas del tipo de vida y llegan a un punto en el que no hay información relevante nueva.

El tamaño de la muestra no se decide previamente, se elige con el trabajo de campo, según se va haciendo la investigación.

* Muestreo estructural. Se usan en la investigación durante los grupos de discusión. No se trata de muestrear unidades, sino relaciones estructurales.

* Muestreo teórico (pags. 9 y 10 fotocopias). Es una forma de muestreo que proponen Glasser y Strauss. Busca fundamentalmente una representatividad de tipo teórico, representativo desde el punto de vista conceptual para dirigirnos a la realidad que queremos investigar. El esquema es el que guía en los escenarios.