Conceptos de estadística

Vocabulario. Curva normal. Diseños. Muestreos. Probabilística

  • Enviado por: Javierog
  • Idioma: castellano
  • País: España España
  • 9 páginas

publicidad
cursos destacados
Productos Notables & Ejercicios resueltos Nivel 2
Productos Notables & Ejercicios resueltos Nivel 2
Aprende como trabajar con Productos Notables de forma fácil y divertida. En este curso de nivel 2...
Ver más información

Ejercicios Resueltos Cálculo Diferencial
Ejercicios Resueltos Cálculo Diferencial
Serie de ejercicios resueltos de Cálculo Diferencial Este curso va ligado al curso actual de Cálculo...
Ver más información


Curva normal: Conocida como campana o Curva de Gauss, es un modelo teórico de curva en el caso de que se de una distribución normal. Es la curva a la que toda distribución normal tiende a dibujar cuando es representada gráficamente.

Curva Platicúrtica: Presenta una curva más aplastada, con una elevación de la distribución inferior a la curva normal.

Curva Leptocúrtica: Presenta una distribución más apuntada, con una elevación superior a la curva normal.

Curva Mesocúrtica: Es el que corresponde a la curva normal y presenta un nivel de apuntamiento considerado como ideal.

Cuantil: Es una forma de interpretar las puntuaciones directas refiriéndolas a diferentes escalas. Si se divide la serie en varias partes, en función de los porcentajes que incluyen, podemos situar las puntuaciones de los sujetos a lo largo de la misma, utilizando los porcentajes que permiten cierta comparación. La serie podrá quedar dividida en cuantas partes se desee, pero generalmente suele hacerse en 4, 10 ó 100, teniendo así los cuartiles, deciles o percentiles. El proceso de cálculo es idéntico al de la mediana, ya que ésta es, a la vez, el cuartil 2, el decil 5 o el percentil 50.

Desviación Media: Hace referencia a la media aritmética de las desviaciones tomadas en valor absoluto, respecto de un promedio. Dicho promedio puede ser la media aritmética, la mediana o la moda, es una medida poco utilizada, sobre todo porque existen otras que permiten un superior desarrollo estadístico a partir de su valor.

Desviación Típica: Es una de las medidas más importantes de dispersión y variabilidad, se utiliza más en el ámbito de la estadística descriptiva, en la caracterización de las muestras y permite un alto desarrollo estadístico sobre la base de la misma. Es la raíz cuadrada de la varianza.

Diagrama de barras: Consiste en representar los valores de una variable en función de sus frecuencias absolutas o relativas, por tanto dentro de un eje de coordenadas colocaremos los valores de la variable en el eje de abscisas y la frecuencia absoluta o relativa en el eje de abscisas. La representación consiste en levantar alturas para cada valor de la variable iguales a su frecuencia.

Diseño: Un diseño es un esquema o estructura lógica de acción que permite mantener constante el flujo de las variables experimentales pertinentes y controlar así la influencia de las variables independientes sobre las variables dependientes. Podemos concretar como objetivos del diseño el maximizar la varianza sistemática, controlar la varianza sistemática de las variables extrañas o fuentes de variación secundarias, y minimizar la varianza del error (el azar y los errores de medición).

Diseños Cuasiexperimentales: Se manipula la variable independiente, es decir, se introduce un tratamiento. Carece de una de dos propiedades del diseño experimental, que son aleatoriedad y grupo control. Son prácticos, brindan información útil para generalizar, se pueden llevar a cabo en ambientes naturales. La desventaja es que pueden surgir varias hipótesis rivales que compiten con la hipótesis de manipulación experimental en la explicación de los resultados observados.

Diseño Experimental Puro: El investigador actúa como un agente activo y no como un observador pasivo, el investigador puede tener una mayor confianza en la autenticidad e interpretación de las relaciones entre variables debido a que las ha observado bajo condiciones rigurosamente controladas.

Diseño Factorial: Se manipulan dos o más variables de manera simultánea. Permite probar múltiples hipótesis en un solo experimento. Permite probar no sólo los efectos principales, sin también la interacción entre las variables manipuladas.

Diseño de Solomon: Fue desarrollado para controlar todas las variables extrañas, y poder observar la varianza sistemática, consecuencia del tratamiento experimental objeto de estudio. Son cuatro grupos los necesarios y todos se forman al azar. La variable experimental se representa por X.

Diseños Jerárquicos: Son diseños donde se encuentran factores anidados. Tienen tres potenciales fuentes de variación. A) Aquella atribuible a la variable experimental. B) El efecto debido a los grupos. C) Las diferencias individuales, como variación residual, y en consecuencia, la variación del error.

Diseño por bloques al azar: Se utiliza cuando las unidades experimentales no son todas iguales, cuando existe gran heterogeneidad. Se forman tantos bloques como valores de la variable independiente interesa contrastar; los tratamientos se asignan igualmente al azar.

Cuadrado Latino: Se distingue de todos los demás porque es cuadrado, ya que los datos nos los proporcionan a través de una matriz cuadrada. Hay dos variables de bloqueo que lo que hacen es homogeneizar la muestra pero que no intervienen en el experimento. No es un diseño al azar, se clasifica a los sujetos según unas condiciones iniciales y luego se aplica el experimento. Las variables de bloqueo, que no intervienen en el desarrollo del proceso, tienen los mismos niveles que la experimental por ser de diseño cuadrado.

Estadística descriptiva: Tiene una función simplificadora y descriptiva consistente en procesos estadísticos que se realizan con datos empíricos, tomados, recogidos y/o medidos en las muestras.

Estadística inferencial: Le corresponde decidir sobre los problemas irresueltos por la estadística descriptiva. Al informarnos sobre los valores de la población, parámetros, permite establecer hipótesis, plantear leyes y tomar decisiones.

Estadística Paramétrica: Es la más poderosa siempre que se cumplan estos 3 supuestos. Que los estadísticos que se estudian existan en la población. Que en ella están distribuidas normalmente y que el estadístico muestral da una estimación del parámetro.

Estadística No Paramétrica: Es aquella cuyo modelo estadístico no parte de supuestos acerca de la población, o estos son muy débiles y operan con datos ordinales y hasta nominales.

Estadístico o estimador: Cualquier característica medible calculada sobre una muestra.

Estado de la cuestión: Es conocer la situación actual del problema planteado en un momento determinado con todas su variables y posibilidades.

Experimento y sus clases: Es una forma de experiencia científica caracterizada por provocar un fenómeno para mantenerlo bajo control y la utilización de la medición. Clases: Experimento de laboratorio y experimento de campo.

Frecuencia absoluta fi : ( de un determinado valor xi ) al número de veces que se repite dicho valor .

Frecuencia absoluta acumulada Fi : ( de un determinado valor xi ) Su frecuencia absoluta más la suma de las frecuencias absolutas de todos los valores anteriores .

Muestreo: El muestreo se ocupa del estudio de las muestras no por sí mismas, sino como un modo de conocer a la población que representa. En vez de hacer un censo completo, los procedimientos de muestro estadístico se han convertido en la herramienta preferida en la mayoría de las situaciones de investigación.

Existen 3 razones principales para extraer una muestra:

- lleva menos tiempo que un censo completo

- es menos costoso

  • es más ágil y eficiente que obtener el completo de la población objeto.

Encuesta: Es una modalidad de investigación destinada a la recogida de información no a través de las pruebas, sino por medio de preguntas formuladas directamente a los sujetos. Las preguntas, eso sí, pueden incidir directa o indirectamente en el tema investigado.

Los pasos que se deben seguir a la hora de hacer una encuesta son:

1) Determinación de los objetivos

2) Determinación del tipo de encuesta:

3) Diseño del cuestionario: Es un instrumento que contiene varias preguntas y que trata de una diversidad de fenómenos o características.

4) Codificación del cuestionario: Una vez diseñado y testado el cuestionario, conviene codificarlo antes de realizar el trabajo de campo. Con el objeto de evitar posibles errores de diseño. La codificación del cuestionario facilita la tabulación de los datos resultantes y su análisis posterior a través de un programa informático de análisis estadístico.

5) Muestreo: En vez de hacer un censo completo, los procedimientos de muestro estadístico se han convertido en la herramienta preferida en la mayoría de las situaciones de investigación.

6) Trabajo de campo: Una vez desarrolladas las fases anteriores, se realiza el trabajo de campo entrevistando a todos los integrantes de la muestra seleccionada. El trabajo de campo es controlado y revisado por el investigador para evitar distorsiones de la información resultante.

7) Tabulación de Datos: Construir tablas. Al finalizar el trabajo de campo, y una vez revisados y depurados los cuestionarios, se tabulan estadísticamente los datos obtenidos.

8) Análisis de Resultados y Elaboración del Informe: Por último, se analizan los datos tabulados, y en base a los resultados y las conclusiones se redacta el informe final de la investigación.

Muestra: Es una parte o subconjunto de una población normalmente seleccionada de tal modo que ponga de manifiesto las propiedades de la población. Su característica más importante es la representatividad.

Probabilística: Son las que utiliza el muestreo al azar, y merced a ello pueden calcular de antemano la probabilidad de detener cada una de las muestras posibles.

No Probabilística: No usan el muestreo al azar sino que se obtiene por el criterio del investigador, razones de economía, comodidad, etc. (Muestreo intencional, muestreo accidental, etc.).

Dentro de los muestreos probabilísticos se encuentran:

Muestreo aleatorio simple: una vez censado el marco de la población, se asigna un número a cada miembro y se eligen aleatoriamente las unidades muestrales, es decir que cada individuo o elemento tiene la misma oportunidad de selección que cualquier otro, y la selección de un individuo o elemento en particular no afecta la probabilidad de que se elija cualquier otro.

Muestro Sistemático: Es un muestreo aleatorio en el cual se eligen los elementos de la población a intervalos uniformes a partir de un listado ordenado (dentro del marco, tomar un número y repetirlo varias veces hasta terminar la lista)

Muestreo estratificado: Lo primero que hace el investigador es clasificar los elementos de la población en subgrupos separados de acuerdo a una o más características. Después se obtiene por separado una muestra aleatoria simple o sistemática de cada estrato.

Muestreo por conglomerado: Es un tipo de muestreo aleatorio en el que los elementos de la población se dividen en forma natural en subgrupos. En éste muestreo, la unidad muestral no son los individuos sino un conjunto de individuos que, bajo determinados aspectos, se puede considerar que forman una unidad o conglomerado. En vez de censar toda la población, es necesario censar sólo los conglomerados. El método consiste en seleccionar aleatoriamente un número de conglomerados cuya suma total de elementos proporcione el tamaño muestral buscado.

Dentro de los muestreos no probabilísticos se encuentran:

Muestreo por criterio: Éste procedimiento se basa en el criterio o juicio del investigador para seleccionar unidades muestrales representativas.

Muestreo por conveniencia: Éste procedimiento consiste en seleccionar las unidades muestrales más convenientes para el estudio, o en permitir que la participación de la muestra sea totalmente voluntaria.

Muestreo por cuotas: En éste método, primero se realiza una estratificación de la muestra que garantice la variedad de criterios y características de la población objeto en estudio, y luego se aplica un muestreo por criterio para seleccionar las unidades muestrales de cada estrato. Ej.: divido en sexo y edad.

Además las muestras pueden ser:

Muestras grandes: Son consideradas aquellas cuyo número de sujetos (N) es superior a 30. Cuando más grande sea una muestra más significativos serán los resultados obtenidos de ella en relación con la población.

Muestras pequeñas: Son consideradas aquellas cuyo número de sujetos (N) es inferior a 30. El problema de las muestras pequeñas es que debido a su escaso número de representantes de la población a estudiar, puede ofrecer unos datos menos representativos de dicha población.

Muestras correlacionadas: En muchas ocasiones, se toman muestras donde cada observación está emparejada con una observación de la otra muestra. Medidas en un mismo sujeto antes y después de someterlo a un tratamiento , medidas en hermanos gemelos, etc.

Muestras independientes: Son aquellas muestras que no están relacionadas con otras.

Probabilidad: Es la probabilidad que tenemos de que algo suceda. Es muy complejo de definir. Hay dos tipos:

Objetiva: A priori. Es una probabilidad ideal a la que tienden los fenómenos reales.

Subjetiva: Real. Se determina de un modo empírico a través de un número suficiente de pruebas.

Problema: un problema existe cuando hay tres elementos, cada uno claramente definido: una situación inicial; una situación final u objetivo a alcanzar y restricciones o pautas respecto de métodos, actividades, tipos de operaciones, etc., sobre los cuales hay acuerdos previos.

Pruebas paramétricas: Son las más poderosas siempre que cumplan estos requisitos (1- Que las características que se estudian existan en la población. 2- Que en ella estén distribuidas normalmente. 3 Que el estadístico muestral da una estimación del parámetro). Ventajas: Mayor potencia para rechazar Hº falsas o al igual potencia el ahorro de sujetos en las muestras, desarrollo estadístico superior, permiten hacer estimaciones de los parámetros indicando el margen de error que les afecta. Inconvenientes: Su uso está limitado a una serie de restricciones.

Pruebas no paramétricas: Son aquellas cuyo modelo estadístico no parte de supuestos acerca de la población o éstos son muy débiles y opera con datos ordinales y hasta nominales. Ventajas: Cálculo más sencillo, menos restrictivas incluso a niveles de medida tan elementales como ordinal o nominal, son especialmente adecuadas para muestras pequeñas donde suelen ser tan potentes como las paramétricas. Inconvenientes: Menor potencia y desarrollo estadístico menor.

Prueba bilateral: Bilateral cuando es bidireccional, de dos colas, es indiferente el sentido del orden.

Prueba unilateral: es unidireccional, de una cola, sólo puede mirar en un sentido sin alterar el significado.

Prueba objetiva: Son aquellas pruebas que se realicen intentando evitar cualquier aspecto que pueda ser interpretado desde una subjetividad, tanto por el que realiza la prueba, como sobre todo, por el que la evalúa.

Prueba Post-hoc: Una vez que se ha determinado que existen diferencias entre las medias, las pruebas de rango post hoc permiten determinar qué medias difieren. La prueba de rango post hoc identifica subconjuntos homogéneos de medias que no se diferencian entre sí.

pruebas de bondad de ajuste: Es una prueba no paramétrica que contrasta si las frecuencias observadas en cada una de las clases de una variable categórica varían de forma significativa de las frecuencias que se esperaría encontrar si la muestra hubiese sido extraída de una población con una determinada distribución de frecuencias.

Ji cuadrado: La prueba estadística de X2 para una muestra se emplea frecuentemente como prueba de bondad de ajuste, sin embargo, en un plan experimental, en el que se cuenta con un grupo muestral, con diversas subclases y las mediciones están en escala nominal, resulta muy útil este procedimiento.

La eficacia de la prueba está de acuerdo con el tamaño de la muestra, pues con un grado de libertad, si hay dos subclases, algunos autores consideran que la prueba es insensible, no obstante la información que aporta más de dos categorías es satisfactoria en función de la fórmula:

X2 = ð HN=l (fo - fe)2

fe

Prueba de McNemar: Prueba que comprueba, para dos variables dicotómicas relacionadas, si los pares de respuestas desiguales (0,1) y (1,0) tienen la misma probabilidad. Esta prueba es muy útil para detectar cambios de una categoría a otra en los diseños experimentales de tipo antes-después.

Prueba Binomial: Prueba para contrastar si una muestra procede de una distribución binomial con la probabilidad especificada de éxito (p).

Prueba de Kolmogorov-Smirnoff: Se trata de un modelo no-paramétrico para comprobar bondad de ajuste. La clasificación de este modelo se debe al hecho que no depende de una distribución original especifica; no se sabe a priori la forma de la distribución de donde se sacan los datos. El modelo de Kolgomorov-Smirnov se aplica a distribuciones de tipo ordinal. También se la usa para probar hipótesis acerca de distribuciones discretas. Se basa en calcular las diferencias, en valor absoluto, entre las frecuencias acumuladas relativas observadas y las esperadas, en cada clase. Luego se busca la mayor de las diferencias en valor absoluto, y la diferencia máxima obtenida se compara con el valor critico de tablas.