Estadística
Falsedades en Estadística
Existen 3 tipos de Falsedades:
Mentiras
Mentiras Detestables
3.
Estadística: Trata del diseño de experimentos o encuestas mediante muestras para obtener una cantidad determinada de información a un costo mínimo; y del uso óptimo de esta (información) se infiere con respecto a una población.
PROCESO EN ESTADÍSTICA
Estadística Moderna:
-
Matemáticos de la teoría de probabilidad
-
Necesidad de recopilar datos sobre bases nacionales
Estadística Descriptiva: Métodos que implican la recolección , presentación y caracterización de un conjunto de datos para describir en la forma apropiada las diversas características de ese conjunto de datos.
Estadística Inferencial: Métodos que posibilitan la estimación de una característica de una población o la forma de una decisión concerniente a una población, tan sólo con base en los resultados de una muestra.
TIPOS DE DATOS:
-
Cualitativos: Categóricos - ejemplo ¿?
-
Cuantitativos: #´s “Conteos (numeros enteros) y mediciones”.
Números Enteros Descrito: (donde obtengo datos?)
-
Publicaciones
-
Encuestas: casa, telefono, correo, m@il.
-
Experimentos
-
En donde uno trabaja
Nota: _ El tipo de pregunta depende de que tipo de entrevista es.
_ ¿ En la escala del 1 al 5 que tal le parecio la fiesta?
Grupos Focales: A partir de una pequeña muestra organizan o sacan conclusiones.
Observación Directa: Donde el que hace la encuesta observa directamente.
Los estudios estadísticos dependen de los datos:
-
Cuestionario
-
Preguntas Ordenadas
-
Redacciones
-
Opciones (no asumir nada obvio)
TIPOS DE MUESTRAS
(pedazo de población)
Probabilísticas:
-
Problema Práctico: saber cuantos son o hay saber tamaño de la población.
Basadas en la forma de elegir:
Aleatorio Simple: la muestra al azar para el estudio.
Sistemática: Para sacar “random” hay muestras sistemáticas; “1 en K” (sistema de elección).
-
El uso del sistema A o B, depende de la muestra que se trabaja o población:
Poblaciones:
_ Aleatoria o desordenada (A y B): sentados en donde sea.
_Ordenada (B): Orden alfabético y numérico. Años, sentados por # de carnét.
_ Cíclicas (A): población de días, BTM, ROBIN, GATUBELA.
C) Estratificada: Califica un grupo sin traslape, en un solo nivel.
-
Origen Étnico
-
Sexo
-
Nivel Social
-
Salario
-
Ej: “ESTRATO”
0.0123 % 2
0.0115 % 5
0.02 % 10
0.05 % 100
0.90 % 1,000
-
Grupos Homogéneos.
-
Uno toma en cuenta el # y cantidad de “estratos”
-
Al hacer categorías hay que tener cuidado.
-
Al clasificar en “profesión” hay que tener en mente sus especialidades.
-
Cuando uno estratifica , se obtiene el menor “error”.
D) Conglomeración (Racimos):
-
Grupos heterogéneos (distantes), pero que hay otros similares.
-
Ej: 2 secciones de estadística (am y pm) grupos diferentes, con similitud en lo que estudian.
-
Ej2:
Venta de Zapatos
Z x x
O x x
N x x
A x x x
S x x
Resumen:
¿Se sabe el # de población? Si No
Probabilística No Probabilística
-
Aleatoria Simple * Cuota
-
Sistemática * Juicio
-
Estratificada * Trozo
-
Conglomerada
Presentación de Datos:
Puede ser en diferentes métodos:
1) Métodos Explicativos: diagramas, tablas, gráficas; pero el problema es decidir cual usar, para poder explicar estadísticamente las cosas.
DIAGRAMAS:
1) Tallo - Hoja (sting - leave): Para presentar información.
-
Dejar la última libre.
-
Se ordena fácilmente.
-
Si se repite el número, se puede ver fácilmente.
Ej:
Números: 6´0 , 7´0, 7´9, 6´4, 4´6, 5´7, 7´8, 6´1, 5´6, 6´7, 6´4, 10´3, 10´5, 12´5, 11´5.
Tallo Hoja
4 6
5 7, 6
6 0, 4, 1, 7, 4
7 5, 9, 8
10 3, 5
11 5
12 5
2) Esqueleto de Pescado (ISHIKAWA): >))))°> Control de Calidad
-
Hay que conocer la causa - efecto, que nos puede ayudar a conocer y comprender una situación.
CAUSA EFECTO
DESVELO TRAFICO
Dormir - Carro -
Bus -
Hora -
------------------------------------------------------------------------- Llegar tarde al trabajo
Choque -
Pinchazo -
Fundió -
DESCOMPOSTURA DE CARRO
3) PARAPETO:
-
Parapeto decía que el 80% de los problemas vienen del 20% de las causas, la mayoría de quejas vienen de pocas causas.
-
Si se eliminan los 2 problemas + grandes, se elimina o se tranquilizan los secundarios.
Quejas Número
Parqueo 35
Baños 25
Cafetería 10
Audiovisuales 30
4) Flujo “Proceso”:
-
Saber como interactua algo; una empresa, etc.
2) Métodos Numéricos: Medidas de Resumen descriptivas.
Se puede dar una medida de:
TENDENCIA CENTRAL:
A) MEDIA: (promedio)
Ej: 7, 9, 14 Media = (7 + 9 + 14) / 3 = 10
3 + 1 = 4 __3_ ___4__
1
_-_-_-_|_-_|_|_-_-_-_|_-_-_
7 9 10 14
media
-
La suma de los números de la Izquierda es igual al de la suma de la derecha.-
-
Punto de equilibrio las diferencias de Izquierda y derecha.-
-
“Diferente camino, mismo kilómetros”
-
VENTAJAS: Toma en cuenta todos los datos
-
DESVENTAJA:
-
9, 10, 11 estan más pegados, es decir, la medida es la misma pero diferente distancia.
-
El Promedio puede MENTIR, ya que hay gente que sube o baja el promedio. “Jordan / Salario”
-
OJO: Ingreso percápita, producto nacional bruto.
B) MEDIANA:
-
Lo que esta en medio ( el 50% a la Iz. y el 50% a la der.)
-
Los datos deben estar ordenados.
-
VENTAJA: Para saber que esta en medio.
-
DESVENTAJA: No toma en cuenta todos los datos, solo los de en medio.
EJ: 7, 9, 14 El 9 es la mediana.
7, 3, 19, 4, 22 luego ordenados: 3, 4, 7, 19
* Si no tiene mitad impar, (4 + 7) / 2 = 5.5
Mediana = 5.5
__|____|__*__-_|_-_-_-_-_-_-_-_-_-_-_-_|_
3 4 5.5 7 19
EJ:
Salario Medio
Están abajo ______|_______ Están arriba
4, 000
C) MODA:
-
Lo que más se repite.-
-
VENTAJA: Única con la que se puede calcular datos Cualitativos.
Busca lo común.
-
EJ:
7 verde La moda es verde por ser común.
3 rojo
1 azul
TENDENCIA NO CENTRAL:
a) PARTES POR MIL: Califica en mil.
b) DECILES: Califica del 1 - 10 (2% = 20%)
c) CUANTILES: Califica por 100.
d) PERCENTIL:
-
VENTAJA: Disfraza la Información.
-
Cambia calificaciones o notas de números a porcentajes.
-
El porcentaje dice la posición que ocupa sobre los demás, y no da la nota.
-
Forma más fácil para dar de manera positiva un resultado.
EJ: Si en un examen hay 100 niños.
Nota Percentil
62 D 100 %
61 99 %
61 99 %
55 33% significa que esta sobre
el 33 % de los demás.-
PARA COMPLETAR necesitamos las medidas de:
DISPERSIÓN
RANGO: restar el valor + grande, menos el valor + pequeño.
7, 9, 11, 15 R = 15 - 7 = 8
11, 10, 9 R = 11 - 9 = 2
* Pero hay que ver que tan separados están los datos.
VARIANZA: es el promedio menos la media, todo al cuadrado, dividido # de datos.
" (D.S.2)/ n
Datos Varianza
7 7 - 10 = -3 -32 = 9
8 8 - 10 = -2 -22 = 4 Varianza
-
15 - 10 = 5 . 52 = 25 38/3 = 12.662
0 38
Dispersión o Separación: Dependiendo para que se use es buena o mala. (lenguaje , idioma “español alemán portugués).
DESVIACIÓN STÁNDAR: Datos menos la media.
Toma en cuenta todos los datos.
Es la raíz de la varianza.
38/3 = 5
COEFICIENTE DE VARIACIÓN: CV = (D.S. / media) * 100
-
VENTAJAS: Comparar cosas muy distintas; que no tengan sentido de relación y da solo dimensiones.
EJ: El precio promedio de
ORO es $125 onz.
PAPEL es $1,400 ton.
CAFÉ es $250 qq.
Se calcula la Desviación Estándar:
D.S. CV
$10 (10/125)*100 = 8 %
$150 (150/1400)*100 = 10.7 %
$ 5 (5/250)*100 = 3 %
Significa que el Café por tener el 3 % , es el elemento que menos cambios tiene. Sería mas seguro invertir en este.
FORMA:
Sabemos hacer la Forma, teniendo ya la tendencia y descripción; es decir cuando ya tenemos la POSICIÓN (tendencia central, mediana, moda, media, tendencia no central); y tenemos el RANGO (recorrido indescriptible, varianza, desviación estándar, coeficiente de variación); entonces proseguimos a saber la forma.
Puede ser Asimétrica, Curtosis y Sesgo.
A) Simétrica: es una curva simétrica.
B) Desviación Standard: Que tan ancha es la curva, pueden tener curvas simétricas pero con dif. Desviación Standard.
C) Asimétrico:
D) Curtosis: Medida de que tan puntiagudo es algo. (este dato lo da la compu).
menor a 3 es = a 3 mayor a 3
Características: se aplica a curvas simétricas debe ser menor o mayor o = a 3.
“TEOREMA DE TCHEVICHEFF”
La Desviación Estándar, la media y forma, sirven para averiguar la mayoría de los datos..
K 1 - 1/K2
-
0
-
¾
-
8/9
Media: 69
D. S.: 20
Regla Empírica: Solo se utiliza en la simétrica, por que la media, moda y mediana son iguales; cubre un buen % de datos.
Fórmula:
9
No Probalísticos:
-
Muestra no representativa, de la cual no se puede proyectar resultados “Muestra Sesgada”.
cuota: first 25 personas que vea de una en una.
Juicio: 25 mujeres que trabajen de pelo negro.
Trozo: Grupo de conveniencia. Encontrar al grupo de un solo. “al mismo tiempo se hace a todos”.
-
Estudio informal para detectar problemas.
-
No son proyectables a atribuirse a otros estudios; no hay que generalizar.
* Si se gira la tabla se ve una grafica, y sabemos donde hay mas números.
Dispersión
-
Interesada en que tanto están separados o que dispersos están.
Varianza
b) Desviación Estándar
c) Rango
d) Coeficiente de Variación
Forma
-
Que forma tienen los datos.
-
Medidos como:
- Sesgo
- Curtosis
- Asimetría
Posición
-
¿Cómo están los datos con referencia a algo fijo?
-
Buscar un punto de diferencia
-
Cómo se distribuyen los datos respecto a algo fijo.
-
Pueden ser:
-
Tendencia Central: Media, mediana, moda.
-
Tendencia no Central: Cuantiles, Percentiles, por centiles.
Para saber la dimensional de algo como el $$, si se da 12.662 no se entendería, por eso la D.S. le quita el 2 poniéndole una raíz, quedando así $ 12.66
Comparar precios de lo mismo por 5 días o más.-
Si no son iguales , no es simétrica.
Media: 20
Moda: 20.01
Mediana: 21.1
Fórmula:
Media +- # (D.S.)
| 69 -+ 2 (20) | 75% de datos
| 69 + - 40 |
[ 29, 109 ]
| 69 -+ 3 (20) |
| 69 + - 60 |
[ 9, 129 ] 89% de datos
Mediana +- (D.S.)
Descargar
Enviado por: | Skonline |
Idioma: | castellano |
País: | Guatemala |