Falsedades en Estadística

Análisis estadístico. Mentiras. Inferencia. Grupos focales. Muestras. Probabilísticas. Tendencia central. Forma

  • Enviado por: Skonline
  • Idioma: castellano
  • País: Guatemala Guatemala
  • 10 páginas
publicidad

Existen 3 tipos de Falsedades:

  • Mentiras

  • Mentiras Detestables

  • 3.

    Estadística: Trata del diseño de experimentos o encuestas mediante muestras para obtener una cantidad determinada de información a un costo mínimo; y del uso óptimo de esta (información) se infiere con respecto a una población.

    PROCESO EN ESTADÍSTICA

    Falsedades en Estadística

    Estadística Moderna:

    • Matemáticos de la teoría de probabilidad

    • Necesidad de recopilar datos sobre bases nacionales

    Estadística Descriptiva: Métodos que implican la recolección , presentación y caracterización de un conjunto de datos para describir en la forma apropiada las diversas características de ese conjunto de datos.

    Estadística Inferencial: Métodos que posibilitan la estimación de una característica de una población o la forma de una decisión concerniente a una población, tan sólo con base en los resultados de una muestra.

    TIPOS DE DATOS:

    • Cualitativos: Categóricos - ejemplo ¿?

    • Cuantitativos: #´s “Conteos (numeros enteros) y mediciones”.

    Números Enteros Descrito: (donde obtengo datos?)

    • Publicaciones

    • Encuestas: casa, telefono, correo, m@il.

    • Experimentos

    • En donde uno trabaja

    Nota: _ El tipo de pregunta depende de que tipo de entrevista es.

    _ ¿ En la escala del 1 al 5 que tal le parecio la fiesta?

    Grupos Focales: A partir de una pequeña muestra organizan o sacan conclusiones.

    Observación Directa: Donde el que hace la encuesta observa directamente.

    Los estudios estadísticos dependen de los datos:

    • Cuestionario

    • Preguntas Ordenadas

    • Redacciones

    • Opciones (no asumir nada obvio)

    TIPOS DE MUESTRAS

    (pedazo de población)

    Probabilísticas:

    • Problema Práctico: saber cuantos son o hay saber tamaño de la población.

    Basadas en la forma de elegir:

  • Aleatorio Simple: la muestra al azar para el estudio.

  • Sistemática: Para sacar “random” hay muestras sistemáticas; “1 en K” (sistema de elección).

    • El uso del sistema A o B, depende de la muestra que se trabaja o población:

    Poblaciones:

    _ Aleatoria o desordenada (A y B): sentados en donde sea.

    _Ordenada (B): Orden alfabético y numérico. Años, sentados por # de carnét.

    _ Cíclicas (A): población de días, BTM, ROBIN, GATUBELA.

    C) Estratificada: Califica un grupo sin traslape, en un solo nivel.

    • Origen Étnico

    • Sexo

    • Nivel Social

    • Salario

    • Ej: “ESTRATO

  • 0.0123 % 2

  • 0.0115 % 5

  • 0.02 % 10

  • 0.05 % 100

  • 0.90 % 1,000

    • Grupos Homogéneos.

    • Uno toma en cuenta el # y cantidad de “estratos”

    • Al hacer categorías hay que tener cuidado.

    • Al clasificar en “profesión” hay que tener en mente sus especialidades.

    • Cuando uno estratifica , se obtiene el menor “error”.

    D) Conglomeración (Racimos):

    • Grupos heterogéneos (distantes), pero que hay otros similares.

    • Ej: 2 secciones de estadística (am y pm) grupos diferentes, con similitud en lo que estudian.

    • Ej2:

    Venta de Zapatos

    Z x x

    O x x

    N x x

    A x x x

    S x x

    Resumen:

    ¿Se sabe el # de población? Si No

    Probabilística No Probabilística

    • Aleatoria Simple * Cuota

    • Sistemática * Juicio

    • Estratificada * Trozo

    • Conglomerada

    Presentación de Datos:

    Puede ser en diferentes métodos:

    1) Métodos Explicativos: diagramas, tablas, gráficas; pero el problema es decidir cual usar, para poder explicar estadísticamente las cosas.

    DIAGRAMAS:

    1) Tallo - Hoja (sting - leave): Para presentar información.

    • Dejar la última libre.

    • Se ordena fácilmente.

    • Si se repite el número, se puede ver fácilmente.

    Ej:

    Números: 6´0 , 7´0, 7´9, 6´4, 4´6, 5´7, 7´8, 6´1, 5´6, 6´7, 6´4, 10´3, 10´5, 12´5, 11´5.

    Tallo Hoja

    4 6

    5 7, 6

    6 0, 4, 1, 7, 4

    7 5, 9, 8

    10 3, 5

    11 5

    12 5

    2) Esqueleto de Pescado (ISHIKAWA): >))))°> Control de Calidad

    • Hay que conocer la causa - efecto, que nos puede ayudar a conocer y comprender una situación.

    CAUSA EFECTO

    DESVELO TRAFICO

    Dormir - Carro -

    Bus -

    Hora -

    ------------------------------------------------------------------------- Llegar tarde al trabajo

    Choque -

    Pinchazo -

    Fundió -

    DESCOMPOSTURA DE CARRO

    3) PARAPETO:

    • Parapeto decía que el 80% de los problemas vienen del 20% de las causas, la mayoría de quejas vienen de pocas causas.

    • Si se eliminan los 2 problemas + grandes, se elimina o se tranquilizan los secundarios.

    Quejas Número

    Parqueo 35

    Baños 25

    Cafetería 10

    Audiovisuales 30

    4) Flujo “Proceso”:

    • Saber como interactua algo; una empresa, etc.

    Falsedades en Estadística

    2) Métodos Numéricos: Medidas de Resumen descriptivas.

    Se puede dar una medida de:

    TENDENCIA CENTRAL:

    A) MEDIA: (promedio)

    Ej: 7, 9, 14 Media = (7 + 9 + 14) / 3 = 10

    3 + 1 = 4 __3_ ___4__

    1

    _-_-_-_|_-_|_|_-_-_-_|_-_-_

    7 9 10 14

    media

    • La suma de los números de la Izquierda es igual al de la suma de la derecha.-

    • Punto de equilibrio las diferencias de Izquierda y derecha.-

    • “Diferente camino, mismo kilómetros”

    • VENTAJAS: Toma en cuenta todos los datos

    • DESVENTAJA:

      • 9, 10, 11 estan más pegados, es decir, la medida es la misma pero diferente distancia.

      • El Promedio puede MENTIR, ya que hay gente que sube o baja el promedio. “Jordan / Salario”

      • OJO: Ingreso percápita, producto nacional bruto.

    B) MEDIANA:

    • Lo que esta en medio ( el 50% a la Iz. y el 50% a la der.)

    • Los datos deben estar ordenados.

    • VENTAJA: Para saber que esta en medio.

    • DESVENTAJA: No toma en cuenta todos los datos, solo los de en medio.

    EJ: 7, 9, 14 El 9 es la mediana.

    7, 3, 19, 4, 22 luego ordenados: 3, 4, 7, 19

    * Si no tiene mitad impar, (4 + 7) / 2 = 5.5

    Mediana = 5.5

    __|____|__*__-_|_-_-_-_-_-_-_-_-_-_-_-_|_

    3 4 5.5 7 19

    EJ:

    Salario Medio

    Están abajo ______|_______ Están arriba

    4, 000

    C) MODA:

    • Lo que más se repite.-

    • VENTAJA: Única con la que se puede calcular datos Cualitativos.

    Busca lo común.

    • EJ:

    7 verde La moda es verde por ser común.

    3 rojo

    1 azul

    TENDENCIA NO CENTRAL:

    a) PARTES POR MIL: Califica en mil.

    b) DECILES: Califica del 1 - 10 (2% = 20%)

    c) CUANTILES: Califica por 100.

    d) PERCENTIL:

        • VENTAJA: Disfraza la Información.

        • Cambia calificaciones o notas de números a porcentajes.

        • El porcentaje dice la posición que ocupa sobre los demás, y no da la nota.

        • Forma más fácil para dar de manera positiva un resultado.

    EJ: Si en un examen hay 100 niños.

    Nota Percentil

    62 D 100 %

    61 99 %

    61 99 %

    55 33% significa que esta sobre

    el 33 % de los demás.-

    PARA COMPLETAR necesitamos las medidas de:

    DISPERSIÓN

  • RANGO: restar el valor + grande, menos el valor + pequeño.

  • 7, 9, 11, 15 R = 15 - 7 = 8

    11, 10, 9 R = 11 - 9 = 2

    * Pero hay que ver que tan separados están los datos.

  • VARIANZA: es el promedio menos la media, todo al cuadrado, dividido # de datos.

  • " (D.S.2)/ n

    Datos Varianza

    7 7 - 10 = -3 -32 = 9

    8 8 - 10 = -2 -22 = 4 Varianza

    • 15 - 10 = 5 . 52 = 25 38/3 = 12.662

    0 38

    Dispersión o Separación: Dependiendo para que se use es buena o mala. (lenguaje , idioma “español alemán portugués).

  • DESVIACIÓN STÁNDAR: Datos menos la media.

  • Toma en cuenta todos los datos.

    Es la raíz de la varianza.

    38/3 = 5

  • COEFICIENTE DE VARIACIÓN: CV = (D.S. / media) * 100

        • VENTAJAS: Comparar cosas muy distintas; que no tengan sentido de relación y da solo dimensiones.

    EJ: El precio promedio de

    ORO es $125 onz.

    PAPEL es $1,400 ton.

    CAFÉ es $250 qq.

    Se calcula la Desviación Estándar:

    D.S. CV

    $10 (10/125)*100 = 8 %

    $150 (150/1400)*100 = 10.7 %

    $ 5 (5/250)*100 = 3 %

    Significa que el Café por tener el 3 % , es el elemento que menos cambios tiene. Sería mas seguro invertir en este.

    FORMA:

    Sabemos hacer la Forma, teniendo ya la tendencia y descripción; es decir cuando ya tenemos la POSICIÓN (tendencia central, mediana, moda, media, tendencia no central); y tenemos el RANGO (recorrido indescriptible, varianza, desviación estándar, coeficiente de variación); entonces proseguimos a saber la forma.

    Puede ser Asimétrica, Curtosis y Sesgo.

    A) Simétrica: es una curva simétrica.

    Falsedades en Estadística

    B) Desviación Standard: Que tan ancha es la curva, pueden tener curvas simétricas pero con dif. Desviación Standard.

    Falsedades en Estadística

    C) Asimétrico:

    Falsedades en Estadística

    D) Curtosis: Medida de que tan puntiagudo es algo. (este dato lo da la compu).

    Falsedades en Estadística

    menor a 3 es = a 3 mayor a 3

    Características: se aplica a curvas simétricas debe ser menor o mayor o = a 3.

    “TEOREMA DE TCHEVICHEFF”

    La Desviación Estándar, la media y forma, sirven para averiguar la mayoría de los datos..

    K 1 - 1/K2

        • 0

        • ¾

        • 8/9

    Media: 69

    D. S.: 20

    Regla Empírica: Solo se utiliza en la simétrica, por que la media, moda y mediana son iguales; cubre un buen % de datos.

    Fórmula:

    9

    No Probalísticos:

    • Muestra no representativa, de la cual no se puede proyectar resultados “Muestra Sesgada”.

  • cuota: first 25 personas que vea de una en una.

  • Juicio: 25 mujeres que trabajen de pelo negro.

  • Trozo: Grupo de conveniencia. Encontrar al grupo de un solo. “al mismo tiempo se hace a todos”.

    • Estudio informal para detectar problemas.

    • No son proyectables a atribuirse a otros estudios; no hay que generalizar.

    * Si se gira la tabla se ve una grafica, y sabemos donde hay mas números.

    Falsedades en Estadística

    Dispersión

    • Interesada en que tanto están separados o que dispersos están.

  • Varianza

  • b) Desviación Estándar

    c) Rango

    d) Coeficiente de Variación

    Forma

    • Que forma tienen los datos.

    • Medidos como:

    - Sesgo

    - Curtosis

    - Asimetría

    Posición

    • ¿Cómo están los datos con referencia a algo fijo?

    • Buscar un punto de diferencia

    • Cómo se distribuyen los datos respecto a algo fijo.

    • Pueden ser:

      • Tendencia Central: Media, mediana, moda.

      • Tendencia no Central: Cuantiles, Percentiles, por centiles.

    Para saber la dimensional de algo como el $$, si se da 12.662 no se entendería, por eso la D.S. le quita el 2 poniéndole una raíz, quedando así $ 12.66

    Comparar precios de lo mismo por 5 días o más.-

    Si no son iguales , no es simétrica.

    Media: 20

    Moda: 20.01

    Mediana: 21.1

    Fórmula:

    Media +- # (D.S.)

    | 69 -+ 2 (20) | 75% de datos

    | 69 + - 40 |

    [ 29, 109 ]

    | 69 -+ 3 (20) |

    | 69 + - 60 |

    [ 9, 129 ] 89% de datos

    Mediana +- (D.S.)