Apuntes, trabajos, monografías...

Inicio Apuntes Amor Humor Test Envía apuntes Foros

Nueva Búsqueda Nueva búsqueda   Ayuda Ayuda  

Falsedades en Estadística


Análisis estadístico. Mentiras. Inferencia. Grupos focales. Muestras. Probabilísticas. Tendencia central. Forma



Estadística
 
Falsedades en Estadística

Falsedades en Estadística

Falsedades en Estadística
 



Existen 3 tipos de Falsedades:

  • Mentiras

  • Mentiras Detestables

  • 3.

    Estadística: Trata del diseño de experimentos o encuestas mediante muestras para obtener una cantidad determinada de información a un costo mínimo; y del uso óptimo de esta (información) se infiere con respecto a una población.

    PROCESO EN ESTADÍSTICA

    Falsedades en Estadística

    Estadística Moderna:

    • Matemáticos de la teoría de probabilidad

    • Necesidad de recopilar datos sobre bases nacionales

    Estadística Descriptiva: Métodos que implican la recolección , presentación y caracterización de un conjunto de datos para describir en la forma apropiada las diversas características de ese conjunto de datos.

    Estadística Inferencial: Métodos que posibilitan la estimación de una característica de una población o la forma de una decisión concerniente a una población, tan sólo con base en los resultados de una muestra.

    TIPOS DE DATOS:

    • Cualitativos: Categóricos - ejemplo ¿?

    • Cuantitativos: #´s “Conteos (numeros enteros) y mediciones”.

    Números Enteros Descrito: (donde obtengo datos?)

    • Publicaciones

    • Encuestas: casa, telefono, correo, m@il.

    • Experimentos

    • En donde uno trabaja

    Nota: _ El tipo de pregunta depende de que tipo de entrevista es.

    _ ¿ En la escala del 1 al 5 que tal le parecio la fiesta?

    Grupos Focales: A partir de una pequeña muestra organizan o sacan conclusiones.

    Observación Directa: Donde el que hace la encuesta observa directamente.

    Los estudios estadísticos dependen de los datos:

    • Cuestionario

    • Preguntas Ordenadas

    • Redacciones

    • Opciones (no asumir nada obvio)

    TIPOS DE MUESTRAS

    (pedazo de población)

    Probabilísticas:

    • Problema Práctico: saber cuantos son o hay saber tamaño de la población.

    Basadas en la forma de elegir:

  • Aleatorio Simple: la muestra al azar para el estudio.

  • Sistemática: Para sacar “random” hay muestras sistemáticas; “1 en K” (sistema de elección).

    • El uso del sistema A o B, depende de la muestra que se trabaja o población:

    Poblaciones:

    _ Aleatoria o desordenada (A y B): sentados en donde sea.

    _Ordenada (B): Orden alfabético y numérico. Años, sentados por # de carnét.

    _ Cíclicas (A): población de días, BTM, ROBIN, GATUBELA.

    C) Estratificada: Califica un grupo sin traslape, en un solo nivel.

    • Origen Étnico

    • Sexo

    • Nivel Social

    • Salario

    • Ej: “ESTRATO

  • 0.0123 % 2

  • 0.0115 % 5

  • 0.02 % 10

  • 0.05 % 100

  • 0.90 % 1,000

    • Grupos Homogéneos.

    • Uno toma en cuenta el # y cantidad de “estratos”

    • Al hacer categorías hay que tener cuidado.

    • Al clasificar en “profesión” hay que tener en mente sus especialidades.

    • Cuando uno estratifica , se obtiene el menor “error”.

    D) Conglomeración (Racimos):

    • Grupos heterogéneos (distantes), pero que hay otros similares.

    • Ej: 2 secciones de estadística (am y pm) grupos diferentes, con similitud en lo que estudian.

    • Ej2:

    Venta de Zapatos

    Z x x

    O x x

    N x x

    A x x x

    S x x

    Resumen:

    ¿Se sabe el # de población? Si No

    Probabilística No Probabilística

    • Aleatoria Simple * Cuota

    • Sistemática * Juicio

    • Estratificada * Trozo

    • Conglomerada

    Presentación de Datos:

    Puede ser en diferentes métodos:

    1) Métodos Explicativos: diagramas, tablas, gráficas; pero el problema es decidir cual usar, para poder explicar estadísticamente las cosas.

    DIAGRAMAS:

    1) Tallo - Hoja (sting - leave): Para presentar información.

    • Dejar la última libre.

    • Se ordena fácilmente.

    • Si se repite el número, se puede ver fácilmente.

    Ej:

    Números: 6´0 , 7´0, 7´9, 6´4, 4´6, 5´7, 7´8, 6´1, 5´6, 6´7, 6´4, 10´3, 10´5, 12´5, 11´5.

    Tallo Hoja

    4 6

    5 7, 6

    6 0, 4, 1, 7, 4

    7 5, 9, 8

    10 3, 5

    11 5

    12 5

    2) Esqueleto de Pescado (ISHIKAWA): >))))°> Control de Calidad

    • Hay que conocer la causa - efecto, que nos puede ayudar a conocer y comprender una situación.

    CAUSA EFECTO

    DESVELO TRAFICO

    Dormir - Carro -

    Bus -

    Hora -

    ------------------------------------------------------------------------- Llegar tarde al trabajo

    Choque -

    Pinchazo -

    Fundió -

    DESCOMPOSTURA DE CARRO

    3) PARAPETO:

    • Parapeto decía que el 80% de los problemas vienen del 20% de las causas, la mayoría de quejas vienen de pocas causas.

    • Si se eliminan los 2 problemas + grandes, se elimina o se tranquilizan los secundarios.

    Quejas Número

    Parqueo 35

    Baños 25

    Cafetería 10

    Audiovisuales 30

    4) Flujo “Proceso”:

    • Saber como interactua algo; una empresa, etc.

    Falsedades en Estadística

    2) Métodos Numéricos: Medidas de Resumen descriptivas.

    Se puede dar una medida de:

    TENDENCIA CENTRAL:

    A) MEDIA: (promedio)

    Ej: 7, 9, 14 Media = (7 + 9 + 14) / 3 = 10

    3 + 1 = 4 __3_ ___4__

    1

    _-_-_-_|_-_|_|_-_-_-_|_-_-_

    7 9 10 14

    media

    • La suma de los números de la Izquierda es igual al de la suma de la derecha.-

    • Punto de equilibrio las diferencias de Izquierda y derecha.-

    • “Diferente camino, mismo kilómetros”

    • VENTAJAS: Toma en cuenta todos los datos

    • DESVENTAJA:

      • 9, 10, 11 estan más pegados, es decir, la medida es la misma pero diferente distancia.

      • El Promedio puede MENTIR, ya que hay gente que sube o baja el promedio. “Jordan / Salario”

      • OJO: Ingreso percápita, producto nacional bruto.

    B) MEDIANA:

    • Lo que esta en medio ( el 50% a la Iz. y el 50% a la der.)

    • Los datos deben estar ordenados.

    • VENTAJA: Para saber que esta en medio.

    • DESVENTAJA: No toma en cuenta todos los datos, solo los de en medio.

    EJ: 7, 9, 14 El 9 es la mediana.

    7, 3, 19, 4, 22 luego ordenados: 3, 4, 7, 19

    * Si no tiene mitad impar, (4 + 7) / 2 = 5.5

    Mediana = 5.5

    __|____|__*__-_|_-_-_-_-_-_-_-_-_-_-_-_|_

    3 4 5.5 7 19

    EJ:

    Salario Medio

    Están abajo ______|_______ Están arriba

    4, 000

    C) MODA:

    • Lo que más se repite.-

    • VENTAJA: Única con la que se puede calcular datos Cualitativos.

    Busca lo común.

    • EJ:

    7 verde La moda es verde por ser común.

    3 rojo

    1 azul

    TENDENCIA NO CENTRAL:

    a) PARTES POR MIL: Califica en mil.

    b) DECILES: Califica del 1 - 10 (2% = 20%)

    c) CUANTILES: Califica por 100.

    d) PERCENTIL:

        • VENTAJA: Disfraza la Información.

        • Cambia calificaciones o notas de números a porcentajes.

        • El porcentaje dice la posición que ocupa sobre los demás, y no da la nota.

        • Forma más fácil para dar de manera positiva un resultado.

    EJ: Si en un examen hay 100 niños.

    Nota Percentil

    62 D 100 %

    61 99 %

    61 99 %

    55 33% significa que esta sobre

    el 33 % de los demás.-

    PARA COMPLETAR necesitamos las medidas de:

    DISPERSIÓN

  • RANGO: restar el valor + grande, menos el valor + pequeño.

  • 7, 9, 11, 15 R = 15 - 7 = 8

    11, 10, 9 R = 11 - 9 = 2

    * Pero hay que ver que tan separados están los datos.

  • VARIANZA: es el promedio menos la media, todo al cuadrado, dividido # de datos.

  • " (D.S.2)/ n

    Datos Varianza

    7 7 - 10 = -3 -32 = 9

    8 8 - 10 = -2 -22 = 4 Varianza

    • 15 - 10 = 5 . 52 = 25 38/3 = 12.662

    0 38

    Dispersión o Separación: Dependiendo para que se use es buena o mala. (lenguaje , idioma “español alemán portugués).

  • DESVIACIÓN STÁNDAR: Datos menos la media.

  • Toma en cuenta todos los datos.

    Es la raíz de la varianza.

    38/3 = 5

  • COEFICIENTE DE VARIACIÓN: CV = (D.S. / media) * 100

        • VENTAJAS: Comparar cosas muy distintas; que no tengan sentido de relación y da solo dimensiones.

    EJ: El precio promedio de

    ORO es $125 onz.

    PAPEL es $1,400 ton.

    CAFÉ es $250 qq.

    Se calcula la Desviación Estándar:

    D.S. CV

    $10 (10/125)*100 = 8 %

    $150 (150/1400)*100 = 10.7 %

    $ 5 (5/250)*100 = 3 %

    Significa que el Café por tener el 3 % , es el elemento que menos cambios tiene. Sería mas seguro invertir en este.

    FORMA:

    Sabemos hacer la Forma, teniendo ya la tendencia y descripción; es decir cuando ya tenemos la POSICIÓN (tendencia central, mediana, moda, media, tendencia no central); y tenemos el RANGO (recorrido indescriptible, varianza, desviación estándar, coeficiente de variación); entonces proseguimos a saber la forma.

    Puede ser Asimétrica, Curtosis y Sesgo.

    A) Simétrica: es una curva simétrica.

    Falsedades en Estadística

    B) Desviación Standard: Que tan ancha es la curva, pueden tener curvas simétricas pero con dif. Desviación Standard.

    Falsedades en Estadística

    C) Asimétrico:

    Falsedades en Estadística

    D) Curtosis: Medida de que tan puntiagudo es algo. (este dato lo da la compu).

    Falsedades en Estadística

    menor a 3 es = a 3 mayor a 3

    Características: se aplica a curvas simétricas debe ser menor o mayor o = a 3.

    “TEOREMA DE TCHEVICHEFF”

    La Desviación Estándar, la media y forma, sirven para averiguar la mayoría de los datos..

    K 1 - 1/K2

        • 0

        • ¾

        • 8/9

    Media: 69

    D. S.: 20

    Regla Empírica: Solo se utiliza en la simétrica, por que la media, moda y mediana son iguales; cubre un buen % de datos.

    Fórmula:

    9

    No Probalísticos:

    • Muestra no representativa, de la cual no se puede proyectar resultados “Muestra Sesgada”.

  • cuota: first 25 personas que vea de una en una.

  • Juicio: 25 mujeres que trabajen de pelo negro.

  • Trozo: Grupo de conveniencia. Encontrar al grupo de un solo. “al mismo tiempo se hace a todos”.

    • Estudio informal para detectar problemas.

    • No son proyectables a atribuirse a otros estudios; no hay que generalizar.

    * Si se gira la tabla se ve una grafica, y sabemos donde hay mas números.

    Falsedades en Estadística

    Dispersión

    • Interesada en que tanto están separados o que dispersos están.

  • Varianza

  • b) Desviación Estándar

    c) Rango

    d) Coeficiente de Variación

    Forma

    • Que forma tienen los datos.

    • Medidos como:

    - Sesgo

    - Curtosis

    - Asimetría

    Posición

    • ¿Cómo están los datos con referencia a algo fijo?

    • Buscar un punto de diferencia

    • Cómo se distribuyen los datos respecto a algo fijo.

    • Pueden ser:

      • Tendencia Central: Media, mediana, moda.

      • Tendencia no Central: Cuantiles, Percentiles, por centiles.

    Para saber la dimensional de algo como el $$, si se da 12.662 no se entendería, por eso la D.S. le quita el 2 poniéndole una raíz, quedando así $ 12.66

    Comparar precios de lo mismo por 5 días o más.-

    Si no son iguales , no es simétrica.

    Media: 20

    Moda: 20.01

    Mediana: 21.1

    Fórmula:

    Media +- # (D.S.)

    | 69 -+ 2 (20) | 75% de datos

    | 69 + - 40 |

    [ 29, 109 ]

    | 69 -+ 3 (20) |

    | 69 + - 60 |

    [ 9, 129 ] 89% de datos

    Mediana +- (D.S.)





    El mayor abanico de cursos y titulaciones a distancia y online
    rincondelvago.com: Condiciones de Uso | Contacto