Estadística

Cálculo de probabilidades. Media. Mediana. Distribución de frecuencias. Regresión lineal y correlación

  • Enviado por: El remitente no desea revelar su nombre
  • Idioma: castellano
  • País: México México
  • 8 páginas

publicidad
cursos destacados
Certifícate PMP - Plan Oro ¡Garantizado!
Certifícate PMP - Plan Oro ¡Garantizado!
¡CURSO 100% TELEPRESENCIAL!



Otorga las 35 Horas de...
Ver más información

Mercados Financieros e Inversiones
Mercados Financieros e Inversiones
Juan Diego Gómez en está compilación de videos habla y analiza escenarios claves de los mercados financieros y de...
Ver más información


C O N T E N I D O

1. Descripción del problema 3

2. Estadística descriptiva 3

3. Estadística no paramétrica 5

4. Distribuciones continuas 7

5. Regresión lineal y correlación 7

6. Conclusiones 8

7. Anexo 1 10

Nota:

  • En los archivos .xls, se encuentra: la base de datos (anexo 1.xls), así como todas las gráficas y tablas mostradas en este trabajo (trabajo final.xls).

  • Descripción del problema.

    A partir de los datos de la precipitación máxima en 24 horas (anexo 1.xls), registrada en la estación de La Joya, ubicada en el municipio de Sta. Rosa, se pretende determinar lo siguiente:

  • Obtener la media, mediana y la distribución de frecuencias

  • Demostrar que la serie de datos elegida es homogénea, de manera que las estimaciones estadísticas muestrales sean válidas.

  • La probabilidad de en el mes de julio de este año, la lámina de lluvia sea superior a los 100 mm.

  • Estimar la precipitación media anual (PMA) para el año 2004 y 2005.

  • Estadística descriptiva.

    Es sabido que para poder determinar parámetros hidrológicos a partir de datos climatológicos es necesario tener una base de datos de por lo menos 20 años, para este estudio en especial se tomaron los datos de la estación climatológica de La Joya, y una periodo de registro de 25 años de 1976-2000. De la base de datos se obtuvo la PMA con los resultados siguientes.

    La estadista descriptiva de la seria de datos se muestra en la tabla 1.

    Tabla 1. PMA estación La Joya y estadística descriptiva

    Año

    PMA

    Media 582.86

    Error típico 29.92

    Mediana 571.20

    Desviación estándar 149.60

    Varianza de la muestra 22379.42

    Curtosis -1.06

    Coeficiente de asimetría 0.26

    Rango 512.80

    Mínimo 375.00

    Máximo 887.80

    Suma 14571.40

    Cuenta 25.00

    Mayor (1) 887.80

    Menor(1) 375.00

    Nivel de confianza(95.0%) 61.75

    1976

    707.9

    1977

    547.1

    1978

    548.7

    1979

    433.0

    1980

    720.9

    1981

    681.5

    1982

    571.2

    1983

    601.5

    1984

    729.3

    1985

    797.8

    1986

    801.0

    1987

    438.9

    1988

    456.8

    1989

    419.0

    1990

    661.3

    1991

    887.8

    1992

    680.6

    1993

    540.0

    1994

    722.2

    1995

    448.7

    1996

    375.0

    1997

    387.7

    1998

    404.7

    1999

    416.9

    2000

    591.9

    En la figura 1, es posible ver la distribución de los datos, así como los datos de la media, el máximo y el mínimo. Se observa que la distribución es cíclica, parecida a una W.

    'Estadística'

    Figura 1. Precipitaciones medias anuales, estación La Joya.

    El histograma (figura 2) muestra que la clase que mayor numero de datos tiene es la 503.2 mm, y se ve un valor lógico y representativo porque es sabido que la PMA del estado de Querétaro es de 550 mm y el dato de la estación La Joya se asemeja al del Edo. Los datos que se muestra en el rango de “y mayor” corresponden a los años de: 1985, 1986 y 1991 que se caracterizaron por ser años demasiado lluviosos en el estado, y finalmente el único dato que se encuentra en el rango de 375 mm corresponde al año 1996 y representa un año extremadamente seco.

    'Estadística'

    Figura 2. Histograma correspondiente a la estación La Joya.

    Estadística no paramétrica.

    Para demostrar que la serie de datos es confiable y poder hacer uso de ellos para estimaciones estadísticas y todo tipo de cálculos hidrológicos, se demostró que los datos son homogéneos mediante dos pruebas : Helmert y secuencias (pruebas.xls), ambas pruebas usan como parámetro de comparación la media de la población y los resultados al ser aplicadas dichas pruebas demuestran que la serie es homogénea y por lo tanto los datos son confiables y pueden ser usados para cálculos y predicciones.

    'Estadística'

    La prueba de secuencias se basa en un rango de número de secuencias que se muestran a continuación.

    'Estadística'

    'Estadística'

    Distribuciones continuas.

    Para poder predecir la probabilidad de que en el mes de julio la lámina de lluvia sea mayor a los 100 mm. Se aplicará la distribución normal.

    A partir de la base de datos de 25 años (anexo 1.xls) se obtuvieron los datos siguientes para el mes de julio:

    Media = 124.85 mm

    Des. Estándar 78.60

    x = 100 mm

    de la tabla de distribución normal = 0.1255

    P = 0.5 -1 + 0.1255 = 0.3745 =37.45 % de probabilidad de que el siguiente mes de julio llueva más de 100 mm.

    Regresión lineal y correlación.

    De acuerdo a los datos de la tabla 1, se obtuvo la ecuación de regresión para poder predecir valores, se realizó la regresión lineal (figura 3)y la

    'Estadística'

    Figura 3. Gráfica de datos y ecuación de regresión lineal.

    De acuerdo con la ecuación de regresión lineal la predicción para la PMA del año de 2004 es:

    Y = - 6.6879 (2004) + 13878

    Y = 475.44 mm

    Igualmente con los datos de la tabla 1, se obtuvo la ecuación de regresión tipo potencial (figura 4).

    'Estadística'

    Figura 4. Gráfica de datos y ecuación de regresión potencial.

    De acuerdo con la ecuación de regresión lineal la predicción para la PMA del año de 2004 es:

    Y = 4E+87x-25.734

    Y = 427.59 mm

    Como se puede ver a pesar de que R es lejano de 1, el resultado no es tan extraño, se podría decir que es conservador respecto a los datos que se tienen registrados.

    Conclusiones.

    De acuerdo a las técnicas estadísticas aplicadas se pueden inferir varias características del sitio donde se ubica la estación, respecto con los datos analizados.

    Se puede ver que el a pesar de que las pruebas de homogeneidad dieron como resultado que los datos utilizados son confiables, en muchos casos las pruebas no son favorables y se supone que no se pueden usar o los datos, pero dado que no se tienen otros parámetros para los estudios hidrológicos se tiene que trabajar con estos datos y tomar ciertas reservas en los resultados.

    En las ecuaciones de regresión, a pesar de que la R es pequeña los valores que se predicen para el año 2004, no son del todo erróneos, pues podrá corroborarse una vez que el registro este completo para dicho año.

    Como se dijo al principio los datos mínimos que se requieren son los de un periodo de 20 años, en este caso se utilizó un periodo de 25 años y se recomienda que este se vaya ampliando de acuerdo a como se vayan realizando los registros necesarios.

    Normalmente este tipo de pruebas en las estaciones se aplican no sólo a una estación si no a varias, normalmente las que tienen influencias dentro de la zona de estudios y algunas veces el registro no esta completo y tiene que ser completado con los datos de la misma estación o con las más cercanas, y muchas veces esto puede ocasionar que las muestras no sean homogéneas.