Ecuaciones de Regresión lineal

Estadística. Modelos. Hipótesis. Coeficiente de correlación

  • Enviado por: El remitente no desea revelar su nombre
  • Idioma: castellano
  • País: Chile Chile
  • 12 páginas
publicidad
cursos destacados
Ejercicios Resueltos Cálculo Diferencial
Ejercicios Resueltos Cálculo Diferencial
Serie de ejercicios resueltos de Cálculo Diferencial Este curso va ligado al curso actual de Cálculo...
Ver más información

Cálculo Integral
Cálculo Integral
Curso básico de cálculo integral de una sola variable. Se parte desde los conceptos básicos como...
Ver más información

publicidad

ESTADISTICAS II

Se desea estimar las ventas semanales de una empresa, que se dedica a la venta de electrodomésticos. Para ello relaciona las ventas (en millones de pesos) con los gastos en publicidad, y con las ventas de artículos alternativos.

La información alternativa a un periodo de 12 semanas escogidas aleatoriamente desde un periodo de 2 años, como se presenta a continuación.

SEMANA

VENTAS

(millones $)

GASTOS

(millones $)

VENTAS ART. ALTERNATIVO

1

13.2

2.5

25.5

2

16.4

3

24

3

14.3

2.8

24.4

4

16.5

4.2

21.8

5

22.3

5.3

20.1

6

15.8

3.6

22.8

7

11.2

2.7

24.6

8

13.3

3.2

23.8

9

8.6

1.9

26.2

10

12.5

3.6

22.8

11

16.5

4.6

20.8

12

16

3.8

22.2

  • Encuentre las ecuaciones de regresión lineal estimadas de los modelo:

  • Yi=0+1Xi+ i

  • Yi=0+1Zi+i

  • Interprete el valor de las pendientes.

  • Pruebe la significancia de cada modelo y con base estadística elija el mejor.

  • Se piensa que entre las ventas Y, y los gastos de publicidad X existe una correlación positiva de por lo menos 70%, concluya con un nivel de significación de 5%.

  • Para cada modelo anterior (pregunta A), dibuje el diagrama de dispersión junto a la ecuación de regresión lineal, y según los gráficos cual ecuación se ajusta mejor.

  • Se plantean los siguientes modelos que relacionan las ventas semanales con los gastos en publicidad y las ventas del articulo alternativo.

  • Yi=*Xi+i

  • Yi=A*XiC

  • Encuentre los coeficientes de cada modelo por medio de un indicador adecuado, elija cual de ellos se ajusta mejor

  • Para el modelo 2 de la pregunta anterior estime las ventas para un nivel de gasto en publicidad de 2.7 millones, use un 95% de confianza.

  • SOLUCIÓN:

    A) Modelo 1:

    "Xi= 41.2

    "Yi= 176.6

    "Xi*Yi= 637.45

    "Xi2= 151.48

    1= n*"Xi*Yi - ("Xi)*("Yi)

    n*"Xi2-("Xi)2

    1= 12(637.45)-(41.2)(176.6)

    12(151.48)-1697.44

    1= 3.104

    0= "Yi-b1"Xi

    n

    0= 176.6-3.104(41.2)

    12

    0= 4.0596

    Por lo tanto el modelo 1 es: Yi=4.0596+3.104*Xi

    De donde se puede decir que si la variable X aumenta en una unidad la variable Y varia 3.104 veces, y 0 no tiene ninguna interpretación practica.

    Modelo 2:

    "Zi= 279

    "Zi*Yi= 4048.07

    "Zi2= 6524.06

    "Yi= 176.6

    1= n*"Zi*Yi - ("Zi)*("Yi)

    n*"Zi2-("Zi)2

    1= 12(3646.07)-(179)(176.6)

    12(6524.06)-77841

    1= -1.5513

    0= "Yi-1"Zi

    n

    0= 176.6+1.5513(179)

    12

    0= 50.7844

    Por lo tanto el modelo 2 es: Yi=50.7844 - 1.5513Zi

    De donde se puede decir que si la variable Z aumenta en una unidad, la variable Y varia 1.5513 veces, y 0 no tiene ninguna interpretación practica.

  • Modelo 1:

  • - Hipótesis: H0: 1=0 (el modelo no se ajusta a los datos)

    H1: 1"0 (el modelo se ajusta a los datos)

    • Estadístico de prueba:

    F= CMR = SMR "F(1;n-2;1-)

    CME SCE/(N-2)

    SMR= b12"(Yi-YP)2 (el subíndice p indica promedio)

    SMR= 3.10412"(Yi-14.72)2

    SMR= 96.6126

    SCE= SCT-SMR

    SCT= "(Yi-YP)2

    SCT= 128.6968

    SCE= 128.6968-96.6126

    SCE= 32.0842

    Fobs= 96.6126 = 30.1122

    32.0842/2

    - RC: F(1;10;0.95)= 4.9646

    • Como Fobs pertenece a la región critica existe suficiente evidencia para rechazar H0 por lo que con un 5% de significación se puede decir que el modelo es significativo.

    • P-value

    *= Prob(F(1;10)>Fobs)

    *= Prob(F(1;10)>30.1122)

    *= 1-Prob(F(1;10)"30.1122)

    *= 1-0.9997335

    *= 0.0002664

    Modelo 2:

    - Hipótesis: H0: 1=0 (el modelo no se ajusta a los datos)

    H1: 1"0 (el modelo se ajusta a los datos)

    • Estadístico de prueba:

    F= CMR = SMR "F(1;n-2;1-)

    CME SCE/(N-2)

    SMR= 12"(Zi-ZP)2 (el subíndice p indica promedio)

    SMR= (-1.5513)2"(Yi-23.25)2

    SMR= 89.7877

    SCE= SCT-SMR

    SCT= "(Yi-YP)2

    SCT= 128.6968

    SCE= 128.6968-89.7877

    SCE= 38.9091

    Fobs= 89.7877 = 23.0763

    38.9091/2

    - RC: F(1;10;0.95)= 4.9646

    - Como Fobs pertenece a la región critica existe suficiente evidencia para rechazar H0 por lo que con un 5% de significación se puede decir que el modelo es significativo.

    - P-value

    *= Prob(F(1;10)>Fobs)

    *= Prob(F(1;10)>23.07)

    *= 1-Prob(F(1;10)"30.1122)

    *= 1-0.9992797

    *= 0.00072

    Coeficiente de determinación:

    Modelo 1:

    SCR= (n-1)b1Sx2

    96.612= 11(3.104)2Sx2

    Sx2= 0.91158

    SCT= (n-1)Sy2

    128.6968= 11Sy2

    Sy2= 11.6997

    R2= b12*Sx2

    Sy2

    R2= (3.104)2*0.91158

    11.6997

    R2= 0.75069

    Modelo 2:

    SCR= (n-1)1Sz2

    89.7877= 11(-1.5513)2Sz2

    Sz2= 3.3918

    SCT= (n-1)Sy2

    128.6968= 11Sy2

    Sy2= 11.6997

    R2= 12*Sz2

    Sy2

    R2= (-1.5513)2*3.3918

    11.6997

    R2= 0.6976

    Como el percentil es mayor en el modelo 1, el porcentaje de ajuste es mayor en 1.

    Coeficiente de correlación:

    = 1x

    y

    =1 Sx

    Sy

    Modelo 1:

    1= (3.104)*0.9547

    3.4205

    1= 0.86636

    Modelo 2:

    2= (-1.5513)*1.8416

    3.4205

    2= -0.83522

    Para el modelo 2 existe una relación lineal inversa, ya que  es negativo

    Por lo tanto el modelo 1 es mejor que el modelo 2.

    C) Modelo 1:

    - Hipótesis: H0: =0.7 (no existe regresión)

    H1: >0.7 (existe regresión)

    • Estadístico de prueba:

    Zobs= (Zr-Z)*(n-3)1/2"N(0;1)

    r= (SIG)b1(SCR/SCT)1/2

    r= (9.612/128.6968)1/2

    r= 0.8664

    Zr=1/2(Ln((1+r)/(1-r)))

    Zr=0.5(Ln((1+0.8664)/(1-0.8664)))

    Zr=1.3184

    Z=1/2(Ln((1+)/(1-)))

    Z=1/2(Ln((1+0.7)/(1-0.7)))

    Z=0.8673

    Zobs= (1.3184 - 0.8673)*3

    Zobs= 1.3532

    • RC:

    Distribuye normal con =0 y =1, con 5% de significación

    Z= 1.644 (Z de tabla)

    • Como Z observado no pertenece a la región critica no existe suficiente evidencia para rechazar H0. Por lo tanto para la variabilidad de los datos no existe una correlación positiva del 70%.

    Ecuaciones de Regresión lineal
    D) Modelo 1:

    Yi=4.0596+3.104*Xi

    Modelo 2:

    Ecuaciones de Regresión lineal

    Yi=50.7844 - 1.5513Zi

    Como se puede apreciar los datos de el modelo 1 se ajustan de una mejor forma al modelo que se propuso, teniendo una variación de las ventas con respecto a los gastos en publicidad positiva.

  • Modelo 1:

  • Yi= Xi+i

    Para este caso b1=  y b0= 0, la ecuación del modelo pasa por el origen.

    S="ei2 = "(Yi-Yie)2 (el subíndice e indica estimación)

    "(Yi-*Xi)2

    dS =0

    d

    2"(Yi-Xi)(-Xi)=0 / *1/2

    ("-Xi*Yi)+ "Xi2=0

    "Xi2="Xi*Yi

    = "Xi*Yi

    "Xi2

    datos:

    "Xi*Yi=637.45

    "Xi2=151.48

    Por lo tanto

     =4.208

    Lo que implica que el modelo seria Yi=4.208Xi+i

    Modelo 2:

    Yi=A*Zic

    Tenemos que Yi = a +c*Zi

    Donde "Zi ="Ln(Zi)=37.72

    "Yi ="Ln(Yi)=31.96

    "Zi *Yi ="Ln(Zi*Yi)=100.298

    Yp ="Ln(Yi)/n=2.663

    Zp ="Ln(Zi)/n=3.143

    "Zi 2=6524.06

    Tenemos que c= "Zi *Yi - ("Zi )("Yi )/n)

    ("Zi 2) - ("Zi )2/n

    c=100.298 - (37.72)(31.96)/12

    6524.06 - 37.722/12

    c= -2.5436*10-5

    a =Yp - c*Zp

    a =2.663+2.5436*10-5(3.143)

    a =2.663

    Por lo tanto A=ea

    A=e2.663

    A=14.3403

  • Yi = A*Zic

  • Gasto=2,7 millones, con 95% de confianza.

    Reemplazando 2,7 en la ecuación anterior:

    Y0 = (14,3403)*(2,7)-0.000025436

    Y0 = 14,339

    Y0 " [ Y0 ± Tn-21-/2 r](1-)

    r= [CME*(1+1/n+ (Z0 - ZP)2/("(Zi -Zp))]1/2

    Zp= "Zi/n=23.25

    CME= SCE/(n-2)

    SCE= SCT-SCR

    SCR= c2*"(Zi-Zp)2=(-2.5436*10-5)2*37.31

    SCR= 2.4139*10-8

    SCT= "(Yi-Yp)2=128.6968

    SCE= 128.6968 - 2,4139*10-8

    SCE= 128,6967

    CME= 128.6967/10=12,8696

    r= [12.89696(1+1/12+(2.7-23.25)2/37.31)]

    r=12.6336

    Y0 " [14.339 ± T100.975*12.6336]

    Y0 " [14.339 ± 2.2281*12.6336]

    Y0 " [-13.809 ; 42.487](95%)

    Ecuaciones de Regresión lineal

    Ecuaciones de Regresión lineal