Ecuaciones de Regresión lineal

Estadística. Modelos. Hipótesis. Coeficiente de correlación

  • Enviado por: El remitente no desea revelar su nombre
  • Idioma: castellano
  • País: Chile Chile
  • 12 páginas

publicidad
cursos destacados
¡Ejercicios resueltos de Límites de Funciones!
¡Ejercicios resueltos de Límites de Funciones!
En este curso de 7 horas, el profesor Willians Medina explica de manera impecable el tema de Límites de...
Ver más información

Aritmética
Aritmética
En este curso de Aritmética se estudian temas necesarios y básicos de esta área. Se muestran las...
Ver más información

publicidad

ESTADISTICAS II

Se desea estimar las ventas semanales de una empresa, que se dedica a la venta de electrodomésticos. Para ello relaciona las ventas (en millones de pesos) con los gastos en publicidad, y con las ventas de artículos alternativos.

La información alternativa a un periodo de 12 semanas escogidas aleatoriamente desde un periodo de 2 años, como se presenta a continuación.

SEMANA

VENTAS

(millones $)

GASTOS

(millones $)

VENTAS ART. ALTERNATIVO

1

13.2

2.5

25.5

2

16.4

3

24

3

14.3

2.8

24.4

4

16.5

4.2

21.8

5

22.3

5.3

20.1

6

15.8

3.6

22.8

7

11.2

2.7

24.6

8

13.3

3.2

23.8

9

8.6

1.9

26.2

10

12.5

3.6

22.8

11

16.5

4.6

20.8

12

16

3.8

22.2

  • Encuentre las ecuaciones de regresión lineal estimadas de los modelo:

  • Yi=0+1Xi+ i

  • Yi=0+1Zi+i

  • Interprete el valor de las pendientes.

  • Pruebe la significancia de cada modelo y con base estadística elija el mejor.

  • Se piensa que entre las ventas Y, y los gastos de publicidad X existe una correlación positiva de por lo menos 70%, concluya con un nivel de significación de 5%.

  • Para cada modelo anterior (pregunta A), dibuje el diagrama de dispersión junto a la ecuación de regresión lineal, y según los gráficos cual ecuación se ajusta mejor.

  • Se plantean los siguientes modelos que relacionan las ventas semanales con los gastos en publicidad y las ventas del articulo alternativo.

  • Yi=*Xi+i

  • Yi=A*XiC

  • Encuentre los coeficientes de cada modelo por medio de un indicador adecuado, elija cual de ellos se ajusta mejor

  • Para el modelo 2 de la pregunta anterior estime las ventas para un nivel de gasto en publicidad de 2.7 millones, use un 95% de confianza.

  • SOLUCIÓN:

    A) Modelo 1:

    "Xi= 41.2

    "Yi= 176.6

    "Xi*Yi= 637.45

    "Xi2= 151.48

    1= n*"Xi*Yi - ("Xi)*("Yi)

    n*"Xi2-("Xi)2

    1= 12(637.45)-(41.2)(176.6)

    12(151.48)-1697.44

    1= 3.104

    0= "Yi-b1"Xi

    n

    0= 176.6-3.104(41.2)

    12

    0= 4.0596

    Por lo tanto el modelo 1 es: Yi=4.0596+3.104*Xi

    De donde se puede decir que si la variable X aumenta en una unidad la variable Y varia 3.104 veces, y 0 no tiene ninguna interpretación practica.

    Modelo 2:

    "Zi= 279

    "Zi*Yi= 4048.07

    "Zi2= 6524.06

    "Yi= 176.6

    1= n*"Zi*Yi - ("Zi)*("Yi)

    n*"Zi2-("Zi)2

    1= 12(3646.07)-(179)(176.6)

    12(6524.06)-77841

    1= -1.5513

    0= "Yi-1"Zi

    n

    0= 176.6+1.5513(179)

    12

    0= 50.7844

    Por lo tanto el modelo 2 es: Yi=50.7844 - 1.5513Zi

    De donde se puede decir que si la variable Z aumenta en una unidad, la variable Y varia 1.5513 veces, y 0 no tiene ninguna interpretación practica.

  • Modelo 1:

  • - Hipótesis: H0: 1=0 (el modelo no se ajusta a los datos)

    H1: 1"0 (el modelo se ajusta a los datos)

    • Estadístico de prueba:

    F= CMR = SMR "F(1;n-2;1-)

    CME SCE/(N-2)

    SMR= b12"(Yi-YP)2 (el subíndice p indica promedio)

    SMR= 3.10412"(Yi-14.72)2

    SMR= 96.6126

    SCE= SCT-SMR

    SCT= "(Yi-YP)2

    SCT= 128.6968

    SCE= 128.6968-96.6126

    SCE= 32.0842

    Fobs= 96.6126 = 30.1122

    32.0842/2

    - RC: F(1;10;0.95)= 4.9646

    • Como Fobs pertenece a la región critica existe suficiente evidencia para rechazar H0 por lo que con un 5% de significación se puede decir que el modelo es significativo.

    • P-value

    *= Prob(F(1;10)>Fobs)

    *= Prob(F(1;10)>30.1122)

    *= 1-Prob(F(1;10)"30.1122)

    *= 1-0.9997335

    *= 0.0002664

    Modelo 2:

    - Hipótesis: H0: 1=0 (el modelo no se ajusta a los datos)

    H1: 1"0 (el modelo se ajusta a los datos)

    • Estadístico de prueba:

    F= CMR = SMR "F(1;n-2;1-)

    CME SCE/(N-2)

    SMR= 12"(Zi-ZP)2 (el subíndice p indica promedio)

    SMR= (-1.5513)2"(Yi-23.25)2

    SMR= 89.7877

    SCE= SCT-SMR

    SCT= "(Yi-YP)2

    SCT= 128.6968

    SCE= 128.6968-89.7877

    SCE= 38.9091

    Fobs= 89.7877 = 23.0763

    38.9091/2

    - RC: F(1;10;0.95)= 4.9646

    - Como Fobs pertenece a la región critica existe suficiente evidencia para rechazar H0 por lo que con un 5% de significación se puede decir que el modelo es significativo.

    - P-value

    *= Prob(F(1;10)>Fobs)

    *= Prob(F(1;10)>23.07)

    *= 1-Prob(F(1;10)"30.1122)

    *= 1-0.9992797

    *= 0.00072

    Coeficiente de determinación:

    Modelo 1:

    SCR= (n-1)b1Sx2

    96.612= 11(3.104)2Sx2

    Sx2= 0.91158

    SCT= (n-1)Sy2

    128.6968= 11Sy2

    Sy2= 11.6997

    R2= b12*Sx2

    Sy2

    R2= (3.104)2*0.91158

    11.6997

    R2= 0.75069

    Modelo 2:

    SCR= (n-1)1Sz2

    89.7877= 11(-1.5513)2Sz2

    Sz2= 3.3918

    SCT= (n-1)Sy2

    128.6968= 11Sy2

    Sy2= 11.6997

    R2= 12*Sz2

    Sy2

    R2= (-1.5513)2*3.3918

    11.6997

    R2= 0.6976

    Como el percentil es mayor en el modelo 1, el porcentaje de ajuste es mayor en 1.

    Coeficiente de correlación:

    = 1x

    y

    =1 Sx

    Sy

    Modelo 1:

    1= (3.104)*0.9547

    3.4205

    1= 0.86636

    Modelo 2:

    2= (-1.5513)*1.8416

    3.4205

    2= -0.83522

    Para el modelo 2 existe una relación lineal inversa, ya que  es negativo

    Por lo tanto el modelo 1 es mejor que el modelo 2.

    C) Modelo 1:

    - Hipótesis: H0: =0.7 (no existe regresión)

    H1: >0.7 (existe regresión)

    • Estadístico de prueba:

    Zobs= (Zr-Z)*(n-3)1/2"N(0;1)

    r= (SIG)b1(SCR/SCT)1/2

    r= (9.612/128.6968)1/2

    r= 0.8664

    Zr=1/2(Ln((1+r)/(1-r)))

    Zr=0.5(Ln((1+0.8664)/(1-0.8664)))

    Zr=1.3184

    Z=1/2(Ln((1+)/(1-)))

    Z=1/2(Ln((1+0.7)/(1-0.7)))

    Z=0.8673

    Zobs= (1.3184 - 0.8673)*3

    Zobs= 1.3532

    • RC:

    Distribuye normal con =0 y =1, con 5% de significación

    Z= 1.644 (Z de tabla)

    • Como Z observado no pertenece a la región critica no existe suficiente evidencia para rechazar H0. Por lo tanto para la variabilidad de los datos no existe una correlación positiva del 70%.

    Ecuaciones de Regresión lineal
    D) Modelo 1:

    Yi=4.0596+3.104*Xi

    Modelo 2:

    Ecuaciones de Regresión lineal

    Yi=50.7844 - 1.5513Zi

    Como se puede apreciar los datos de el modelo 1 se ajustan de una mejor forma al modelo que se propuso, teniendo una variación de las ventas con respecto a los gastos en publicidad positiva.

  • Modelo 1:

  • Yi= Xi+i

    Para este caso b1=  y b0= 0, la ecuación del modelo pasa por el origen.

    S="ei2 = "(Yi-Yie)2 (el subíndice e indica estimación)

    "(Yi-*Xi)2

    dS =0

    d

    2"(Yi-Xi)(-Xi)=0 / *1/2

    ("-Xi*Yi)+ "Xi2=0

    "Xi2="Xi*Yi

    = "Xi*Yi

    "Xi2

    datos:

    "Xi*Yi=637.45

    "Xi2=151.48

    Por lo tanto

     =4.208

    Lo que implica que el modelo seria Yi=4.208Xi+i

    Modelo 2:

    Yi=A*Zic

    Tenemos que Yi = a +c*Zi

    Donde "Zi ="Ln(Zi)=37.72

    "Yi ="Ln(Yi)=31.96

    "Zi *Yi ="Ln(Zi*Yi)=100.298

    Yp ="Ln(Yi)/n=2.663

    Zp ="Ln(Zi)/n=3.143

    "Zi 2=6524.06

    Tenemos que c= "Zi *Yi - ("Zi )("Yi )/n)

    ("Zi 2) - ("Zi )2/n

    c=100.298 - (37.72)(31.96)/12

    6524.06 - 37.722/12

    c= -2.5436*10-5

    a =Yp - c*Zp

    a =2.663+2.5436*10-5(3.143)

    a =2.663

    Por lo tanto A=ea

    A=e2.663

    A=14.3403

  • Yi = A*Zic

  • Gasto=2,7 millones, con 95% de confianza.

    Reemplazando 2,7 en la ecuación anterior:

    Y0 = (14,3403)*(2,7)-0.000025436

    Y0 = 14,339

    Y0 " [ Y0 ± Tn-21-/2 r](1-)

    r= [CME*(1+1/n+ (Z0 - ZP)2/("(Zi -Zp))]1/2

    Zp= "Zi/n=23.25

    CME= SCE/(n-2)

    SCE= SCT-SCR

    SCR= c2*"(Zi-Zp)2=(-2.5436*10-5)2*37.31

    SCR= 2.4139*10-8

    SCT= "(Yi-Yp)2=128.6968

    SCE= 128.6968 - 2,4139*10-8

    SCE= 128,6967

    CME= 128.6967/10=12,8696

    r= [12.89696(1+1/12+(2.7-23.25)2/37.31)]

    r=12.6336

    Y0 " [14.339 ± T100.975*12.6336]

    Y0 " [14.339 ± 2.2281*12.6336]

    Y0 " [-13.809 ; 42.487](95%)

    Ecuaciones de Regresión lineal

    Ecuaciones de Regresión lineal