Estadística
Ecuaciones de Regresión lineal
ESTADISTICAS II
Se desea estimar las ventas semanales de una empresa, que se dedica a la venta de electrodomésticos. Para ello relaciona las ventas (en millones de pesos) con los gastos en publicidad, y con las ventas de artículos alternativos.
La información alternativa a un periodo de 12 semanas escogidas aleatoriamente desde un periodo de 2 años, como se presenta a continuación.
SEMANA | VENTAS (millones $) | GASTOS (millones $) | VENTAS ART. ALTERNATIVO |
1 | 13.2 | 2.5 | 25.5 |
2 | 16.4 | 3 | 24 |
3 | 14.3 | 2.8 | 24.4 |
4 | 16.5 | 4.2 | 21.8 |
5 | 22.3 | 5.3 | 20.1 |
6 | 15.8 | 3.6 | 22.8 |
7 | 11.2 | 2.7 | 24.6 |
8 | 13.3 | 3.2 | 23.8 |
9 | 8.6 | 1.9 | 26.2 |
10 | 12.5 | 3.6 | 22.8 |
11 | 16.5 | 4.6 | 20.8 |
12 | 16 | 3.8 | 22.2 |
Encuentre las ecuaciones de regresión lineal estimadas de los modelo:
Yi=0+1Xi+ i
Yi=0+1Zi+i
Interprete el valor de las pendientes.
Pruebe la significancia de cada modelo y con base estadística elija el mejor.
Se piensa que entre las ventas Y, y los gastos de publicidad X existe una correlación positiva de por lo menos 70%, concluya con un nivel de significación de 5%.
Para cada modelo anterior (pregunta A), dibuje el diagrama de dispersión junto a la ecuación de regresión lineal, y según los gráficos cual ecuación se ajusta mejor.
Se plantean los siguientes modelos que relacionan las ventas semanales con los gastos en publicidad y las ventas del articulo alternativo.
Yi=*Xi+i
Yi=A*XiC
Encuentre los coeficientes de cada modelo por medio de un indicador adecuado, elija cual de ellos se ajusta mejor
Para el modelo 2 de la pregunta anterior estime las ventas para un nivel de gasto en publicidad de 2.7 millones, use un 95% de confianza.
SOLUCIÓN:
A) Modelo 1:
"Xi= 41.2
"Yi= 176.6
"Xi*Yi= 637.45
"Xi2= 151.48
1= n*"Xi*Yi - ("Xi)*("Yi)
n*"Xi2-("Xi)2
1= 12(637.45)-(41.2)(176.6)
12(151.48)-1697.44
1= 3.104
0= "Yi-b1"Xi
n
0= 176.6-3.104(41.2)
12
0= 4.0596
Por lo tanto el modelo 1 es: Yi=4.0596+3.104*Xi
De donde se puede decir que si la variable X aumenta en una unidad la variable Y varia 3.104 veces, y 0 no tiene ninguna interpretación practica.
Modelo 2:
"Zi= 279
"Zi*Yi= 4048.07
"Zi2= 6524.06
"Yi= 176.6
1= n*"Zi*Yi - ("Zi)*("Yi)
n*"Zi2-("Zi)2
1= 12(3646.07)-(179)(176.6)
12(6524.06)-77841
1= -1.5513
0= "Yi-1"Zi
n
0= 176.6+1.5513(179)
12
0= 50.7844
Por lo tanto el modelo 2 es: Yi=50.7844 - 1.5513Zi
De donde se puede decir que si la variable Z aumenta en una unidad, la variable Y varia 1.5513 veces, y 0 no tiene ninguna interpretación practica.
Modelo 1:
- Hipótesis: H0: 1=0 (el modelo no se ajusta a los datos)
H1: 1"0 (el modelo se ajusta a los datos)
-
Estadístico de prueba:
F= CMR = SMR "F(1;n-2;1-)
CME SCE/(N-2)
SMR= b12"(Yi-YP)2 (el subíndice p indica promedio)
SMR= 3.10412"(Yi-14.72)2
SMR= 96.6126
SCE= SCT-SMR
SCT= "(Yi-YP)2
SCT= 128.6968
SCE= 128.6968-96.6126
SCE= 32.0842
Fobs= 96.6126 = 30.1122
32.0842/2
- RC: F(1;10;0.95)= 4.9646
-
Como Fobs pertenece a la región critica existe suficiente evidencia para rechazar H0 por lo que con un 5% de significación se puede decir que el modelo es significativo.
-
P-value
*= Prob(F(1;10)>Fobs)
*= Prob(F(1;10)>30.1122)
*= 1-Prob(F(1;10)"30.1122)
*= 1-0.9997335
*= 0.0002664
Modelo 2:
- Hipótesis: H0: 1=0 (el modelo no se ajusta a los datos)
H1: 1"0 (el modelo se ajusta a los datos)
-
Estadístico de prueba:
F= CMR = SMR "F(1;n-2;1-)
CME SCE/(N-2)
SMR= 12"(Zi-ZP)2 (el subíndice p indica promedio)
SMR= (-1.5513)2"(Yi-23.25)2
SMR= 89.7877
SCE= SCT-SMR
SCT= "(Yi-YP)2
SCT= 128.6968
SCE= 128.6968-89.7877
SCE= 38.9091
Fobs= 89.7877 = 23.0763
38.9091/2
- RC: F(1;10;0.95)= 4.9646
- Como Fobs pertenece a la región critica existe suficiente evidencia para rechazar H0 por lo que con un 5% de significación se puede decir que el modelo es significativo.
- P-value
*= Prob(F(1;10)>Fobs)
*= Prob(F(1;10)>23.07)
*= 1-Prob(F(1;10)"30.1122)
*= 1-0.9992797
*= 0.00072
Coeficiente de determinación:
Modelo 1:
SCR= (n-1)b1Sx2
96.612= 11(3.104)2Sx2
Sx2= 0.91158
SCT= (n-1)Sy2
128.6968= 11Sy2
Sy2= 11.6997
R2= b12*Sx2
Sy2
R2= (3.104)2*0.91158
11.6997
R2= 0.75069
Modelo 2:
SCR= (n-1)1Sz2
89.7877= 11(-1.5513)2Sz2
Sz2= 3.3918
SCT= (n-1)Sy2
128.6968= 11Sy2
Sy2= 11.6997
R2= 12*Sz2
Sy2
R2= (-1.5513)2*3.3918
11.6997
R2= 0.6976
Como el percentil es mayor en el modelo 1, el porcentaje de ajuste es mayor en 1.
Coeficiente de correlación:
= 1x
y
=1 Sx
Sy
Modelo 1:
1= (3.104)*0.9547
3.4205
1= 0.86636
Modelo 2:
2= (-1.5513)*1.8416
3.4205
2= -0.83522
Para el modelo 2 existe una relación lineal inversa, ya que es negativo
Por lo tanto el modelo 1 es mejor que el modelo 2.
C) Modelo 1:
- Hipótesis: H0: =0.7 (no existe regresión)
H1: >0.7 (existe regresión)
-
Estadístico de prueba:
Zobs= (Zr-Z)*(n-3)1/2"N(0;1)
r= (SIG)b1(SCR/SCT)1/2
r= (9.612/128.6968)1/2
r= 0.8664
Zr=1/2(Ln((1+r)/(1-r)))
Zr=0.5(Ln((1+0.8664)/(1-0.8664)))
Zr=1.3184
Z=1/2(Ln((1+)/(1-)))
Z=1/2(Ln((1+0.7)/(1-0.7)))
Z=0.8673
Zobs= (1.3184 - 0.8673)*3
Zobs= 1.3532
-
RC:
Distribuye normal con =0 y =1, con 5% de significación
Z= 1.644 (Z de tabla)
-
Como Z observado no pertenece a la región critica no existe suficiente evidencia para rechazar H0. Por lo tanto para la variabilidad de los datos no existe una correlación positiva del 70%.
D) Modelo 1:
Yi=4.0596+3.104*Xi
Modelo 2:
Yi=50.7844 - 1.5513Zi
Como se puede apreciar los datos de el modelo 1 se ajustan de una mejor forma al modelo que se propuso, teniendo una variación de las ventas con respecto a los gastos en publicidad positiva.
Modelo 1:
Yi= Xi+i
Para este caso b1= y b0= 0, la ecuación del modelo pasa por el origen.
S="ei2 = "(Yi-Yie)2 (el subíndice e indica estimación)
"(Yi-*Xi)2
dS =0
d
2"(Yi-Xi)(-Xi)=0 / *1/2
("-Xi*Yi)+ "Xi2=0
"Xi2="Xi*Yi
= "Xi*Yi
"Xi2
datos:
"Xi*Yi=637.45
"Xi2=151.48
Por lo tanto
=4.208
Lo que implica que el modelo seria Yi=4.208Xi+i
Modelo 2:
Yi=A*Zic
Tenemos que Yi = a +c*Zi
Donde "Zi ="Ln(Zi)=37.72
"Yi ="Ln(Yi)=31.96
"Zi *Yi ="Ln(Zi*Yi)=100.298
Yp ="Ln(Yi)/n=2.663
Zp ="Ln(Zi)/n=3.143
"Zi 2=6524.06
Tenemos que c= "Zi *Yi - ("Zi )("Yi )/n)
("Zi 2) - ("Zi )2/n
c=100.298 - (37.72)(31.96)/12
6524.06 - 37.722/12
c= -2.5436*10-5
a =Yp - c*Zp
a =2.663+2.5436*10-5(3.143)
a =2.663
Por lo tanto A=ea
A=e2.663
A=14.3403
Yi = A*Zic
Gasto=2,7 millones, con 95% de confianza.
Reemplazando 2,7 en la ecuación anterior:
Y0 = (14,3403)*(2,7)-0.000025436
Y0 = 14,339
Y0 " [ Y0 ± Tn-21-/2 r](1-)
r= [CME*(1+1/n+ (Z0 - ZP)2/("(Zi -Zp))]1/2
Zp= "Zi/n=23.25
CME= SCE/(n-2)
SCE= SCT-SCR
SCR= c2*"(Zi-Zp)2=(-2.5436*10-5)2*37.31
SCR= 2.4139*10-8
SCT= "(Yi-Yp)2=128.6968
SCE= 128.6968 - 2,4139*10-8
SCE= 128,6967
CME= 128.6967/10=12,8696
r= [12.89696(1+1/12+(2.7-23.25)2/37.31)]
r=12.6336
Y0 " [14.339 ± T100.975*12.6336]
Y0 " [14.339 ± 2.2281*12.6336]
Y0 " [-13.809 ; 42.487](95%)
Descargar
Enviado por: | El remitente no desea revelar su nombre |
Idioma: | castellano |
País: | Chile |