Regresión Lineal
Estadística. Ecuación. Hipótesis. Desviaciones estándares

- Regresión Lineal
Ficha resumen del documento - Regresión Lineal
Versión PDF - Regresión Lineal
Versión para descargar
Trabajo de Regresión múltiple
Desarrollamos una ecuación de regresión para estimar la producción de gasolina como una función de las propiedades de destilación de cierto tipo de petróleo crudo. Se identificaron cuatro variables de predicción: la gravedad del petróleo crudo, 0API (X1); la presión de vapor del petróleo crudo, psi (X2); el punto de 10% ASTM para el petróleo crudo, 0F (X3) y el punto final ASTM para la gasolina, 0F (X4). Los primeros dos miden la gravedad y la presión de vapor del petróleo crudo. El punto de 10% ASTM es la temperatura para la cual se ha evaporado cierta cantidad de líquido, y el punto final para la gasolina es la temperatura para la cual se ha evaporado todo el líquido. La variable respuesta fue la cantidad de gasolina producida expresada como un porcentaje respecto al total de petróleo crudo. El objetivo radicó en determinar una ecuación de regresión para la producción de gasolina como una función lineal de las propiedades de destilación de cierto tipo de petróleo crudo X1, X2, X3 y el punto final deseado para la gasolina X4. Los datos seleccionados aleatoriamente se muestran en la tabla.
| Y | X1 | X2 | X3 | X4 |
| 6,9 | 38,4 | 6,1 | 220 | 235 |
| 14,4 | 40,3 | 4,8 | 231 | 307 |
| 7,4 | 40 | 6,1 | 217 | 212 |
| 8,5 | 31,8 | 0,2 | 316 | 365 |
| 8 | 40,8 | 3,5 | 210 | 218 |
| 2,8 | 41,3 | 1,8 | 267 | 235 |
| 5 | 38,1 | 1,2 | 274 | 285 |
| 12,2 | 50,8 | 8,6 | 190 | 205 |
| 10 | 32,2 | 5,2 | 236 | 267 |
| 15,2 | 38,4 | 6,1 | 220 | 300 |
| 26,8 | 40,3 | 4,8 | 231 | 367 |
| 14 | 32,2 | 2,4 | 284 | 351 |
| 14,7 | 31,8 | 0,2 | 316 | 379 |
| 6,4 | 41,3 | 1,8 | 267 | 275 |
| 17,6 | 38,1 | 1,2 | 274 | 365 |
| 22,3 | 50,8 | 8,6 | 190 | 375 |
| 24,8 | 32,2 | 5,2 | 236 | 360 |
| 26 | 38,4 | 6,1 | 220 | 365 |
| 34,9 | 40,3 | 4,8 | 231 | 395 |
| 18,2 | 40 | 6,1 | 217 | 272 |
| 23,2 | 32,2 | 2,4 | 284 | 424 |
| 18 | 31,8 | 0,2 | 316 | 428 |
| 13,1 | 40,8 | 3,5 | 210 | 273 |
| 16,1 | 41,3 | 1,8 | 267 | 358 |
| 32,1 | 38,1 | 1,2 | 274 | 444 |
| 34,7 | 50,8 | 8,6 | 190 | 345 |
| 31,7 | 32,2 | 5,2 | 236 | 402 |
| 33,6 | 38,4 | 6,1 | 220 | 410 |
| 30,4 | 40 | 6,1 | 217 | 340 |
| 26,6 | 40,8 | 3,5 | 210 | 347 |
| 27,8 | 41,3 | 1,8 | 267 | 416 |
| 45,7 | 50,8 | 8,6 | 190 | 407 |
Donde la variable “Y” corresponde a la producción de gasolina que esta en función de las otras cuatro variables que son:
-
X1: la gravedad del petróleo crudo.
-
X2: la presión de vapor del petróleo crudo.
-
X3: el punto de 10% ASTM del petróleo crudo.
-
X4: el punto final ASTM para la gasolina.
Los datos obtenidos en la tabla son los siguientes:
Regression





Podemos obtener la ecuación de regresión la cual es:
Y = B1*X1+ B2*X2+ B3*X3+ B4*X4
Mediante los mínimos cuadrados obtenemos la ecuación:
Y = 0.03637*X1 + 0.16*X2 - 0.171*X3 + 0.147*X4 + 9.674
| Fuente de variación | Grados libertad | Suma de los cuadrados | Cuadrados medios | Estadística F |
| Regresión | K= m - 1 | B'X'Y- Yi/n | SCR/(m-1) | SCR/(m-1) SCE/(n-m) |
| Error | n - m | Y'Y-B'X'Y | SCE/(n-m) | |
| Total | n - 1 | Y'Y - Yi/n |
Donde X' es una matriz de orden m*n
Teniendo presente también que el coeficiente de correlación múltiple es:
R2 = SCR = 1 - SCE
STC STC'
Así, nuestra hipótesis nula: H: B1 = B2 = B3 = B4 = 0
Podemos observar mediante las tablas que nuestro f observado sí pertenece a la región crítica por lo que nuestra hipótesis nula será rechazada, por lo que todos los coeficientes de regresión ( excepto el término constante) son iguales a cero.
Tenemos que las variables rechazadas son aquellas que muestran un p-value mayor que el 0.5.
Podemos decir que nuestros coeficientes de correlación múltiple son relativamente altos. Existe una pequeña duda de que la regresión entre la producción de gasolina y las cuatro variables de predicción sea estadísticamente significativas
En este ejercicio las desviaciones estándares de los estimadores de mínimos cuadrados para X0 y B2 son grandes, lo que sugiere que X2, y posiblemente otras variables de predicción, puedan no tener un gran efecto sobre la producción de gasolina.








