Regresión lineal
Estadística. Datos. Dependencia entre variables. Coeficiente de determinación. Varianza

- Regresión lineal
Ficha resumen del documento - Regresión lineal
Versión PDF - Regresión lineal
Versión para descargar
INTRODUCCIÓN
El trigo es uno de los principales cultivos en nuestro país. La producción total en el año agrícola 1994-1995 ascendió a casi 3.5 millones de toneladas. El estudio aquí realizado trata de explicar los factores que influyen en la producción de trigo de 48 provincias españolas ( solamente en dos no existen cultivos de trigo: en Guipúzcoa y Las Palmas de Gran Canaria ).
Se han considerado factores climáticos: precipitación anual y temperaturas medias máxima y mínima, y la superficie cultivada en cada provincia ( que oscila entre las 4 ha. de Vizcaya hasta las 226.000 ha. de cultivos de trigo en Sevilla ). Con ayuda de un ordenador y el programa Statgrahics, se intentará dilucidar cuáles son los factores más influyentes y en que medida afectan a la producción de trigo en España.
Los datos han sido obtenidos del anuario de Estadística agraria del Ministerio de Agricultura, Pesca y Alimentación. Dicho anuario se puede consultar en la página web del Ministerio
DATOS DEL ESTUDIO
| Provincias | Superficie ( ha ) | Producción ( t ) | Temp. media ( ºC ) | Precipitación total ( mm ) | |
| Máxima | Mínima | ||||
| La Coruña | 12648 | 29090 | 18,5 | 12 | 1066,7 |
| Lugo | 13148 | 30240 | 17,8 | 6,3 | 1023,6 |
| Orense | 3973 | 5960 | 21,9 | 8,7 | 798,3 |
| Pontevedra | 1077 | 1616 | 18,7 | 10,4 | 1881,2 |
| Asturias | 180 | 324 | 17,8 | 10,5 | 1050 |
| Cantabria | 516 | 1703 | 18,7 | 12,2 | 1138,4 |
| Alava | 25191 | 115879 | 17,7 | 6,9 | 695,5 |
| Vizcaya | 4 | 12 | 19,8 | 10 | 1318,3 |
| Navarra | 95514 | 285035 | 18,9 | 7,8 | 524,7 |
| La Rioja | 35586 | 165087 | 20,2 | 8,4 | 377,7 |
| Huesca | 36069 | 81558 | 20 | 8,6 | 417 |
| Teruel | 36759 | 54278 | 20 | 4,9 | 325 |
| Zaragoza | 174258 | 161794 | 21,5 | 10,2 | 257,7 |
| Barcelona | 16580 | 50629 | 19,3 | 11,8 | 681,6 |
| Gerona | 11179 | 48225 | 21 | 8,6 | 773,5 |
| Lérida | 27264 | 95140 | 21,5 | 8,8 | 314,8 |
| Tarragona | 3338 | 8858 | 23,5 | 12,6 | 567,8 |
| Baleares | 4593 | 7349 | 22,5 | 10,8 | 511,7 |
| Avila | 15188 | 11634 | 17,6 | 4,4 | 324,9 |
| Burgos | 176564 | 580195 | 17,2 | 5,1 | 528,4 |
| León | 60428 | 138306 | 17,4 | 6 | 378,6 |
| Palencia | 86047 | 120121 | 19,7 | 7,1 | 315,7 |
| Salamanca | 68425 | 73180 | 19,4 | 6,4 | 339,9 |
| Segovia | 54349 | 93525 | 18,3 | 7,2 | 441,5 |
| Soria | 77721 | 174881 | 17,6 | 5,5 | 470,5 |
| Valladolid | 42294 | 72384 | 19,6 | 7,2 | 306,4 |
| Zamora | 76129 | 75650 | 19,8 | 8,1 | 239,4 |
| Madrid | 24042 | 25197 | 20,5 | 10,6 | 287,4 |
| Albacete | 36200 | 33209 | 20,9 | 8 | 293,3 |
| Ciudad Real | 54385 | 30247 | 22,8 | 9,6 | 194,7 |
| Cuenca | 49687 | 28262 | 20,1 | 7,4 | 403,6 |
| Guadalajara | 62817 | 72051 | 21,9 | 6,1 | 314,8 |
| Toledo | 68432 | 46317 | 23,1 | 10,1 | 133,7 |
| Alicante | 2753 | 2922 | 23,6 | 13,4 | 151,5 |
| Castellón | 1164 | 1100 | 22,7 | 12,7 | 398,8 |
| Valencia | 3067 | 2151 | 23,2 | 14 | 341,1 |
| Murcia | 5908 | 1996 | 25,4 | 18,5 | 178,9 |
| Badajoz | 98920 | 28367 | 24,9 | 10,6 | 213,9 |
| Cáceres | 11135 | 14335 | 22,8 | 11,1 | 367,5 |
| Almería | 3350 | 770 | 23,8 | 14,8 | 176,3 |
| Cádiz | 93377 | 56536 | 21,8 | 15,6 | 254,5 |
| Córdoba | 121854 | 106560 | 26 | 11,5 | 297,7 |
| Granada | 19785 | 17348 | 24,1 | 8,3 | 164,7 |
| Huelva | 27624 | 49696 | 24,7 | 12,4 | 264,9 |
| Jaén | 23791 | 3826 | 22,2 | 13 | 205,3 |
| Málaga | 36970 | 19545 | 23,9 | 14,2 | 145,8 |
| Sevilla | 225967 | 445517 | 26,5 | 13,4 | 255,5 |
| S. C. Tenerife | 212 | 106 | 24,8 | 18,7 | 100,3 |
REGRESIÓN SIMPLE
A continuación se realiza un análisis de regresión simple de cada variable, para hacernos una idea de cómo afectan a la producción por separado.
El modelo de regresión simple será el siguiente:
Y= B0 + B1*Xi + Ui
Donde se cumplen las siguientes hipótesis: la perturbación Ui tiene que tener esperanza nula y varianza siempre constante; además las perturbaciones Ui han de ser independientes con una distribución normal.
DEPENDENCIA ENTRE VARIABLES
Parece que existe una fuerte dependencia lineal entre la temperatura máxima y mínima. Este hecho puede dar problemas de colinealidad en la regresión múltiple. También se aprecia cierta relación entre la superficie de cultivo y la producción.








