Regresión lineal

Estadística. Datos. Dependencia entre variables. Coeficiente de determinación. Varianza

  • Enviado por: Jose Carbajo
  • Idioma: castellano
  • País: España España
  • 15 páginas
publicidad
publicidad

INTRODUCCIÓN

El trigo es uno de los principales cultivos en nuestro país. La producción total en el año agrícola 1994-1995 ascendió a casi 3.5 millones de toneladas. El estudio aquí realizado trata de explicar los factores que influyen en la producción de trigo de 48 provincias españolas ( solamente en dos no existen cultivos de trigo: en Guipúzcoa y Las Palmas de Gran Canaria ).

Se han considerado factores climáticos: precipitación anual y temperaturas medias máxima y mínima, y la superficie cultivada en cada provincia ( que oscila entre las 4 ha. de Vizcaya hasta las 226.000 ha. de cultivos de trigo en Sevilla ). Con ayuda de un ordenador y el programa Statgrahics, se intentará dilucidar cuáles son los factores más influyentes y en que medida afectan a la producción de trigo en España.

Los datos han sido obtenidos del anuario de Estadística agraria del Ministerio de Agricultura, Pesca y Alimentación. Dicho anuario se puede consultar en la página web del Ministerio

DATOS DEL ESTUDIO

Provincias

Superficie ( ha )

Producción ( t )

Temp. media ( ºC )

Precipitación total ( mm )

Máxima

Mínima

La Coruña

12648

29090

18,5

12

1066,7

Lugo

13148

30240

17,8

6,3

1023,6

Orense

3973

5960

21,9

8,7

798,3

Pontevedra

1077

1616

18,7

10,4

1881,2

Asturias

180

324

17,8

10,5

1050

Cantabria

516

1703

18,7

12,2

1138,4

Alava

25191

115879

17,7

6,9

695,5

Vizcaya

4

12

19,8

10

1318,3

Navarra

95514

285035

18,9

7,8

524,7

La Rioja

35586

165087

20,2

8,4

377,7

Huesca

36069

81558

20

8,6

417

Teruel

36759

54278

20

4,9

325

Zaragoza

174258

161794

21,5

10,2

257,7

Barcelona

16580

50629

19,3

11,8

681,6

Gerona

11179

48225

21

8,6

773,5

Lérida

27264

95140

21,5

8,8

314,8

Tarragona

3338

8858

23,5

12,6

567,8

Baleares

4593

7349

22,5

10,8

511,7

Avila

15188

11634

17,6

4,4

324,9

Burgos

176564

580195

17,2

5,1

528,4

León

60428

138306

17,4

6

378,6

Palencia

86047

120121

19,7

7,1

315,7

Salamanca

68425

73180

19,4

6,4

339,9

Segovia

54349

93525

18,3

7,2

441,5

Soria

77721

174881

17,6

5,5

470,5

Valladolid

42294

72384

19,6

7,2

306,4

Zamora

76129

75650

19,8

8,1

239,4

Madrid

24042

25197

20,5

10,6

287,4

Albacete

36200

33209

20,9

8

293,3

Ciudad Real

54385

30247

22,8

9,6

194,7

Cuenca

49687

28262

20,1

7,4

403,6

Guadalajara

62817

72051

21,9

6,1

314,8

Toledo

68432

46317

23,1

10,1

133,7

Alicante

2753

2922

23,6

13,4

151,5

Castellón

1164

1100

22,7

12,7

398,8

Valencia

3067

2151

23,2

14

341,1

Murcia

5908

1996

25,4

18,5

178,9

Badajoz

98920

28367

24,9

10,6

213,9

Cáceres

11135

14335

22,8

11,1

367,5

Almería

3350

770

23,8

14,8

176,3

Cádiz

93377

56536

21,8

15,6

254,5

Córdoba

121854

106560

26

11,5

297,7

Granada

19785

17348

24,1

8,3

164,7

Huelva

27624

49696

24,7

12,4

264,9

Jaén

23791

3826

22,2

13

205,3

Málaga

36970

19545

23,9

14,2

145,8

Sevilla

225967

445517

26,5

13,4

255,5

S. C. Tenerife

212

106

24,8

18,7

100,3

REGRESIÓN SIMPLE

A continuación se realiza un análisis de regresión simple de cada variable, para hacernos una idea de cómo afectan a la producción por separado.

El modelo de regresión simple será el siguiente:

Y= B0 + B1*Xi + Ui

Donde se cumplen las siguientes hipótesis: la perturbación Ui tiene que tener esperanza nula y varianza siempre constante; además las perturbaciones Ui han de ser independientes con una distribución normal.

DEPENDENCIA ENTRE VARIABLES

Parece que existe una fuerte dependencia lineal entre la temperatura máxima y mínima. Este hecho puede dar problemas de colinealidad en la regresión múltiple. También se aprecia cierta relación entre la superficie de cultivo y la producción.