Econometría

Economía. Regresión. Volumen de negocio. Variables explicativas

  • Enviado por: Jato
  • Idioma: castellano
  • País: España España
  • 5 páginas
publicidad

ECONOMETRÍA I

PRÁCTICA CON SPAD Y EXCELL

Para realizar el estudio de la regresión mediante SPAD y EXCELL, hemos decidido buscar información sobre el sector de la hostelería en España en la base de datos del Instituto Nacional de Estadística (INE). Así, hemos logrado los siguientes datos sobre el volumen de negocio en el sector hostelero por comunidades autónomas durante el último trimestre de 2001:

Volumen de negocio

Nº empresas

Nº locales

Personas ocupadas

Inversión

Andalucía, Ceuta y Melilla

166925

1863

2112

23013

33598

Aragón

20353

506

524

3261

2241

Asturias

15695

303

340

2318

2877

Baleares

479634

1428

2070

62357

53311

Canarias

351724

1631

1975

34273

67917

Cantabria

13730

354

421

2495

2888

Castilla y León

40674

890

978

6676

6171

Castilla la Mancha

12732

396

420

2386

2736

Cataluña

320512

2592

3349

41568

52956

Comunidad Valenciana

95978

932

1034

13237

13666

Extremadura

7400

197

203

1504

1221

Galicia

35151

931

966

5755

4619

Madrid

224469

1315

1616

25704

35369

Murcia

9896

192

207

1792

1901

Navarra

34732

438

504

3732

1728

País Vasco

32457

659

816

4424

3045

Rioja (La)

7228

91

105

1090

531

Por tanto, nos encontramos ante un modelo formado por una variable explicada (volumen de negocio), y 4 explicativas (empresas, locales, personas ocupadas e inversión). Lo que nosotros pretendemos es saber si el volumen de negocio se explica adecuadamente con dichas variables explicativas, por lo que primero buscaremos cuál es la combinación óptima de variables para realizar la regresión más adecuada. Para ello hemos importado la tabla a SPAD convirtiéndola en una base de datos de SPAD para después, a través del programa, encontrar la combinación óptima. A continuación presentamos los resultados obtenidos en SPAD:

RECHERCHE DES AJUSTEMENTS OPTIMAUX

MODELE 1

DEFINITION

:----- MODELE

V1 = V2--V5

APUREMENT DES INDIVIDUS ACTIFS AYANT UNE DONNEE MANQUANTE POUR LA VARIABLE ENDOGENE

INDIVIDUS ACTIFS RETENUS POUR LES CALCULS: 17

INDIVIDUS ACTIFS EXCLUS POUR LES CALCULS: 0

GESTION DES DONNEES MANQUANTES.

AUCUNE VALEUR MANQUANTE DETECTEE

LES MEILLEURS AJUSTEMENTS DU MODELE

REGRESSION MULTIPLE

VARIABLE ENDOGENE NUMERO 1 : C1 VOLU

1 VARIABLE + CONSTANTE, DDL(STUDENT) = 15

AJUSTEMENT 1

R**2= 0.978 F(R2)= 668.0038 PROBA= 0.0000 V-TEST= 99.99

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

8.1816 25.85 0.000 99.99 C4 POCU

AJUSTEMENT 2

R**2= 0.915 F(R2)= 161.0459 PROBA= 0.0000 V-TEST= 99.99

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

6.2422 12.69 0.000 99.99 C5 INVE

AJUSTEMENT 3

R**2= 0.717 F(R2)= 38.0170 PROBA= 0.0000 V-TEST= 4.29

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

138.5077 6.17 0.000 4.29 C3 NLOC

2 VARIABLES + CONSTANTE, DDL(STUDENT) = 14

AJUSTEMENT 1

R**2= 0.993 F(R2)= 982.7562 PROBA= 0.0000 V-TEST= 7.91

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

5.8404 12.44 0.000 99.99 C4 POCU

2.0113 5.43 0.000 3.92 C5 INVE

AJUSTEMENT 2

R**2= 0.978 F(R2)= 312.0105 PROBA= 0.0000 V-TEST= 6.88

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

1.5400 0.11 0.914 0.11 C2 NEMP

8.1331 14.81 0.000 99.99 C4 POCU

AJUSTEMENT 3

R**2= 0.978 F(R2)= 311.7447 PROBA= 0.0000 V-TEST= 6.88

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

-0.2596 0.02 0.984 0.02 C3 NLOC

8.1928 12.90 0.000 5.29 C4 POCU

3 VARIABLES + CONSTANTE, DDL(STUDENT) = 13

AJUSTEMENT 1

R**2= 0.998 F(R2)= 1817.8450 PROBA= 0.0000 V-TEST= 8.30

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

-28.3032 5.07 0.000 3.70 C2 NEMP

5.9380 20.96 0.000 99.99 C4 POCU

2.6925 10.34 0.000 5.29 C5 INVE

AJUSTEMENT 2

R**2= 0.997 F(R2)= 1698.1130 PROBA= 0.0000 V-TEST= 8.25

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

-24.2848 4.81 0.000 3.58 C3 NLOC

6.1906 20.55 0.000 99.99 C4 POCU

2.6144 9.96 0.000 5.29 C5 INVE

AJUSTEMENT 3

R**2= 0.979 F(R2)= 205.3405 PROBA= 0.0000 V-TEST= 6.49

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

88.6516 0.90 0.383 0.87 C2 NEMP

-78.9043 0.90 0.387 0.87 C3 NLOC

8.8110 9.40 0.000 5.09 C4 POCU

4 VARIABLES + CONSTANTE, DDL(STUDENT) = 12

AJUSTEMENT 1

R**2= 0.998 F(R2)= 1261.6143 PROBA= 0.0000 V-TEST= 7.84

COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE

-34.5618 0.94 0.368 0.90 C2 NEMP

5.5372 0.17 0.867 0.17 C3 NLOC

5.8798 13.08 0.000 5.29 C4 POCU

2.7056 9.62 0.000 5.04 C5 INVE

CROISSANCE DU R**2 EN FONCTION DU NOMBRE DE VARIABLES

0.717 (R**2 MIN) (R**2 MAX) 0.998

+-I-----------------------------------------------------------------I-+

1 | 1**********************************************1*************1 |

2 | *************************************************************2***1 |

3 | **************************************************************1***2 |

4 | ******************************************************************1 |

+---------------------------------------------------------------------+

MODELE 2

DEFINITION

FIN

A la vista de estos resultados, hemos considerado que la mejor combinación de variables explicativas para realizar la regresión es la que utiliza el nº de empresas, el nº de personas ocupadas y la inversión como variables explicativas. Hemos llegado a esta conclusión porque es la combinación que presenta la mayor R^2, con un nivel de 0,998, lo que significa que esas variables explicativas explican en un 99,8 % a la variable explicada (volumen de negocio).

Así mismo, presentan una probabilidad crítica muy mínima, muy por debajo de 0,05, lo que significa que con una seguridad mayor que un 95 % podemos afirmar que todos los coeficientes son diferentes de 0.

Por tanto, hemos elegido como variables explicativas óptimas el nº de empresas, el nº de personas ocupadas y el nivel de inversión para explicar el volumen de negocio en el último trimestre. Una vez que hemos decidido cuáles son las mejores variables, hemos vuelto a EXCELL para realizar la regresión con la Herramienta de Análisis de Datos, obteniendo los siguientes resultados:

Con los resultados que hemos logrado, demostramos que las variables explicativas que hemos elegido son buenas puesto que, aparte de que la R^2 es muy alta, de un 0,9971, las probabilidades críticas son adecuadas porque son inferiores a 0,05.

Una vez que hemos calculado el cuadrado de los residuos y el cuadrado de la diferencia de los residuos, hemos logrado calcular una d de Durbin de 2,0818. Además, puesto que se trata de un modelo con 3 variables explicativas y 17 observaciones obtenemos una d1 de 0,9 y una d2 de 1,71 por lo que llegamos a la siguiente regla de decisión:

Si 0 " d* " 0,9 autocorrelación positiva

Si 0,9 " d* " 1,71 zona de duda o indeterminación

Si 1,71 " d* " 3,29 Independencia con un 95 % de seguridad

Si 3,29 " d* " 3,1 zona de duda o indeterminación

Si 3,1 " d* " 4 autocorrelación negativa

Ya que nuestra d de Durbin es de 2,0818, se encontrará en la zona de independencia, por lo que podemos afirmar con un 95 % de seguridad que no existe autocorrelación.

CONCLUSIÓN

Para terminar, y a modo de conclusión, hemos llegado a la conclusión de que el volumen de negocio en el sector de la hostelería en España en el último trimestre de 2001 se explica en más del 99 %, y con una seguridad superior al 95 %, por los niveles del número de empresas, personas ocupadas y de inversión en el sector durante el último trimestre.