Economía y Empresa
Econometría
ECONOMETRÍA I
PRÁCTICA CON SPAD Y EXCELL
Para realizar el estudio de la regresión mediante SPAD y EXCELL, hemos decidido buscar información sobre el sector de la hostelería en España en la base de datos del Instituto Nacional de Estadística (INE). Así, hemos logrado los siguientes datos sobre el volumen de negocio en el sector hostelero por comunidades autónomas durante el último trimestre de 2001:
Volumen de negocio | Nº empresas |
Nº locales | Personas ocupadas | Inversión | |
Andalucía, Ceuta y Melilla | 166925 | 1863 | 2112 | 23013 | 33598 |
Aragón | 20353 | 506 | 524 | 3261 | 2241 |
Asturias | 15695 | 303 | 340 | 2318 | 2877 |
Baleares | 479634 | 1428 | 2070 | 62357 | 53311 |
Canarias | 351724 | 1631 | 1975 | 34273 | 67917 |
Cantabria | 13730 | 354 | 421 | 2495 | 2888 |
Castilla y León | 40674 | 890 | 978 | 6676 | 6171 |
Castilla la Mancha | 12732 | 396 | 420 | 2386 | 2736 |
Cataluña | 320512 | 2592 | 3349 | 41568 | 52956 |
Comunidad Valenciana | 95978 | 932 | 1034 | 13237 | 13666 |
Extremadura | 7400 | 197 | 203 | 1504 | 1221 |
Galicia | 35151 | 931 | 966 | 5755 | 4619 |
Madrid | 224469 | 1315 | 1616 | 25704 | 35369 |
Murcia | 9896 | 192 | 207 | 1792 | 1901 |
Navarra | 34732 | 438 | 504 | 3732 | 1728 |
País Vasco | 32457 | 659 | 816 | 4424 | 3045 |
Rioja (La) | 7228 | 91 | 105 | 1090 | 531 |
Por tanto, nos encontramos ante un modelo formado por una variable explicada (volumen de negocio), y 4 explicativas (empresas, locales, personas ocupadas e inversión). Lo que nosotros pretendemos es saber si el volumen de negocio se explica adecuadamente con dichas variables explicativas, por lo que primero buscaremos cuál es la combinación óptima de variables para realizar la regresión más adecuada. Para ello hemos importado la tabla a SPAD convirtiéndola en una base de datos de SPAD para después, a través del programa, encontrar la combinación óptima. A continuación presentamos los resultados obtenidos en SPAD:
RECHERCHE DES AJUSTEMENTS OPTIMAUX
MODELE 1
DEFINITION
:----- MODELE
V1 = V2--V5
APUREMENT DES INDIVIDUS ACTIFS AYANT UNE DONNEE MANQUANTE POUR LA VARIABLE ENDOGENE
INDIVIDUS ACTIFS RETENUS POUR LES CALCULS: 17
INDIVIDUS ACTIFS EXCLUS POUR LES CALCULS: 0
GESTION DES DONNEES MANQUANTES.
AUCUNE VALEUR MANQUANTE DETECTEE
LES MEILLEURS AJUSTEMENTS DU MODELE
REGRESSION MULTIPLE
VARIABLE ENDOGENE NUMERO 1 : C1 VOLU
1 VARIABLE + CONSTANTE, DDL(STUDENT) = 15
AJUSTEMENT 1
R**2= 0.978 F(R2)= 668.0038 PROBA= 0.0000 V-TEST= 99.99
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
8.1816 25.85 0.000 99.99 C4 POCU
AJUSTEMENT 2
R**2= 0.915 F(R2)= 161.0459 PROBA= 0.0000 V-TEST= 99.99
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
6.2422 12.69 0.000 99.99 C5 INVE
AJUSTEMENT 3
R**2= 0.717 F(R2)= 38.0170 PROBA= 0.0000 V-TEST= 4.29
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
138.5077 6.17 0.000 4.29 C3 NLOC
2 VARIABLES + CONSTANTE, DDL(STUDENT) = 14
AJUSTEMENT 1
R**2= 0.993 F(R2)= 982.7562 PROBA= 0.0000 V-TEST= 7.91
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
5.8404 12.44 0.000 99.99 C4 POCU
2.0113 5.43 0.000 3.92 C5 INVE
AJUSTEMENT 2
R**2= 0.978 F(R2)= 312.0105 PROBA= 0.0000 V-TEST= 6.88
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
1.5400 0.11 0.914 0.11 C2 NEMP
8.1331 14.81 0.000 99.99 C4 POCU
AJUSTEMENT 3
R**2= 0.978 F(R2)= 311.7447 PROBA= 0.0000 V-TEST= 6.88
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
-0.2596 0.02 0.984 0.02 C3 NLOC
8.1928 12.90 0.000 5.29 C4 POCU
3 VARIABLES + CONSTANTE, DDL(STUDENT) = 13
AJUSTEMENT 1
R**2= 0.998 F(R2)= 1817.8450 PROBA= 0.0000 V-TEST= 8.30
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
-28.3032 5.07 0.000 3.70 C2 NEMP
5.9380 20.96 0.000 99.99 C4 POCU
2.6925 10.34 0.000 5.29 C5 INVE
AJUSTEMENT 2
R**2= 0.997 F(R2)= 1698.1130 PROBA= 0.0000 V-TEST= 8.25
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
-24.2848 4.81 0.000 3.58 C3 NLOC
6.1906 20.55 0.000 99.99 C4 POCU
2.6144 9.96 0.000 5.29 C5 INVE
AJUSTEMENT 3
R**2= 0.979 F(R2)= 205.3405 PROBA= 0.0000 V-TEST= 6.49
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
88.6516 0.90 0.383 0.87 C2 NEMP
-78.9043 0.90 0.387 0.87 C3 NLOC
8.8110 9.40 0.000 5.09 C4 POCU
4 VARIABLES + CONSTANTE, DDL(STUDENT) = 12
AJUSTEMENT 1
R**2= 0.998 F(R2)= 1261.6143 PROBA= 0.0000 V-TEST= 7.84
COEFFICIENT STUDENT PROBA V-TEST IDEN LIBELLE DE LA VARIABLE
-34.5618 0.94 0.368 0.90 C2 NEMP
5.5372 0.17 0.867 0.17 C3 NLOC
5.8798 13.08 0.000 5.29 C4 POCU
2.7056 9.62 0.000 5.04 C5 INVE
CROISSANCE DU R**2 EN FONCTION DU NOMBRE DE VARIABLES
0.717 (R**2 MIN) (R**2 MAX) 0.998
+-I-----------------------------------------------------------------I-+
1 | 1**********************************************1*************1 |
2 | *************************************************************2***1 |
3 | **************************************************************1***2 |
4 | ******************************************************************1 |
+---------------------------------------------------------------------+
MODELE 2
DEFINITION
FIN
A la vista de estos resultados, hemos considerado que la mejor combinación de variables explicativas para realizar la regresión es la que utiliza el nº de empresas, el nº de personas ocupadas y la inversión como variables explicativas. Hemos llegado a esta conclusión porque es la combinación que presenta la mayor R^2, con un nivel de 0,998, lo que significa que esas variables explicativas explican en un 99,8 % a la variable explicada (volumen de negocio).
Así mismo, presentan una probabilidad crítica muy mínima, muy por debajo de 0,05, lo que significa que con una seguridad mayor que un 95 % podemos afirmar que todos los coeficientes son diferentes de 0.
Por tanto, hemos elegido como variables explicativas óptimas el nº de empresas, el nº de personas ocupadas y el nivel de inversión para explicar el volumen de negocio en el último trimestre. Una vez que hemos decidido cuáles son las mejores variables, hemos vuelto a EXCELL para realizar la regresión con la Herramienta de Análisis de Datos, obteniendo los siguientes resultados:
Con los resultados que hemos logrado, demostramos que las variables explicativas que hemos elegido son buenas puesto que, aparte de que la R^2 es muy alta, de un 0,9971, las probabilidades críticas son adecuadas porque son inferiores a 0,05.
Una vez que hemos calculado el cuadrado de los residuos y el cuadrado de la diferencia de los residuos, hemos logrado calcular una d de Durbin de 2,0818. Además, puesto que se trata de un modelo con 3 variables explicativas y 17 observaciones obtenemos una d1 de 0,9 y una d2 de 1,71 por lo que llegamos a la siguiente regla de decisión:
Si 0 " d* " 0,9 autocorrelación positiva
Si 0,9 " d* " 1,71 zona de duda o indeterminación
Si 1,71 " d* " 3,29 Independencia con un 95 % de seguridad
Si 3,29 " d* " 3,1 zona de duda o indeterminación
Si 3,1 " d* " 4 autocorrelación negativa
Ya que nuestra d de Durbin es de 2,0818, se encontrará en la zona de independencia, por lo que podemos afirmar con un 95 % de seguridad que no existe autocorrelación.
CONCLUSIÓN
Para terminar, y a modo de conclusión, hemos llegado a la conclusión de que el volumen de negocio en el sector de la hostelería en España en el último trimestre de 2001 se explica en más del 99 %, y con una seguridad superior al 95 %, por los niveles del número de empresas, personas ocupadas y de inversión en el sector durante el último trimestre.
Descargar
Enviado por: | Jato |
Idioma: | castellano |
País: | España |