Estadística de ventas de automóviles

Estadística económica. P-Value. Variables. Muestras

  • Enviado por: Lofraso
  • Idioma: castellano
  • País: Colombia Colombia
  • 28 páginas
publicidad

1. Prueba de bondad del ajuste

1.1. Ventas mensuales Y

Sea “X” la variable aleatoria ventas mensuales (millones de dólares)

= X se distribuye N (53.3127; =18.0734 )

= X no se distribuye N (53.3127; =18.0734 )

mean = 52,9646

standard deviation = 18,6263

Estadística de ventas de automóviles

Prueba de bondad del ajuste para Y

Chi-Square Test

----------------------------------------------------------------------------

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

----------------------------------------------------------------------------

at or below 29,094 28 38,50 2,86

29,094 37,2883 52 38,50 4,73

37,2883 43,1969 49 38,50 2,86

43,1969 48,2457 41 38,50 0,16

48,2457 52,9646 50 38,50 3,43

52,9646 57,6836 32 38,50 1,10

57,6836 62,7323 27 38,50 3,43

62,7323 68,641 27 38,50 3,43

68,641 76,8353 31 38,50 1,46

above 76,8353 48 38,50 2,34

----------------------------------------------------------------------------

Chi-Square = 25,8309 with 7 d.f. P-Value = 0,000539938

Dado que la prueba de la chi-cuadrado no cumple con un valor necesario para que la hipótesis nula sobreviva, a pesar de que las frecuencias esperadas son mayores de 5, entonces se recurre a las pruebas no paramétricas.

Estimated Kolmogorov statistic DPLUS = 0,0756453

Estimated Kolmogorov statistic DMINUS = 0,0348178

Estimated overall statistic DN = 0,0756453

Approximate P-Value = 0,0244053

Dado que tanto el p-value que nos da la prueba de la chi-cuadrado = 0,000539938 con 7 y el p-value aproximado que nos brinda la Kolmogorov es = 0.0244053 son menores que = 0.04 (valor necesario para que dicha hipótesis () sobreviva); se puede decir que no hay evidencia suficiente para aceptar que la variable ventas mensuales se distribuye normalmente con 53.3127 y =18.0734. Aceptándose entonces la hipótesis alternativa.

1.2. Inversión en capacitación al personal de ventas X1

Sea “X” la variable aleatoria inversión en capacitación ( dólares)

= X se distribuye N (544.6893; =257.014 )

= X no se distribuye N (544.6893; =257.014 )

mean = 534,701

standard deviation = 251,588

Estadística de ventas de automóviles

Prueba de bondad del ajuste para X1

Chi-Square Test

----------------------------------------------------------------------------

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

----------------------------------------------------------------------------

at or below 212,277 46 38,50 1,46

212,277 322,959 54 38,50 6,24

322,959 402,768 35 38,50 0,32

402,768 470,962 34 38,50 0,53

470,962 534,701 34 38,50 0,53

534,701 598,441 24 38,50 5,46

598,441 666,635 25 38,50 4,73

666,635 746,444 31 38,50 1,46

746,444 857,126 52 38,50 4,73

857,126 998,0 50 25,88 22,48

above 998,0 0 12,62 12,62

----------------------------------------------------------------------------

Chi-Square = 60,5559 with 8 d.f. P-Value = 3,62549E-10

Dado que la prueba de la chi-cuadrado no cumple con un valor necesario para que la hipótesis nula sobreviva, a pesar de que las frecuencias esperadas son mayores de 5, entonces se recurre a las pruebas no paramétricas.

Estimated Kolmogorov statistic DPLUS = 0,0703306

Estimated Kolmogorov statistic DMINUS = 0,0703477

Estimated overall statistic DN = 0,0703477

Approximate P-Value = 0,0442712

Dado que el p-value que nos da la prueba de la chi-cuadrado=3.62549E-10 con 8 es menor que nuestro alfa, pero al observar el p-value aproximado que nos brinda la Kolmogorov es = 0.0442712 nos dice que es mayor que = 0.04 (valor necesario para que dicha hipótesis () sobreviva); se puede decir que hay evidencia suficiente para aceptar que la variable inversión en capacitación se distribuye normalmente con 544.689 y =538 Aceptándose entonces la hipótesis nula.

1.3. Numero de automóviles registrados X2

Sea “X” la variable aleatoria numero de automóviles registrados (millones)

= X se distribuye N (7.6997; =2.4365 )

= X no se distribuye N (7.6997; =2.4365 )

mean = 7,68447

standard deviation = 2,38604

Estadística de ventas de automóviles

Prueba de bondad del ajuste para X2

Chi-Square Test

----------------------------------------------------------------------------

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

----------------------------------------------------------------------------

at or below 4,62662 54 38,50 6,24

4,62662 5,67632 40 38,50 0,06

5,67632 6,43322 35 38,50 0,32

6,43322 7,07997 36 38,50 0,16

7,07997 7,68447 24 38,50 5,46

7,68447 8,28897 28 38,50 2,86

8,28897 8,93571 42 38,50 0,32

8,93571 9,69262 33 38,50 0,79

9,69262 10,7423 40 38,50 0,06

10,7423 12,99 53 33,46 11,41

above 12,99 0 5,04 5,04

----------------------------------------------------------------------------

Chi-Square = 32,7169 with 8 d.f. P-Value = 0,0000692569

Dado que la prueba de la chi-cuadrado no cumple con un valor necesario para que la hipótesis nula sobreviva, a pesar de que las frecuencias esperadas son mayores de 5, entonces se recurre a las pruebas no paramétricas.

Estimated Kolmogorov statistic DPLUS = 0,0545702

Estimated Kolmogorov statistic DMINUS = 0,0464019

Estimated overall statistic DN = 0,0545702

Approximate P-Value = 0,202032

Dado que el p-value que nos da la prueba de la chi-cuadrado=0.0000692569 con 8 es menor que nuestro alfa, pero al observar el p-value aproximado que nos brinda la Kolmogorov es = 0.202032 nos dice que es mayor que = 0.04 (valor necesario para que dicha hipótesis () sobreviva); se puede decir que hay evidencia suficiente para aceptar que la variable inversión en capacitación se distribuye normalmente con 7.69972 y =2.4365. Aceptándose entonces la hipótesis nula.

1.4. Ingreso personal promedio X3

Sea “X” la variable aleatoria ingreso personal promedio (millones de dólares)

= X se distribuye N (55.1265; =23.0394 )

= X no se distribuye N (55.1265; =23.0394 )

mean = 55,974

standard deviation = 22,9769

Estadística de ventas de automóviles

Prueba de bondad del ajuste para X3

Chi-Square Test

----------------------------------------------------------------------------

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

----------------------------------------------------------------------------

at or below 26,5279 50 38,50 3,44

26,5279 36,6361 44 38,50 0,79

36,6361 43,9249 48 38,50 2,34

43,9249 50,1529 20 38,50 8,89

50,1529 55,974 29 38,50 2,34

55,974 61,7952 29 38,50 2,34

61,7952 68,0232 30 38,50 1,88

68,0232 75,3119 39 38,50 0,01

75,3119 85,4202 41 38,50 0,16

85,4202 95,8 55 22,51 46,87

above 95,8 0 15,99 15,99

----------------------------------------------------------------------------

Chi-Square = 85,0485 with 8 d.f. P-Value = 4,66294E-15

Dado que la prueba de la chi-cuadrado no cumple con un valor necesario para que la hipótesis nula sobreviva, a pesar de que las frecuencias esperadas son mayores de 5, entonces se recurre a las pruebas no paramétricas.

Estimated Kolmogorov statistic DPLUS = 0,0739703

Estimated Kolmogorov statistic DMINUS = 0,0667924

Estimated overall statistic DN = 0,0739703

Approximate P-Value = 0,0295997

Dado que tanto el p-value que nos da la prueba de la chi-cuadrado = 4,66294E-15 con 8 y el p-value aproximado que nos brinda la Kolmogorov es = 0.0295997 son menores que = 0.04 (valor necesario para que dicha hipótesis () sobreviva); se puede decir que no hay evidencia suficiente para aceptar que la variable ventas mensuales se distribuye normalmente con 55.1265 y =23.0394. Aceptándose entonces la hipótesis alternativa.

2. Prueba de bondad del ajuste para ventas mensuales Y por región

2.1. Region 1

Sea “X” la variable aleatoria ventas mensuales (millones de dólares) para la región 1

= X se distribuye N

= X no se distribuye N

mean = 44,748

standard deviation = 12,8387

Estadística de ventas de automóviles

Prueba de bondad del ajuste para Y

Chi-Square Test

----------------------------------------------------------------------------

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

----------------------------------------------------------------------------

at or below 29,0766 27 26,78 0,00

29,0766 34,9301 30 26,78 0,39

34,9301 39,218 24 26,78 0,29

39,218 42,9543 31 26,78 0,67

42,9543 46,5417 21 26,78 1,25

46,5417 50,278 28 26,78 0,06

50,278 54,5659 27 26,78 0,00

54,5659 60,4195 26 26,78 0,02

above 60,4195 27 26,78 0,00

----------------------------------------------------------------------------

Chi-Square = 2,67288 with 6 d.f. P-Value = 0,84864

Estimated Kolmogorov statistic DPLUS = 0,0341041

Estimated Kolmogorov statistic DMINUS = 0,0191459

Estimated overall statistic DN = 0,0341041

Approximate P-Value = 0,941947

Dado que tanto el p-value que nos da la prueba de la chi-cuadrado = 0.84864 con 6 y el p-value aproximado que nos brinda la Kolmogorov es = 0.941947 son mayores que = 0.04 (valor necesario para que dicha hipótesis () sobreviva); se puede decir que hay evidencia suficiente para aceptar que la variable ventas mensuales para la región 1 se distribuye normalmente. Esto nos lleva a concluir que las inferencias que realicemos tendrán una alta confiablidad.

2.2. Region 2

Sea “X” la variable aleatoria ventas mensuales (millones de dólares) para la región 2

= X se distribuye N

= X no se distribuye N

mean = 67,3334

standard deviation = 20,8828

Estadística de ventas de automóviles

Prueba de bondad del ajuste para Y

Chi-Square Test

----------------------------------------------------------------------------

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

----------------------------------------------------------------------------

at or below 43,3108 10 8,62 0,22

43,3108 53,2481 10 8,62 0,22

53,2481 60,6793 4 8,62 2,48

60,6793 67,3334 6 8,63 0,80

67,3334 73,9875 9 8,63 0,02

73,9875 81,4187 14 8,62 3,35

81,4187 91,356 7 8,62 0,31

above 91,356 9 8,62 0,02

----------------------------------------------------------------------------

Chi-Square = 7,40594 with 5 d.f. P-Value = 0,192157

Estimated Kolmogorov statistic DPLUS = 0,0602213

Estimated Kolmogorov statistic DMINUS = 0,0846546

Estimated overall statistic DN = 0,0846546

Approximate P-Value = 0,705911

Dado que tanto el p-value que nos da la prueba de la chi-cuadrado = 0.192157 con 5 y el p-value aproximado que nos brinda la Kolmogorov es = 0.705911 son mayores que = 0.04 (valor necesario para que dicha hipótesis () sobreviva); se puede decir que hay evidencia suficiente para aceptar que la variable ventas mensuales para la región 2 se distribuye normalmente. Esto nos lleva a concluir que las inferencias que realicemos tendrán una alta confiablidad.

2.3. Region 3

Sea “X” la variable aleatoria ventas mensuales (millones de dólares) para la región 3

= X se distribuye N

= X no se distribuye N

mean = 66,148

standard deviation = 16,6276

Estadística de ventas de automóviles

Prueba de bondad del ajuste para Y

Chi-Square Test

----------------------------------------------------------------------------

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chi-Square

----------------------------------------------------------------------------

at or below 47,0204 11 9,37 0,28

47,0204 54,9328 9 9,37 0,01

54,9328 60,8498 7 9,37 0,60

60,8498 66,148 9 9,38 0,02

66,148 71,4463 11 9,38 0,28

71,4463 77,3632 10 9,37 0,04

77,3632 85,2757 8 9,37 0,20

above 85,2757 10 9,37 0,04

----------------------------------------------------------------------------

Chi-Square = 1,47994 with 5 d.f. P-Value = 0,915373

Estimated Kolmogorov statistic DPLUS = 0,036228

Estimated Kolmogorov statistic DMINUS = 0,0498449

Estimated overall statistic DN = 0,0498449

Approximate P-Value = 0,992263

Dado que tanto el p-value que nos da la prueba de la chi-cuadrado = 0.915373 con 5 y el p-value aproximado que nos brinda la Kolmogorov es = 0.992263 son mayores que = 0.04 (valor necesario para que dicha hipótesis () sobreviva); se puede decir que hay evidencia suficiente para aceptar que la variable ventas mensuales para la región 3 se distribuye normalmente. Esto nos lleva a concluir que las inferencias que realicemos tendrán una alta confiablidad.

3. Prueba de hipótesis para la media

Sea “ X” la variable aleatoria ventas mensuales X ~ N ( µ,  )

Estadistica descriptive para Y

Count = 385

Average = 52,9646

Median = 50,4265

Variance = 346,94

Standard deviation = 18,6263

Coeff. of variation = 35,1675%

Analizando con unas ventas mensuales de por lo menos de 55 millones de pesos mensuales. Dado que y promedio = 52.9646 millones de pesos se plantea la hipótesis nula con mayor probabilidad de ser rechazada.

Ho :  " 5.5

H1 :  < 5.5

Prueba de hipótesis

Hypothesis Tests

----------------

Sample mean = 52,9646

Sample standard deviation = 18,6263

Sample size = 385

Null Hypothesis: mean = 55,0

Alternative: less than

Computed t statistic = -2,14414

P-Value = 0,0163244

Reject the null hypothesis for alpha = 0,0412.

El p-value es menor que el alfa por lo tanto existe suficiente evidencia para rechazar H.

Esto quiere decir que no hay suficiente evidencia para decir que el ingreso mensual es de por lo menos de 55 millones de pesos mensuales, esto para el sector metalmecánico no es muy recomendable puesto que no tiene bases para pronósticos de ventas, en años posteriores.

4. Prueba de hipótesis para la diferencia de medias y razón de varianzas

4.1. Prueba de hipótesis para la razón de varianzas

Sea Y: la variable aleatoria ventas mensuales de las agencias que tienen un supervisor.

Sea X: la variable aleatoria ventas mensuales de las agencias que tienen dos supervisores.

Ho : X / Y = 1

H1 : X / Y " 1

Prueba de hipótesis para la razón de varianzas

Hypothesis Tests

----------------

Sample standard deviations = 18,4547 and 18,7791

Sample sizes = 188 and 197

Null Hypothesis: ratio of variances = 1,0

Alternative: not equal

Computed F statistic = 0,965749

P-Value = 0,810651

Do not reject the null hypothesis for alpha = 0,0412.

ANÁLISIS:

Por medio de la estadística f (calculada) nos damos cuenta que esta es menor que la estadística f (tabulada), por lo tanto caemos en la región de aceptación de la hipótesis nula.

Otra forma de verificación es con el p-value el cual es mayor que el nivel de significancia permitiéndonos corroborar lo dicho, de que las varianzas son iguales.

4.2. Prueba de hipótesis para la diferencia de medias

Sea Y: la variable aleatoria ventas mensuales de las agencias que tienen un supervisor.

Sea X: la variable aleatoria ventas mensuales de las agencias que tienen dos supervisores.

Ho : X - Y =0

H1 : 1X - Y " 0

Prueba de hipótesis para la diferencia de medias

Hypothesis Tests

----------------

Sample means = 51,8996 and 53,981

Sample standard deviations = 18,4547 and 18,7791

Sample sizes = 188 and 197

Null Hypothesis: difference between means = 0,0

Alternative: not equal

Computed t statistic = -1,09629

P-Value = 0,273642

Do not reject the null hypothesis for alpha = 0,0412.

(Equal variances assumed).

ANÁLISIS: Se observa que la estadística t (calculada) es menor que la estadística t (tabulada), lo que nos indica que el valor calculado cae en la región de aceptación de la hipótesis nula.

El p-value siendo mayor que el nivel de significancia, nos permite terminar de corroborar que las medias son iguales.

Con este resultado es importante que el sector entre a analizar porque las agencias que tienen dos supervisores, en promedio, tienen la misma utilidad que las que tienen uno. Ya que no es rentable tener agencias con mas de un supervisor puesto que no están aumentando el promedio de ventas mensuales.

5. Prueba de hipótesis para la diferencia de proporciones

Tabla de frecuencias cruzada

Row

1 2 3 Total

----------------------------------------

No Satisfecho| 18 | 16 | 11 | 45

| 7,47% | 23,19% | 14,67% | 11,69%

----------------------------------------

Satisfechos | 223 | 53 | 64 | 340

| 92,53% | 76,81% | 85,33% | 88,31%

----------------------------------------

Column 241 69 75 385

Total 62,60% 17,92% 19,48% 100,00%

Cell contents:

Observed frequency

Percentage of column

Prueba de hipotesis

Hypothesis Tests

----------------

Sample proportions = 0,9253 and 0,7681

Sample sizes = 241 and 69

Null Hypothesis: difference between proportions = 0,0

Alternative: not equal

Computed z statistic = 3,68427

P-Value = 0,000229424

Reject the null hypothesis for alpha = 0,0412.

Warning: normal approximation may not be appropriate for small sample sizes.

Dado que el p-value =0.000229424 es menor que el nivel de significancia, la hipótesis nula cae en la región de rechazo. Por la tanto hay evidencia suficiente para rechazar la hipótesis nula y se acepta la hipótesis alternativa; de que las proporciones son diferentes.

Esto quiere decir que la proporción los supervisores que están satisfechos con las condiciones laborales en la en la región 1 es diferente a la proporción de los supervisores que esta satisfechos con las condiciones laborales en la región 2; se tendría que entrar a analizar porque las regiones no tiene el mismo promedio de ventas mensuales.

6. Prueba de hipótesis para proporción

Sea “X” la variable aleatoria: opinión sobre el estado de las vías.

X" binomial. Como n>30 podemos decir que X~N

Ho :  " 0.5

H1 :  < 0.5

Estadística de ventas de automóviles

Prueba de hipotesis

Hypothesis Tests

----------------

Sample proportion = 0,1584

Sample size = 385

Null Hypothesis: proportion = 0,5

Alternative: less than

P-Value = 0,0

Reject the null hypothesis for alpha = 0,0412.

Si comparamos el p-value (0.0) con el nivel de significancia 0.04, vemos que el p-value es menor y llegamos a la conclusión de rechazar la hipótesis de que la calificación excelente del estado de las vías es menor que el 50% .

7. Prueba de independencia

Sea X: la variable aleatoria de cumplimiento del presupuesto

Sea Y: la variable aleatoria condiciones de las vías

Ho: Existe independencia entre el cumplimiento del presupuesto con respecto a las condiciones de las vías.

H1: Existe dependencia entre el cumplimiento del presupuesto con respecto a las condiciones de las vías.

Tabla de frecuancias cruzadaFrequency

Row

0 1 2 3 4 Total

------------------------------------------------------------------

0 | 15 | 30 | 71 | 26 | 32 | 174

| 17,63 | 40,68 | 56,04 | 32,09 | 27,57 | 45,19%

| 0,39 | 2,80 | 3,99 | 1,16 | 0,71 |

------------------------------------------------------------------

1 | 24 | 60 | 53 | 45 | 29 | 211

| 21,37 | 49,32 | 67,96 | 38,91 | 33,43 | 54,81%

| 0,32 | 2,31 | 3,29 | 0,95 | 0,59 |

------------------------------------------------------------------

Column 39 90 124 71 61 385

Total 10,13% 23,38% 32,21% 18,44% 15,84% 100,00%

Cell contents:

Observed frequency

Expected frequency

Contribution to chi-squared

Prueba Chi Cuadrado

------------------------------------------

Chi-Square Df P-Value

------------------------------------------

16,52 4 0,0024

------------------------------------------

ANÁLISIS: Debido a que el p value de la Chi cuadrada nos da menor que nuestro alfa se rechaza la hipótesis nula, es decir que apoyados en la evidencia muestral se concluye que no hay evidencia suficiente para aceptar la hipótesis nula y con esto la idea de que las condiciones de las vías y el cumplimiento del presupuesto son variables dependientes.

Ósea que el cambio de una afectara a la otra ya que existe una relación.

Se aconsejaría a la empresa que a la hora de analizar el cumplimiento del presupuesto, para mejorarlo o para ver que factores influyen directamente en el aumento o la disminución de este, hacer relación con el estado de las vías ya que la prueba estadística nos muestra evidencia suficiente para rechazar su independencia.

8. Prueba Anova de un solo camino

Sea “X” la variable aleatoria ventas mensuales de acuerdo con la calificación del estado de las vías.

H1: Existe al menos uno diferente

Estadística de ventas de automóviles

Tabla Anova Y by X9

Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Between groups 5797,04 4 1449,26 4,32 0,0020

Within groups 127428,0 380 335,336

-----------------------------------------------------------------------------

Total (Corr.) 133225,0 384

Table of Means for Y by X9

with 95,88 percent LSD intervals

Stnd. error

X9 Count Mean (pooled s) Lower limit Upper limit

--------------------------------------------------------------------------------

0 39 51,0709 2,9323 46,8235 55,3184

1 90 50,2203 1,93027 47,4243 53,0163

2 124 50,3925 1,64448 48,0105 52,7746

3 71 55,1872 2,17326 52,0392 58,3351

4 61 60,866 2,34464 57,4698 64,2622

--------------------------------------------------------------------------------

Total 385 52,9646

Como el p value de la prueba ANOVA es menor que el alfa, concluimos que hay al menor una media diferente entre las clases. En la tabla anterior se observa que las ventas mensuales son mayores cuando la opinión sobre el estado de las vías es la mejor, mientras que las mas bajas ventas mensuales se presentan cuando la opinión sobre las vías es la peor, de los resultados de la tabla también podemos concluir que las ventas mensuales no tienen una relación directa (lógica) con la opinión sobre el estado de las vías ya que se esperaría que mientas peor fuera el estado de las vías aumentaran mas las ventas mensuales. Cabe anotar que la desviación es mayor en aquellas opiniones que poseen un menor tamaño de muestra, por ejemplo cuando se observa la desviación de la respuesta no sabe/no responde que corresponde al valor 0, la desviación es la mayor de todas las respuestas sobre el estado de las vías. Por lo que puede que en algunos de los resultados obtenidos no se tenga suficiente certeza de que dan los resultados reales acerca de la prueba que se esta realizando. Por lo que una de las recomendaciones que se le podría dar a la compañía es que aumente el tamaño de la muestra con el fin de que la confianza en los resultados sea mayor.

9. Variables que estratifican a la variable ventas mensuales Y

9.1. Region X6

Estadística de ventas de automóviles

ANOVA Table for Y by X6

Analysis of Variance

Source Sum of Squares Df Mean Square F-Ratio P-Value

Between groups 43551,5 2 21775,8 92,76 0,0000

Within groups 89673,3 382 234,747

Total (Corr.) 133225,0 384

Table of Means for Y by X6

with 95,88 percent LSD intervals

Stnd. Error

X6 Count Mean (pooled s) Lower limit Upper limit

1 241 44,748 0,986942 43,3185 46,1776

2 69 67,3334 1,84449 64,6617 70,0051

3 75 66,148 1,76917 63,5855 68,7106

Total 385 52,9646

9.2. Cumplimiento presupuesto de ventas X7

Estadística de ventas de automóviles

ANOVA Table for Y by X7

Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Between groups 1362,81 1 1362,81 3,96 0,0473

Within groups 131862,0 383 344,287

-----------------------------------------------------------------------------

Total (Corr.) 133225,0 384

Table of Means for Y by X7

with 95,88 percent LSD intervals

--------------------------------------------------------------------------------

Stnd. error

X7 Count Mean (pooled s) Lower limit Upper limit

--------------------------------------------------------------------------------

0 174 55,0365 1,40665 52,999 57,0739

1 211 51,2561 1,27738 49,4059 53,1063

--------------------------------------------------------------------------------

Total 385 52,9646

9.3. Calificacion de condiciones laborales X8

Estadística de ventas de automóviles

ANOVA Table for Y by X8

Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Between groups 1834,25 3 611,417 1,77 0,1518

Within groups 131391,0 381 344,857

-----------------------------------------------------------------------------

Total (Corr.) 133225,0 384

Table of Means for Y by X8

with 95,88 percent LSD intervals

--------------------------------------------------------------------------------

Stnd. error

X8 Count Mean (pooled s) Lower limit Upper limit

--------------------------------------------------------------------------------

1 5 61,4849 8,3049 49,4554 73,5144

2 40 58,2191 2,93623 53,966 62,4721

3 165 52,9684 1,4457 50,8743 55,0624

4 175 51,5166 1,40379 49,4833 53,55

--------------------------------------------------------------------------------

Total 385 52,9646

9.4. Mes X10

Estadística de ventas de automóviles

ANOVA Table for Y by X10

Analysis of Variance

-----------------------------------------------------------------------------

Source Sum of Squares Df Mean Square F-Ratio P-Value

-----------------------------------------------------------------------------

Between groups 129883,0 10 12988,3 1453,71 0,0000

Within groups 3341,54 374 8,93461

-----------------------------------------------------------------------------

Total (Corr.) 133225,0 384

Table of Means for Y by X10

with 95,88 percent LSD intervals

--------------------------------------------------------------------------------

Stnd. error

X10 Count Mean (pooled s) Lower limit Upper limit

--------------------------------------------------------------------------------

Abril 63 35,0354 0,376589 34,4899 35,5809

Agosto 33 74,1304 0,520332 73,3767 74,8842

Enero 1 101,145 2,98908 96,8148 105,475

Febrero 5 18,1994 1,33676 16,263 20,1358

Julio 19 83,1014 0,685742 82,108 84,0947

Junio 16 93,5908 0,74727 92,5084 94,6733

Marzo 29 25,866 0,555058 25,0619 26,67

Mayo 49 64,9688 0,427012 64,3503 65,5874

Noviembre 3 105,835 1,72575 103,336 108,335

Octubre 77 54,316 0,340637 53,8226 54,8095

Septiembre 90 44,8433 0,315077 44,3869 45,2997

--------------------------------------------------------------------------------

Total 385 52,9646

De los anteriores resultados se puede decir que las variables que menos se traslapan al ser comparadas con las ventas mensuales son la region y el cumplimiento del presupuesto. de la prueba anova de las ventas mensuales por región podemos observar que existe un traslape entre las regiones 2 y 3, al mostrar que existe homogeneidad entre estos grupos, lo que quiere decir que no hay diferencia significativa entre las medias de las ventas mensuales con respecto a estas dos regiones, entre la región 1 y las regiones 2 y 3 no se presenta ningún tipo de traslape, al mostrar que la homogeneidad entre estos grupos es muy baja, por lo tanto podemos decir que existe una diferencia significativa entre la media de las ventas mensuales de la región 1 y las medias de las ventas mensuales de la región 2 y 3. Partiendo de esta prueba podemos decir que la variable región tiene ciertas posibilidades en comparación con otras variables de estratificar a la variable ventas mensuales debido a que existe poco traslape entre las curvas.

Pero al observar la prueba Anova para las ventas mensuales por cumplimiento del presupuesto podemos observar que las curvas no se traslapan, al mostrar que no existe prácticamente homogeneidad entre estos grupos, lo que nos permite decir que existe una diferencia significativa entre las medias de las ventas mensuales con respecto al cumplimiento del presupuesto de ventas. Partiendo de esta prueba se puede decir que la variable que mejor estratifica las ventas mensuales es el cumplimiento del presupuesto de ventas, debido a que entre las curvas no existe traslape alguno.

10. Regresión Lineal Simple

Matriz de correlación

Y X1 X2 X3 X4

------------------------------------------------------------------------------------------------------------------------

Y -0,0403 0,1997 0,5323 0,0407

( 385) ( 385) ( 385) ( 385)

0,4301 0,0001 0,0000 0,4258

X1 -0,0403 -0,0637 -0,0539 -0,0988

( 385) ( 385) ( 385) ( 385)

0,4301 0,2124 0,2911 0,0529

X2 0,1997 -0,0637 -0,0045 0,0510

( 385) ( 385) ( 385) ( 385)

0,0001 0,2124 0,9295 0,3185

X3 0,5323 -0,0539 -0,0045 -0,0333

( 385) ( 385) ( 385) ( 385)

0,0000 0,2911 0,9295 0,5153

X4 0,0407 -0,0988 0,0510 -0,0333

( 385) ( 385) ( 385) ( 385)

0,4258 0,0529 0,3185 0,5153

X5 0,0559 -0,0587 0,0568 0,0555 -0,0554

( 385) ( 385) ( 385) ( 385) ( 385)

0,2736 0,2508 0,2664 0,2777 0,2782

------------------------------------------------------------------------------------------------------------------------

X5

------------------------------------------------------------------------------------------------------------------------

Y 0,0559

( 385)

0,2736

X1 -0,0587

( 385)

0,2508

X2 0,0568

( 385)

0,2664

X3 0,0555

( 385)

0,2777

X4 -0,0554

( 385)

0,2782

X5

------------------------------------------------------------------------------------------------------------------------

Correlation

(Sample Size)

P-Value

Al analizar la matriz de correlación, se concluye que la variable que mayor predice es la variable ingreso personal promedio X3, puesto que posee el menor p value y la mayor correlación. Con esta seguiremos realizando los demás puntos.

Regresión Simple- Y vs. X3

Regression Analysis - Linear model: Y = a + b*X

-----------------------------------------------------------------------------

Dependent variable: Y

Independent variable: X3

-----------------------------------------------------------------------------

Standard T

Parameter Estimate Error Statistic P-Value

-----------------------------------------------------------------------------

Intercept 28,8129 2,12141 13,582 0,0000

Slope 0,43148 0,0350674 12,3043 0,0000

-----------------------------------------------------------------------------

Correlation Coefficient = 0,532262

R-squared = 28,3303 percent

R-squared (adjusted for d.f.) = 28,1432 percent

Standard Error of Est. = 15,7892

Mean absolute error = 12,5493

Durbin-Watson statistic = 1,16673 (P=0,0000)

Lag 1 residual autocorrelation = 0,404786

Al analizar la relación existente entre las variables ingreso personal y ventas promedio, el coeficiente de correlación que ha sido calculado por Statgraphics para estas dos variables r = 0.532262. Cuando r se encuentra entre 0.30 y 0.60 se dice que existe una mala linealidad entre las dos variables.

En la grafica que se presenta a continuación también nos podemos dar cuenta que los puntos en ella no siguen ningún patrón. Una razón mas para afirmar que la linealidad es mala. Puede verse utilizando el modelo lineal la predicción se va a corregir en 28,3303% o se deja de cometer un error del 28,3303 cuando se utiliza este modelo.

Estadística de ventas de automóviles

Prueba de bondad del ajuste para los errores

Prueba de bondad del ajuste para los residuals de la regression lineal

Prueba Chi-cuadrado

----------------------------------------------------------------------------

Limite Limite Frecuencia Frecuencia

inferior superior observada esperada Chi-cuadrado

----------------------------------------------------------------------------

at or below -20.2324 13 38.40 16.80

-20.2324 -13.287 63 38.40 15.76

-13.287 -8.27895 71 38.40 27.68

-8.27895 -3.99972 39 38.40 0.01

-3.99972 1.22399E-10 37 38.40 0.05

1.22399E-10 3.99972 31 38.40 1.43

3.99972 8.27895 34 38.40 0.50

8.27895 13.287 29 38.40 2.30

13.287 20.2324 19 38.40 9.80

above 20.2324 48 38.40 2.40

----------------------------------------------------------------------------

Chi-cuadrado = 76.7302 con 7 g.l. P-Value = 6.38378E-14

Kolmogorov estadistico estimado DPLUS = 0.0951313

Kolmogorov estadistico estimado DMINUS = 0.0691041

Estimated overall statistic DN = 0.0951313

P-Value aproximado= 0.00191655

11. Comparacion de modelos lineales

Estadística de ventas de automóviles

Regresion Simple - Y vs. X3 (X5=1)

Regression Analysis - Linear model: Y = a + b*X

-----------------------------------------------------------------------------

Dependent variable: Y

Independent variable: X3

Selection variable: X5=1

-----------------------------------------------------------------------------

Standard T

Parameter Estimate Error Statistic P-Value

-----------------------------------------------------------------------------

Intercept 28,9444 2,99587 9,66146 0,0000

Slope 0,419875 0,0505785 8,30146 0,0000

-----------------------------------------------------------------------------

Correlation Coefficient = 0,519945

R-squared = 27,0343 percent

R-squared (adjusted for d.f.) = 26,642 percent

Standard Error of Est. = 15,8063

Mean absolute error = 12,073

Durbin-Watson statistic = 1,22583 (P=0,0000)

Lag 1 residual autocorrelation = 0,362988

Estadística de ventas de automóviles

Regrsion simple - Y vs. X3 (X5=2)

Regression Analysis - Linear model: Y = a + b*X

-----------------------------------------------------------------------------

Dependent variable: Y

Independent variable: X3

Selection variable: X5=2

-----------------------------------------------------------------------------

Standard T

Parameter Estimate Error Statistic P-Value

-----------------------------------------------------------------------------

Intercept 28,8039 3,02211 9,53107 0,0000

Slope 0,440027 0,0489994 8,98025 0,0000

-----------------------------------------------------------------------------

Correlation Coefficient = 0,540896

R-squared = 29,2568 percent

R-squared (adjusted for d.f.) = 28,894 percent

Standard Error of Est. = 15,8354

Mean absolute error = 12,9793

Durbin-Watson statistic = 1,33716 (P=0,0000)

Lag 1 residual autocorrelation = 0,322907

Estadística de ventas de automóviles

Con los resultados obtenidos podemos determinar que el modelo de predicción de las ventas mensuales promedio basado en el numero de supervisores es mejor para el caso cuando son dos puesto que tiene un mayor porcentaje de corrección de errores. Además en la gráfica podemos observar que las observaciones en el caso cuando es un supervisor, están más centradas alrededor de la recta que en el caso cuando son uno.

Debemos realizar las siguientes pruebas de hipótesis para verificar que tan buen modelo es este:

Prueba de hipótesis para el intercepto

Como el valor de esta prueba (0) es menor que el  con el que venimos trabajando, la hipótesis nula es rechazada. Lo que nos dice que el intercepto es diferente a cero (0) y que probablemente hay otras variables que deban estar incluidas dentro del modelo.

Prueba de hipótesis para la pendiente

Como el valor de esta prueba es igual a cero (0) y menor que el , esta hipótesis debe ser rechazada, por lo tanto la pendiente es diferente de 0. Esto quiere decir que la variable ingreso personal promedio de las agencias que tienen dos supervisores si debe estar incluida en este modelo y además que por cada unidad de ingreso personal promedio cuando X5=2 que se incremente, el valor de las ventas mensuales promedio aumenta en 0,440027 unidades.

12. Regresion Multiple

Regresion multiple - Y

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: Y

-----------------------------------------------------------------------------

Standard T

Parameter Estimate Error Statistic P-Value

-----------------------------------------------------------------------------

CONSTANT 10,5693 6,25538 1,68964 0,0919

X1 0,000530975 0,00315158 0,168479 0,8663

X2 1,55338 0,330533 4,69962 0,0000

X3 0,433054 0,0342848 12,6311 0,0000

X4 1,09181 0,927429 1,17724 0,2398

X5 0,677283 1,57859 0,429043 0,6681

-----------------------------------------------------------------------------

R-squared = 32,684 percent

R-squared (adjusted for d.f.) = 31,796 percent

Standard Error of Est. = 15,3827

Mean absolute error = 11,8448

Durbin-Watson statistic = 1,11166 (P=0,0000)

Lag 1 residual autocorrelation = 0,431718

Multiple Regression - Y

Multiple Regression Analysis

-----------------------------------------------------------------------------

Dependent variable: Y

-----------------------------------------------------------------------------

Standard T

Parameter Estimate Error Statistic P-Value

-----------------------------------------------------------------------------

CONSTANT 16,6472 3,26579 5,09746 0,0000

X2 1,57776 0,328357 4,80501 0,0000

X3 0,432221 0,0340983 12,6757 0,0000

-----------------------------------------------------------------------------

R-squared = 32,4151 percent

R-squared (adjusted for d.f.) = 32,0613 percent

Standard Error of Est. = 15,3527

Mean absolute error = 11,928

Durbin-Watson statistic = 1,10934 (P=0,0000)

Lag 1 residual autocorrelation = 0,433462

Para realizar la regresión múltiple, primero se deben buscar las variable que mejor predicen las ventas mensuales; este proceso se realiza sacando las variables con un p value mayor que el alfa del 4%. Al final quedaron que las mejores variables que predicen a Y son el ingreso personal promedio y el numero de automóviles registrados, aunque cabe anotar que nos es un muy buen modelo puesto que no corrige un buen porcentaje errores. Se deberían buscar otras variables que mejoren el modelo.

Prueba de hipótesis para el intercepto

Como el valor de esta prueba (0) es menor que el  con el que venimos trabajando, la hipótesis nula es rechazada. Lo que nos dice que el intercepto es diferente a cero (0) y que probablemente hay otras variables que deban estar incluidas dentro del modelo.

Prueba de hipótesis para la pendiente

Como el valor de esta prueba es igual a cero (0) y menor que el , esta hipótesis debe ser rechazada, por lo tanto la pendiente es diferente de 0. Esto quiere decir que la variable ingreso personal promedio y número de automóviles registrados si deben estar incluida en este modelo