Paquetes estadísticos

Estadística. Informática. Ventajas. Desventajas. Comparativa. Programación. Ergonomía. Costes. Programas. Ofimática

  • Enviado por: Samuel
  • Idioma: castellano
  • País: Venezuela Venezuela
  • 12 páginas
publicidad
cursos destacados
Ejercicios resueltos de Trigonometría Plana
Ejercicios resueltos de Trigonometría Plana
Serie de ejercicios resueltos de Trigonometría Plana

Este curso va ligado al curso actual de...
Ver más información

Series y Sucesiones
Series y Sucesiones
Curso sobre series y sucesiones que incluye definiciones básicas, criterios de convergencia, series de...
Ver más información

publicidad

PAQUETES ESTADISTICOS

Conceptualmente, un paquete estadístico es un conjunto de programas informáticos específicamente diseñados para el análisis estadístico de datos con el objetivo de resolver problemas de estadística descriptiva, inferencial o ambos

Es un conjunto de programas y subprogramas conectados de manera que funcionan de manera conjunta; es decir, para pasar de uno a otro no se necesita salir del programa y volver a él. Un paquete estadístico permite aplicar a un mismo fichero de datos un conjunto ilimitado de procedimientos estadísticos de manera sincronizada, sin salir del programa. De esta forma, la utilidad del conjunto integrado es mayor que la suma de las partes. En cierto modo, un paquete estadístico es similar a un paquete ofimático (por ejemplo, Office 97 de Microsoft).

Hay paquetes que fueron escritos originalmente para ordenadores tipo mainframe : SPSS , BMDP , SAS , Minitab , Genstat y GLIM. Los tres primeros se volvieron muy populares en ese entorno. Actualmente pueden usarse en PC todos ellos. Otros paquetes se han desarrollado específicamente para PC, sin haber pasado por la etapa de los mainframes.

Algunas de las variables que es necesario tener en cuenta para comparar adecuadamente unos paquetes estadísticos de otros son, esencialmente, las seis que se mencionan a continuación:

1.- Coste: Este es uno de los puntos mas importantes que hay que tocar al momento de elegir un Paquete Estadístico, desafortunadamente, el coste de sus licencias está fuera del alcance de la mayor parte de los usuarios y la obtención de copias subrepticias no es posible para muchos ni fácil en absoluto para ninguno.

2.- Nivel de sofisticación del usuario: Idealmente, éste debería ser un entendido en estadística y tener ciertos conocimientos de programación. En la medida que carezca de los segundos, tendrá que renunciar a realizar por su cuenta cierto tipo de análisis que vayan más allá de los más comunes; y en tanto que carezca de los primeros, será más dependiente de aquellos paquetes con un interfaz más informativo.

3.- Tamaño del conjunto de datos: En la mayor parte de los problemas -al menos, en lo que respecta a su número, no a su dificultad ni importancia- esta variable no supone ninguna restricción significativa. De hecho, la mayotia de los paquetes pueden manejar sin mayores problemas conjuntos de datos no excesivamente grandes. Sólo cuando se rebasa cierto umbral es preciso considerar paquetes específicamente diseñados para hacer frente a este tipo de condicionantes.

Los distribuidores de muchos paquetes estadísticos comerciales suelen hacer hincapié en la probada capacidad de sus productos para manipular grandes conjuntos de datos. Desafortunadamente para ellos, el rango de problemas en que estas virtudes son críticas se estrecha aceleradamente: por una parte, las ampliaciones de memoria son cada vez más económicas, elevando hasta niveles muy cómodos el umbral a partir del cual serían necesarios productos más sofisticados; por la otra, para los problemas en que los conjuntos de datos son verdaderamente grandes -bases de datos de corporaciones, información censal, etc.- pueden emplearse herramientas específicas como, por ejemplo, programas escritos en C que interactúen con el gestor de la base de datos.

4.- Grado de intensidad computacional: El incremento en la potencia computacional de los ordenadores permite hoy en día aplicar ciertas técnicas estadísticas impensables hace unos años y ampliar su campo de aplicación a ámbitos inasequibles para las tradicionales. Las técnicas de remuestreo o de validación cruzada, ciertos tests exactos y gran parte de las técnicas bayesianas exigen una enorme capacidad de cálculo.

No todos los paquetes estadísticos están igualmente adaptados para este tipo de problemas. Con muchos de ellos -por ejemplo, Minitab, Stata y gran parte de los paquetes gratuitos- resulta simplemente imposible porque fueron diseñados únicamente para implementar técnicas tradicionales y carecen de un verdadero lenguaje de programación asociado que resulte eficiente.

5.- Ergonomía: Curiosamente, el aspecto que tal vez más encarezca determinados paquetes estadísticos es el ergonómico: la posibilidad de contar con ayudas interactivas o tutoriales, de representar gráficamente datos con un golpe de ratón, de exportar automáticamente los resultados a formato .html o .pdf, etc. Bajo cierto punto de vista, el coste de las licencias es, de hecho, el coste de la impericia o la pereza. A la primera, en mercadotecnia, se la suele denominar productivity; a la segunda, learning curve. Es más productivo y exige menor esfuerzo mental un paquete estadístico en que para imprimir no haya sino que pulsar el icono de la impresora, en que para visualizar unos datos baste con visitar el menú Gráficos o el Importar para leer datos de un fichero con el formato de cierta hoja de cálculo. Este tipo de habilidades son realmente reduntantes si se cuenta con un mínimo de habilidad y no se pretende escatimar un adarme de esfuerzo: utilizando ficheros de texto como intermediarios, se pueden intercambiar datos con cualquier hoja de cálculo o con otros programas que permiten manipular datos o gráficos, gran parte de los cuales son de distribución gratuita.

6.- Facilidad de programación: Si bien contar con lenguajes de programación complejos no es lo deseable, si lo es disponer de la capacidad de generar programas sencillos tipo "batch files" que permitan realizar tareas de transformación, cálculo de datos, realización de pruebas estadísticas, generación de nuevos archivos y documentos conteniendo resultados sin necesidad de estar digitando cada vez los comandos correspondientes, con el consiguiente ahorro de tiempo y esfuerzo.

VENTAJAS Y DESVENTAJAS DE LOS PAQUETES ESTADISTICOS.

Debido a las diferencias existentes entre los paquetes estadisticos, mencionaremos individualmente las ventajas y desventajas de algunos de ellos, desarrollando mayormente los Paquetes mas conocidos como son SAS y SPSS y de muchos otros solo se mencionara su existencia.

- SAS, Statistical Analysis System (SAS Institute Inc., Cary , NC) http://www.sas.com

* Comprende amplias posibilidades de procedimientos estadísticos (métodos multivariados, regresión múltiple con posibilidades diagnósticas , análisis de supervivencia con riesgos proporcionales y regresión logística) y permite cálculos exactos para tablas r x c y contiene potentes posibilidades gráficas.

* Todos los procedimientos pueden emplearse de una sola ejecución.

* Los resultados pueden guardarse como archivos y usarse como entradas para futuras ejecuciones.

* Es particularmente útil en la gestión de datos y en la redacción de informes.

* Algunos procedimientos tienen varias opciones por lo cual debe examinarse cuidadosamente el manual antes de seleccionar la opción deseada.

* SAS ofrece la mayor flexibilidad para personalizar el manejo y análisis de datos, sin embargo su principal inconveniente es que no resulta fácil aprender a usarlo.

- SPSS, Statistical Package for the Social Sciencies (SPSS Inc. , Chicago)

* Dispone de un amplio conjunto de métodos estadísticos (multivariados, series temporales, regresión logística y análisis de supervivencia).Todos los procedimientos pueden emplearse de una sola ejecución.

* Algunos procedimientos tienen varias opciones por lo cual debe examinarse cuidadosamente el manual antes de seleccionar la opción deseada. SPSS es el más fácil de aprender para los investigadores principiantes y tiene un manual que explica la filosofía y los mecanismos de las técnicas estadísticas.

* Puede creerse que SPSS es un producto caro y ligado a compras costosas. Esto no es totalmente cierto. Si bien no es un producto barato, sí es rentable. De hecho, el éxito de SPSS se debe a:

  • Vinculación de los objetivos a las necesidades de la empresa.

  • Perfecto Acoplamiento a un Plan de Investigación bien formulado.

  • Servicio de Calidad para los usuarios.

  • Eficaz Evaluación de los Resultados hallados.

  • Facilidad del Manejo y de la Programación.

  • ALGUNAS DIFERENCIAS ENTRES LOS DOS GRANDES (SAS y SPSS)

    • Precio
      El precio de SPSS es mucho menor que el del programa SAS, en torno a la mitad del precio.

    • Rentabilidad
      Recomendable para PYMES (hasta 500 trabajadores), SPSS es la mejor solución. Para grandes empresas (más de 500 empleados) o aquellas que puedan permitirse un fuerte desembolso sin necesidad de retorno a corto plazo, SAS es más rentable que SPSS, ya que permite ejecutar mayor número de procedimientos estadísticos y operativos.

    • Facilidad
      El manejo de SPSS es mucho más sencillo que el de SAS. El interfaz estilo hoja de cálculo de SPSS y su posibilidad de abrir ventanas muy comprensivas le convierten en un feo adversario para SAS. No obstante, SAS, una vez conocido el manejo de su lenguaje de programación, es más divertido que SPSS.

    • Formación
      La dependencia absoluta del lenguaje de programación por parte de SAS le hace muy vulnerable ante necesidades repentinas, ya que obliga a la Empresa a costear caros programas de formación, con el fin de permitir que su personal le saque el máximo provecho. SPSS, sin embargo, al ser mucho más fácil, no encadena al usuario a largos procesos formativos, sino que, en un tiempo mucho más corto que SAS, puede realizar complejos procedimientos de análisis sin esfuerzo.

    • Robustez
      La dependencia absoluta de Windows por parte de SPSS le hace muy vulnerable ante "caídas" del sistema, normalmente provocadas por acciones ilícitas del usuario. El programa SAS, por su parte, al tener su propio sistema operativo, toma la iniciativa del sistema, una vez arrancado, no permitiendo que una acción no autorizada por parte del usuario paralice el trabajo del operario

    - BMDP http://www.spssscience.com/Bmdp/

    Es el más antiguo de los paquetes. El primer manual para BMD Biomedical Computers Programs se publicó en 1961.En 1975 pasó a denominarse BMDP. Cubre un amplio abanico de métodos estadísticos pero su capacidad para manejar datos es limitada.

    Desventajas: sus programas se ejecutan por separado: solo puede accederse a uno de ellos en cada ejecución.

    Los resultados de cada programa se pueden guardar en un archivo de BMDP y utilizarse como entrada en otros programas.

    - Epi Info (Center for Diseases Control/WHO, Dean et al). http://www.cdc.gov/epiinfo

    Posee un excelente manejo de cuestionarios y entrada de datos. Posee escasos pero muy potentes comandos para el análisis estadístico y funciona prácticamente en cualquier computadora y sus utilitarios más importantes requieren escasos recursos informáticos. Es ideal para epidemiología de campo.

    No posee métodos multivariados ni estadísticas de supervivencia. No tiene costo. Las versiones actuales "corren" en DOS. Se está implementando una versión para Windows.

    - Minitab Statistical Software (State College , Pa) http://www.minitab.com

    Permite uso interactivo y es popular entre estudiantes y usuarios no especializados aunque no contempla tantos métodos estadísticos como SPSS, SAS o BMDP, incluye regresión múltiple. No es adecuado para conjuntos de datos pequeños

    - Stata Statistical Package (Stata Corporation ,Computing Resource Center, College Station , Texas) http://www.stata.com

    Tiene muy amplias capacidades estadísticas aplicables a áreas biológicas, del comportamiento y económicas.

    - Stat View Software (Abacus Concepts INC, Berkeley) http://www.statview.com

    Fácil de aprender y operar y dispone de tests básicos y capacidades gráficas, pero no es capaz de manejar grandes conjuntos de datos ni dispone de estadísticas de análisis de sobre-vida ni regresión logística.

    - StatXact 3 (V3 Cytel Software Corporation , Cambridge , Massachussetts) http://www.cytel.com

    Por primera vez pone a disposición en forma práctica cálculos exactos para datos discretos, como por ejemplo el test exacto para una tabla r x c, test de tendencia exacta para tabla r x 2 y el test exacto para la combinación de tablas 2 x 2 cuando falla el test de Mantel-Haenszel.

    También permite el cálculo para niveles de significación semi-p , uso recomendado por Armitage para datos discretos.

    - Genstat, General Statistic Program

    Se le considera uno de los paquetes más difíciles de aprender. Es al mismo tiempo un lenguaje y un paquete de modo que el tipo de operaciones algebraicas usadas habitualmente en estadística pueden programarse facilmente lo que permite la ejecución de métodos nuevos. Por ello es popular entre los estadísticos que se encuentran desarrollando nuevos métodos o variantes de métodos existentes. Tiene buenos recursos para analizar experimentos diseñados.

    - GLIM, Generalized Linear Interactive Modelling http://www.nag.com/stats/GDGE.html

    Fue escrito para ajustar modelos lineales en forma interactiva lo que permite al investigador avanzar mediante la prueba y ajuste de diferentes modelos, con lo que puede agregar o descartar variables y apreciar el efecto de estos cambios antes de decidir el siguiente paso. Es más útil en tamaños pequeños a medianos de datos

    - Prophet (National Center for Research Resources , National Institutes of Health. BBN Systems and Technologies , 1997) http://www-prophet.bbn.com

    Es un paquete aún en etapa de prueba. Es bastante semejante en sus disponibilidades a SPSS, pero pensamos que es superior en la presentación de los resultados. Tiene un excelente y didáctico manual en línea por medio de Internet.

    - Arcus Quickset Biomedical (Research Solutions, Cambridge, England) http://www.researchsolutions.com/arcus_quickstat/index.html

    - Cricket Graph III (Islandia , NY) http://www.cjs.cadmus.com/da/instructions/cricket_mac.html

    - CSS Statistical Software (Statsoft Inc)

    - EGRET . Epidemiologycal Graphics and Testing Package (Statistic and Research Corporation , Washington,1988) http://www.cytel.com/products/egret

    - Epicure Peanuts (Hirosoft International Corporation , Seattle, Washington,1993) http://www.hirosoft.com/index.html

    - GRAPHROC.Maximatti Oy , Xerttulink , Finland http://www.saunalahti.fi/~maxim

    - Graphpad Instat software http://www.graphpad.com

    - HLM V4.0 (Scientific Software International , Chicago , Illinois) http://www.ssicentral.com/hlm/hlm.htm

    - JMP Software V3.01, V3.15, V3.2 (SAS Institute,Cary,NC) http://www.jmpdiscovery.com/

    - LISREL V8. Scientific Software International , Chicago , 1993 http://www.ssicentral/com/lisrel/mainlix/htm

    - Lotus (Lotus Development Corporation) http://www.lotus.com

    - Microsoft Excel http://www.microsoft.com/office/excel/default.htm

    - MLn. Multilevel Statistical Models , London

    - MLWIN (Multilevel Modeling for Windows).Institute of Education , London , 1998 http://ioc.ac.uk/mlwin

    - NUD*IST V4.0 . Qualitative Solution and Research , Victoria , Australia http://www.qsr.com.au

    - Report V6.0.08 (IDV , Munich , Germany)

    - Review Manager. RevMan.The Cochran Collaboration , Oxford) Versiones 3.1, 4.0 http://hiru.mcmaster.ca/cochrane/cochrane/revman.htm

    - ROC Analyzer V09B (Centrosoft , Birmingham , Alabama)

    - Sigmastat V2.0 (Jandel Scientific) http://www.spssscience.com/sigmastat

    - Simstat V3.5 http://www.kovcomp.co.uk

    - S-Plus Statistical Package (Stat Sci , Seattle and Europe)

    - Statigraphics (Manigistics)

    - Statistica (Statsoft, Tulsa Ok)

    - Statprobe (Ann Arbor, Mich) http://www.statprobetechnologies.com

    - Stat Soft (Tulsa, Okl) http://www.statsoftinc.com

    - SUDAAN. Analysis with Complex Samples , Lavange LM http://www.rti.org./patents/sudaan/sudaan.html

    - SYSTAT Software (Wilkinson, 1990, SYSTAT Inc) http://www.spssscience.com/systat

    - Testimate V5.2ª (IDV, Munich, Germany)

    - True Epistat (Epistat Services) http://www.true_epistat.com

    - Clinfo Systems (Southern California School of Medicine)

    - Egret (Statistics and Epidemiology Research Corporation)

    - GBSTAT http://www.gbstat.com/index1.htm

    - LogXact http://www.cytel.com/new.pages/LX.2.html

    - NCSS V6.0 (J.L. Hintze , Kaysville , Utah) http://www.ncss.com

    - SIP - Sistema Informático Perinatal http://www.clap.hc.edu.uy

    - SPIDA (Gebski et al, 1992)

    - Statistix (NH Analytical Software) http://www.statistix.com

    INTRODUCCION

    Un Paquete Estadístico es un conjunto de programas y subprogramas conectados de manera que funcionan de manera conjunta; es decir, para pasar de uno a otro no se necesita salir del programa y volver a él. Un paquete estadístico permite aplicar a un mismo fichero de datos un conjunto ilimitado de procedimientos estadísticos de manera sincronizada, sin salir del programa. De esta forma, la utilidad del conjunto integrado es mayor que la suma de las partes. En cierto modo, un paquete estadístico es similar a un paquete ofimática Este, entre otros temas como las ventajan y desventajas de cada uno de los paquetes estadísticos por nosotros conocidos, serán tocados y ampliados en este trabajo.

    CONCLUSION

    A la vista de lo investigado, podemos decir que los Paquetes Estadísticos son muy útiles al momento de hacer cálculos estadísticos pero, los usuarios que sólo se aproximan circunstancialmente a problemas de tipo estadístico y que sólo buscan soluciones poco sofisticadas y puntuales deben reexaminar las rutinas estadísticas de cualquier hoja de cálculo, incluyendo, tal vez, algunos de los macros de libre distribución que pueden encontrar en Internet, usar algún programa gratuito con un interfaz simple como los que pueden encontrarse e Internet o tal vez, buscar en Internet alguna de las cada vez más numerosas páginas en las que es posible realizar interactivamente y en línea determinadas manipulaciones estadísticas.

    Por otra parte, a aquellos usuarios que tengan que realizar análisis estadísticos más complejos y de una forma más regular podrían tomar como primera opción R, programa gratuito que pueden descargarse en internet. Usado en combinación con otro tipo de programas que extienden su capacidad gráfica -hojas de cálculo, procesadores de texto, programas específicos para la representación de datos, JavaScript, etc.- puede realizar con un coste nulo análisis sumamente sofisticados que, incluyen, tal vez, el 99% de los que precisan el 95% de los usuarios. Sólo un número pequeño de ellos echaría en falta alguna de las herramientas adicionales que incluye su versión comercial, S-Plus, o tal vez alguna de las de SAS o SPSS u otros.

    BIBLIOGRAFIA

    - http://www.estadistico.com/arts.html?20001113

    - http:// www.sas.com

    - http://www.spssscience.com/Bmdp/

    - http://www.cdc.gov/epiinfo

    - http://www.mednet.org.uy/suis/infosuis/temas/infosuis8-a.htm

    - http://www.suis.org.uy/infosuis/temas/temas_08-1.shtml