Documentación
Estadística
ESTADÍSTICA APLICADA A LA DOCUMENTACIÓ
1er de documentació - curs 2003-2004
Tema 1: Conceptes 2
Tema 2: Estadística univariada 3
Organització de les dades 3
Indicadors de tendència central 4
Indicadors d'ordre o posició 5
Indicadors de dispersió 6
Indicadors de forma i de simetria 8
Distribució normal 9
Tema 3: Estadística bivariada 11
Representació conjunta de dues variables 11
Covariança i correlació 11
Coeficients de regressió o predicció 13
Relació entre el coeficient de correlació i el coeficient de regressió b 14
Fonts de variança 14
Tema 4: Estadística inferencial 15
Estimació per intervals/Estimació de paràmetres 15
Estimació per intervals de la proporció poblacional 17
Contrast d'Hipòtesi o Proves de significació 18
Contrastos paramètrics i no paramètrics 20
Una o més variables agrupades per categories: Distribució X2 22
TEMA 1 - CONCEPTES
Població: conjunt de tos els elements que comparteixen una o més característiques.
Mostra: Qualsevol subconjunt d'elements d'una població. En serà representativa quan reculli les característiques pròpies de la població. En el mostratge aleatori tots els elements han de ser equiprobables i independents.
Paràmetre: propietat descriptiva d'una població. Es simbolitzen amb caràcters grecs.
Estadístic: propietat descriptiva d'una mostra.
-
Error mostral (EM): diferència entre el paràmetre i l'estadístic.
-
Teoria de la probabilitat: fer estimacions sobre les característiques desconegudes de la població a partir de les característiques de la mostra ! estimació de paràmetres.
Variable: Propietat dels elements d'una població.
-
Variables qualitatives: qualitats o atributs no mesurables manifestats mitjançant categories o modalitats.
-
Variables quantitatives: es poden mesurar amb números reals.
-
Discretes: nombres enters, no admet valors intermitjos.
-
Contínues: presenta infinits valors entre dos modalitats consecutives. A efectes pràctics n'hi ha que es consideren discretes.
Mesura: procés pel qual s'assignen valors numèrics a les modalitats d'una variable.
Escala de mesura: relacionar un conjunt de modalitats diferents amb un conjunt de nombres diferents.
-
E. Nominal: els valors assignats són meres etiquetes, no tenen propietats matemàtiques. En podem dir si són iguals o diferents.
-
E. Ordinal: podem establir si són iguals o diferents i a més saber quins són previs i quins posteriors. Ex: ordre d'incorporació dels diferents països a la UE. No admeten operacions matemàtiques.
-
E. d'Interval: podem establir igualtats i diferències, ordenar-los i també determinar-ne les distàncies. El valor nul és arbitrari. Ex: la temperatura, en la que els 0º Centígrads no simbolitzen la mateixa que 0º Farenheit.
-
E. de Raó: a més de totes les característiques anteriors, existeix un valor nul no arbitrari que indica absència del valor a mesurar. Ex: número d'usuaris.
Exemples
Escala | Tipus de variable | Exemple |
Nominal | Qualitativa | Autor d'un llibre Barri d'on prové l'usuari Títol de revista |
Ordinal | Semiquantitativa | Volum d'una revista: 1, 2, 3,.. Nivell socio-econòmic d'un barri: baix, mitjà, alt... |
Interval | Discreta | Any de publicació: 1999, 2001... |
De raó | Discreta | Número d'usuaris, número de pàgines... Número de dies d'obertura anuals: 270, 271'5... Pressupost anual: 24000 €, 56358'56 €... |
Contínua | Factor d'impacte d'un article Mitjana d'edat dels socis |
TEMA 2 - ESTADÍSTICA UNIVARIADA
ORGANITZACIÓ DE LES DADES > Variables qualitatives
-
Una variable: sexe
Categories | Freqüència absoluta (fi) | Percentatge (Pi) | Proporció (pi) |
Home | 6 | 15 | 0'15 |
Dona | 34 | 85 | 0'85 |
Total () | 40 | 100 | 1 |
-
Dues variables: sexe i estat civil. En aquest cas s'elabora una taula de contingència.
Estat civil | ||||
Sexe | Solter | Casat | Separat | |
Home | 5 | 0 | 1 | 6 |
Dona | 26 | 8 | 0 | 34 |
Total () | 31 | 8 | 1 | 40 |
ORGANITZACIÓ DE LES DADES > Variables ordinals
Coneixements d'estadística | fi | pi | Pi | fa | pa | Pa |
Baix | 21 | 0'52 | 52'5 | 21 | 0'525 | 52'5 |
Mitjà | 14 | 0'35 | 35 | 35 | 0'875 | 87'5 |
Alt | 5 | 0'125 | 12'5 | 40 | 1 | 100 |
Total () | 40 | 1 | 100 |
ORGANITZACIÓ DE LES DADES > Variables quantitatives
-
Taula de freqüències agrupada per intervals. Per saber quina serà l'amplitud de l'interval:
-
Representació gràfica: diagrama de tija i fulles
-
Dades agrupades:
-
l'interval crític és el primer on la freqüència absoluta acumulada (fa) supera n/2, (que en aquest cas és 20).
Amplitud = | (Valor màxim - Valor mínim) +1 |
Número d'intervals |
En l'Exemple:
* Atenció, el valor màxim és 71, no 75: encara que a la taula l'interval sigui fins a 75, l'últim valor existent és el 71. Ho podem verue al diagrama de tija i fulles.
X (pes) | Li | Ls | Xi | fi | Pi | pi | fa | Pa | pa |
51-55 | 50,5 | 55,5 | 53 | 2 | 13 | 0,13 | 2 | 13 | 0,13 |
56-60 | 55,5 | 60,5 | 58 | 3 | 20 | 0,2 | 5 | 33 | 0,3 |
61-65 | 60,5 | 65,5 | 63 | 6 | 40 | 0,4 | 11 | 73 | 0,73 |
66-70 | 65,5 | 70,5 | 68 | 3 | 20 | 0,2 | 14 | 93 | 0,93 |
71-75 | 70,5 | 75,5 | 73 | 1 | 6 | 0,06 | 15 | 100 | 1 |
Total () | 15 | 100 | 1 |
2 | 5 * | 12 |
3 | 5 | 679 |
6 | 6 * | 112345 |
3 | 6 | 678 |
1 | 7 * | 1 |
TEMA 2 - ESTADÍSTICA UNIVARIADA > INDICADORS DE TENDÈNCIA CENTRAL
MODA
Valor de la distribució que més es repeteix
MEDIANA (Md)
On: Li: Límit real o exacte de l'interval crític n: nombre real d'observacions nb: freqüència acumulada (fa) per sota de l'interval crític nd: freqüència absoluta (fi) de l'interval crític i: amplitud de l'interval |
Exemple Md
X (pes) | Xi | Li | Ls | fi | fa | Pa | ||||||
41-45 | 43 | 40,5 | 45.5 | 2 | 2 | 5 | ||||||
46-50 | 48 | 45.5 | 50,5 | 4 | 6 | 15 |
Enviado por: | GMMG |
Idioma: | catalán |
País: | España |