Analisis descriptivo de una variable

Estadística. Probabilítica. Matemática aplicada. Encuesta. Metodos. Tipos. Diseño. Frecuencias. Medidas de dispersión. Concentración

  • Enviado por: Gamjaci
  • Idioma: catalán
  • País: España España
  • 19 páginas
publicidad
publicidad

Introducció i repàs de l'anàlisi descriptiva d'una variable

Introducció

1.1. Definició d'estadística

L'estadística és l'estudi de com es pot utilitzar la informació per tal de donar una guia per fer una acció en situacions que impliquin incertesa. (barnett)

  • Estadística descriptiva: Técnica o métode que se segueix per recollir, organitzar, resumir, presentar i analitzar els resultats de les observacions dels fenómens reals.

  • Inferencia: Estudia les lleis de comportament d'aquells fenòmens que depenen de l'atzar. Mitjançant els resultats obtinguts de l'análisi d'una mostra de la població infereix o estima les lleis generals del comportament de la població.

1.2. Aplicacions de l'estadística

S'aplica a tots els fenòmens de masses que es donen a la vida de les societats humanes. Es un métode científic d'estudi o investigació.

  • Empresa: Control de qualitat a la producció, vendes, direcció comercial, financera, etc.

  • Economia i administració publica: Producció, consum, finances, emigració, demografía, etc.

1.3. Població elements carácters

  • Població: Conjunt finit o infinit (sinónim de grans) d'elements (persones o coses).

  • Elements o individus: Persones o coses que integren una població.

  • Carácter o variable: Propietats o qualitats dels elements d'una població.


1.4. Tipus de variables

  • Variable qualitativa: Carácter no susceptible d'ésser mesurat. No és numèric.
    Observable només qualitativament. Es divideix en modalitats. Aquestes han d'ésser exhaustivas i mútuament excloent.

  • Variable quatitativa: Carácter susceptible d'ésser mesurat. Numéric. Es pot observar quantitativament.

    • Variable discreta: Entre dos valors consecutius no pot prendre cap altre. Exemple: nombre de fills.

    • Variable continua: Entre dos valors sempre s'en pot trobar un intermig. Exemple: edat.

1.5. Escales de mesura

  • Nominal: L'ordre és arbitrari. Les diferencies entre un valor i l'altre poden ésser diferents (freqüéncia, percentatge, moda)

  • Ordinal: Ordre natural. Les diferencies entre un valor i l'altre poden ésse diferents (millor mediana que mitjana)

  • Interval: Les diferencies entre els valors són les mateixes. El zero és arbitrari.

  • Rati: Igual que l'interval. Zero es significatiu (agregats)

  • Escala

    Variable

    Nominal

    Qualitativa

    Ordinal

    Qualitativa / Quantitativa

    Interval

    Quantitativa

    Rati

    1.6. Observacions temporal i atemporals

    • Temporals: Referides a diferents moments en el temps: exemple venda d'un producte per una empresa al llarg de varis anys.

    • Atemporals: Referides al mateix instant de temps o interval de temps. Exemple: Vendes d'un producte durant un any per les diferents empreses de la comarca.

    1.7. Fonts de les dades estadístiques

    Les dades estadístiques s'obtenen com a conseqüéncia de determinadas observacions.

    • Fonts primáries: Les dades no existeixen i s'han de recollir per exemple mitjançant enquestes.

      • Avantatges: S'obtenen les dades de la manera més adient per allò que es vol estudiar.

      • Inconvenients: Procediment molt costos.

    • Fonts secundaries: Dades ja existents publicadas per díferents estaments públics o privats.

      • Avantatges: La feina de recollir les dades ja esta feta i per tant el cost es baix.

      • Inconvenients: Potser no obtenim allò que exactament volem. No sabem si hi han errors.

    1.8. Métodes d'observació

    • Exhaustiva (la millor de totes): Tots els elements d'una població.

      • Avantatge: Es més fiable.

      • Inconvenient: Requereix molt de temps. Cost elevat a vegades es destrueixen els elements (control de qualitat)

    • Parcial: Alguns elements.

      • Subpoblació: El elements que formen part de la subpoblació tenen unes característiques especials que no tenen la resta d'elements (ex. Grans magatzems per estudiar hábits de consum)

      • Mostra (La millor desprès de l'exhaustiva): Els elements que la componen no tenen cap característica especial que els distingeixi de la resta d'elements.

        • Aleatòria: depén de l'atzar.

        • No aleatòria: no depén de l'atzar.

    • Mixta: exhaustiva combinada amb parcial.

    1.9. Métode d'enquesta

    1.9.1. Definir l'Objecte d'Estudi

    És un primer pas imprescindible que cal fer sempre abans del disseny del qüestionari. La concreció de l'objectiu implica també la selecció de la població que es vol estudiar.

    Básicament hi ha tres objectius possibles:

  • Descriure una població. Exemples sobre estudis de mercats:

    • Estudi de gustos i preferències: Quines són les preferéncies dels usuaris respecte al producte x? Quins atributs del producte x troben més importants? Qué es valora més de l'envás del producte x?

    • Estudi del perfíl del consumidor: Quin és el perfil socioeconòmic dels usuaris del producte x? Quin és l'estil de vida dels usuaris del producte x?

    • Estudí de conducta del consumidor: Com utilitzen els consumidors el producte x? On el compren? Amb quina freqüéncia el compren? Quin membre de la família l'empresa?

    • Estudi sobre les actituds del consumidor: Com perceben o valoren els consumidors el producte x? o el polític y? Creu que la cosa z l'afectará positivament o negativament? Qué agrada o no agrada del producte x? I de l'envás del producte x?

    • Estudi dels motíus de compra: Com ho fan els consumidors per decidir quin producte compren? Quins atributs són més importants? Dels membres de la llar, qui pren la decisió? Quan la pren? Quines alternativas considera? De quant de temps disposa per fer la compra?

    • Estudí de les percepcions: Amb qué s'associen determinats colors o olors? Quina sensació produeix un determinat anunci?

    • Estudís sobre la marca: Quines marques coneixen o recorden els consumidors (notorietat)? Com perceben els consumidors la marca x?

    • Comparar dues poblacions o dos aspectes d'una mateixa població. Exemples:

      • Estudi del perfíl del consumidor: En qué es diferencien els perfils socioeconòmics dels usuaris dels productos x i y?

      • Estudi de gustos í preferéncies: Com han evolucionat les preferéncies dels usuaris respecte al producte x comparat amb l'any passat?

      • Análísí de posicíonament: Com es percep el producte x comparat amb altres productos competidors?

      • Estudís sobre la marca: Quines idees associen els consumidors amb les diferent marques?

      • Relacionar dues o més variables. Exemples:

      • Com afecta el perfil socioeconómic / estil de vida / gustos / conducta del consumidor a les actituds / percepcions / preferéncies / conducta / intenció de compra dels usuaris respecte al producte x?


        1.9.2. Definició de la població

        Segons siguin els objectius caldrá seleccionar la població a estudiar. Els casos més freqüents són:

        • Usuaris del producte.

        • Usuaris de la marca.

        • Població en general.

        • Població major d'edat.

        • Famílies (enquestar només cap de familia)

        • Poblacions especials (ex. Socis d'un club, drogaaddictes, pares d'alumnes, ...)

        1.9.3. Variables lmplicades

        Caldrá definir totes aquelles variables que cal descriure, comparar o relacionar abans de redactar les preguntes. Altrament el qüestionari te el risc d'estar ple de preguntes poc rellevants que només fan que cansar l'entrevistat, o mancat de preguntes clau pels objectius de l'estudi. Hi ha molts tipus de variables que poden ser mesurades per mitjá d'un qüestionari.

        • Variables soci econòmiques (edat, estat civil, sexe, nivell d'estudis, renda, lloc de residencia, mida de la llar, ...)

        • Comportament passat.

        • Intenció de comportament futur.

        • Actituds, opinions i preferències.

        Segons el nivell de mesura, les variables es divideixen en:

        • Qualítatíves nomínals: Són variables que simplement classifiquen els enquestats en diferents grups, per exemple sexe, estat civil, atribut més important d'un producte, marca preferida d'un producte, etc. És codifiquen numéricament (per exemple: estat civil: l. Solter, 2. Casat o en parella, 3. Divorciat o separat, 4. Vidu), però aquests números no tenen interpretació (no podem dir, per exemple, que ser vidu és més que ser divorciat, que la diferencia entre casat i solter és 2-1=1, que una persona vídua té un estat civil doble que una persona casada o que una persona soltera i una persona divorciada en promig estan casats)

        • Qualitatives ordinals: Són variables que, a més de classificar els individus en grups permeten establir un ordre entre aquests grups. Per exemple classe social (l. Alta, 2. Mitjana, 3. Baixa, etc.) Com en el cas de les variables nominals, no podem realitzar operacions numériques (no podem dir per exemple que la diferencia entre alta i mitjana és la mateixa que entre mitjana i baixa).


        • Numériques o quantitatives: en aquestes variables els valors es poden interpretar numéricament. Es divideixen en intervals (estan permeses la suma i la resta. Ex: podem dir que quelcom que está a 20 graus está 10 graus més calent que quelcom que está a 10 però no que está el doble de calent) i de raó (hi ha un origen fix i també está permés el quocient. Ex: nombre de fills podem dir que qui té quatre fills en té el doble de qui en té dos) Tant els de intervals com els de raó es divideixen també en discrets (poden prendre un nombre finit de valors, per exemple: nombre de vegades que s'ha anat al cinema el darrer mes) i continus (dins de qualsevol interval poden prendre infinits valor, per exemple: alçada, renda, etc.).

        1.9.4. Redacció de preguntes

        1) Algunes regles básiques:

        • El redactat ha de ser senzill, amb un vocabulari entenedor per a gent amb pocs nivells d'instrucció i ha d'emprar formes gramaticals senzilles. També és aconsellable que les preguntes siguin curtes. En tot cas, cal redactar frases senceres (“quina és la seva edat?”)

        • Expressions vagues (sovint, molt, rarament, etc.) No volen dir el mateix per a tothom, millor emprar expressions més concretes per al context concret de la pregunta. Cal definir les paraules clau si no estan clares.

        • Preguntes obertes, no és dona cap possible resposta. Són difícils de tractar estadìsticament i sovint són deixades en blanc per l'entrevistat. Cas de que siguin contestadas aporten informació qualitativa important. S'en pot incloure alguna en el qüestionari.

        • Preguntes tancades. És confecciona una llista tancada de respostes possibles. Cal que aquesta llista sigui complerta i les opcions s'excloguin mútuament. Les opcions de resposta han d'anar codificades (numerades)

        Quina és la seva situació laboral / professional?


        • 01. Empresari / directiu / professió lliberal.

        • 02. Comandament intermig / técnic.

        • 03. Especialista, professional.

        • 04. Treballador d'oficina, dependent, venedor.

        • 05. Treballador manual qualificat.

        • 06. Treballador manual no qualificat.

        • 07. Feines de la llar.

        • 08. Jubilat.

        • 09. Estudiant.

        • 10. Aturat.


        Nivell d'estudis:


        • 01. Primaris.

        • 02. Secundaris.

        • 03. Superiors.

        • 04. Altres.


        Les preguntes concretes sobre un fet determinat poden agrupar-se per no ser repetitives.


        Quins tipus de serveis ha utilitzat durant la seva estada a l'hotel?

        Si

        No

        01. Habitacions

        1

        2

        02. Piscina

        1

        2

        03. Gimnàs

        1

        2

        04. Sauna

        1

        2

        05. Perruqueria

        1

        2

        No formular mai dues preguntes en una (“vostè seria partidari que a la universitat es dediques més temps a les activitats culturals i esportives?”)

        Vostè seria partidari que a la Universitat es dediques més temps a les següents activitats, encara que això impliques alguna reducció en els temaris?

        Si

        No

        No ho sé

        Indiferent

        Activitats Culturals

        1

        2

        3

        4

        Activitats Esportives

        1

        2

        3

        4

        Per mesurar comportaments passats. Cal fixar un marc de referencia temporal concret (no dir “darrerament”, “en general”) prou curt com per qué l'enquestat pugui recordar bé els episodis. Evitar quantificadors vagues (sovint, molt, gairebé mai, ...)

        En els darrers 15 dies, es a dir, des de ... ha anat vostè al cinema?


        • 01. Sí.

        • 02. No.

        • 03. No ho recorda.


        En els darrers 30 dies, es a dir, des de ... quantes vegades ha anat al cinema?

        Actituds i valoracions. No es poden mesurar amb modalitat de resposta de si o no, el que respon ha de poder matisar la intensitat d'una actitud o una opinió.

        D'aquesta manera podem obtenir respostes que es poden considerar numèriques.

        Valori la importància dels següents motius a l'hora d'escollir el producte x (1 gens important - 5 molt important)

        01. Preu

        1

        2

        3

        4

        5

        02. Qualitat

        1

        2

        3

        4

        5

        03. Relació preu - qualitat

        1

        2

        3

        4

        5

        04. Forma d'envàs

        1

        2

        3

        4

        5

        05. Publicitat del producte

        1

        2

        3

        4

        5

        Avaluí fins a quin punt creu que aquest producte té les qualitats següents. Encerclar un número més a la dreta si creu que l'adjectiu de la dreta descriu més el producte. Encerclar un número més a l'esquerra si creu que l'adjectiu de l'esquerra descriu més al producte.

        Barat

        1

        2

        3

        4

        5

        6

        7

        Car

        Exclusiu

        1

        2

        3

        4

        5

        6

        7

        Ordinari

        Per mesurar variables possiblement comprometedores per l'entrevistat se solen donar possibilitats de resposta molt amples a fi de no obligar l'entrevistat a concretar massa. També s'acostumen a donar possibilitats molt extremes a fi que la situació de l'entrevistat, sigui quina sigui, sembli a prop de la mitjana.

        Quines són els ingressos mensuals nets, en euros, de la seva llar per tots els conceptes?


        • 01. Menys de 600.

        • 02. Entre 600 i menys de 900.

        • 03. Entre 900 i menys de 1200.

        • 04. Entre 1200 i menys de 1800.

        • 05. Entre 1800 i menys de 3000.

        • 06. Més de 3000.


        1.9.5. Ordre de les preguntes

        El qüestionari es sol començar per preguntes relativament senzilles, possiblement interessants per l'enquestat i que l'ajudin a emmarcar els objectius del qüestionari i posar-se en context. Per exemple, en un estudi de conducta del consumidor preguntes sobre ús del producte o sobre preferéncies, etc. Poden ser adequades.

        L'atenció de l'enquestat sol ser òptima al cap d'un parell de minuts, quan ja s'ha arribat a un bon nivell d'interacció amb l'enquestat sense arribar al cansament. És el moment d'incloure les preguntes difícils.

        Les variables sociodemográfiques se solen posar al final perqué són fácils de respondre (per tant el cansament no hi influeix gaire) i perqué poden causar un cert rebuig si es fan al principi i sense justificació. Una de les preguntes que causen més rebuig és la renda, i, en comptes, s'empren variables proxi (educació, ocupació)

        No només cal tenir cura el redactat de cada pregunta per separat sinó el context en que es troben les preguntes. Preguntes anteriors sobre determinats temes poden fer més importants certs aspectes. Si preguntem sobre satisfacció amb diferents aspectes d'un producte i després satisfacció global amb el producte l'enquestat tindrá més en compte els aspectes ja preguntats anteriorment perqué se l'ha obligat a pensar-hi. Altres efectes poden ser força més preocupant. Imaginem que abans de preguntes per valorar un servei públic hi haguessin preguntes sobre impostos: possiblement molta gent consideraría que els impostos són massa alts i llavors respondrien que no valoren gaire el servei perque está per sota del que esperen obtenir donada la quantitat pagada.

        1.9.6. Prova pilot del güestionari

        Serveix per millorar-lo. Es important que el qüestionari sigui entenedor pels membres de la població i no només pels estudiosos que l'han dissenyat. Després de la redacció es imprescindible fer una prova pilot amb una mostra reduïda per detectar preguntes que:


        • No s'entenen.

        • Són ambigües.

        • Causen malestar o rebuig a l'entrevistat.

        • No contenen prou alternatives de resposta.

        • Enteses per diferent gent de diferent manera.

        • Difícils de respondre (Ex: Ordenar 10 alternativas de més preferida a menys preferida)

        • No són pertinents per determinats enquestats (per tant no s'han de preguntar a tothom)


        1.9.7. Métode de recollida de dades

        • Personal: És el més car. Permet a l'enquestat aclarir dubtes. Permet presentar preguntes amb suport físic o gráfic (Ex: Productes de mostra, catálegs, ...) es el métode en el que l'enquestat pot estar més influenciat per l'entrevistador o pot tenir més vergonya a donar respostes sensibles.

        • Per teléfon: Té un cost intermig. Permet supervisar els entrevistadors per part de l'investigador. Redueix una mica la influencia de l'entrevistador i la vergonya a donar respostes sensibles. És més fácil que les respostes siguin precipitades. És més difícil controlar o saber exactament qui respon. Queda exclosa la gent sense telèfon. No es poden fer preguntes amb suport gràfic o físic.

        • Per correu: És barat. No permet a l'enquestat resoldre dubtes. Redueix una mica la influencia de l'entrevistador i la vergonya a donar respostes sensibles. Permet les preguntes amb suport gráfic però no físic. Sol haver-hi un percentatge elevat de no resposta i per tant errors greus per aquest motiu, sobretot si es pot pensar que els que no responen son diferents dels que sí ho fan. Molts tarden força a contestar i el temps que es tarda a completar l'estudi sol ser més alt.

        • Per ordinador: És barat. No permet a l'enquestat resoldre dubtes. Queda exclosa la gent sense ordinador. Permet presentar preguntes amb suport físic o gráfic.

        1.9.8. Recollida de les dades

        L'entrevistador és una peça clau degut a les moltes tasques que fa. Selecciona l'entrevistat, li explica l'estudi, el convenç a participar (cartes de presentació prometent anonimat, amb recolzament d'autoritats académiques universitáries, ajuden, ...) formula les preguntes, aclareix dubtes, demana més informació quan la resposta és incorrecta o incompleta.

        En definitiva, l'entrevistador interacciona socialment amb l'entrevistat i per tant pot condicionar fortament les respostes, fins i tot modificant les preguntes tot llegint-les a la seva manera (caldria que les preguntes fossin redactadas en un registre de llenguatge oral per a reduir aquest tipus de comportament). L'entrevistat pot tenir vergonya a donar certes respostes, sobretot si l'entrevistador reacciona amb sorpresa o amb rialles, o si és de classe social o edat molt diferent a la de l'entrevistat.

        1.9.9. Entrada de dades a l'ordinador

        Disposar els individus per files i les variables per columnes.

        Reservar sempre un valor numéric per a la no resposta (valors perduts) Cal que sigui un valor impossible de la variable. Si és possible, emprar el mateix per a totes les preguntes.


        Anàlisi descriptiu d'una variable

        2.1. Distribució de fregüéncies

        Conjunt dels valors de la variable ordenats de forma creixent o decreixent i les freqüéncies absolutes de cada valor.

        • Freqüència absoluta () Nombre de vegades que es repeteix una dada dintre d'un col·lectiu.

        • Freqüència total (N) Nombre total de dades. Es igual a la suma de les freqüències absolutes.

        • Amplitud de la variable. Diferència entre el major i el menor valor de la variable.

        • Freqüència acumula () Suma de la freqüència absoluta de la dada amb les freqüències absolutes de totes les dades anteriors.

        • Freqüència relativa (n¡/N) Quocient entre la freqüència absoluta de la dada i la freqüència total.

        • Freqüència acumulada relativa (N¡/N) Suma de la freqüència relativa de la dada amb les freqüències relativas de totes les dades anteriors.

        • Percentatqe () Freqüència relativa multiplicada per 100.

        • Percentatqe acumulat () Freqüència relativa acumulada multiplicada per 100.

        • Distribució de freqüències dades numèriques sense intervals.



        Exemple: tenim les edats de 20 persones i fem la distribució de freqüéncies.

        'Analisis descriptivo de una variable'

        Distribució de freqüències dades numeriques amb intervals. S'utilitza si la variable té molts de valors. Cada interval ha d'ésser suficientment homogeni perqué l'agrupació efectuada no resulti contradictoria a l'objectiu de la simplificació.

        Amplitud de l'interval (L¡-1 - L¡) Diferència entre l'extrem superior i l'inferior. Els intervals poden ésser d'igual amplitud o diferent amplitud.

        Marca de classe () Semisuma dels extrems de l'interval. S'atribueix aquest valor a la freqüència de l'interval. X¡ = (L¡-1 + L¡) / 2

        Exemple: Tenim les notes d'un examen fet a 20 alumnes i fem la distribució de freqüències agrupant la variable amb intervals.

        'Analisis descriptivo de una variable'

        Distribució de freqüències dades no numériques, variables qualitatives. No tenen sentit les freqú'encies acumulades. Tenim la variable color de cotxes i fem la distribució de freqüéncies.


        'Analisis descriptivo de una variable'

        N¡ No té sentit.

        N¡/N No té sentit.

        p¡ No té sentit.


        2.2. Representació gráfica

        L'objectíu és aconseguir un impacte visual apropiat de les dades.

        Coses a tenir en compte:

        Escala del gràfic per:


        • Interpretar.

        • Comparar.


        Hi ha diferents tipus de gráfics:

        Mesures de posició

        3.1. Definició i classificació

        És un valor que representa i sintetitza a tota la distribució de freqüéncies.


        3.2. Mitjana aritmética simple

        n

         x¡n¡

        -

        =

        ¡=1

        x

        N

        Exemple: Calculem la mitjana de la següent distribució d'edats:


        'Analisis descriptivo de una variable'

        Mitjana = 448 / 20 = 22,4

        Una persona de 22,4 anys seria la que representaria al grup de 20 persones.


        3.3. Mitjana aritmética ponderada

        S'utilitza quan els valors de la variable tenen diferent importància o significació dintre del conjunt de la distribució.

        El pes o importància relativa de cada valor dintre del conjunt, s'anomen ponderació (w¡)

        n

         x¡w¡

        --

        =

        ¡=1

        w

        W

        Exemple: Dos aspirants a la plaça per entrar a una determinada empresa passen diferents proves que tenen diferent importància.

        'Analisis descriptivo de una variable'


        'Analisis descriptivo de una variable'

        Aspirant 1 = 89/12 = 7,4

        Aspirant 2 = 90/12 = 7,5

        El segon aspirant obté una nota més alta, aquest obtindria la plaça.



        Propietats de la mitjana aritmética

        • La mitjana és el centre de gravetat de la distribució. La suma de les desviacions dels valors respecte a ella és igual a zero.  (x¡ - Mitjana)n¡ = 0

        • Si es multipliquen tots els valors de la variable per una constant, la mitjana queda multiplicada per aquesta constant.

        • Si sumem a tots els valors de la variable una constant, la mitjana queda augmentada en aquesta constant.

        • La mitjana de la suma de dos o més variables és igual a la suma de les mitjanes aritmétiques de cada una de les variables. Si no tenen la mateixa freqüéncia total, es calcula la mitjana ponderada.

        Inconvenients de la mitiana aritmética

        Els valors extrems elevats li afecten molt.

        3.4. Mediana

        És el valor que ocupa el lloc central de la distribució quan els valors de la variable estan ordenats.

        Distribució sense freqüéncies:

        Edat

        Edat

        21

        20

        23

        21

        24

        Me = 24

        22

        26

        24

        Me = (22+24)/2 = 23

        28

        28

        29

        Distribució amb freqüéncies.

        'Analisis descriptivo de una variable'


        Si N/2 coinciden amb una freqüéncia acumulada i el número de dades és parell,


        'Analisis descriptivo de una variable'

        La interpretació de la mediana és igual que en el cas de la mitjana. És el valor que representa tota la distribució.


        3.5. Mode

        És el valor de la variable que es repeteix més vegades.

        'Analisis descriptivo de una variable'


        3.6. Utilització de la mitjana, mediana i mode

        El mode només s'utilitza com a única mesura de posició amb les variables qualitatives. Amb les variables quantitatives va acompanyada de la mitjana i/o mediana.

        Normalment s'utilitza la mitjana, acompanyada de la mediana. Casos on l'ús de la mediana, és millor que la mitjana:

        • Quan les dades estan en escala ordinal.

        • Quan poden existir errors.

        • Cas d'existir valors extrems.

        Ingressos de les famílies d'un bloc de pisos:


        'Analisis descriptivo de una variable'

        Mitjana aritmética = 29.900 (no és representativa)

        Mediana = 10.000

        Sense l'últim ingrés:

        Mitjana aritmètica = 9.880

        Me = 9.500

        En aquest cas la millor mesura de posició és la mediana amb totes les dades, es a dir, Me = 10.000


        3.7. Mesures de posició no centráls

        Quartils

        Són tres valors de la variable que la divideixen en 4 parts iguals. Cada part conté el 25% dels valors de la distribució.

        Per calcular la posició d'un quartil determinat s'utilitza la fórmula: kN/4 (k = 1,2,3)

        El valor resultant es busca en la columna de les freqüéncies acumulades i el valor de la variable que correspon a aquesta freqüéncia, és el quartil buscat.

        El quartil 2 = mediana.

        Els quartils 1 i 3 se utilitzen per calcular el gráfic de caixa.

        Exemple: Tenim la següent distribució d'edats i calculem els quartils


        'Analisis descriptivo de una variable'

        1,75/4 = 18,75 Q1 = 20

        2,75/4 = 37,5 Q2 = 26

        3,75/4 = 56,25 Q3 = 30



        Percentils

        Són 99 valors de la variable que la divideixen en 100 parts iguals. Cada part conté el 1% dels valors de la distribució.

        Per calcular la posició d'un percentil determinat s'utilitza la fórmula:
        kN/100 (k=1, 2 ..., 100)

        El valor resultant es busca en la columna de les freqüéncies acumulades i el valor de la variable que correspon a aquesta freqüéncia, és el percentil buscat.

        Percentil 50 = mediana, percentil 25 = primer quartil, etc.

        40,75/100 = 30 P40 = 24 90,75/100 = 67,5 P90 = 35

        Mesures de dispersió i concentració

        4.1. Definició i classificació

        La dispersió o variabilitat és la major o menor separació dels valors de la variable respecta a la mitjana.

        Donen el grau de representativitat de la mitjana.

        Exemples. Salaris de 3 persones amb la mateixa mitjana:

        Empresa 1

        Empresa 2

        190

        0

        200

        x = 200

        200

        x =200

        210

        400


        Empresa 1: mitjana molt representativa

        Empresa 2: mitjana poc representativa


        4.2. Amplitud de la variable

        Diferéncia entre el valor máxim i el mínim. A = xn - x1

        Pot donar una idea sobre la dispersió de la variable, però és poc precisa.

        4.3. Amplitud interguartilica

        Diferéncia entre el tercer quartil i el primer quartil. A| = Q3 - Ql

        Aquesta mesura ens indica l'amplitud del 50% dels valors centrals de la distribució.

        El gráfic de caixa representa gráficament aquesta mesura.

        Permet eliminar els valors extrems de la variable però tampoc és molt precisa.

        4.4. Variáncia

        Quan més elevat el seu valor, més dispersió existirá i la mitjana, será menys representativa.

        Inconvenients:

        • Li afecten les unitats de mesura de la variable per tant és difícil la seva interpretació. A més, és una mesura al quadrat.

        Tenim la distribució de freqüencies d'una variable a una pregunta de valoració.


        'Analisis descriptivo de una variable'

        Mitjana = 1.260/350 = 3,6

        Variancia = (4.960/350) - (3,6)2 = 1,21 La interpretació és impossible.


        Propietats de la variáncia

        • Sempre és positiva.

        • Si sumem a tots els valors de la distribució una constant, la variáncia no varia.

        • Si multipliquem tots els valors de la distribució per una constant, la variáncia queda multiplicada per la constant al quadrat.

        4.5. Desviació estándard o tipos

        És l'arrel quadrada positiva de la variáncia. S = "S2

        Quan més elevat el seu valor, més dispersió existirá i la mitjana, será menys representativa.


        Inconvenients:

        • Li afecten les unitats de mesura de la variable per tant és difícil la seva interpretació.

        S = "1,2114 = 1,1 La interpretació és difícil.

        Propietats de la desviació

        • Sempre és positiva.

        • Si sumem a tots els valors de la distribució una constant, la desviació no varia.

        • Si multipliquem tots els valors de la distribució per una constant, la desviació queda multiplicada per la constant.

        4.6. Coeficient de variació de Pearson

        V (%) = (S / Mitjana) * 100

        Com més elevat més dispersió i per tant, menys representativa la mitjana.

        El valor mínim és zero, en aquest cas, tots els valors coincideixen amb la mitjana, no hi ha dispersió.

        Aquesta mesura ens dona la dispersió en percentatge. Permet interpretar la disperso d'una variables i comparar la de varies variables inclòs si estan en diferents unitats de mesura.

        V = (1,1 / 3,6) * 100 = 30,56

        Hi ha una certa dispersión però no massa, per tant, la mitjana és bastant representativa.

        4.7. Tipicació o estandarització d'una variable

        Tipificar una variable és convertir-la en una nova variable que té de mitjana zero i de variáncia 1.

        Per obtenir els valors tipificats: z¡ = (x¡ - Mitjana) / S

        Utilització práctica: Permet comparar valors que pertanyen a diferents distribucions, donada la adimensionalitat de les dades, un cop tipificades.


        'Analisis descriptivo de una variable'

        Mitjana x = 915 / 4 = 228,8

        Variancia x =
        (210.725 / 4) - (228,8)2 = 354,8

        Desviació estándar o tipus x = "354,7 = 18,8

        z¡ = (220 - 228,8) / 18,8 = -1,5

        z¡ = (225 - 228,8) / 18,8 = -0,2

        La mitjana és igual a zero i la desviació igual a 1.

        Mitjana z = 0 / 4 = 0

        Variancia z = "1 = 1

        Desviació estándar o tipus z =
        (4,01 / 4) - (0)2 = 1



        4.8. Concentració

        La concentració és el major o menor grau d'igualtat en el repartiment del total dels valors de la variable.

        Permeten conéixer el grau d'equidistribució de la variable, és a dir, si els valors de la variable estan distribuits equitativament.

        S'utilitza en variables de tipus econòmic: salaris, rendes, etc.

        4.9. Mesures de concentració

        Índex de Gini

        0 " IG " 1

        Si IG = l Concentració máxima. Tota la renda o salarI está en mans d'una persona.

        Si IG =0 Concentració mínima. Máxima equidistribució de la variable.

        Per calcular aquest índex la variable a analitzar ha d'estar ordenada de menor a major.

        Exemple: Tenim els salaris dels treballadors d'una empresa i calculem l'índex de Gini.

        'Analisis descriptivo de una variable'


        El salari no está distribuit equitativament. El 40,5% dels treballadors obtenen tan sols el 25,1% del total de la massa salarial. Si fos distribuit equitativament, el 40% dels treballadors cobraria el 40% de la massa salarial, i axi successivament.

        IG = 59,04 / 377,03 = 0,16

        El valor de l'índex és baix, per tant, els salaris estan distribuits de forma bastant equitativa, encara que no totalment.


        4.1 0. Corba de Lorenz

        Per representar gráficament la concentració s'utilitza la corba de Lorenz.

        D'utilitzat el p¡ i q¡ fets per calcular l'índex de Gini.

        'Analisis descriptivo de una variable'

        'Analisis descriptivo de una variable'

        'Analisis descriptivo de una variable'

        'Analisis descriptivo de una variable'

        'Analisis descriptivo de una variable'