Relativ frekvens

Beregning av den relative frekvensen som et mengdediagram

Den relative frekvensen er et divisjonsnummer og et mål på beskrivende statistikk . Det gjenspeiler andelen av elementene i et sett som har en viss karakteristisk verdi. Det beregnes ved å dele den absolutte frekvensen til en funksjon i et underliggende sett med antall objekter i dette settet. Den relative frekvensen er derfor en brøkdel og har en verdi mellom 0 og 1.

Generell matematisk definisjon

Relative frekvenser beregnes i forhold til en underliggende størrelse. Dette settet kan enten være en populasjon eller et utvalg . For å definere den relative frekvensen, la oss anta at det underliggende settet har elementer. Arrangementet skjer under disse elementene . Den relative frekvensen beregnes som antall observasjoner med karakteristikken delt på totalt antall alle elementene i det underliggende settet.

Den relative frekvensen blir derfor funnet som

.

er også kjent som den absolutte frekvensen . I motsetning til den relative frekvensen er det vanligvis ikke mulig å sammenligne mellom prøver (eller populasjoner) av forskjellige størrelser med absolutt frekvens .

Eksempler

Andel jenter i en skoleklasse

I klasse A er det 24 elever, 12 av dem jenter. I klasse B er det 18 elever, 9 av dem jenter. Dette betyr at det er flere jenter i klasse A (12) enn i klasse B (9) hvis du ser på absolutt frekvens. På den annen side, hvis du ser på jentefrekvensen i forhold til den respektive klassestørrelsen, kan du se at andelen jenter er den samme i begge klasser: i klasse A er den relative frekvensen til jenter 0,5 (= 1224 ) og i klasse B er det også 0, 5 (= 918 ). Den relative frekvensen kan også enkelt konverteres til en prosentandel ved å multiplisere den med 100%. Dermed består begge klassene av 50% (= 0,5 × 100%) jenter.

Avstemninger

I en valgmåling blir 600 stemmeberettigede i Bayern intervjuet, samt 200 stemmeberettigede i Berlin. I Bayern gikk til 120 respondenter, partiet A å velge. I Berlin sier 100 respondenter at de ville stemme på parti A. Den absolutte frekvensen for velgere fra parti A er altså høyere i Bayern enn i Berlin, nemlig 120 respondenter i Bayern mot 100 respondenter i Berlin. Dette skyldes imidlertid at tre ganger så mange mennesker ble intervjuet i Bayern som i Berlin. En sammenligning av de absolutte frekvensene er derfor ikke nyttig.

I motsetning tillater den relative frekvensen en sammenligning av populariteten til parti A mellom Bayern og Berlin. I Bayern den relative frekvensen er 0,2 (= 120 / 600 ). For Berlin beregnes den relative frekvensen som 0,5 (= 100200 ). Party A er mye mer populær i Berlin enn i Bayern.

kjennetegn

I motsetning til den absolutte frekvensen er den relative frekvensen alltid mellom 0 og 1. Dette betyr at forskjellige relative frekvenser kan sammenlignes med hverandre, selv om de refererer til en annen referansevariabel. I beskrivende statistikk brukes derfor relative frekvenser for å kunne sammenligne frekvensfordelinger uavhengig av antall elementer i populasjonen (dvs. uavhengig av utvalgsstørrelse ).

I sammenheng med inferensiell statistikk og stokastikk , brukes den relative frekvensen som en maksimal sannsynlighetsestimator for parameter sannsynligheten for suksess for en binomial fordeling .

Følgende beregningsregler gjelder for den relative frekvensen:

  • på grunn av normaliseringen til antall repetisjoner.
  • for den sikre begivenheten .
  • for summen av hendelser.
  • for den komplementære hendelsen.

Relativ frekvens og sannsynlighet

Frekventistisk sannsynlighetskonsept

Det hyppige sannsynlighetskonseptet tolker sannsynligheten for en hendelse som den relative frekvensen den skjer med i et stort antall identiske, gjentatte, uavhengige tilfeldige eksperimenter . Dette er den såkalte 'Limes-definisjonen' ifølge von Mises . Forutsetningen for dette sannsynlighetskonseptet er at eksperimentet kan gjentas etter behov; de enkelte rundene må være uavhengige av hverandre.

Eksempel: Du ruller matrisen 100 ganger og får følgende fordeling: 1 faller 10 ganger (dette tilsvarer en relativ frekvens på 10%), 2 faller 15 ganger (15%), og 3 også 15 ganger (15%) , 4 i 20%, 5 i 30% og 6 i 10% av tilfellene. Etter 10.000 løp har de relative frekvensene - hvis det er en god terning - stabilisert seg i nærheten av sannsynlighetene, slik at f.eks. For eksempel er den relative frekvensen for å rulle en 3 rundt 16,6%.

Den aksiomatiske definisjonen av sannsynlighet brukt i dag som grunnlag for sannsynlighetsteori klarer seg uten å bruke begrepet relativ frekvens. Selv ved å bruke denne definisjonen av sannsynlighet, er det imidlertid et nært forhold (ved hjelp av loven om store tall ) mellom sannsynlighet og relativ frekvens.

Lov om store tall

Lov med stort antall betegner visse konvergenssatser for den nesten sikre konvergensen og konvergensen i sannsynligheten for tilfeldige variabler. I sin enkleste form sier disse setningene at den relative frekvensen til et tilfeldig resultat vanligvis nærmer seg sannsynligheten for dette tilfeldige resultatet hvis det underliggende tilfeldige eksperimentet blir utført om og om igjen. Lovene til store tall kan bevises fra Kolmogorovs aksiomatiske definisjon av sannsynlighet. Dermed er det en nær sammenheng mellom relativ frekvens og sannsynlighet selv om man ikke er representant for den objektivistiske oppfatningen av sannsynlighet.

litteratur

  • Bernhard Rüger: Induktiv statistikk. Introduksjon for økonomer og samfunnsvitere . R. Oldenbourg Verlag, München Wien 1988, ISBN 3-486-20535-8 .

Individuelle bevis

  1. Bernhard Rüger (1988), s. 8 ff.
  2. Bernhard Rüger (1988), s. 11 ff.
  3. a b c Bernhard Rüger (1988), s. 79 ff.