Én kategorisk parameter#

Forutsetninger og læringsmål#

Læreplan #

Annet#

Introduksjon#

Vi skal nå snakke om statistikk med en kategorisk parameter. Eksempler er nasjonalitet, mynt/kron, farge og is-smak. Vi forutsetter altså ikke at verdiene kan ordnes; vi forutsetter for eksempel ikke at is-smakene kan sorteres i noen gitt rekkefølge.

Det meste av det vi sier kan også brukes om situasjoner hvor det er mulig å ordne verdiene (f.eks. når vi forutsetter at ⚁ er større enn ⚀).

Eksempler#

Is-smak#

Vi forutsetter at en kuleis har tre smaker: Jordbær 🔴, blåbær 🔵 og pistasj 🟢. Det er ikke gitt noen ordning mellom disse. Utfallsrommet kan altså representeres ved {🔴, 🔵, 🟢}.

Terningkast#

Vi forutsteter at et terningkast har utfallsrommet: {⚀, ⚁, ⚂, ⚃, ⚄, ⚅}.

Her kan man riktignok si at det eksisterer en ordning: ⚅ > ⚄. Vi kan altså si at dette er en ordnet parameter. Men den ordningen skal vi (foreløpig) ikke bruke.

Vi kan tilmed si det eksisterer en addisjonsoperator: ⚀ + ⚁ → ⚂. Denne skal vi heller ikke bruke.

Representasjoner#

Utfallsrom med utheving av gunstige utfall#

Hendelsen “Minst 5”
Vi kan tegne opp utfallsrommet i en liste, som i figuren. Dette er beslektet både med en tabell og med Venn-diagram. I eksempelet til høyre har vi også tatt med en hendelse (“minst fem”) og vist utfallene med lilla bakgrunnsfarge.

Tabell over data#

Den vanligste måten å sette opp data på er å la objektene i populasjonen være rader (linjer), og parametrene kolonner. I kast med én terning har vi vel bare én parameter (en annen kunne kanskje være hvor mange sekunder hvert kast tok). I tabellen til høyre har vi også tatt med en kolonne for kastnummer.

Vi kunne også tatt med kolonner for hendelsene “er partall” og “er minst tre”.

Dette er altså en tabell over TODO, ikke over utfall; hver rad er en kjøring av eksperimentet, ikke et utfall.

Frekvenstabell over utfall#

En frekvenstabell er en tabell over utfallsrommet; utfallene er hver sin rad. En av kolonne angir frekvens. I eksempelet til høyre har vi også tatt med kolonner for relativ frekvens og teoretisk frekvens.

Vi kunne også tatt med rader for hendelsene “er partall” og “er minst tre”.

Frekvensdiagram#

Histogram over terningkast
I et frekvensdiagram er frekvensen (antallet) på vertikal akse. Utfallsrommet er på horisontal akse.

Formelspråk#

Et utfallsrom kan skrives som en mengde: {⚀, ⚁, ⚂, ⚃, ⚄‚ ⚅}.

Frekvens#

Frekvensen til en hendelse er antall ganger hendelsen skjer. En gang vi kastet en terning ti ganger, fikk vi tre eller mer syv ganger. Frekvensen var altså 7. Frekvens kan også kalles “empirisk frekvens”, “faktisk frekvens” eller “frekvens i en populasjon”.

Totalfrekvens#

Totalfrekvensen er summen av frekvensene over hele utfallsrommet. Kaster vi en terning ti ganger, blir totaltfrekvensen 10.

“Totalfrekvens” er ikke veldig vanlig begrep i norske lærebøker.

Relativ frekvens#

Relativ frekvens til en hendelse er \(\frac{\textrm{frekvens}}{\textrm{total frekvens}}\). En gang vi kastet en terning ti ganger, fikk vi tre eller mer syv ganger. Relativ frekvens er altså lik \(\frac{7}{10}\) eller 70%.

Total relativ frekvens er alltid 1, dvs. 100%.

Vi skal senere se at “relativ frekvens” likner veldig på “sannsynlighet”. Total sannsynlighet er alltid 1, dvs. 100%.

Teoretisk frekvens#

Det vi har snakket om hittil er “empirisk frekvens” — frekvens vi har talt opp i faktiske data. Vi skal senere snakke om teoretisk frekvens — frekvens vi har regnet ut teoretisk. Den teoretiske frekvensen for å få ⚅ når vi har ett terningkast er ⅙.

Vi skal også se på “store talls lov”: Når vi har mange observasjoner (terningkast) vil den empiriske relative frekvensen nærme seg den teoretiske frekvensen.

Ikke-overlappende#

At to hendelser er ikke-overlappende betyr at de ikke har felles utfall. ”Få 1” og “få minst tre” på terning er ikke-overlappende. “Få partall” og “få minst tre” er derimot overlappende.

Algoritmer#

Lover#

Frekvens for ikke#

Frekvensen for at noe ikke skjer er lik total frekvens minus frekvens. Frekvensen for å ikke få minst tre i 20 kast er lik 20 − frekvensen for å få minst tre. I vårt eksempel er det 3.

Relativ frekvens for at A ikke skjer er lik 100% minus relativ frekvens for at A skjer.

Vi skal senere se at sannsynligheten for ikke A = 100% - sannsynligheten for A: \(P(¬A) = 1 - P(A)\).

Addisjonsregelen#

https://www.matematikk.org/artikkel.html?tid=154553&within_tid=154366

  • assosiert med eller.

Addisjonssetningen for mengder QEDsetn5s793

Talltyper#