Statistikkens kunst:
opdag misinformation,
forstå verden og træf
bedre beslutninger

Claus Thorn Ekstrøm

Hvad bruger vi statistik til?

  • Mønstre.
    Hvad ser vi?

  • Forudsigelser.
    Hvad forventer vi at se ved ny observation?

  • Årsagssammenhænge / kausalitet.
    Hvorfor?

1) Er det et stort tal?

30-årige mænd har 10 års skolegang

En dansk årgang er på knap 60.000 børn.


38.065 pladser i Parken


Ca. 13.000 kvinder og 15.000 mænd ofre for vold. Det svarer til 0,4% (♀) og 0,5% (♂).

Ca. 15.000 dør af kræft om året.


DKs bruttonationalproduktet (BNP) for 2022 er 2.797.938.000.000 kr


Middellevetiden for nyfødte er 79,6 år (♂) og 83,4 år (♀).


Referencetal. Lav et katalog!

http://www.isthatabignumber.com/

2) Hvorfor ser jeg dette tal?

Og hvilken følelse får jeg i maven?

Videnskabsmand Brugtvognsforhandler
Vær skeptisk overfor dine resultater “Sælg” dine resultaterne
Fortolk konklusioner forsigtigt Overdriv/spin vigtigheden
Offentliggør negative resultater Offentliggør strategisk
Replicér replicér replicér Replicér … hvis nødvendigt
Nye ekstreme fund mindre tilbøjelige til at være sande Offentliggør hurtigst muligt … før andre

Narrativ, politik, click-bait, nyhedsværdi, argumenter, …

Publication bias

Studier med større effekt er mere tilbøjelige til at blive publiceret.

Fantastiske/overraskende resultater bliver promoveret

\[\text{Observeret effekt} = \text{Sand effekt} + \text{ Støj/usikkerhed}\]

p hacking

p hacking

p hacking

p hacking

3) Hvilken population er repræsenteret?

Politiken 18. februar 2023

4) Optælling er svært

5) Er usikkerheden oplyst?

AI og forudsige død




Tidlig død blandt 30-65 årige

Forudsig død indenfor 4 år

Resultat: 78%

Usikkerhed?

6) Konfundering eller “dark data”?

7) Survivorship bias og “dark data”?

Image from Wikipedia on survivorship bias

8) Sammenhæng eller årsagssammenhæng?

9) Absolut eller relativ forskel?

Risikoforskel: 4 pp

Relativ risiko: 5

Risikoforskel: 4 pp

Relativ risiko: 1.08

10) Confirmation bias?

  1. Er det et stort tal?
  2. Hvorfor ser jeg dette tal?
  3. Hvilken population er repræsenteret?
  4. Optælling er svært
  5. Er usikkerheden oplyst?
  1. Er der mulig konfundering?
  2. Er der mulig survivorship bias?
  3. Sammenhæng eller årsagssammenhæng?
  4. Absolut eller relativ forskel?
  5. Confirmation bias?

Tak

http://tinyurl.com/4rsfsdxu

www.sandsynligvis.dk