Statistikkens kunst

Opdag misinformation,
forstå verden og
træf bedre beslutninger

Claus Thorn Ekstrøm
Biostatistik, KU

April 26, 2023

Statistik er svært

Pris 399 kr

Moms: 25%

Hvad er prisen uden moms?

Hvad bruger vi statistik til?



  • Mønstre.
    Hvad ser vi?

  • Prædiktion.
    Hvad forventer vi at se ved ny observation?

  • Kausalitet.
    Hvorfor?

1) Er det et stort tal?


38.065 pladser i Parken


DKs bruttonationalproduktet (BNP) for 2022 er 2.797.938.000.000 kr


Ca. 15.000 dør af kræft om året.

Ca. 15.000 dør af kræft om året.


38.065 pladser i Parken


DKs bruttonationalproduktet (BNP) for 2022 er 2.797.938.000.000 kr





  • Referencetal. Lav et katalog.
  • Visualisering.
  • Forhold.


http://www.isthatabignumber.com/

2) Hvorfor ser jeg dette tal?

Incitamentsstruktur

Videnskabsmand Brugtvognsforhandler
Vær skeptisk overfor dine resultater “Sælg” dine resultaterne
Fortolk konklusioner forsigtigt Overdriv/spin vigtigheden
Offentliggør negative resultater Offentliggør strategisk
Replicér replicér replicér Replicér … hvis nødvendigt
Nye ekstreme fund mindre tilbøjelige til at være sande. Dobbeltcheckes Offentliggør hurtigst muligt … før andre

Narrativ, politik, click-bait, nyhedsværdi, argumenter, …

3) Hvilken population er repræsenteret?

Politiken 18. februar 2023

4) Optælling er svært

5) Konfundering eller “dark data”?

6) Survivorship bias og “dark data”?

Image from Wikipedia on survivorship bias

7) Sammenhæng eller årsagssammenhæng?

8) Absolut eller relativ forskel?

5% vs 1%




Risikoforskel

4 pp




Relativ risiko

5

55% vs 51%




Risikoforskel

4 pp




Relativ risiko

1.08

9) Er usikkerheden oplyst?

Omfavn usikkerheden

https://covid19.ssi.dk/

10) Confirmation bias?

På falderebet

Kan det virkelig passe?

AI og kunstig intelligens - don’t believe the hype

Tak

Tre hurtige spørgsnmål:



tinyurl.com/2p924hpr

www.sandsynligvis.dk

  1. Er det et stort tal?
  2. Hvorfor ser jeg dette tal?
  3. Hvilken population er repræsenteret?
  4. Optælling er svært
  5. Er der mulig konfundering?
  6. Er der mulig survivorship bias?
  7. Sammenhæng eller årsagssammenhæng?
  8. Absolut eller relativ forskel?
  9. Er usikkerheden oplyst?
  10. Confirmation bias?