På kurset benytter vi statistikprogrammet R som værktøj til at lave statistiske analyser og datahåndtering.

R er et program og programmeringssprog designet til at lave statistiske udregninger og grafik. R findes til Windows, mac OS X og Linux, og programmet kan gratis hentes fra hjemmesiden www.r-project.org og programmet bedes blive installeret inden kursusstart. Fra hjemmesiden vælges først download (CRAN), derefter en server i nærheden af Danmark, hvorefter man kan hente og installere R. Vi bruger R fordi det er blevet de facto standarden indenfor statistisk software, fordi det gør det let at reproducere sine resultater, og fordi R nyder godt af et stort og dynamisk brugermiljø, der er med til at lave udvidelsespakker til R. Det betyder, at mange nyudviklede analysemetoder leveres med kode til R, så alle brugere kan anvende disse nye metoder uden at skulle programmere dem selv - alt sammen inde fra R.

R fungerer ved at man skriver kommandoer til programmet, som så udføres. Ved første øjekast kan indlæringskurven derfor virke stejlere end for programmer, men R er ikke sværere at lære end andre statistikprogrammer, og så snart man er fortrolig med programmet har man adgang til et af de stærkeste statistiske analyseværktøjer, der findes.

Se desuden mere i appendiks A og i videoerne fra DataCamp.

Pakken stat4med

Vi stal bruge en række datasæt, som jeg har samlet i pakken stat4med. Den findes ikke på CRAN, men skal installeres manuelt.

Hvis man er på windows kan man køre følgende kommando direkte i R

install.packages("http://www.biostatistics.dk/puff/data/stat4med_0.0.0.9000.zip", repos=NULL)

og hvis man er på Mac OSX eller linux skal man køre følgende

install.packages("http://www.biostatistics.dk/puff/data/stat4med_0.0.0.9000.tar.gz", repos=NULL)

Så burde pakken være installeret, og man kan køre

library("stat4med")

for at få adgang til datasættene.

Husk at install.packages() svarer til at man installerer en lampe. Det behøver man kun at gøre en gang. library() svarer til at vi tænder for lyser - det skal man gøre hver gang man har en R session, hvor funktionerne eller datasættene fra pakken skal bruges.

Opsætning af R Studio

Jeg har sat R studio op på en måde, som fungerer godt til den måde, som jeg arbejder med R i R Studio. Ændringerne består i, at

  1. jeg har byttet rundt på placeringen af de 4 vinduer i R Studio. Jeg bruger næsten aldrig Environment, History og Connections, så jeg har byttet rundt p ådet og på Console så jeg har så meget plads til at skrive kode i som muligt.

    Opsætningen kan ændres, når man går ind i den globale opsætning i R Studio via Tools -> Global options på Windows eller via RStudio -> Preferences på Mac. Herefter vælges Pane layout, og min opsætning ses nedenfor.

  2. jeg har ændret farveopsætningen så jeg ikke bruger den almindelige hvide baggrund. Det føles lidt trættende for øjnene, når man sidder meget foran skærmen. Det er valgt under Appearance

  3. fjerne et flueben i “Show output inline for all R Markdown documents”, så output altid bliver vist i konsollen.


Lavet af Claus Ekstrøm 2020. Siden er sidst opdateret 28 July, 2020