Åpen oppgave

Åpen oppgave

I denne siste oppgaven til INF100 kan du velge selv hva du skal jobbe med, så lenge du har med følgende punkter:

Forslag til datasett

Grenselinjene

Denne kilden brukte vi flere ganger, både med Turtle og Matplotlib: https://gadm.org/download_country.html

Filen vi brukte var Norway -> GeoJSON level-0, som har kun de eksterne grensene. Level-1-filen inneholder fylkesgrenser, og level-2-filen har kommunegrenser med.

Et mulig prosjekt kan være å spørre brukeren om et kommunenavn og så plotte kun den kommunen sammen med landegrensen.

Disse datafilene kan også godt kombineres med…

Populasjonsdata

https://www.geonames.org/ har mange spennende datasett, som er tilgjengelige under http://download.geonames.org/export/dump/. F.eks de fleste stedsnavn i et land (NO.zip) eller alle byene i verden (cities15000.zip)

Dataformatet er CSV med delimiter="\t" istedenfor ";". En beskrivelse av de ulike kolonnene finnes i readme.txt

Her kan du f.eks plotte byene med ulik størrelse avhengig innbyggertallet, eller sammenligne gjennomsnittsstørrelsen på alle byer med B som forbokstav mot de med O.

Andre geografiske datasett

Ikke-geografiske datasett

Fivethirtyeight

Nettsiden https://fivethirtyeight.com/ har sine kildefiler tiljengelig som CSV her: https://data.fivethirtyeight.com/

Noen jeg likte der:

Statistisk sentralbyrå

SSB tilbyr CSV- eller JSON-nedlasting av sine analyser. Detaljene og en forklaring hvordan settene kan lastes ned er på https://www.ssb.no/api/slik-bruker-du-api-med-ferdige-datasett

En oversikt over de tilgjengelige datasett er https://data.ssb.no/api/v0/dataset/list.csv?lang=no

Andre kilder?

Hvis du finner andre kilder som du vil dele, gjerne gi beskjed i discord, da kan vi legge dem til her.