Uke 12 - matplotlib / CSV

Obs

matplotlib er et eksternt bibliotek som vi må installere først:

python -m pip install --user matplotlib

Du må kanskje erstatte «python» med en full path (den som vises når du bruker kjøreknappen i VSCode).

Matplotlib

Du kan bruke matplotlib til å visualisere data. Slik som de fleste python-biblioteker, har matplotlib en veldig god dokumentasjon på nettet. Her skal vi bare se på noen enkle bruk av biblioteken.

Les gjennom Intro to pyplot. De bruker et annet eksternt bibliotek, numpy, i noen av eksemplene for å lage lister med verdier. Vi skal se på numpy neste uke, denne uken skal vi bare bruke vanlige lister som input.

Om du er interessert kan du finne flere eksempler til bruk av matplotlib på Sample Plots.

Her er et enkelt eksempel på pyplot (eksempel_1.py):

import matplotlib.pyplot as plt
from math import sin

# liste med x-verdier
xs = [n / 10 for n in range(101)]
# 2 ulike lister med y-verdier
ys_1 = [sin(x) for x in xs]
ys_2 = [3 * sin(x) for x in xs]

plt.plot(xs, ys_1, "-.r")
plt.plot(xs, ys_2, "--b")

# savefig lagrer filene
plt.savefig("test.png")
plt.savefig("test.pdf")

# interaktivt vindu
plt.show()

Denne koden produserer følgende plot:

../_images/eksempel_1.png

Hva skjer om vi ikke har med den siste raden: plt.show()?

Her er et eksempel på flere grafer ved siden av hverandre (eksempel_2.py):

import matplotlib.pyplot as plt
from math import sin

xs = [n / 10 for n in range(101)]
ys = [sin(x) for x in xs]

plt.subplot(221)
plt.plot(xs, ys, "-.r")
plt.ylabel("y")

plt.subplot(222)
plt.plot(xs, [3 * y for y in ys], "--y")

plt.subplot(223)
plt.plot(xs, ys, "-.k")
plt.xlabel("x")

plt.subplot(224)
plt.plot(xs, [3 * y for y in ys], "--b")

plt.suptitle("Several plots")
plt.show()

Denne koden produserer følgende plot:

../_images/eksempel_2.png

Jo flere datapunkter du bruker, desto høyere oppløsning får grafen din. Her er et eksempel på dette (eksempel_3.py):

import matplotlib.pyplot as plt
from math import sin

def square_wave(x):
    return (
        sin(x)
        + 1 / 3 * sin(3 * x)
        + 1 / 5 * sin(5 * x)
        + 1 / 7 * sin(7 * x)
        + 1 / 9 * sin(9 * x)
    )


# Lower resolution
xs = [n / 5 for n in range(51)]
ys = [square_wave(x) for x in xs]
plt.plot(xs, ys, label="51 points")

# Higher resolution
xs = [n / 100 for n in range(1001)]
ys = [square_wave(x) for x in xs]
plt.plot(xs, ys, label="1001 points")

# plot labels
plt.title("Resolution example")
plt.xlabel("x")
plt.ylabel("y")
plt.legend()

plt.show()

Denne koden produserer følgende plot:

../_images/eksempel_3.png

Svar på følgende spørsmål om pyplot:

  • Hvordan lager du en plot?

  • Hvordan får du etiketter på x- og y-aksen i din plot?

  • Hvordan får du en titel høyest opp på din plot?

  • Hvordan bestemmer du farge og mønstre på grafen?

  • Hvordan får du flere grafer oppå hverandre?

  • Hvordan får du flere grafer ved siden av hverandre?

CSV bibliotek

CSV er et enkelt tekstbasert filformat for tabeller. Hver linje holder komma-separerte verdier (CSV: Comma-separated values). Vi skal bare gå gjennom et eksempel her, men «Automate»-boken har mer om CSV i kapittel 16 for de som er interessert.

CSV modulen er fortsett ganske «low-level», og mange skritt i dataanalyse må skrives for hånd. Den eksterne pandas-biblioteken som vi skal se litt på senere, tar bort mange av disse kjedelige oppgavene.

Obligatoriske oppgaver

Del 1 - CSV

  1. Endre del_1a.py og skriv ut antall bedrifter som produserer hver enkelt art (ART, kolonne 12)

  2. Endre del_1b.py og plott kun bedriftene som oppdrar Laks (ART, kolonne 12)

  3. Endre del_1c.py og plott FERSKVANN og SALTVANN med ulike farger (se på VANNMILJØ, kolonne 20)

  4. Endre del_1d.py og kom på et annet interessant spørsmål om datasettet og implementer det.

Testene i del 1 sjekker bare at koden kjører, de ser ikke på outputet. Det skjer kun manuelt når vi retter

Del 2 - Hage

Du og naboen din har begge like store hager. Hagene deres representeres som 2D-lister, hvor garden[i][j], gir et element på posisjonen (i, j). Hvert element i en hage er representert som en streng, og kan være en av de følgende: "grass", "moss", "strawberry", "rock", "raspberry". Du har i det siste sett at det har blitt litt vel mye mose og stein i hagen din, og mistenker at det er naboen din som har lagt det der. For å fikse opp i dette, skal du fullføre funksjonen clean_garden(my_garden, neighbors_garden). Her skal du først lage små funksjoner for å gjøre det enklere å løse den faktiske oppgaven.

Til slutt skal du bytte ut hvert stein og mose fra din hage, med den første jordbær og bringebær fra naboen sin hage som finnes (de to ting som skal byttes trenger ikke å være på samme posisjon).

Lag en funksjon find_item som tar inn to argumenter: (garden, item), som returnerer en (i, j) posisjon som en tuppel, hvis item finnes i garden. Hvis det ikke finnes, returnerer du None

Lag en funksjon swap_items som bytter ut to elementer mellom to hager, la den ta inn disse argumentene: (garden1, garden2, pos1, pos2), hvor pos1 og pos2 er (i, j) tupler. Her skal du ikke returnere noe, men endre listene du får inn som argumenter.

Bruk funksjonene du har definert for å fullføre clean_garden(my_garden, neighbors_garden): Bytt ut all «rock» med «strawberry», og «moss» med «raspberry» fra naboen sin hage så lenge det finnes muligheter for bytte.