dl005: wetterprojekt
Intro (00:00:00)
Thema des Podcasts (00:00:18)
Willkommen zur fünften Folge des datenleben-Podcast, dem Podcast über Data Science.
Wir sind Helena und Janine und möchten mit euch in die vielfältige Welt der Daten eintauchen.
Daten umgeben uns überall und sind eine wichtige Grundlage für unsere Entscheidungen.
Wie gehen wir mit diesen Daten um?, ist daher eine der wichtigsten Fragen von Data Science.
Neues von uns (00:00:39)
- Helena muss ihre Vorstellung aktualisieren
- Aufgrund der Coronapandemie wurde die Verteidigung ihrer Doktorarbeit verschoben
- Ende Juni wurde die Disputation nachgeholt und 1 Woche vor Aufnahme der Folge kam die Urkunde
- Helena darf sich jetzt offiziell Frau Dr. Helena Schmidt nennen
Thema der Folge (00:02:23)
- Wie bereits in Folge 1 erwähnt, hat Helena zusammen mit Rebecca 2018 ein Wetterprojekt entwickelt
- Zusammen haben sie an der Ausschreibung Summer of Weather Code des ECMWF teilgenommen
- Es gab verschiedene Challenges; die beiden haben sich für innovative visualizations beworben
- Um das Projekt zu entwickeln, hatten sie ein halbes Jahr Zeit
- Als Data Scientist und Designerin waren sie dabei das perfekte Team
- Und wie das ganze abgelaufen ist, welche Hürden es gab und was das Ergebnis ihrer Zusammenarbeit ist, darum geht es heute.
- Dafür begrüßen wir ganz offiziell unseren erstan datenleben-Gast
- Bei uns ist heute Rebecca, auch besser bekannt als Pecca
Vorstellung Pecca (00:03:32)
- Sie hat Kommunikations- und Industriedesign studiert
- Interessiert an Tecknik und in der Hacker- und Maker-Szene aktiv
- Arbeitet derzeit als Redakteurin beim Make-Magazin
- Zuvor in der Öffentlichkeitsarbeit an der Physikalisch-Technischen Bundesanstalt
- Im Zentrum steht für sie, wie komplexe technische und wissenschaftliche Inhalte barrierefrei vermittelt werden können
Was ist an Wettervorhersagen interessant? (00:04:55)
- Jeder kennt Wetterberichte, die sind aber irgendwie oft falsch
- Dabei sagen Wettermodelle sogar wie zuverlässig ein Wetterbericht ist
- Nur weiß das meistens keiner
- Es wird selten übersichtlich dargestellt, Infos an vielen Orten; Temperatur, Regenradar
- Alle Wetterseiten haben das gleiche Designschema F, selten innovative Ansätze
- Einzige deutsche Webseite, die mehr Informationen bietet ist kachelmannwetter
- Aber woher kommt das eigentlich, dass das so wenig zufriedenstellen ist?
Einspieler: Das Wetter und der Mensch (00:07:25)
- Eugen Roth charakterisiert in seinem Gedicht "Immer ungelegen" nicht nur das Wetter
- Er zeigt auch die Abhängigkeit des Menschen vom Wetter, besser gesagt, das ihm Ausgeliefertsein auf
- Das Wetter ist ein komplexes System, das unseren Planeten am Leben erhält
- Es entscheidet über Wachstum, Nahrungsangebot und Nutzbarkeit von Lebensräumen
- Von alten Mythologien, über erste versuche Regelmäßigkeiten zu erkennen bis zu den wissenschaftlichen Anfängen der Meteorologie, hat des Wetter immer eine wichtige Rolle gespielt
- Richard Hamblyn schreibt in "Die Erfindung der Wolken" von 4000 Jahre alten Vorhersagen
- Wenn der Mensch das Wetter nicht versteht, kann zuweilen Ängste schüren, wie etwa im Jahr 1783
- Schwefelhaltiger Nebel zog über Europa, Feldarbeiten konnten ihrer Arbeit kaum nachgehen
- Lungenkrankheiten brachen aus, die Sonne war teils verdunkelt und Asche regnete nieder
- Schuld war der Vulkanausbruch des Laki-Kraters auf Island, der etwa 8 Monate anhielt
- Die Klimaschwankung des Winters 1783/84 gilt als eine der härtesten überhaupt in Mitteleuropa
- Richard Hamblyn schreibt: Ängste konnten sich ausbreiten, da es keine einheitliche Sprache für die Beschreibung der Ereignisse gab
- Es hatte sich noch keine einheitliche Wetterberichterstattung ausgebilde
- Wenn es heißt "seit Beginn der Wetteraufzeichnungen", ist damit eventuell das Jahr 1781 gemeint
- Mit Morsetelegrafen war es ab 1832 möglich schneller zu kommunizieren und Wetterkarten zu erstellen
- Ungenauigkeit von Vorhersagen rührt daher, dass sich Wetter lokal auswirkt, aber global entsteht
- Seit immer mehr Daten erfasst und verarbeitet werden können, werden Wettermodelle immer besser
- Von den Wetterdaten der Aeronauten des 19. Jahrhunderts bis zu Satelliten aus dem All
Wie kamt ihr zu eurem Projekt? (00:12:32)
- Wie habt ihr von der Ausschreibung erfahren und wie seid ihr auf die Idee gekommen mitzumchen?
- Heise-Online hatte die Ausschreibung auf der Seite
- "Summer of Weather Code" klang spannend, da nicht nur auf Studierende und Einzelpersonen bezogen
- Die verschiedenen Themen klangen alle interessant, für Innovativ Visualisations entschieden
- Schwierig war, wie man vermittelt, dass man Expertise hat, ohne Meteorologen zu sein
- Mit Data Science, Desing und einem allgemeinen Verständnis für Wissenschaft gut ausgerüstet gefühlt
- In der Bewerbung hervorgehoben, dass der Blick von außer für innovative Ansätze gerade gut ist
- Die Bewerbung bestand nur aus einem Text und dem Lebenslauf
- Um Designexpertise zu beweisen, haben sie einen "maximal durchdesignten" Lebenslauf eingereicht
- Hattet ihr von vornerein eine Idee, ein Problem im Auge, das ihr mit eurem Projekt beheben wolltet?
- Überhaupt nicht; man musste auch zunächst 4 Vorschläge für Projekte erarbeiten
- Davon werden dann 2 ausgesucht, die in den Mockups über längere Zeit weiter ausgearbeitet werden
- Es war auch vorher völlig unklar, wie Wetterdaten überhaupt aussehen, was man damit machen kann
- Die Betreuer regten an, dass es schön wäre, wenn die Daten auch für Laien verständlicher sind
Was ist ein Mockup? (00:18:17)
- Ein Mockup ist eine "tote Grafik" aus Data Science Sicht, da man die nicht mit echten Daten macht
- Mockup ist erstmal eine Machbarkeitsstudie, man muss erstmal ausprobieren was funktioniert
- Mussten erstmal ein Problem finden, das analysieren und auf die Zielgruppe ausrichten
- Für Nicht-Designer ist es oft schwierig zu verstehen, dass es dabei nur um das Konzept geht
- Und nicht zum Beispiel darum, dass die Farben schon die endgültigen sind oder andere Details
- Die Betreuenden konnten das aber sehr gut einordnen, auch ob die Daten das hergeben etc.
- Mockups sind bereits sehr aufwändig: Beispieldaten generieren, wie stellt man das dar?
- Kreative Lösungen für 3, 4, 5 Probleme ist auch ein großer Aufwand
- War euer finales Projekt auch das, was ihr favorisiert habt?
- Man hat ja Einfluss darauf, wie man es präsentiert; haben gesagt auf welche wir richtig Lust hätten
- Mit den Betreuenden zusammen entschieden; Zusammenarbeit war immer sehr konstruktiv
- Am Anfang stand ja auch noch nicht fest, was für Daten verwendet werden können
- Das Datenformat in der Meteorologie nennt sich NetCDF, Helena bezeichnet es als multidimensional
- Daten für die Welt, für verschiedene Zeitpunkte, die Höhe, Breiten- und Längengrad, weitere Daten
- Aufwand das zu verstehen war größer, auch wie man dann für diese Daten programmiert
Welches Mockup wurde finalisiert? (00:23:25)
- Für ein Meteogramm entschieden, das stellt den zeitlichen Verlauf des Wetters an einem Ort dar
- Idee: Die Unsicherheiten der Wettervorhersagen darstellen
- Ziel: Wenn man eine Wettervorhersage sieht, soll ersichtlich sein, was sehr sicher passiert
- Aber auch, was nicht so sicher vorausgesagt werden kann
- Das ECMFW berechnet 51 verschiedene Wettervorhersagen mit je verschiedenen Startwerten
- Aus diesen kann man eine Statistik rausziehen, wie sicher oder unsicher die Vorhersage ist
- Das Projekt war es dann diese Unsicherheiten darzustellen, sodass sie verständlich sind
- Problem: das ist in unserer Gesellschaft nicht sehr verbreitet
- Anwendungsfall: Ich will in 2 Wochen in den Urlaub und möchte wissen, wie das Wetter wird
- Das Wetterprojekt sollte darstellen in welche Richtung das Wetter wahrscheinlich kippt, wenn es nicht die Vorhersage erfüllen wird
- Zum Beispiel: Es wird 18 Grad und sonnig. Wird es das nicht, wird es kälter und regnerischer
- Man erkennt, dass es keine Chance auf wärmer und sonniger gibt; das gibt eine bessere Planbarkeit
- Ein breiteres Spektrum von Informationen macht die Vorhersage verlässlicher
Wie setzt man so eine Idee um? (00:26:45)
- Schritt 1: recherchieren was andere schon gemacht haben, um Unsicherheiten darzustellen
- Zwei Paper gefunden, die 2018 erschienen sind, die gute Ideen hatten
- Das erste ist der Hypothetical Outcome Plot, hier werden alle Wetterszenarien schnell nacheinander angezeigt wie in einem Daumenkino
- Erlaubt ein Gefühl dafür zu bekommen, wie sich das Wetter verhalten kann
- Haben das implementiert und Personen gezeigt, aber dabei festgestellt, dass Erklärungen nötig sind
- Daher wurde das nicht umgesetzt, auch weil bestimmte Wetterereignisse nicht gut darstellbar waren
- Das zweite waren die Value-Suppressing Uncertainty Palettes für Wahrscheinlichkeitsdarstellung
- Beispiel Wahnlvorhersagen in den USA: Die Bundeststaaten werden entweder blau oder rot eingefärbt
- Jenachdem wer wahrscheinlich die Wahl gewinnen wird
- Je genauer sie das vorhersagen können, desto kräftiger ist die Farbe für den jeweiligen Staat
- Wird zu 100% rot gewählt, ist der Staat auch sehr kräftig rot eingefärbt
- Wenn eine Vorhersage schwierig ist, es aber eher rot wird, dann wird der Staat hellrosa eingefärbt
- Die Legende wurde als Tortenstück umgesetzt, das von Rot über Hellrot und Hellblau zu Blau geht
- So ein Übergang zeigt viel besser an, dass der helle Bereich Unsicherheit bedeutet
- Das war sehr inspirierend, denn das ist beim Wetter ja genauso, daher dafür dann entschieden
Wie wurde das auf das Wetter angewendet? (00:32:24)
- Anwendung auf Wetter: Nur mit Farben zu arbeiten, erschien unübersichtlich, daher Piktogramme
- Entschieden den Ansatz weiter zu entwickeln: Value Suppressing Uncertainty Pictograms
- Herausforderung im Design: Leitlinie ist Gleiches gleich behandeln, das heißt man muss 2 Codierungen für eine Information anbieten
- Eine sichere Vorhersage für Regen ist ein offener Regenschirm und eine weniger sichere dann ein geschlossener Regenschirm der blasser ist
- Für mehr Barrierefreiheit wurde eine Farbpalette gewählt, die auch bei Farbsehschwächen funktioniert
- Das heißt das Türkis war mal mehr blau, mal mehr grün, je nach Wahrscheinlichkeit
- Macht man das Bild dann mal schwarz-weiß, sieht man, dass die Töne sehr unterschiedlich aussehen
- Man muss insgesamt viel ausprobieren und auch immer testen: ist das überhaupt nachvollziehbar
- Bei Temperatur für einen Graphen entschieden, der je nach Wahrscheinlichkeit schmal oder breit ist
- Auch hier: Gleiches gleich behandeln, der Graph hat auch Transparenz für Wahrhscheinlichkeiten
Wie arbeitet man dann mit den Daten? (00:38:35)
- Die NetCDF-Dateien sind sehr groß
- Bei dem Wettermodell gibt es einen Datenpunkt für 6 Stunden, also für alle 6 Stunden ein Piktogramm
- Je mehr Tage man in die Zukunft geht, desto mehr Unsicherheit kommt auch in die Vorhersage mit rein
- Wobei es auch sein kann, dass das Wettermodell schon nach zwei Tagen sehr unsicher ist
- Oder auch mal, dass es für 2 Wochen sehr sicher vorhergesagt werden kann
- Problem in der Darstellung: Unsicherheit darf nicht so aussehen, als wisse man nicht, was man tut
- Standardinfos wurden daher auch schnell zugänglich präsentiert
- Für jeden Zeitpunkt gab es dann 3 Piktogramme: Regen, Wolkenbedeckung, Wind, dazu dann Temperatur als Graph
- Woher weiß man welches Piktogramm wann in welcher Abstufung/Wahrscheinlichkeit auftaucht?
- Haben drei verschiedene Datentypen und drei verschiedene Grenzwerte genommen
- Beispiel Regen: da muss man sich schon sehr sicher sein, wenn also 90% der Vorhersageszenarien angeben, es regnet nicht, dann erscheint "kein Regen"
- Während bei Wind andere Werte kommen, die stärke von Wind ist auch extrem subjektiv
- Da müsste man nochmal auch Umfragen machen, ob sich Menschen damit gut informiert fühlen
- Icons im Bereich Regen und Sonne sind schon sehr gängig, bei Windstärke sind sie eher streitbar
- Zum Beispiel für Menschen, die Modellflugzeuge fliegen
- Habt ihr bereits schon Eindrücke von Menschen gesammelt?
- Eine funktionierende Version, die man online stellen konnte, gab es erst einen Monat vor Ende
- Die konnte auch noch nicht so richtig alles
- Am Anfang vielen Leuten die verschiedenen Konzepte gezeigt, um nach Bedürfnissen zu gucken
- Am Ende ging es hauptsächlich darum, die Präsentation des Projektes auszuarbeiten
- Es fehlt zum Beispiel noch die Unterscheidung von Regen und Schnee; auch Gewitter
Mit welchen Tools wurde gearbeitet? (00:49:12)
- Pecca arbeitet gerne mit dem OpenSource Vektorgraphikprogramm Incscape
- Mit Übung geht das sehr fix, da sind anfangs die Mockups und später die Icons erstellt
- Um die Icons auch immer in der aktuellsten Version einbinden zu können, wurde Gitlab verwendet
- Helena hat für das Programmieren die Sprache Python verwendet; den Webdienst speziell mit Flask
- Mit Flask kann man in Python schnell einen Webserver aufbauen mit Suchfeldern etc.
- Auf der Seite konnte man den Ort eingeben und der Server hat die Daten beim ECWMF angefragt
- Man muss Verschiedenes berücksichtigen, wie Höhenangaben um die richtige Temperatur auszugeben
- Die Graphiken wurden mit Matplotlib programmiert, hat aber einige Tücken, die man kennen muss
- Z.B., dass generierte Bilder gespeichert bleiben und irgendwann der Server überlaufen ist
- Oder bei zwei gleichzeitigen Anfragen entsteht ein vermischtes Bild
- Grund ist: Bestimmte Programmteile werden zu bestimmten Zeitpunkten durchgeführt
- Das kann man umgehen, wenn man die Einstellungen kennt; zu sehen im Programmcode auf Github
- Schwierig war auch die unterschiedlichen Teile, Piktogramme und Graphen, einzubauen
Wie gestaltet man die Anwendung übersichtlich? (00:54:42)
- Im Design ist das magische Wort "Weißraum", man muss den Dingen platz lassen für Übersichtlichkeit
- Viele Infos an einem Ort muss man ordentlich strukturieren und aufräumen
- In der Anwendung gibt es kompakte und größere Graphiken, je nachdem über wie viele Tage man anzeigt
- So eine Woche ist eigentlich am übersichtlichsten
- Es ist so praktisch und schön geworden, dass beide es begeistert benutzt haben, solange es ging
- Schwer ist, wie man an diese Daten kommt, die sind nicht frei zugänglich, offene Daten wären schön
- Die zur verfügung gestellte Datenquelle wurde nach einem Jahr geschlossen für die Anwendung
- Es wäre aber cool daran weiterzuarbeiten und andere Datenquellen anzapfen zu können
Wie hat sich die interdisziplinäre Zusammenarbeit gestaltet? (00:58:03)
- Konntet ihr euch gut austauschen oder hat sich jeder mehr auf seiner eigenen spielwiese ausgetobt?
- Anfangs ging es bei Helena erstmal darum die Daten zu verstehen
- Pecca hat schonmal verschiedene Designs angesehen und rumprobiert, sich informiert was es gibt
- Nach der Recherche haben sie ihr Wissen zusammen gebracht und Sachen miteinander entwickelt
- Im Design ist es allgemein so, dass man mit mehr Leuten auch auf mehr Ideen kommt
- Zu wissen wie die Daten aussehen und funktionieren, ist wichtig für die Frage, wie man sie darstellt
- Sich gegenseitig für das Thema/den Schwerpunkt des anderen zu interessieren, ist sehr wichtig
- Um am Ende eine technisch sinnvolle und optisch bedienbare Lösung zu entwickeln
Fazit (01:02:48)
- Darstellung für Wetter gefunden, die Spaß macht und bestimmt auch für andere Menschen hilfreich ist
- Was würde sich — wenn jeder das benutzen könnte — für die Menschen verändern? In einem Satz:
- "Die Leute hätten viel mehr Vertrauen in Wettervorhersagen."
- Gibt es Pläne das Projekt weiterzuverfolgen?
- Konkrete Pläne gibt es nicht, sind aber offen dafür es weiterzuführen
Nächste Folge: #FrauenLesen am 17.10.2020 (01:05:26)
- Unter dem Hashtag #FrauenLesen teilen in den sozialen Netzwerken engagierte Leser*innen Bücher, die von Frauen geschrieben wurden
- Gedanke dahinter: Frauen als Autorinnen und allgemein im Literaturbetrieb sichtbarer machen
- Es gibt die Meinung, dass Frauen im literarischen Kanon weniger präsent sind, weil sie angeblich auch weniger relevante Literatur geschrieben haben
- Wir möchten in der nächsten Folge etwas den Daten auf den Grund gehen
Call to Action (01:06:48)
- Wenn euch unser Podcast gefällt, empfehlt uns weiter, folgt uns aus Twitter unter @datenleben
- Oder besucht unsere Webseite: www.datenleben.de
- Habt ihr Fragen oder Themenvorschläge, dann schreibt uns bitte; gerne per E-Mail oder Twitter
Outro (01:07:26)
Schlagworte zur Folge
Wetter, Wahrscheinlichkeiten, Visualisierung von Daten, Teilnahme an Ausschreibungen, Projektabläufe, Entwicklung
Quellen
- ECMWF: Summer of Weather Code 2018
- kachelmannwetter.com
- Wikipedia: Laki-Krater
- Deutscher Wetterdienst: Wie entsteht eine Wettervorhersage?
- Lebenslauf zur Bewerbung beim Summer of Weather Code 2018
- [Wikipedia: NetCDF
- Jessica Hullman et al.: Hypothetical Outcome Plots Outperform Error Bars and Violin Plots for Inferences about Reliability of Variable Ordering
- Michael Correll et al.: Value-Suppressing Uncertainty Palettes