Archive: Episoden

dl045: jahresrückblick 2023

dl045: jahresrückblick 2023

Willkommen zum traditionellen Jahresrückblick. Wir nehmen uns wieder Zeit, etwas über unser Podcastjahr zu reflektieren. Und dann stellen wir uns natürlich der Frage, welche Data Science Themen dieses Jahr im Fokus standen. Spoiler: wir landen wieder bei der sogenannten KI und verschiedenen Anwendungen. Und wir kommen auf einzelne Themen von vergangenen Folgen nochmal zurück, zu denen wir noch kleine Ergänzungen gefunden haben. Wie zum beispiel zu unserer Folge über Whisper oder zu den Gartenvögeln. Und am Ende fragen wir uns wieder, was uns im neuen Jahr wohl erwarten wird.

dl044: datenvisualisierung mit ggplot

dl044: datenvisualisierung mit ggplot

Unsere Reihe zum Thema Datenvisualisierung geht weiter! Wir reden über ggplot, das ist nämlich ein nützliches Tool, um Graphen mit der Programmiersprache R zu erstellen. Am Anfang geht es um das Buch „Grammar of Graphics“ und die darin vorgestellten Prinzipien für das Erzeugen von Plots. Danach erläutert Helena, wie sich diese Prinzipien in der Arbeit mit ggplot angewendet werden. Und dann gehen wir auch mit Beispielen ein bisschen konkreter auf einzelne Sachen ein, die dabei eine Rolle spielen. Und zum Schluss wollen wir noch ein bisschen die Vor- und Nachteile abwägen.

dl043: perspektiven auf data science

dl043: perspektiven auf data science

Wir glauben, dass in Data Science sehr viele verschiedene Perspektiven stecken. Deswegen wollten wir mal verschiedene Menschen aus dem Bereich Data Science sprechen und fragen, was sie so machen. In kurzen und nicht ganz so kurzen Interviews wollten wir herausfinden: Was macht ihr als Data Scientist/mit Data Science? Wie seid ihr dort hingekommen, das jetzt zu machen? Und: Was interessiert oder begeistert euch am meisten an dem, was ihr tut? Es wird um Sensordaten gehen, um die verschiedenen Wege, die Menschen zu Data Science gebracht haben und natürlich auch… große KI-Modelle wie Chat-GPT.

dl042: die erde, asteroiden und wahrscheinlichkeiten

dl042: die erde, asteroiden und wahrscheinlichkeiten

Willkommen zur Folge mit der Antwort auf das Leben, das Universum und den ganzen Rest. Es geht um Wahrscheinlichkeiten. Und zwar darum, wie Asteroiden beobachtet werden und deren Flugbahnen berechnet werden. Wie wahrscheinlich ist so ein Ereignis? Und wie gefährlich kann es uns werden, wenn es eintritt? Wir haben uns angesehen, wie das berechnet wird. Aber auch, welche Objekte am Himmel gerade unter Beobachtung stehen. Ausserdem auch, was die Erde schon getroffen hat und was es mit dem Asteroiden Bennu auf sich hat, der schon viele Jahre von Forschenden genauestens unter die Lupe genommen wird. Und natürlich müssen wir auch kurz darüber reden, wie solche Ereignesse verhindert werden können, wenn sie nur früh genug entdeckt werden.

dl041: barrierearme datenvisualisierung

dl041: barrierearme datenvisualisierung

In dieser Folge geht es endlich mal wieder um Datenvisualisierung. Wir haben uns die Frage gestellt, wie visualisierte Daten möglichst barrierearm zur Verfügung gestellt werden können. Dafür haben wir uns mit Anne-Victoria Meyer (Anvi) unterhalten. Sie hat sich in ihrer Masterarbeit intensiv mit diesem Thema beschäftigt – und zwar aus der Perspektive einer Webentwicklerin. Dabei hat sie auch eine praktische Studie durchgeführt anhand eines eigenen Prototypen für barrierearme Datenvisualisierung.

dl040: wie nutzen wir whisper für transkripte?

dl040: wie nutzen wir whisper für transkripte?

Machine Learning und Neuronale Netze sind mittel, um uns potentiell Arbeit abzunehmen. Whisper ist zum Beispiel ein Machine Learning Modell, das Sprache in Audiodateien erkennen und in Text verarbeiten kann. Damit die Inhalte unserer Folgen für viele Menschen gut zugänglich sind, haben wir seit Anfang 2023 komplette Transkripte in unseren Shownotes, die wir mit Hilfe von Whisper erstellen. Zeit mal darüber zu reden, wie wir das finden, was für Erfahrungen wir gemacht haben und — besonders spannend — ob Whisper halten kann, was wir uns davon versprochen haben.

dl039: was sind natürliche experimente?

dl039: was sind natürliche experimente?

Experimente sind eine wichtige Methode, um Erkenntnisse über uns und die Welt in der wir leben, zu gewinnen. Aber nicht alles lässt sich mit planbaren Experimenten im Labor untersuchen. Dann müssen wir auf Beobachtungen zurückgreifen. Wir reden darüber, was Experimente sind und wann sie warum u.a. nicht möglich sind. Und wir gehen der Frage nach: Was sind natürliche Experimente und wie können mit ihnen Erkenntnisse gewonnen werden? … und wie nicht? Weitere wichtige Schlagworte dieser Folge sind: Korrelation & Kausalität und Ethik.

dl038: data feminism

dl038: data feminism

Was ist data feminism und was hat das mit Macht zu tun? Diese Folge heißt „data feminism“, was gleichzeitig der Titel des Buches ist, über das wir reden werden. „Data Feminism“ wurde von Catherine D’Ignazio und Lauren F. Klein geschrieben. Laut den Autorinnen ist Data Science eine Form von Macht mit der sowohl Gutes, als auch Schlechtes getan werden kann. Und wie das mit der von den Autorinnen präsentierten Perspektive des intersektionellen Feminismus zusammenhängt, werden wir uns näher ansehen. Dafür haben wir uns 3 Kapitel des Buches genauer angesehen und werden darüber reden, welche Beobachtungen, Beispiele und Anmerkungen wir dabei vorfinden.

dl037: citizen science und die gartenvögel

dl037: citizen science und die gartenvögel

Wir reden über Vögel – und mehr. Bei der „Stunde der Gartenvögel“ vom Naturschutzbund Deutschland (NABU) heißt es: Zählen, zählen, zählen. Seit vielen Jahren ruft der NABU bundesweiten dazu auf, bei der Datenerhebung zu helfen. Wir haben uns die Broschüre „15 Jahre Stunde der Gartenvögel“ des NABU angesehen und fragen uns: Was kam dabei raus? Wie sieht die Methode der Untersuchung aus? Wie können die Citizen Scientists mitmachen? Es geht also um Methoden der Datenerhebung, um Bürger*innen-Beteiligung und um die kleinen gefiederten Nachbarn in unseren Gärten und Grünanlagen.

dl036: graphentypen 2 – histogramme, boxplots, etc.

dl036: graphentypen 2 – histogramme, boxplots, etc.

In unserer Reihe zu Graphentypen geht es um verschiedene Daten und welche Arten der Darstellung es für diese gibt. Im ersten Teil (dl029: graphentypen – skalen und zeiger) ging es um die kleinste Einheit: um eindimensionalen Daten. Dieses Mal wird es ein bisschen komplexer. Wir reden über Graphentypen, mit denen sich eindimensionale Verteilungen abbilden lassen. Es geht um Histogramme, Boxplots, Violinenplots und kumulierte Häufigkeiten. Welche Darstellung eignet sich für welchen Zweck? Worauf kann man bei der Auswahl des Plots achten? Und überhaupt: Womit erstellt mensch eigentlich modern aussehende Plots?