US-Wahlen 2024: Datenmonitoring in Swing States
Einleitung
Im Rahmen eines analytischen Projekts bei DryShaft Data Lab war ich an der Entwicklung einer Plattform beteiligt, die die Dynamik des US-Präsidentschaftswahlkampfs 2024 beobachtete. Ziel war es, Daten aus Medienquellen, sozialen Netzwerken und Prediction Markets zu aggregieren, um entscheidende Veränderungen in der öffentlichen Wahrnehmung und den Markterwartungen zu erkennen.
Nach dem Super Tuesday (5. März 2024) wurden vier sogenannte Swing States mit besonders dynamischer Marktentwicklung ausgewählt: Michigan, Pennsylvania, Wisconsin und Nevada. Auch für Bundesstaaten mit stabilen Mehrheitsverhältnissen (z.B. Kalifornien oder Texas) wurden Daten erfasst, allerdings mit geringerem Analysefokus. Eine Auswahl dieser aggregierten Prognosedaten ist im Abschnitt Marktdynamik in den Schlüsselstaaten ↓ visualisiert.
Meine Rolle
Ich arbeitete in einem dreiköpfigen Team, das für die Erhebung und Verarbeitung von Daten aus nationalen und regionalen Medien zu zwei dieser Bundesstaaten verantwortlich war.
- Recherche und Bewertung neuer Quellen (Zeitungen, Agenturen, Blogs, Expertenmeinungen)
- Entwicklung von Web-Scrapern in Python (Selenium, Grab, BeautifulSoup)
- Integration der Google Natural Language API (Sentimentanalyse, Entity Recognition, Textklassifikation)
- Speicherung und Strukturierung der Daten in PostgreSQL und MongoDB
Darüber hinaus war ich für die stündliche Erhebung von Daten aus Prediction Markets (Polymarket) via WebSocket zuständig und stellte die Verfügbarkeit über ein REST-Interface auf Basis von FastAPI sicher. Ich koordinierte interne Abläufe in unserem Mini-Team, kommunizierte mit Data Engineers und Tradern und sorgte für die Stabilität des Systems.
Methodik
- Automatisiertes Scraping aus über 100 Quellen
- Strukturierte Aufbereitung von Mediendaten (Datum, Region, Länge, Erwähnungen)
- Semantische Analyse mit Google Natural Language AI
- Stündliche Aktualisierung der Wahrscheinlichkeiten aus Prediction Markets
- Entwicklung eines REST-Backends mit FastAPI
- Grafische Darstellung marktrelevanter Dynamiken zu Schlüsselereignissen
Schlüsselereignisse im Wahlkampf
- 27. Juni 2024: Erstes Präsidentschaftsduell Biden vs. Trump (CNN)
- 15.–18. Juli 2024: Republikanischer Parteitag – Nominierung von Donald Trump und JD Vance
- 21. Juli 2024: Rückzug von Joe Biden aus dem Rennen
- 19.–22. August 2024: Demokratischer Parteitag – Nominierung von Kamala Harris und Tim Walz
- 10. September 2024: Zweites Präsidentschaftsduell Trump vs. Harris (ABC)
Marktdynamik in den Schlüsselstaaten
Technologien
Python · FastAPI · PostgreSQL · MongoDB · Selenium · Google Natural Language API · WebSocket · REST
Einschränkungen
Das Projekt unterliegt einer Vertraulichkeitsvereinbarung (NDA). Detaillierte Auswertungen des Nutzerverhaltens auf Prediction Markets bleiben vertraulich. Die erhobenen Daten wurden ausschließlich zur internen Analyse und Handelsunterstützung genutzt. Quellcode und vollständige Datensätze werden nicht veröffentlicht.