Wortfeld: Semantische Presseschau
Projektüberblick
Wortfeld ist ein Analysewerkzeug für deutschsprachige Nachrichtenartikel auf Basis eines ausgewählten Tagesschau-Korpus. Der Fokus liegt auf der Kombination von NLP-Methoden (spaCy, TF-IDF) und Google NLP zur Extraktion semantischer Informationen.
Das Projekt dient als technisches MVP für ein realistisches Textanalyse-Setup mit Python, FastAPI und MongoDB.
Die Anwendung ist online verfügbar unter: wortfeld.up.railway.app.
Daten & Verarbeitung
- 96 Tagesschau-Artikel aus einem Korpus von 11.000+ Beiträgen (2024–2025)
- Daten gespeichert und strukturiert in MongoDB
- NLP-Analyse: spaCy (POS, NER, Noun Chunks, Lemmas)
- TF-IDF-Schlüsselwörter: Themen, Geografie, neue Begriffe
- Zusätzliche Entitäten-Extraktion via Google NLP
Frontend-Funktionen
- Übersichtsseite mit Filter nach Tags
- Einzelseite mit vollständigem Artikeltext
- Farbcodierte Tags (Thema, Ort, neue Begriffe)
- Analyseblock: Google NLP (Personen, Organisationen, Orte)
- Infobereich: „Über dieses Projekt“
Weiterführende Infos
Die vollständige Projektbeschreibung mit Methodik, Motivation und Reflexion findest du direkt auf der Anwendung
unter wortfeld.up.railway.app: