TXT Werk: Aktuelle Trends auf Twitter zur Europawahl 2019

TXT Werk API: enabling text analysis
15. Mai 2019

Aktuelle Trends auf Twitter zur Europawahl 2019

Vom 23. bis 26. Mai finden in ganz Europa zum 9. Mal Wahlen zum Europaparlament statt. Der Wahlkampf in Deutschland ist in vollem Gange. Mittlerweile hängen in den Straßen die Wahlplakate und auch in den Medien sind die Parteien präsent. Wir, das KI-Team der Neofonie, analysieren mit Hilfe unseres Textanalyse-Frameworks TXT Werk schon im Voraus, über welche Themen die Parteien im Zusammenhang mit der Europawahl reden, und wie diese Themen die Twitter-Community bewegen. Der folgende Artikel beschreibt unser technisches Vorgehen für die automatisierte Analyse und zeigt Ergebnisse der Auswertung. Wir werden die Ergebnisse bis zur Europawahl immer wieder aktualisieren.

Technische Umsetzung einer Analyse von aktuellen Tweets

Neofonies Textanalyse-Framework TXT Werk unterstützt unter anderem die Extraktion von Entitäten (NER) aus einem Text, die Verschlagwortung von Texten sowie die Klassifizierung von Texten nach Textgenres. Diese Fähigkeiten haben wir uns bei der Analyse aktueller Tweets zum Thema "Europawahl 2019" zunutze gemacht. Twitter bietet die Möglichkeit über eine Rest-API Informationen zu einzelnen Tweets abzurufen. Diese API fragen wir an und sammeln solche Tweets, die entweder durch entsprechende Hashtags oder direkte Nennung von relevanten Entitäten Bezug auf die Europawahl nehmen. Darüber hinaus werden aber auch Tweets von wichtigen Vertretern der größeren Parteien und Nennungen dieser Politiker in die Tweet-Sammlung aufgenommen. Zu jedem Tweet stellt Twitter eine Reihe von Informationen bereit, aus denen wir die für uns relevanten ausgewählt haben, um am Ende ein umfassendes Bild über die aktuellen Trends zu erhalten. Darunter ist beispielsweise der Zeitpunkt, an dem betreffende Tweets gepostet wurden, oder auch die Anzahl der Likes, welche ein Tweet erhalten hat. Den eigentlichen Text des Tweets analysieren wir mit TXT Werk, was uns für jeden Tweet Informationen darüber liefert, worum es in diesem Tweet geht.

Abb. 1: Beispiel-Tweet zur Europawahl analysiert mit TXT Werk. Im Bild der Text des Tweets und die von TXT Werk extrahierten Entitäten.
Abb. 1: Beispiel-Tweet zur Europawahl analysiert mit TXT Werk. Im Bild der Text des Tweets und die von TXT Werk extrahierten Entitäten.

Um außerdem auch die Stimmung von Tweets und die darin genannten Themen zu erfassen, wird außerdem eine sogenannte Sentimentanalyse durchgeführt. Anschließend untersuchen wir anhand der aktuellen Tweets deren Reichweite und Erfolg. Bei der Reichweite erfolgt eine Unterscheidung zwischen potenzieller und definitiver Reichweite. Für die Berechnung der Reichweite summieren wir grundsätzlich die Anzahl der User, die einen Tweet geretweetet und/oder geliket haben, auf. Daraus ergibt sich zunächst eine definitive Reichweite, also die Anzahl der User, die den betreffenden Tweet definitiv gesehen haben. Darüber hinaus erreichen Tweets aber auch User, die anschließend keine Reaktion in Form eines Likes oder eines Retweets zeigen. Diese Kennzahl drücken wir mithilfe der potenziellen Reichweite aus, wobei alle Follower des Urhebers sowie die Follower der User, die einen Tweet geretweetet und/oder geliket haben, aufsummiert werden. Damit erfassen wir diejenigen User, die den betreffenden Tweet gesehen haben könnten.

Abb. 2: Schematische Darstellung der Berechnung von definitiver und potenzieller Reichweite von Tweets.
Abb. 2: Schematische Darstellung der Berechnung von definitiver und potenzieller Reichweite von Tweets.

Aus dem Verhältnis der definitiven zur potenziellen Reichweite lässt sich schließlich der Erfolg eines Tweets ablesen: Je geringer die Differenz zwischen diesen beiden Größen ist, desto größer ist auch der Erfolg, denn dann wurde ein Großteil der User, die einen Tweet potenziell gesehen haben, auch tatsächlich erreicht. Für einzelne Tweets oder Themen ergibt sich dabei allerdings eine eher unübersichtliche Datensammlung mit wenig Aussagekraft bezüglich aktueller Trends. Überträgt man dieses Verfahren aber auf die einzelnen Parteien, so erhält man eine interessante Übersicht darüber, welche der einzelnen Parteien den Diskurs auf Twitter dominieren. Denn auf diese Art und Weise lässt sich die Reichweitenentwicklung der einzelnen Parteien auf Twitter verfolgen.

Tab. 1: Verwendete Analyse-Parameter und ihr Ursprung.
Parameter Quelle: Twitter Quelle: TXT-Werk Quelle: extern Sonstige Quelle
Tweet ID x
Text x
Zeitpunkt x
Ort x
GPS-Koordinaten nominatim
normierte Adresse nominatim
Hashtags x
User Mentions x
Anzahl der Likes x
Anzahl der Retweets x
Parteizugehörigkeit des Urhebers manuelle Festlegung durch Politikerlisten
Anzahl der Follower des Urhebers x
Anzahl der Tweets des Urhebers x
Entitäten x
Schlagwörter x
Textkategorie x
Sentiment Google
definitive Tweet-Reichweite Berechnung
potenzielle Tweet-Reichweite Berechnung
Anzahl der Follower von Retweetern x
Anzahl der Follower von Likern x
Erfolg Berechnung

Die Sammlung der Twitter-Daten erfolgt anschließend über Elasticsearch, eine Visualisierung haben wir durch Kibana verwirklicht. Darüber hinaus ist ein Skript entstanden, das die Erstellung eines individuellen Dashboards zu aktuellen Trends auf Twitter ermöglicht. Hierbei können Visualisierungen ausgewählt werden, welche aktuelle Trends grafisch und somit leicht verständlich darstellen. Die zugrundeliegenden Daten können außerdem durch Filterfunktionen verfeinert werden, um auch spezielle Fragen zu beantworten.

Abb. 3: Beispielhafte Filterung für ein individuelles Dashboard über aktuelle Trends zur Europawahl auf Twitter.
Abb. 3: Beispielhafte Filterung für ein individuelles Dashboard über aktuelle Trends zur Europawahl auf Twitter.
Abb. 4: Beispielhafte Inhalte des Dashboards zur Europawahl.
Abb. 4: Beispielhafte Inhalte des Dashboards zur Europawahl.

Twitter-Trends Europawahl – die Ergebnisse bisher

Motto März: Bei der Europawahl geht’s um Europa

Hier eine verkürzte Darstellung dessen, wie sich die Trends zur Europawahl seit dem März 2019 auf Twitter verändert haben. Die Ausgangsposition, die Twitter im März bietet, ist folgende: die absolut am häufigsten genannten Themen im Zusammenhang mit der Europawahl sind „Europa“, die CDU und die CSU – kein Wunder, da Ende März doch das Europaprogramm der CDU/CSU beschlossen wurde. Darüber hinaus bewegten aber auch Ungarns rechtsnationale Partei Fidesz und der Brexit die Gemüter. Wir erinnern uns: im März stand der Ausschluss der Fidesz-Partei aus der Europäischen Volkspartei (EVP) zur Debatte und Großbritannien sollte ursprünglich am 29. März aus der EU austreten. Unter den einzelnen Parteien steht bei der SPD, der Linken, den Grünen und der FDP das Thema „Europa“ recht unspezifisch im Vordergrund. Bei der CDU und der AfD sieht man sich selbst im Mittelpunkt der Debatte. Immerhin eine Partei, nämlich die SPD, fällt auf Twitter mit einem spezifischen Wahlkampfthema auf, nämlich mit Debatten zur Grundrente.

Abb. 5: Prominenteste Themen der einzelnen Parteien auf Twitter im März.
Abb. 5: Prominenteste Themen der einzelnen Parteien auf Twitter im März.

Auch in den Bundesländern ergibt sich noch ein sehr undifferenziertes Bild. Die einzige Ausnahme bildet Niedersachsen, wo die Holocaustleugnerin und Spitzenkandidatin der Partei Die Rechte, Ursula Haverbeck, die Aufmerksamkeit auf sich zog.

Motto April: Wer ist eigentlich die AfD und warum streiken unsere Schüler?

Im April beginnen sich auf Twitter zwei Trends mit Bezug zur Europawahl abzuzeichnen: Diskussionen um die AfD und dank der anhaltenden Schülerstreiks zunehmende Beschäftigung mit dem Thema „Klimaschutz“. Absolut werden insgesamt „Europa“, die EU und die AfD am häufigsten genannt. Darüber hinaus stellt die AfD sich selbst weiterhin in den Mittelpunkt, während die Linke, die Grünen und die FDP neben den Themen "Europa" und "EU" auf Twitter insbesondere das Volksbegehren zur Vergesellschaftung ("Enteignung") von Immobilienunternehmen thematisieren. Betrachtet man das zugrundeliegende Sentiment von Tweets, werden beispielsweise Airbus und die Lufthansa, die CO2-Bilanz, aber auch die Große Koalition eher in negativ konnotierten Zusammenhängen verwendet. Im Zusammenhang mit der Diskussion um Uploadfilter zeichnen sich interessanterweise außerdem positive Konnotationen für das Bundesjustizministerium, wohl aufgrund von Ministerin Katarina Barley, ab.

Abb. 6: Themen in negativ konnotierten Tweets im
                                    April 2019.
Abb. 6: Themen in negativ konnotierten Tweets im April 2019.
Abb. 7: Themen in positiv konnotierten Tweets im
                                    April 2019.
Abb. 7: Themen in positiv konnotierten Tweets im April 2019.

Motto April/Mai: Von allem ein bisschen, aber nichts Konkretes

In den letzten 30 Tagen setzen sich diese Trends fort: auch hier werden „Europa“, die EU und die AfD am häufigsten im Zusammenhang mit der Europawahl erwähnt, etwas weiter unten in den Diagrammen folgen aber wiederum spezifischere Themenschwerpunkte wie z.B. der Klimaschutz, aber auch das Bundesverfassungsgericht, was Mitte April nach einem Eilantrag auch für Menschen mit Behinderung ein Stimmrecht für die Europawahl beschlossen hat.

Abb. 8: Wichtigste Themen mit Bezug zur
                                    Europawahl in den letzten 30 Tagen.
Abb. 8: Wichtigste Themen mit Bezug zur Europawahl in den letzten 30 Tagen.

Bei den Parteien setzt sich das Bild der vorherigen Monate fort: eher unspezifisch stehen für die SPD, die Linke, die Grünen, die CDU und die FDP die Themen „Europa“ und die EU im Vordergrund, während die AfD weiterhin mit sich selbst beschäftigt ist.

Motto der letzten Woche: Geht wählen! Der Wahl-O-Mat hilft.

Auch in den letzten sieben Tagen werden die Spitzenplätze der genannten Themen durch Europa, die EU und die AfD belegt. Darüber hinaus sind aber auch weiterhin der Brexit und der Klimaschutz dominant. Hinzu kommen Russland, womöglich im Zuge der Debatten um eine Verhinderung der Wahlmanipulation durch Russland, und der Wahl-O-Mat als Instrument der Entscheidungshilfe zur Europawahl. Neben der Beschäftigung mit Europa und der EU allgemein durch die SPD, die Linke, die Grünen und die CDU stehen für die Grünen ganz klassisch der Klimaschutz und für die CDU der Muttertag im Vordergrund. Die AfD thematisiert - oh, Wunder! - wiederum sich selbst und von der FDP werden die Themen “Baukindergeld” und “Behinderung” diskutiert.

Abb. 9: Themenschwerpunkte der einzelnen Parteien auf Twitter während der letzten 7 Tage.
Abb. 9: Themenschwerpunkte der einzelnen Parteien auf Twitter während der letzten 7 Tage.

Auffallend ist außerdem die negative Konnotation von Tweets, die sich mit der Partei für Arbeit, Rechtsstaat, Tierschutz, Elitenförderung und basisdemokratische Initiative (kurz: Die PARTEI) auseinandersetzen. In besonders positiven Zusammenhängen werden die IG Metall und das Thema “Klima” genannt.

Aufmerksamkeit für die Parteien auf Twitter: Grüne top, CDU flop

Interessant ist außerdem eine Betrachtung der Reichweiten der einzelnen Parteien auf Twitter bezogen auf die letzten 90 Tage. Die höchsten potenziellen Reichweiten ergeben sich für die Grünen und die beiden großen Volksparteien SPD und CDU, während die definitive Reichweite von der AfD eindeutig angeführt wird, worauf die Grünen und wiederum mit Abstand die SPD folgen.

Abb. 10: Potenzielle und definitive Reichweite der einzelnen Parteien in den letzten 90 Tagen.
Abb. 10: Potenzielle und definitive Reichweite der einzelnen Parteien in den letzten 90 Tagen.

Datengrundlage

Zeitraum:
01.03.2019 bis 14.05.2019
Anzahl der analysierten Tweets:
3264
Anzahl der untersuchten Politiker- und Parteiaccounts:
35
Anzahl der gefundenen (voneinander verschiedenen) Entitäten:
2008
Anzahl der gefundenen Entitäten insgesamt:
5945

Kontaktieren Sie uns

Sie möchten weitere Informationen erhalten? Sie haben weitere Fragen? Nehmen Sie mit uns Kontakt auf!

Über uns


TXT Werk ist die Textmining API der Neofonie GmbH, ein in Berlin ansässiger Fullservice Provider, spezialisiert auf Portale, Suche, Sozial Media, E-Publishing und Entwicklung mobiler Applikationen.

Impressum


Neofonie GmbH
Robert-Koch-Platz 4
10115 Berlin, Germany
Phone: +49 30 24627-0
Website: https://www.neofonie.de

Amtsgericht Berlin-Charlottenburg
HRB 67 460 - Sitz Berlin
Geschäftsführung:
Thomas Kitlitschko
USt-ID: DE 194 693 995

Sie benötigen Hilfe?


Sie können weitere Informationen in der Dokumentation der TXT Werk API erhalten.



2018 neofonie GmbH
Datenschutzerklärung