Heim BlogWeb-Scraping Mine Reddits Milliarden von Meinungen: Web Scraping Reddit und Sentiment Analysis (2024)

Mine Reddits Milliarden von Meinungen: Web Scraping Reddit und Sentiment Analysis (2024)

von Kadek
Blog-Banner Reddit

Allein im Januar 2024 gab es 7,57 Milliarden Besuche auf Reddit. Es gibt 2,8 Millionen Subreddits mit Diskussionen zu allem, was man sich vorstellen kann – von r/cats bis r/memes und einem unserer persönlichen Favoriten, r/dataisbeautiful.

Diese Zahlen in Milliarden und Abermillionen weisen darauf hin, dass Reddit eine der größten Online-Communities der Welt ist; Das macht es zu einem reifen Feld für die Datenextraktion.

Die Frage ist, wie man bei so vielen Kommentaren, Beiträgen und Threads Reddit-Daten in großem Umfang sammeln kann. Geben Sie ein, Web Scraping.

Ganz gleich, ob es darum geht, populäre Debatten über Jahrzehnte hinweg zu verfolgen, Ihre Marke in sozialen Netzwerken zu überwachen, sich auf die Schwachstellen Ihrer Kunden einzulassen oder den Überblick über kulturelle Veränderungen zu behalten – das Sammeln von Daten aus Reddit ist die neue Möglichkeit, die Forschung im Goldgräberzeitalter der Informationen zu konsolidieren .

Schnall dich an, du wirst gleich erfahren, wie aussagekräftig die Daten von Reddit sein können.

Was ist die Reddit-Sentiment-Analyse?

Nehmen wir an, Sie möchten gleich nach der Markteinführung ein neues Paar Sneaker von Nike kaufen. Dazu möchten Sie wissen, wie die allgemeine Stimmung gegenüber dem Produkt auf Subreddits wie r/Nike und /sneakers ist.

Sie können diese Daten sammeln, indem Sie die Subreddits durchsuchen und den Ton der Beiträge und Kommentare analysieren – sind sie überwiegend positiv, negativ oder neutral?

Dies ist die Stimmungsanalyse von Reddit. Sie werden feststellen, dass es in diesem Fall sowohl für den Kunden als auch für die Marke von Vorteil ist. Es besteht eine hohe Wahrscheinlichkeit, dass einige (heimtückische) Leute von Nike dieselben Subreddits im Auge behalten, um auf Reaktionen auf ihre Produkteinführung zu achten.

Sie recherchieren die Marke, sie recherchieren Ihr Feedback.

Wie scrape ich Reddit-Daten?

Kein Code? Kein Problem. Sie müssen kein Master-Programmierer sein, um Ihre eigene Reddit-Stimmungsanalyse durchzuführen. Viele Leute durchsuchen Reddit mit Python, aber bei Grespr sind wir mit allen befreundet. Vor allem Nicht-Programmierer.

Wenn Sie No-Code-Web-Scraping-Tools wie Grepsr verwenden, wird der Datenextraktionsprozess durch Automatisierung vereinfacht.

Der Prozess funktioniert auf zwei Arten:

  • Die URL-Methode: Geben Sie URLs ein, um bestimmte Seiten schnell zu durchsuchen. Ein Web Scraper sammelt automatisch alle verfügbaren Daten einer Seite basierend auf ihrer URL.
  • Point-and-Click-Oberfläche: Passen Sie die Teile Ihrer Website, die Sie durchsuchen möchten, mit einer visuellen Point-and-Click-Oberfläche an. Ziehen Sie Elemente per Drag-and-Drop, um genau die Datenparameter auszuwählen, die Sie benötigen.

Wir empfehlen, die offizielle Reddit-API-Dokumentation (Application Programming Interface) zu lesen, die Ihnen den Zugriff auf Beiträge, Kommentare und Benutzerinformationen von bestimmten Subreddits oder der gesamten Plattform ermöglicht und dabei die Richtlinien von Reddit respektiert.

Fallstudien aus dem wirklichen Leben: Die Macht der Reddit-Daten

Stellen Sie sich das Scrapen von Reddit so vor, als würden Sie tatsächlich die Nadel im Heuhaufen finden. Von schwer erreichbaren demografischen Daten bis hin zu inoffiziellen öffentlichen Diskussionen ist die anonymisierte Plattform von Reddit eine Goldgrube für die Marktforschung.

Neugierig? Lass es uns herausfinden.

1. Öffentliche Wahrnehmung von ChatGPT

Hintergrund: In einer Studie der Lingkopin-Universität untersuchten Forscher, wie große öffentliche Ankündigungen die Häufigkeit von Diskussionen auf dem Subreddit r/ChatGPT zwischen seinem Start und dem 31. März 2023 beeinflussten.

Zielsetzung: Analysieren Sie die Diskussionen rund um ChatGPT, beobachten Sie, wie sie sich im Laufe der Zeit entwickelt haben, und identifizieren Sie wichtige Ereignisse im Zusammenhang mit ihnen.

Methodik: Eine PushShift-API sammelte fast 500.000 Beiträge zu ChatGPT von Reddit. Als nächstes wurde ein Tool namens BERTopic verwendet, um herauszufinden, worüber die Leute in diesen Beiträgen gesprochen haben.

Ergebnisse: Große ChatGPT-Ereignisse, wie die Investition und Integration von Bing durch Microsoft, waren mit Spitzen in der Reddit-Aktivität und Verschiebungen bei Diskussionsthemen verbunden. Darüber hinaus tauchten im Laufe der Zeit in Diskussionen über mehrere Subreddits umfassendere Themenkategorien wie „Bildung“ und „Jobs“ auf.

Im Gegensatz dazu konzentrierten sich Gespräche zu bestimmten Themen wie „Bing“ eher auf direkt relevante Subreddits. „Bing“-Diskussionen nahmen als Reaktion auf Ereignisse im Zusammenhang mit der Integration von ChatGPT in die Suchmaschine zu und entstanden nicht organisch.

Was verrät diese Fallstudie?

  • Erstens ist die Fähigkeit von Reddit, Gespräche sowohl organisch als auch als Reaktion auf Echtzeitereignisse in der Welt anzuregen, immens. Ein Einblick in die Entwicklung der öffentlichen Meinung rund um neue Technologie – roh und ungefiltert – ist von unschätzbarem Wert Identifizieren Sie Stimmungstrends und Dreh- und Angelpunkte.
  • Zweite, Die Reddit-Stimmung reagiert stark auf reale Entwicklungen. Das bedeutet, dass Sie das öffentliche Interesse fast sofort verfolgen können, indem Sie Spitzen in der Reddit-Aktivität beobachten.

2. Reddit Web Scraping für soziale Zwecke – JUUL

Erinnerst du dich an JUUL? Das Unternehmen geriet in die Kritik, weil es die E-Zigaretten-Krise bei Teenagern angeheizt hatte, und seine Produkte wurden im Juni 2022 verboten.

Interessanterweise hat eine 2019 in JMIR Publications veröffentlichte Studie Daten von Reddit, insbesondere zwei Subreddits, r/UnderageJuul und r/JUUL, ausgewertet und den Wert von Social Media Mining für die Überwachung der öffentlichen Gesundheit bewiesen.

Hintergrund: JUUL erfreute sich bei der Jugend schnell großer Beliebtheit, doch ihre Erwerbsmethoden, Vorlieben und Nutzungsmuster waren weitgehend unbekannt.

Zielsetzung: Durchsuchen Sie Reddit nach Social-Media-Daten, um Wissenslücken über die Nutzung von JUUL durch Minderjährige zu schließen.

Methodik: Forscher haben zuvor Reddit-Beiträge und -Kommentare aus 716 Threads und 2935 Kommentare aus dem jetzt verbotenen Subreddit r/UnderageJuul herausgesucht.

Ergebnisse: Es gab r/UnderageJuul-Benutzer bereits im Alter von 13 Jahren, wobei die beliebtesten Geschmacksrichtungen die der offiziellen JUUL-Linie waren: Mango, Minze und Gurke. In den Threads wurden sieben diskrete Möglichkeiten erwähnt, an JUUL-Produkte zu gelangen. Die häufigste davon war der Kauf von anderen Reddit-Benutzern.

Durch das Scrapen von Reddit war die Studie in der Lage Finden Sie wichtige Informationen zu Demografie, Produktpräferenzen und illegalen Zugriffsansätzen in einem ansonsten notorisch schwierig zu recherchierenden Abschnitt.

Das, Leute, ist die Macht des Web Scraping Reddit.

3. Wie Marken Reddit nutzen – Laneige

Laneige ist ein koreanisches Hautpflege-Schönheitsunternehmen, das in den beliebtesten Communities von Reddit eine der höchsten Markennennungen hat – r/skincarereaddiction mit 2,2. Millionen Mitglieder und r/AsianBeauty mit 1,9 Millionen Mitgliedern.

Eine leitende Managerin bei Laneige, Shrija Pandya, hat eindeutig das Beste aus dem Web-Scraping auf Reddit und gemacht Überwachung die Präsenz ihrer Marke auf der Plattform: „Wir wussten, dass die Beauty-Communitys auf Reddit so stark sind und dass sie eine starke Affinität zu Schönheit und Hautpflege haben.“

Laneige hatte seinen offiziellen Einstieg bei Reddit erst letztes Jahr mit Werbeanzeigen, aber wie Sie sehen werden, liegen die Markenerwähnungen auf Subreddits schon sechs Jahre zurück.

Gedanken zu Laneige Gedanken zu Laneige
Ein Screenshot eines Reddit-Beitrags der Community r/AsianBeauty.

Das Ziel des Beauty-Riesen auf Reddit bestand darin, die Markenbekanntheit zu fördern und die Kaufbereitschaft und -absicht zu steigern. Sie waren erfolgreich – um 50 % höhere Klickraten zu erzielen Und 42 % höhere Abschlussraten für sechs Sekunden lange Videos als der vertikale Beauty-Benchmark von Reddit.

4. Lehren aus AMAs – Audi

Reddit AMAs – „Ask Me Anything“ – sind Sitzungen mit Community-Experten, die ein Q&A-Format zur Interaktion mit den Followern in ihrer Community veranstalten. Nehmen wir an, Lewis Hamilton würde Ihre brennenden Fragen zu schnellen Autos im Subreddit r/Formula1 beantworten. (Kann man F1-Autos wirklich verkehrt herum fahren?)

AMAs sind eine fruchtbare Datengrundlage für das Social-Media-Mining für Marken, Unternehmen und Vermarkter:

  • Sie helfen dir um die öffentliche Wahrnehmung und Reaktion einzuschätzen zu Ihren Dienstleistungen und Produkten in Echtzeit
  • AMAs Heben Sie Schwachstellen in der Customer Journey hervor das würde sonst nicht auffallen
  • Sie Beziehungen festigen durch den Aufbau von Glaubwürdigkeit und die Humanisierung der Marke

Audi hat, wie fast jede andere große Automarke, eine eigene Reddit-Community. Sie haben „Think Faster – The World's Fastest AMA“ ins Leben gerufen – mit einer Geschwindigkeit von satten 130 Meilen pro Stunde und jeweils einem 30-minütigen Abschnitt.

Die Herausforderung bestand für Prominente wie Olivia Munn, Adam Scott und Issa Rae darin, ihr Mittagessen aufzubewahren, während sie in Echtzeit Fragen durch Reddit-Kommentare beantworteten.

Echtzeit-Reddit-DatenEchtzeit-Reddit-Daten
Audis „Think Faster“-Kampagne mit Adam Scott mit einer AMA-Karte. (Quelle: The Shorty Awards)

Die Kampagne war ein voller Erfolg, so dass sogar der Gründer von Reddit, Alexis Ohanian, seine Begeisterung twitterte. Ken Bracht, Marketingleiter von Audi in Amerika, sagte: „Was die Botschaft betrifft, möchten wir, dass die Zuschauer ein Gefühl dafür bekommen, wie es ist, bei hoher Geschwindigkeit hinter dem Steuer eines RS 5 Coupé zu sitzen.“

Und oh, das haben sie.

Die AMA wurde seit 2014 dreimal veranstaltet und verzeichnete insgesamt 2 Millionen Aufrufe, über 6000 Kommentare und unzählige Beiträge in Magazinen.

Bereit für Web Scrape Reddit?

Reddit ist ein Barometer für die öffentliche Meinung und Markttrends, egal ob Sie eine Marke, ein Vermarkter oder einfach nur neugierig sind. Durch die Überwachung relevanter Subreddits können Sie aus der ersten Reihe sehen, was in Ihrem Teil der Welt vor sich geht.

Verpassen Sie nicht den Goldrausch an Informationen im 21. Jahrhundert – fangen Sie noch heute mit Grepsr an!

Related Posts

Hinterlasse einen Kommentar