ANZEIGE

Wie bereits im ersten Teil erläutert: Börse ist Psychologie. Um die Psychologie der Börse zu erkennen, wird im Netz nach relevanter Kommunikation gesucht. Es sollen virale Gerüchte gefunden werden, die den Kurs einer Aktie erheblich beeinflussen können.

Doch wie fischt man im riesigen Datenmeer die relevanten Nachrichten aus? Es wurde ein System entwickelt, das zuverlässig Trends erkennt und präzise Voraussagen ermöglicht. Alles fängt mit der Frage an, nach welchen Nachrichten man eigentlich suchen soll.


Wollen Sie von diesem System profitieren? Dann buchen Sie jetzt den Sentiment Trader. Nur noch heute erhalten Sie den Service mit Livetime-Rabatt.


Da lediglich die Kommunikation über Finanzmärkte interessiert, werden (Wirtschafts-)Nachrichtenbeiträge, Diskussionen aus Finanzforen und Twitter ausgewertet. Auf Twitter wird seit einigen Jahren auch sehr intensiv über Aktien und andere Finanzthemen geschrieben und diskutiert.

Für das Einsammeln der Daten werden so genannte Crawler benutzt. Das sind Computerprogramme, die Webseiten nach Schlüsselworten durchsuchen. Sie sind wie Fischkutter, durch deren Siebe Meerwasser rauscht und nur die Fische hängen bleiben. Auf der Suche nach Schlüsselworten fischen die Crawler zum Beispiel auf allen möglichen Finanzportalen und Sozialen Netzwerken.

Die Crawler durchsuchen tausende Internetseiten pro Tag und verschicken täglich mehrere Millionen Datensätze. Doch wie beim Fischkutter auf hoher See gibt es auch im Internet immer Beifang, der nicht gebraucht wird. Im Internet sind das keine rostigen Fahrräder oder Steine vom Meeresgrund, sondern Spam-Nachrichten. Immer wieder gehen irrelevante Daten ins Netz.

Ein Tweet über das letzte Bundesliga-Spiel von Borussia Dortmund zum Beispiel hat nicht zwangsläufig etwas mit der Aktie des BVB zu tun. Auch Werbeinhalte oder falsche Nachrichten sollen schnell wieder von Bord geworfen werden.

Im Fall des BVB wird deswegen explizit nach der Borussia Dortmund GmbH & Co. KGaA gesucht. Damit sperrt das System Nachrichten, die sich um das runde Leder, aber nicht um den Aktienmarkt drehen, aus. Um Spam oder Werbung aus unseren Daten rauszuhalten, werden die Nachrichten, die die Crawler sammeln, gefiltert.

Auch beim Filtern wird – genau wie beim Suchen – mit Schlüsselworten gearbeitet. Spam-Nachrichten lassen sich häufig daran erkennen, dass sie bestimmte Worte enthalten, die normale Nachrichten nicht enthalten. Auf diese Weise sortieren sich verdächtige Nachrichten bereits beim Einsammeln aus.

Außerdem werden auffälligen Werten manuell nachgegangen. Steigt etwa die Zahl der Nachrichten zu einem Wertpapier ohne erkennbaren Grund deutlich an, wird analysiert, was genau zu dem Anstieg geführt hat und es wird nach Auffälligkeiten gesucht. Bei Twitter können das zum Beispiel Accounts sein, die erst vor kurzem angelegt wurden, aber schon hunderte Tweets gesendet haben.

Dort wurde bereits ein Netzwerk von falschen Nutzern aufgedeckt, die massenhaft Tweets verbreiteten und das Gesprächsaufkommen zu einer Aktie künstlich in die Höhe trieben. All diese Nutzer werden vom System gesperrt, ihre Nachrichten automatisch aussortiert und nicht mehr in der Analyse berücksichtigt. Die Liste von geblockten Nutzern wird stetig aktualisiert, um die Echtheit der Daten zu gewährleisten. Denn nur, wenn die Daten nicht durch Betrüger oder Spammer verzerrt sind, sind sie eine valide Grundlage für die weiteren Analysen.

Wenn nun alle relevanten und wichtigen Beiträge gefiltert wurden, stellt sich nun weiterhin die Frage: Wie kann präzise und automatisch gefiltert werden, ob eine Nachricht positiv oder negativ ist, ohne hunderttausende Nachrichten jeden Tag selbst lesen zu müssen?

Die Antwort lautet wieder: mithilfe von Schlüsselworten. Es wurde ein System programmiert, das die Nachrichten, die die Crawler eingesammelt und die Filter sortiert haben, nach Worten absucht. Insgesamt mehrere tausend solcher Schlüsselworte kennt das System und kann so die Nachrichten in „positiv“ oder „negativ“ einteilen - übrigens nicht nur in deutscher Sprache, sondern auch Englisch und Chinesisch.

Ist in einer Nachricht etwa von „long“ die Rede, erkennt es, dass es sich um eine positive Nachricht handelt. Das System erkennt auch Negationen. Es würde also die Nachricht „Geht auf gar keinen Fall long“ nicht als positiv bewerten, nur weil darin das Wort „long“ enthalten ist, sondern sie korrekterweise als negativ verbuchen. Heraus kommt so zu insgesamt mehr als 54.000 Aktien, Indizes, den wichtigsten Währungen und Rohstoffen ein erstes, einfaches Stimmungsbild. Steigen Sie jetzt beim Sentiment Trader ein und erhalten die automatisierten Signale.