Bestimmt haben Sie bereits mit ihr gearbeitet, wussten es aber nicht. EASE ist unsere Machine Learning-Technologie, die geschäftsrelevante Signale (z.B. Managementwechsel, Umsatzsteigerung, Neubau uvm.) in Sätzen erkennt.
Egal, ob in Social Media-Posts, auf einer Webseite oder an einer anderen Stelle im World Wide Web – EASE findet seit mehr als fünf Jahren alle wichtigen Informationen und macht sie für unsere Kunden nutzbar! Damit stellt sie sicher, dass Kunden sofort wissen, wenn ihre Zielunternehmen einen Bedarf haben oder über Risiken von Lieferanten oder Bestandskunden auf dem Laufenden zu bleiben.
Wie funktioniert EASE?
Doch wie funktioniert eigentlich die Technologie hinter der Technologie? Hinter unserer EASE steckt ein ausgeklügeltes Text Classification-System. Besser gesagt: Es handelt sich um eine Sentence Classification, die wir selbst entwickelt haben.
Die Schwierigkeit beim Herausarbeiten eines solchen Systems liegt darin, dass konkrete Ereignisse erkannt werden müssen. Das ist deshalb recht kniffelig, weil viele Ereignisse in kleinen, unvollständigen Textschnippseln – etwa in einem Tweet – enthalten sein können. Um sicherzustellen, dass eine gute Qualität bei der Erkennung von Signalen erreicht wird, benötigen Klassifikationssysteme normalerweise sehr viele hochwertige Trainingsdaten.
Die Künstliche Intelligenz (KI) lernt mithilfe von zahlreichen positiven und negativen Satzbeispielen. In der Regel werden Trainingsbeispiele manuell annotiert, um der Maschine zu zeigen, welche Beispiele richtig und gesucht sind und welche Beispiele falsch sind und aussortiert werden müssen.
An eine solche Anzahl zu gelangen und eine hohe Qualität sicherzustellen, ist, wie man sich vorstellen kann, sehr zeitaufwändig und häufig auch teuer. Ein Problem, das nicht nur Echobot betrifft. Daher ist eine eigene Milliarden-Industrie entstanden, die KI-Firmen mit manuell annotierten Trainingsdaten beliefert.
Was zeichnet EASE aus?
Unser Ziel war es, ein System zu entwerfen, das es erlaubt, äußerst kostengünstig und schnell neue Klassifikatoren zu entwickeln, um eine große Bandbreite an unterschiedlichen Signalen in möglichst vielen Sprachen anbieten zu können. Gleichzeitig müssen die fertigen Klassifikatoren in kürzester Zeit große Textmengen verarbeiten können. Und das alles, ohne bei der Qualität Kompromisse einzugehen.
„Diese Ziele konnten wir erreichen, indem wir eine ‚Fabrik‘ für neuronale Netze zur Signal-Klassifikation entwickelt haben. Die meisten Aufgaben übernehme dabei Lern-Algorithmen, aber es gibt auch Aspekte, die lassen sich schneller und besser durch Linguistik-Experten lösen.“ erklärt Data Scientist Thomas Wagener, der seit mehreren Jahren an der Weiterentwicklung der EASE beteiligt ist.
Die EASE ist daher als eine Art Plattform für das optimierte und durchdachte Zusammenspiel von lernenden Algorithmen und menschlichen „Lehrern“ aufgebaut. Mithilfe dieser Plattform können wir effizient neue Trainingsdaten erzeugen sowie Klassifikatoren für die Texterkennung trainieren und evaluieren. Aber nicht nur das! Wir haben es außerdem geschafft, mit relativ wenigen Trainingsbeispielen genauste Ergebnisse zu erzielen! Dafür haben wir ein spezielles Trainingsverfahren und eine besondere Architektur der neuronalen Netze entwickelt.
Firmen wie Google und Co. erhalten durch ihre Nutzer mehr als genug Trainingsmaterial. Außerdem haben solche Big Player häufig sowohl die Zeit als auch das nötige Kleingeld, große Volumina manuell annotieren zu lassen, um ihre Systeme zu trainieren. Das wollten wir umgehen und mit der EASE ist uns das auch gelungen.
Wenig Trainingsdaten, große Wirkung.