Die drei ??? und der Datensee

09.12.2015  /  3 Minuten Lesezeit
Autor:
Christian Warneck

Amadeus Blog: An große Datenmengen zu kommen ist gar nicht so schwer. Vor kurzem während des Amadeus Technology Forum hat Dr. Joachim Köhler vom Fraunhofer IAIS zwei anschauliche Beispiele aus dem weiteren Umfeld der Reisebranche genannt.

Autos etwa fungieren bald als flächendeckende Wettersensoren: Sind die Scheibenwischer an, heißt das, dass es regnet – die Wischerdaten vieler Autos ergeben ein Echtzeit-Wetterbild, das zum Beispiel Landwirte gut für ihre Tagesplanung gebrauchen können. Und Rolls-Royce stattet seine Flugzeug-Triebwerke neuerdings mit bis zu 3.000 Sensoren aus, die unterwegs Informationen zu den Vorgängen im Inneren sammeln. Daraus entwickelt der Hersteller ein neues Wartungskonzept. Auf einem handelsüblichen Interkontinentalflug entstehen mehrere Terabyte (Billionen Byte) Daten. So sieht Big Data aus.

Datensammeln ist das eine. Die eigentliche Herausforderung beginnt mit dem intelligenten Auswerten. Die drei Fragezeichen, denen Big-Data-Nutzer sich stellen müssen, lauten Geschwindigkeit, Volumen und Vielfalt. Will heißen: Die Daten sammeln sich immer schneller an, kommen in immer größerer Bandbreite herein und stammen aus unterschiedlichen Quellen. Es braucht also die nötige Speicherkapazität, es braucht Geschwindigkeit und die Fähigkeit, diverse Formate zusammen zu betrachten.

Langsam entwickeln sich die dafür nötigen Techniken. Dazu gehören das Text Mining, also das maschinelle Verstehen von Texten, und das Deep Learning, das Lernen durch neuronale Netze – am Ende könnte eine künstliche Intelligenz stehen.

Die Reisebranche, hat Joachim Köhler überzeugend dargelegt, ist sehr daten- und prozessintensiv und daher für Big Data bestens geeignet. Recht hat er: Was sammeln Buchungsmaschinen und Reisewebsites nicht alles an Informationen! Tobias Grosche, Head of Data Scientists Germany der Travel Intelligence Unit von Amadeus, rechnete vor, dass Amadeus jeden Tag 150 Millionen Suchanfragen mit insgesamt 100 Gigabyte verarbeitet, was sich in den vergangenen viereinhalb Jahren zu mehr als 100 Terabyte summiert hat. Das Airline-System Amadeus Altéa Reservation hält 130 Millionen aktive PNRs vor, die 14 Terabyte belegen. Pricing-Informationen kommen auf 80 Terabyte pro Jahr – und so weiter. Alles entsteht in Echtzeit und wird gespeichert.

Daraus müssten sich doch personalisierte Angebote für immer feiner bestimmte Zielgruppen und Vorhersagen über ihr Verhalten gewinnen lassen. Und zwar automatisch durch Nutzung verschiedener Mobilitätsplattformen und durch intelligente Empfehlungstechniken. Am Ende könnte eine weitere Automatisierung der Online-Plattformen stehen.

Eine „Reisebranchen-Siri“ fanden die Gäste des Amadeus Technology Forum eine gute Idee. Harald Piske von Comvel zum Beispiel wünscht sich eine Software, die gesprochene Sprache so gut versteht, dass sie unbestimmt daherkommende mündliche Anfragen mit konkreten Angeboten beantwortet. Und dabei berücksichtigt, was jeder humanoide Expedient aus dem Effeff weiß: Familien braucht man Nachtflüge mit Umsteigen gar nicht erst anzubieten.

Okay – so weit sind wir noch nicht. Aber ein wichtiger Schritt ist getan: Amadeus hat seine Techniken für die Marktanalyse neu aufgestellt. Die Travel Intelligence Engine legt Daten nicht mehr sortiert und beschriftet ab, füllt sie also sozusagen nicht mehr in Flaschen, sondern lässt sie ungebremst als Rohdaten in die Speicher fließen. Aus diesem „Datensee“ kann Amadeus jede gewünschte Auswertung fischen.Möglich wird das durch die immer günstigere Hardware und durch neue Techniken parallelen Rechnens. Daten der Kunden, Daten aus Amadeus Systemen und aus externen Quellen liegen dort einträchtig nebeneinander und warten auf das Fischernetz.

Amadeus ist in der Lage, ein Terabyte Daten innerhalb von acht Stunden zu sieben und seinen Kunden Auswertungen von etwa 200 Gigabyte zur Verfügung zu stellen, zum Beispiel als leicht fassbare „Dashboards“ für Verhaltensanalysen und Verhaltensprognosen.

Das würde auch Justus, Bob und Peter aus Rocky Beach in Kalifornien gefallen, den drei ??? aus der Krimiserie: Eine unüberschaubare Menge an Indizien und die Einengung der Zielgruppe per Knopfdruck.

Über den Autor

Christian Warneck, der seine frühe Kindheit in Boston, USA, verbrachte, studierte Mathematik mit Schwerpunkt Informatik in Darmstadt und lebt heute mit seiner Familie in Bad Homburg. Er arbeitet seit 1992…
Mehr über den Autor

Schreiben Sie einen Kommentar