Wie maschinelles Lernen die adaptive Betrugserkennung fördert

Wir leben in der Zukunft – nun zumindest in der Zukunft, die wir uns vor nicht allzu langer Zeit ausgemalt haben. Autos fahren autonom, Sprachassistenten, wie Siri und Alexa können uns bereits einfache Aufgaben abnehmen und wir können unsere Handys mit Hilfe von Gesichtserkennung entsperren. Maschinelles Lernen ist in diesem Zusammenhang nicht mehr wegzudenken.

Die Essenz von maschinellem Lernen macht Folgendes aus: Wir füttern unsere statistischen Modelle eine große Menge an Daten ohne den Modellen explizite Anweisungen zu geben, wodurch diese Schlussfolgerungen über die Zusammenhänge der verschiedenen Datenpunkte schließt. Spotify zum Beispiel schlägt seinen Nutzern neue Musik basierend auf der eigenen Streaming-Historie und der Historie anderer Nutzer, die ähnliche Musik hören, vor. Autos fahren autonom, indem sie Sensoren, 3D-Karten und Videos von früheren Fahrten analysieren. Dadurch wissen sie, wie sie sich im Straßenverkehr verhalten müssen, zum Beispiel wann sie vor einer Ampel oder einem Zebrastreifen halten müssen. Für Betrugserkennung wird maschinelles Lernen (ML) ähnlich angewandt.

Modelle zur Betrugserkennung nutzen ein datenreiches Netzwerk von Bestellungen, die ein Kunde bereits bestellt hat und erkennen in Echtzeit, ob eine Bestellung legitim oder betrügerischer Natur ist. Genau wie andere Formen des maschinellen Lernens sind Betrugserkennungssysteme auf unterschiedliche Dateneingaben angewiesen. Diese Eingaben werden als Merkmale bezeichnet.

Maschinelles Lernen: Merkmale 101

Fortgeschrittene statistische Modelle nutzen hunderte oder sogar tausende Merkmale bei der Erfüllung ihrer Aufgaben. Ein Merkmal kann schlichtweg einen Bestellwert ausmachen, es kann jedoch auch komplexer sein und zum Beispiel den Zusammenhang von Rechnungs- und Lieferadresse erfassen. Dabei ist wichtig zu beachten, dass wir das Modell zwar mit Merkmalen, wie dem Bestellwert oder die Beziehung zwischen Rechnungs- und Lieferadresse speisen können, letztendlich hängt es jedoch vom Modell ab zu entscheiden, wie es die einzelnen Merkmale gewichtet.

Nachdem das Modell mehrere Millionen Bestellungen überprüft hat kann es sein, dass das Modell bestimmt, dass ein Bestellwert über 250€ risikoreicher ist, als ein geringerer Bestellwert. Zudem könnte es lernen, dass Bestellungen, bei der die Rechnungsadresse mit der Lieferadresse übereinstimmen legitimer zu sein scheint. Bedeutet das jedoch, dass das Modell immer Bestellungen mit der gleichen Liefer- und Rechnungsadresse genehmigt sowie Bestellungen über einem Bestellwert von 250€ ablehnt? Ganz gewiss nicht. Abhängig vom richtigen Input lernt ein Modell über die Zeit, wie die einzelnen Merkmale zu bewerten sind. Akkuratere Entscheidungen basieren demnach auf der Menge der Daten und Merkmale.

Obwohl sich E-Commerce-Betrug über alle Branchen erstreckt gibt es Merkmale, die einzigartig für eine bestimmte Branche sind, wohingegen andere Merkmale universal sind. Schauen wir uns Beispiele sowohl allgemeiner als auch branchenspezifischer Merkmale an, welche ausschlaggebend für eine Verbesserung der Betrugserkennung der Modelle waren.

Maschinelles Lernen: Generelle Betrugsmerkmale

Einige Kriterien, die für Online-Transaktionen erforderlich sind treffen branchenübergreifend zu. Unabhängig davon, ob ein Kunde einen Flug bucht oder ein paar Turnschuhe kauft, müssen bei jeder Bestellung ein paar Standardinformationen angegeben werden. Wir haben im Folgenden ein paar Beispiele zusammengetragen, die unabhängig von der Industrie relevant für Betrugserkennung sind:

Das Alter der Emailadresse: Ein Betrugspräventionssystem hat meistens Zugriff auf das Alter der Emailadresse. Im Allgemeinen gilt dabei, je älter eine Emailadresse, umso legitimer ist eine Bestellung, die mit ihr aufgegeben wurde. Eine Emailadresse, die vor sieben Jahren registriert wurde ist damit sicherer als eine, die erst wenige Tage alt ist.

Expressversand: Händler sollten bei Expressversand besonders aufmerksam sein (es sei denn sie sind Amazon). Verbraucher sind nämlich in der Regel nicht bereit mehr Geld für Expressversand zu zahlen. Einem Betrüger hingegen macht es jedoch nichts aus mehr für den Expressversand zu bezahlen, da er ja nicht sein eigenes Geld ausgibt und die Ware zudem so schnell wie möglich in Empfang nehmen kann.

Bestellungen reduzierter Ware: Bestellungen von reduzierten Waren sind meist sicherer, als von teurer Ware. Reduzierte Ware hat für Betrüger einen geringeren Wert, weswegen Riskifieds Daten zeigen, dass Betrug an Tagen, wie dem Black Friday um 50% niedriger ist.

Obwohl diese Funktionen im gesamten E-Commerce Standard sind, müssen sie je nach Kontext unterschiedlich bewertet werden. Betrüger sind nämlich in der Lage sieben Jahre alte Emailkonten zu hacken, um das System auszutricksen und viele neue Emailadressen sind vollkommen sicher. Einige Kunden sind zudem bereit etwas mehr für den Expressversand ihrer Ware zu bezahlen. Aus diesem Grund werden Merkmale in verschiedenen Modellen unterschiedlich gewichtet, und wir fügen in einzelnen Branchen Merkmale, die für diese bestimmte Branche wichtig sind, hinzu, um die Genauigkeit des Modells bei der Betrugserkennung weiter zu erhöhen.

Besonderheiten der Branche

Für jede Branche brauchen wir spezifische Merkmale, da nicht alle Merkmale für jede Branche relevant sind. Urlaubsreisen, die Monate vorher gebucht werden gelten in der Reiseindustrie als sicherer, als Lastminute-Reisen. Zeit vor der Abreise ist jedoch kein Merkmal, das auf die Modebranche angewendet werden kann. Weiterversand könnte ein Anzeichen für Betrug im Zusammenhang mit einer Bestellung in der Unterhaltungselektronik sein, jedoch nicht unbedingt auffällig für eine Bestellung von Luxusmode mit einer internationalen Kreditkarte. Im Folgenden haben wir einige Beispiele für branchenspezifische Merkmale aufgelistet, die bei der Aufdeckung von Betrug hilfreich waren:

Beziehung zwischen Alter und Arten der Geschenkgutscheine: Ältere Verbraucher kaufen in der Regel keine Geschenkgutscheine für Xboxen, außer es ist ein Weihnachts- oder Geburtstagsgeschenk für ihre Enkelkinder. Anderweitig liegt der Verdacht nahe, dass es sich um Betrug handelt. Aufgrund angereicherter Daten von Drittquellen können Modelle, unter Anbetracht des Alters des Käufers und der Saison, feststellen, ob es sich um eine legitime Bestellung handelt.

Hintergrund des Verkäufers auf Sneaker-Marketplaces: Viele Verbraucher kaufen Sneakers auf Online-Marketplaces auf denen allerlei Produkte vertreiben werden. In der Turnschuhindustrie ist das Wissen, dass der Verkäufer bereits an viele Kunden verkauft und eine niedrigere Chargeback-Rate hat, ein stärkerer Indikator für das Modell, dass es sich bei einem Kauf bei eben diesem Verkäufer wahrscheinlich weniger um Betrug handelt.

Entfernung zwischen IP-Adresse und Rechnungsadresse: Dies ist ein Merkmal, dass nützlich für viele Branchen ist, jedoch abhängig von der Branche unterschiedliche Auswirkungen hat. Eine weite Entfernung zwischen IP- und Rechnungsadresse ist für den Kauf eines Flugtickets weniger alarmierend, als es für die Bestellung von Mode oder Elektronikartikeln ist. Bei Einkäufen im Einzelhandel sind IP-Adressen, die mehr als 10 Meilen von einer Rechnungsadresse entfernt sind, verdächtiger. Im Zuge von Reisetickets ist es wahrscheinlicher, dass sich der Käufer in einem anderen Land aufhält, wenn er sich entscheidet, einen Flug zu buchen oder eine Veranstaltung zu besuchen.

Maschinelles Lernen: Unterm Strich

Merkmale sind die Bausteine für Modelle des maschinellen Lernens. So wie ein Turm mit mehr ineinander greifenden Bausteinen stabiler ist, kann ein statistisches Modell mit komplexeren Merkmalen seine Genauigkeit verbessern. Durch mehr Funktionen, sowohl allgemeinen als auch branchenspezifischen, lernt das Modell, wie viel Gewicht jeder Eingabe zuzuweisen ist, was mehr Kontext in seine Entscheidungsfindung einfließen lässt. Denken Sie an einige der angeführten Beispiele. Welche Merkmale wenden Sie in ihrem Unternehmen an? Und stellen Sie sich dann vor um wie viel einfacher es wäre, wenn Ihnen ein Modell bei der Entscheidungsfindung helfen würde. Mit Fragen wenden Sie sich bitte an [email protected].