Sponsoring zielgerichtet auswerten: Interview mit unserem Data Science-Experten

Computer Vision ETECTURE

Egal ob bei der Tour de France, in der Formel 1 oder beim Skispringen: Sport-Sponsoring ist regelmäßig Teil von Marketingkonzepten. Für die Analyse des Erfolgs stellt sich die Frage nach der grundsätzlichen Sichtbarkeit und der gesamten Anzeigedauer des Logos in der Live- und Nachberichterstattung zu einer Sportveranstaltung. Beantwortet wird diese Frage in der Regel durch die Auswertungen der Fernseh- und Videoberichterstattung durch Analysten – ein personal- und zeitintensiver Vorgang, der außerdem fehleranfällig und teuer ist. Ein von uns entwickeltes, auf Computer Vision basierendes Modell hilft, die Berichterstattung schneller, besser und günstiger auszuwerten. Wir haben mit unserem Kollegen Patrick Gebert, Data Scientist, über die Entwicklung und Besonderheiten des Modells gesprochen.

 

Patrick, du bist seit zwei Jahren als Data Scientist bei ETECTURE und bringst Themen wie Computer Vision voran. Was fasziniert dich daran?

 

Patrick Gebert: Mich fasziniert es, Computern mit Hilfe von Machine Learning und datengetriebenen Ansätzen Fähigkeiten beizubringen, die mit reiner Manpower erreichte Ergebnisse übertreffen und uns überraschen. Die Vielseitigkeit der Anwendungsfälle beeindruckt mich ebenfalls. Sei es die Texterkennung im Rahmen einer Dokumentenanalyse, die Unterstützung der Qualitätskontrolle bei der Durchsicht von Produkten auf Mängel oder die Vorhersage von bestimmten Ereignissen. Darüber hinaus begeistert es mich, wie datengetriebene Ansätze Unternehmensprozesse vereinfachen und Mehrwerte für die Kunden schaffen können.

 

Ihr habt vor kurzem mithilfe von Computer Vision ein Modell trainiert, das es ermöglicht, die Live- und Nachberichterstattung von Events hinsichtlich der Sichtbarkeit von Sponsorenlogos zu evaluieren. Wie seid ihr darauf aufmerksam geworden?

 

Patrick: Wir haben uns mit einem Anbieter unterhalten, der unter anderem auf Sponsoringevaluierung im Sportbusiness-Sektor spezialisiert ist. Im Austausch erfuhren wir, dass Mitarbeitende Live- und Nachberichterstattungen direkt auswerten und auf dieser Basis hochwertige Analysen erstellen. Das stellt eine unglaubliche Fleißarbeit mit hohem zeitlichem Aufwand dar, die zudem leider fehleranfällig sein kann. Dadurch entstand die Idee, unsere Fähigkeiten im Bereich Computer Vision einzusetzen und ein Modell zu entwickeln. Mit diesem beabsichtigen wir, den Aufwand zu reduzieren und es zu ermöglichen, Analysen wesentlich effizienter und mit deutlich reduzierter Fehleranfälligkeit erstellen zu können. Dass es eine sehr große Herausforderung werden würde, war allen Beteiligten von Anfang an bewusst - trotzdem sind wir gemeinsam mit einer großen Begeisterung in dieses Projekt gestartet.

 

Wie seid ihr an die Umsetzung herangegangen? Welche Herausforderungen kamen dabei auf euch zu?

 

Patrick: In den Gesprächen hat sich sehr schnell abgezeichnet, dass zwei Kernherausforderungen bestehen. Zum einen waren dies die wenigen Trainingsdaten für bestimmte Marken. Denn in diesem Fall waren Marken von kleineren deutschen Herstellern gefordert. Normalerweise gibt es Datensätze für Millionen von Markenlogos frei verfügbar, aber für bestimmte Marken ist es ungleich schwerer, Bildmatertial mit gelabelten Logos in großem Stil zu bekommen. Zum anderen bestand die Herausforderung darin, ein Modell ohne Nachtraining zu entwickeln. Das soll es Mitarbeitenden ermöglichen, das Modell eigenständig ohne Fachwissen anzupassen und zu erweitern.

 

Deshalb haben wir ein Modell trainiert, das die Struktur von Logos im Allgemeinen erfasst und auf Python sowie Pytorch basiert. Dadurch erkennt es in einem ersten Schritt einen Bildausschnitt als Logo. Allerdings kann so die Marke des Kunden noch nicht identifiziert werden. In einem zweiten Schritt wird deshalb ein Referenzbild des Kunden hinzugezogen, mit dessen Hilfe die Ähnlichkeit zwischen dem erkannten Logo aus dem Bildausschnitt und dem Referenzbild berechnet wird. Ist die Ähnlichkeit hoch, wird es dem Kunden zugeordnet. Somit erlaubt uns das Modell, fehlende Trainingsdaten für eine bestimmte Marke auszugleichenund es benötigt niemals ein Nachtraining. Ein Referenzbild genügt, um Logos in Berichterstattungen zuverlässig Marken zuzuordnen.

 

Wo siehst du die Vorteile der Entwicklung?

 

Patrick: Mich begeistert vor allem, dass wir einen Ansatz gefunden haben, beide Herausforderungen in einem Zug lösen zu können: die mangelnden Daten und die komplexe Anpassung der Modelle. Uns kommt dabei zugute, dass die Struktur von Logos immer recht ähnlich ist und wir dahingehend nicht auf Trainingsdaten angewiesen sind. Zudem erleichtern wir so Mitarbeitenden die Anwendung, da das Nachtraining entfällt und nur ein Referenzbild zur Analyse benötigt wird. Durch das datengetriebene Modell kann die monotone und fehleranfällige Arbeit der visuellen Analyse von Fernseh- und Videomaterial schneller, kosteneffektiver und effizienter erledigt werden. Der Aufwand reduziert sich somit spürbar und die Analyse basiert dennoch auf einem stabilen Vorgehen.

 

Insgesamt können wir mit Computer Vision die Arbeit sowie Unternehmensprozesse unserer Kunden vereinfachen und unsere Kunden fit für die Herausforderungen der Zukunft machen – und das begeistert mich.

Patrick Gebert ETECTURE

Was sind eure aktuellen Erkenntnisse zum Modell?

 

Patrick: Wir haben unseren Ansatz in einem ersten Proof of Concept validiert und konnten zeigen, dass das Modell in der Lage ist, Logos zu erkennen, die es bisher nur ein einziges Mal gesehen hatte. In einem nächsten Schritt soll es weiter ausgebaut werden, damit es robuster wird. Momentan sehen wir noch Verbesserungspotenzial bei stark deformierten Logos oder solchen, die nur teilweise zu sehen oder gar verschwommen sind. Das trifft insbesondere auf Logos zu, die bei hoher Geschwindigkeit wie beim Skispringern oder im Rennsport zu sehen sind. Diese Punkte sind im Bereich Computer Vision allerdings oft problematisch, aber mithilfe von Data Documentation relativ einfach zu lösen. Grundsätzlich sind wir auch mit der bisherigen Erkennungsrate zufrieden, die wir jedoch weiter steigern wollen.

 

Welche weiteren Entwicklungsschritte wären denkbar?

 

Patrick: Unsere Vision ist es, mithilfe des Modells einen Mehrwert bei der Entscheidung und Analyse im Sponsoring zu schaffen. In einem ersten Schritt planen wir, noch mehr Informationen zum Kontext der Platzierung des Logos zu extrahieren. Zum Beispiel auf welchem Werbeträger (Person, Gegenstand, Sportgerät) sich ein Logo befindet. Darauf aufbauend streben wir eine Ausweitung der Analyse an, sodass Unternehmen mit unserem Modell eine objektive Entscheidung basierend auf Zahlen treffen können, wo ihr Logo für eine erfolgreiche Werbekampagne angebracht und platziert sein sollte. Ob es die Unter- oder Oberseite des Skis ist, der Heckflügel des Rennwagens oder die Ostkurve des Stadions. Momentan ist das in den bestehenden Prozessen nicht verlässlich durchführbar, sodass die Empfehlungen auf der Erfahrung der Analysten beruht.

 

Herzlichen Dank für das Gespräch, Patrick!

Das Interview führte Sonja Wahl, Werkstudentin im Marketing bei ETECTURE.

Ansprechpartner