OVK Contextual Standard

Der Online-Vermarkterkreis (OVK) im Bundesverband Digitale Wirtschaft (BVDW) e. V. ist die Interessenvertretung der Online-Display-Vermarkter am deutschen Werbemarkt. Sie setzen sich für die Stärkung des nationalen Online-Werbemarktes und die Erhaltung seiner Angebotsvielfalt ein. Gemeinsam mit den Marktpartnern entwickeln und fördern sie Standards und Regelwerke, um Orientierung zu liefern und Markttransparenz herzustellen.

Eine neu erarbeitete Vorgabe in Hinblick auf diese Ziele ist die Schaffung eines einheitlichen Kriterienkataloges, der bei der Betrachtung von Inhalte-Klassifizierungstechnologien zum Einsatz kommt. Ziel soll sein, für Dritte die Funktionsweise und Qualitätssicherung der eingesetzten Technologie offen zu legen und damit Vertrauen und Transparenz in diese zu schaffen. Um zu vermeiden, dass sich verschiedene Marktteilnehmer verschiedenen Taxonomien bedienen und um Anforderungen an den Datenschutz und Transparenz hochzuhalten, wurden seitens der OVK Mitglieder an einem gemeinsamen Regelwerk gearbeitet, welches sowohl eine einheitliche Taxonomie, nach der die Klassifizierung stattfinden soll, als auch eine Dokumentations- und Qualitätssicherungsrichtlinie beschreibt.

Weitere Informationen sind in der offiziellen Meldung  und entsprechendem Handout des BVDW zu finden.

Contextual Classification – Funke Digital

Funke setzt bei der Umsetzung des Standards auf die kontextuelle Klassifizierungs-Technologie von IBM Watson, welche sowohl direkt via API als auch durch die Data Management Plattform (DMP) Permutive angebunden ist. Die Klassifizierung erfolgt nach der IAB Content Taxonomie, wodurch eine wesentliche Rahmenbedingungen des OVK Contextual Standards erfüllt wird. Nachdem sich nun auch Google mit Publisher Provided Signal der IAB Content Taxonomie angeschlossen haben, hat sie sich als weltweiter Standard etabliert. So ist das Vergleichen von Reichweiten und Performance, Platform- und Kanalübergreifend möglich. Dank einem größeren Umfang an sensiblen Kategorien, erfüllen wir mit dem OVK Contextual Standard zusätzlich einen höheren Datenschutz und damit auch einen besseren Schutz des Markenimages unserer Kunden. In einem internen Benchmarking von 300 Artikeln, haben wir im Vergleich zu anderen Classification Lösungen eine um 28 % treffendere semantische Einordnung mit dem Watson Modell erzielen können (Details gern auf Anfrage).

Systemfunktionalität

Beschreibung der Anbindung der Services und Überprüfbarkeit der Ergebnisse.

Anbindung und Ablauf der Klassifikation über DMP Permutive

Permutive greift auf die IBM Watson API zurück, um Inhalte, die mit einem Ad Targeting versehen werden sollen, zu klassifizieren. Das Ergebnis fließt durch onsite segmentation unmittelbar in die jeweiligen Zielgruppendefinitionen ein.

Der Ablauf ist folgender:

  1. Neue URL / neuer Artikel wird durch Permutive Script auf Seite identifiziert
  2. Relevanz der URL für Klassifizierung wird nach 50 gemessenen Seitenaufrufen festgestellt, wodurch der Artikeltext aus dem body Element der Seite sowie der Titel und die Url zur Klassifizierung an die IBM Watson API gesendet werden.
  3. Das Ergebnis der Klassifizierung steht anschließend in einem Cache zur Verfügung, wodurch es bei jedem weiteren Artikelaufruf zur Segmentierung eines Nutzers und anschließendem Ad-Targeting eingesetzt werden kann.
  4. Das Ergebnis kann jederzeit über einen JS Parameter auf der Seite eingesehen werden.
  5. Neue oder republished Artikel erhalten eine neue URL und starten hierdurch den Prozess von neuem.

Dauer der Klassifizierung: 50 Seitenaufrufe nach Neuerscheinen eines Artikels.

Anbindung und Ablauf der Klassifikation über proprietäre Data Pipeline

Neben der Integration via Permutive verfügt Funke über eine direkte Integration zur Watson API als Teil des contextual Targetings Produktes „FUX“ von Funke.

  1. Neue URL / neuer Artikel wird durch Analytics Technologie Snowplow auf Seite identifiziert.
  2. Folgende Prozessierungsschritte werden hierdurch ausgelöst:
    1. Crawler speichert HTML-Seite ab
    2. Daten werden aus relevanten Inhalten und Metadaten entnommen und via ETL Strecke (Extract Transform Load) prozessiert
  3. Der Body und Titel der URL wird zur Klassifizierung via API an folgende Services gesendet:
    1. IBM Watson
    2. Google NLP
  4. Das Klassifizierungsergebnis wird einer Artikel Datenbank hinzugefügt und via API an das jeweilige CMS der Webseite übertragen.
  5. Es steht anschließend im CMS am jeweiligen Artikel zur Verfügung, wodurch es bei jedem weiteren Artikelaufruf direkt im Seitenquellcode eingebettet ohne Verzögerung zur Anreicherung des Adrequest-Targetings genutzt werden kann.

Dauer der Klassifizierung ca. 3min nach Veröffentlichung eines Artikels

Standards und Datenschutz

Es wird gemäß der IAB Content Taxonomy 2.2 klassifiziert. Dabei werden sensible Kategorien gemäß OVK-Vorgabe ausgeschlossen und über ein Keyword „bvdw_sensitive“ gelabeled. Alle Ergebnisse können über einen Funktionsaufruf auf den jeweiligen Seiten eingesehen werden. Das Klassifizierungsergebnis kann potentiell gemäß Open RTB-Protokoll via User Object an den Bidrequest übergeben werden.

Ergebnisse und Qualitätssicherung

In folgendem PDF sind Klassifizierungsergebnisse von 50 zufälligen Vermarktungsrelevaten Seiten der Funke Mediengruppe aufgelistet. Diese werden regelmäßig aktualisiert. Weiterhin kann unter der u.g. Kontaktadresse ein debug script angefragt werden, über welches die jeweiligen Klassifizierungsergebnisse auf beliebigen publishing domains der Funke Mediengruppe  eingesehen werden können.

Zweistufiges Prüfverfahren

Die o.g. Ergebnisse werden automatisiert mit dem Google NLP Klassifizierungsergebnis abgeglichen. Bei Unregelmäßigkeiten wird eine manuelle Prüfung der entsprechenden Artikel veranlasst. Parallel dazu werden monatlich Stichproben auf Validität überprüft.

Kontakt

Das Team Adtechnology & Monetization beantwortet gern Ihre Fragen unter admo-data@funkemedien.de