Dealfront Life

KI bei Dealfront: Der Firmenversteher Company2Vec

Matthias Keller ∙ 16 August 2023
AI technology Dealfront

Du suchst in unserem Tool Connect nach einer Firma und plötzlich siehst Du auf einen Blick, was diese Firma macht, indem Keywords und Branchencodes angezeigt werden. Oder Du suchst Àhnliche Firmen zu einer Liste Deiner Bestandskunden und Dealfront liefert Dir diese B2B-Lookalikes im Handumdrehen.

Cluster search in Dealfront

Blick ins Tool: So sieht die Keyword-, Branchen-, und Clustersuche in Dealfront aus Beispiele fĂŒr Keywords:

  • Bauleitung, Bauleistungsversicherung

  • Finanzierung, DIN 20022

  • Anrufaufzeichnung, SIP Trunk

Beispiele fĂŒr Branchen:

  • Baugewerbe

  • Finanzwesen

  • Telekommunikation

Beispiele fĂŒr Trigger Events:

  • Bauprojekt

  • Gewinnsteigerung, Insolvenz

  • Stellenangebot

Wie machen unsere Tools das? Wie findet der Computer heraus, in welcher Branche eine Firma tĂ€tig ist oder welche Firmen Ă€hnlich zueinander sind? Gerade FirmenĂ€hnlichkeit hat schließlich so viele Aspekte – von den Produkten, bis zu den Leistungen (Produktion, Vertrieb, Reparatur
) und der GrĂ¶ĂŸe eines Unternehmens spielen viele Faktoren eine Rolle.

In diesem speziellen Fall ist unser „Firmenversteher” am Werk – eine Technologie, die wir Company2Vec getauft haben. Dabei handelt es sich um ein einzigartiges, eigens fĂŒr die Interpretation von Firmen entwickeltes Neuronales Netz. Vektoren und Textverarbeitung spielen hier eine wichtige Rolle. Welche genau, das sehen wir uns nun im Detail an.

Wie funktioniert Company2Vec?

Wir mĂŒssen ein bisschen ausholen, um die Funktionsweise unserer Company2Vec-Technologie zu erklĂ€ren: Und zwar treffen bei der maschinellen Sprachverarbeitung, dem Natural Language Processing (NLP), drei Bereiche aufeinander: Linguistik, Informatik und kĂŒnstliche Intelligenz. Die Sprache der Informatik und kĂŒnstlichen Intelligenz sind Zahlen. Damit natĂŒrliche Sprache maschinell verarbeitet werden kann, muss zunĂ€chst ein ganz grundlegendes Problem gelöst werden: Wie lassen sich Texte in Zahlen umwandeln, damit die Maschine damit ĂŒberhaupt rechnen kann?

Klassischerweise wurde frĂŒher jedem Wort einfach eine Zahl zugeordnet. Texte werden so zu Reihen aus Zahlen. Aus viel Input-Text konnten Maschinen zwar auch Muster und wiederkehrende Strukturen lernen, aber fĂŒr den Computer war das Zahlensymbol fĂŒr „Boss“ nur ein inhaltloser Platzhalter, der genauso wenig Bezug zum Zahlensymbol fĂŒr „Chef“ hatte, wie zu jedem anderen Wort. Wortbedeutungen, WortĂ€hnlichkeiten, Plural- / Singularformen, all dies war fĂŒr die Computer nicht mehr erfassbar.

Der Durchbruch ereignete sich, als die NLP-Forschung erkannte, dass sie Sprache auch durch Vektoren mit besonderen Eigenschaften ausdrĂŒcken kann. Ein Vektor ist zunĂ€chst mal ziemlich unspektakulĂ€r: Es sind lediglich die Koordinaten eines Punktes im Raum. Im dreidimensionalen Raum lĂ€sst sich jeder Punkt durch drei Werte beschreiben: Die x-, y- und z-Koordinate (Grafik). Im NLP-Bereich haben die Vektoren in der Regel deutlich mehr als drei Dimensionen, aber das Prinzip ist das gleiche.

Vector system AI Dealfront

Vektoren im Raum: KI bei Dealfront

Egal wie viele Dimensionen – die Vektoren (Punkte im Raum) haben nun die praktische Eigenschaft, dass sich die Entfernung zwischen jeweils zwei Punkten bestimmen lĂ€sst. Im NLP-Bereich war es irgendwann möglich, jedem Wort einen Vektor (Punkt) zuordnen, und zwar so, dass Ă€hnliche Wörter möglichst nahe beieinander liegen. Der Punkt fĂŒr Chef liegt also in der NĂ€he von anderen Ă€hnlichen Punkten, z.B. den Punkten fĂŒr Chefin oder Boss. Das erste erfolgreiche Verfahren dieser Art wird Word2Vec genannt.

Solche oder Àhnliche Vektor-Modelle liegen heute praktisch allen Deep-Learning-Anwendungen, die Texte verarbeiten, zugrunde.

Wie passt das nun zu unserem Company2Vec? Nun, im NLP-Bereich stand man vor dem Problem, wie man Wörter lernenden Algorithmen zugĂ€nglich macht, ohne dass deren Eigenschaften und Bedeutung verloren geht. Wir standen wiederum vor der Herausforderung, wie wir Firmen und deren Eigenschaften lernenden Algorithmen zugĂ€nglich machen. Wie Word2Vec setzt Company2Vec auf Vektoren, die Ähnlichkeiten als Entfernungen zueinander ausdrĂŒcken. Allerdings entsprechen die Vektoren bei Company2Vec nicht Wörtern, sondern Firmen. Wir haben ein tiefes neuronales Netz entwickelt, das aus verschiedenen Texten ĂŒber eine Firma (z.B. Firmenbeschreibungen auf Webseiten) solche Vektoren berechnet. FĂŒr die Verarbeitung von Firmen mit neuronalen Netzen war Company2Vec fĂŒr uns ein Durchbruch, wie es Word2Vec bei der Verarbeitung von Wörtern war.

Exkurs aus dem Alltag: Company2Vec vs. Maschinelle Übersetzung

Im Prinzip können nicht nur Wörter, sondern auch SĂ€tze oder sogar ganze Texte als Vektor dargestellt werden. Dabei wird z.B. einem Satz ein Punkt im Raum zugewiesen. Systeme, die SĂ€tze oder Texte in Vektoren umwandeln, werden Encoder genannt. Solche Encoder sind im NLP-Bereich in vielen Anwendungen ĂŒblich. Unser Company2Vec-Encoder hat aber besondere Eigenschaften.

Um dies zu verstehen, schauen wir uns Systeme an, die wir alle kennen und nutzen: Maschinelle Übersetzungssysteme aus dem Internet. Google Translate, DeepL und Co. liefern uns oft sehr prĂ€zise bis hin zu haarstrĂ€ubenden Übersetzungen. Unter der Haube finden sich auch hier Vektor-Encoder. Die Vektoren stellen die BrĂŒcke zwischen den Sprachen dar. Vektor-Encoder packen die gesamte Bedeutung von SĂ€tzen in Vektoren, die dann von Vektor-Decodern wieder in ganze SĂ€tze der Zielsprache entschlĂŒsselt werden.

FĂŒr die maschinelle Übersetzung ist der Inhalt eines Satzes und jede Formulierung relevant. Daher muss der Encoder so trainiert sein, dass er alle Feinheiten erkennt und eine prĂ€zise Übersetzung erzeugt. Alles steckt in diesem Vektor.

AI translation content

Die KI erkennt den Kontext und ĂŒbersetzt das deutsche Wort „Kater" so mit der richtigen Bedeutung: Beispiel einer maschinellen Übersetzung (Quelle: DeepL)

Bei unserem Company2Vec-Encoder verhĂ€lt es sich anders. Wenn wir die TĂ€tigkeit, Ausrichtung und GrĂ¶ĂŸe von Firmen aus Texten mit einem Encoder erfassen wollen, muss dieser so trainiert sein, dass er nur die Informationen aus einer Firmenbeschreibung oder Webseite extrahiert, die fĂŒr uns relevant sind. Das heißt, hier muss der Encoder unabhĂ€ngig von der Formulierung arbeiten. Bei der maschinellen Übersetzung unterscheiden sich die Vektoren bei unterschiedlichen Formulierungen. Beim Company2Vec sollen sie jedoch möglichst gleich sein, wenn es sich um die gleiche Firma handelt.

Was macht Company2Vec so besonders?

Bei Dealfront haben wir eine Möglichkeit gefunden, den Company2Vec-Encoder so zu trainieren, dass nur die relevanten Merkmale einer Firma erfasst werden. Im Vektorraum, auf dem die Firmen abgebildet werden, liegen Firmen, die einander Ă€hnlich sind, deshalb nahe beieinander. Durch unser Trainingsverfahren sind diese gelernten Ähnlichkeiten sehr intuitiv – die berechneten Ähnlichkeiten liegen sehr nahe an der menschlichen EinschĂ€tzung. Außerdem können wir dieses spezielle Verfahren ganz einfach internationalisieren. Der Encoder kann auch Unternehmen, zu denen wir nur Text in Fremdsprachen haben, auf dem gleichen Vektorraum abbilden.

Mit diesen Input-Daten können wir nun bessere neuronale Netze fĂŒr eine Vielzahl von Anwendungen entwickeln, die in Zusammenhang mit Firmen stehen. Wir verfĂŒgen ĂŒber eine Basistechnologie, von der unsere Kunden in den nĂ€chsten Jahren profitieren werden und die wir Schritt fĂŒr Schritt in weiteren Sprachen ausrollen werden.

erklÀrt Martin Meyries, Data Science Manager @ Dealfront

Was leistet Company2Vec alles?

Unser Company2Vec-System kommt an vielen Stellen in unseren Produkten zum Einsatz. Wie bereits erwĂ€hnt, spielt es bei der Funktion „Ähnliche Firmen finden“ eine große Rolle. Außerdem prĂ€diziert es unsere Branchencodes und kann die Standards verschiedener LĂ€nder aufeinander abbilden. Mithilfe des Company2Vec können wir die Relevanz von Keywords prĂŒfen – hierbei prĂŒft der Computer, ob ein Keyword auch bei anderen, Ă€hnlichen Firmen verwendet wird. Falls ja, ist es ein „gutes“ bzw. hochrelevantes Keyword zu einer Firma. An weiteren Anwendungsfeldern arbeiten wir mit Hochdruck! KĂŒnftig sollen alle Modelle, bei denen die TĂ€tigkeit von Unternehmen eine Rolle spielt (beispielsweise verbesserte Vorhersage des Umsatzes einer Firma, Next-Customer-Prediction und vieles mehr), auf Company2Vec aufbauen.

Ein Beispiel fĂŒr die Funktionsweise von Company2Vec:

→ Firma, die Laborausstattung herstellt, sucht Ă€hnliche Firmen zu Bestandskunden.

→ Dealfront Target (oder besser gesagt: Company2Vec) erkennt verschiedene Cluster: medizinische Labore, SchwimmbĂ€der, Chemiebetriebe und vieles mehr

→ Ergebnis: Target spielt dem Laborausstatter gleich 350 neue hochinteressante Firmen inkl. Ansprechpartner und allen relevanten Details aus!

Cluster Dealfront

Fazit: Company2Vec verschafft Dir neue Möglichkeiten

Ganz abgesehen von der ganzen Technologie, die hinter Company2Vec steckt, brauchst Du Dir eigentlich nur merken, dass er Dir und Deinem Business Vorteile bringt! Einige davon wollen wir Dir mal aufzÀhlen:

  • Spare Recherchezeit: Mit Company2Vec findest Du blitzschnell Ă€hnliche Firmen zu Deinen Bestandskunden – vielleicht auch Firmen, die Du vorher gar nicht auf dem Schirm hattest.

  • Spezifische Pitches: Die gefundenen Ă€hnlichen Firmen kannst Du mit einem Ă€hnlichen, hochspezifischen Pitch ĂŒberzeugen. Wieso? Nun, Deine Bestandskunden kennst Du schließlich bereits sehr gut und kannst ihre Use Cases direkt ummĂŒnzen!

  • Bessere Leads: Falls LeadqualitĂ€t bei Dir mal ein Problem darstellt, schafft Company2Vec Abhilfe: Wenn Du dem System nur die besten Lead- oder Kundenlisten als Datenfutter bietest, findet es fĂŒr Dich Ă€hnliche Firmen, die ebenfalls Deinen QualitĂ€tsstandards entsprechen.

Also worauf wartest Du? Lerne Dealfront gerne in einer unverbindlichen Demo kennen und probiere unsere KI-Tools selbst aus!