Back to Dealfront DigestDealfront Life

KI bei Dealfront: Der Firmenversteher Company2Vec

Matthias Keller 16 August 2023

This article is also available in German.

AI technology Dealfront

Du suchst in unserem Tool Connect nach einer Firma und plötzlich siehst Du auf einen Blick, was diese Firma macht, indem Keywords und Branchencodes angezeigt werden. Oder Du suchst ähnliche Firmen zu einer Liste Deiner Bestandskunden und Dealfront liefert Dir diese B2B-Lookalikes im Handumdrehen.

Cluster search in Dealfront

Blick ins Tool: So sieht die Keyword-, Branchen-, und Clustersuche in Dealfront aus Beispiele für Keywords:

  • Bauleitung, Bauleistungsversicherung

  • Finanzierung, DIN 20022

  • Anrufaufzeichnung, SIP Trunk

Beispiele für Branchen:

  • Baugewerbe

  • Finanzwesen

  • Telekommunikation

Beispiele für Trigger Events:

  • Bauprojekt

  • Gewinnsteigerung, Insolvenz

  • Stellenangebot

Wie machen unsere Tools das? Wie findet der Computer heraus, in welcher Branche eine Firma tätig ist oder welche Firmen ähnlich zueinander sind? Gerade Firmenähnlichkeit hat schließlich so viele Aspekte – von den Produkten, bis zu den Leistungen (Produktion, Vertrieb, Reparatur…) und der Größe eines Unternehmens spielen viele Faktoren eine Rolle.

In diesem speziellen Fall ist unser „Firmenversteher” am Werk – eine Technologie, die wir Company2Vec getauft haben. Dabei handelt es sich um ein einzigartiges, eigens für die Interpretation von Firmen entwickeltes Neuronales Netz. Vektoren und Textverarbeitung spielen hier eine wichtige Rolle. Welche genau, das sehen wir uns nun im Detail an.

Wie funktioniert Company2Vec?

Wir müssen ein bisschen ausholen, um die Funktionsweise unserer Company2Vec-Technologie zu erklären: Und zwar treffen bei der maschinellen Sprachverarbeitung, dem Natural Language Processing (NLP), drei Bereiche aufeinander: Linguistik, Informatik und künstliche Intelligenz. Die Sprache der Informatik und künstlichen Intelligenz sind Zahlen. Damit natürliche Sprache maschinell verarbeitet werden kann, muss zunächst ein ganz grundlegendes Problem gelöst werden: Wie lassen sich Texte in Zahlen umwandeln, damit die Maschine damit überhaupt rechnen kann?

Klassischerweise wurde früher jedem Wort einfach eine Zahl zugeordnet. Texte werden so zu Reihen aus Zahlen. Aus viel Input-Text konnten Maschinen zwar auch Muster und wiederkehrende Strukturen lernen, aber für den Computer war das Zahlensymbol für „Boss“ nur ein inhaltloser Platzhalter, der genauso wenig Bezug zum Zahlensymbol für „Chef“ hatte, wie zu jedem anderen Wort. Wortbedeutungen, Wortähnlichkeiten, Plural- / Singularformen, all dies war für die Computer nicht mehr erfassbar.

Der Durchbruch ereignete sich, als die NLP-Forschung erkannte, dass sie Sprache auch durch Vektoren mit besonderen Eigenschaften ausdrücken kann. Ein Vektor ist zunächst mal ziemlich unspektakulär: Es sind lediglich die Koordinaten eines Punktes im Raum. Im dreidimensionalen Raum lässt sich jeder Punkt durch drei Werte beschreiben: Die x-, y- und z-Koordinate (Grafik). Im NLP-Bereich haben die Vektoren in der Regel deutlich mehr als drei Dimensionen, aber das Prinzip ist das gleiche.

Vector system AI Dealfront

Vektoren im Raum: KI bei Dealfront

Egal wie viele Dimensionen – die Vektoren (Punkte im Raum) haben nun die praktische Eigenschaft, dass sich die Entfernung zwischen jeweils zwei Punkten bestimmen lässt. Im NLP-Bereich war es irgendwann möglich, jedem Wort einen Vektor (Punkt) zuordnen, und zwar so, dass ähnliche Wörter möglichst nahe beieinander liegen. Der Punkt für Chef liegt also in der Nähe von anderen ähnlichen Punkten, z.B. den Punkten für Chefin oder Boss. Das erste erfolgreiche Verfahren dieser Art wird Word2Vec genannt.

Solche oder ähnliche Vektor-Modelle liegen heute praktisch allen Deep-Learning-Anwendungen, die Texte verarbeiten, zugrunde.

Wie passt das nun zu unserem Company2Vec? Nun, im NLP-Bereich stand man vor dem Problem, wie man Wörter lernenden Algorithmen zugänglich macht, ohne dass deren Eigenschaften und Bedeutung verloren geht. Wir standen wiederum vor der Herausforderung, wie wir Firmen und deren Eigenschaften lernenden Algorithmen zugänglich machen. Wie Word2Vec setzt Company2Vec auf Vektoren, die Ähnlichkeiten als Entfernungen zueinander ausdrücken. Allerdings entsprechen die Vektoren bei Company2Vec nicht Wörtern, sondern Firmen. Wir haben ein tiefes neuronales Netz entwickelt, das aus verschiedenen Texten über eine Firma (z.B. Firmenbeschreibungen auf Webseiten) solche Vektoren berechnet. Für die Verarbeitung von Firmen mit neuronalen Netzen war Company2Vec für uns ein Durchbruch, wie es Word2Vec bei der Verarbeitung von Wörtern war.

Exkurs aus dem Alltag: Company2Vec vs. Maschinelle Übersetzung

Im Prinzip können nicht nur Wörter, sondern auch Sätze oder sogar ganze Texte als Vektor dargestellt werden. Dabei wird z.B. einem Satz ein Punkt im Raum zugewiesen. Systeme, die Sätze oder Texte in Vektoren umwandeln, werden Encoder genannt. Solche Encoder sind im NLP-Bereich in vielen Anwendungen üblich. Unser Company2Vec-Encoder hat aber besondere Eigenschaften.

Um dies zu verstehen, schauen wir uns Systeme an, die wir alle kennen und nutzen: Maschinelle Übersetzungssysteme aus dem Internet. Google Translate, DeepL und Co. liefern uns oft sehr präzise bis hin zu haarsträubenden Übersetzungen. Unter der Haube finden sich auch hier Vektor-Encoder. Die Vektoren stellen die Brücke zwischen den Sprachen dar. Vektor-Encoder packen die gesamte Bedeutung von Sätzen in Vektoren, die dann von Vektor-Decodern wieder in ganze Sätze der Zielsprache entschlüsselt werden.

Für die maschinelle Übersetzung ist der Inhalt eines Satzes und jede Formulierung relevant. Daher muss der Encoder so trainiert sein, dass er alle Feinheiten erkennt und eine präzise Übersetzung erzeugt. Alles steckt in diesem Vektor.

AI translation content

Die KI erkennt den Kontext und übersetzt das deutsche Wort „Kater" so mit der richtigen Bedeutung: Beispiel einer maschinellen Übersetzung (Quelle: DeepL)

Bei unserem Company2Vec-Encoder verhält es sich anders. Wenn wir die Tätigkeit, Ausrichtung und Größe von Firmen aus Texten mit einem Encoder erfassen wollen, muss dieser so trainiert sein, dass er nur die Informationen aus einer Firmenbeschreibung oder Webseite extrahiert, die für uns relevant sind. Das heißt, hier muss der Encoder unabhängig von der Formulierung arbeiten. Bei der maschinellen Übersetzung unterscheiden sich die Vektoren bei unterschiedlichen Formulierungen. Beim Company2Vec sollen sie jedoch möglichst gleich sein, wenn es sich um die gleiche Firma handelt.

Was macht Company2Vec so besonders?

Bei Dealfront haben wir eine Möglichkeit gefunden, den Company2Vec-Encoder so zu trainieren, dass nur die relevanten Merkmale einer Firma erfasst werden. Im Vektorraum, auf dem die Firmen abgebildet werden, liegen Firmen, die einander ähnlich sind, deshalb nahe beieinander. Durch unser Trainingsverfahren sind diese gelernten Ähnlichkeiten sehr intuitiv – die berechneten Ähnlichkeiten liegen sehr nahe an der menschlichen Einschätzung. Außerdem können wir dieses spezielle Verfahren ganz einfach internationalisieren. Der Encoder kann auch Unternehmen, zu denen wir nur Text in Fremdsprachen haben, auf dem gleichen Vektorraum abbilden.

Mit diesen Input-Daten können wir nun bessere neuronale Netze für eine Vielzahl von Anwendungen entwickeln, die in Zusammenhang mit Firmen stehen. Wir verfügen über eine Basistechnologie, von der unsere Kunden in den nächsten Jahren profitieren werden und die wir Schritt für Schritt in weiteren Sprachen ausrollen werden.

erklärt Martin Meyries, Data Science Manager @ Dealfront

Was leistet Company2Vec alles?

Unser Company2Vec-System kommt an vielen Stellen in unseren Produkten zum Einsatz. Wie bereits erwähnt, spielt es bei der Funktion „Ähnliche Firmen finden“ eine große Rolle. Außerdem prädiziert es unsere Branchencodes und kann die Standards verschiedener Länder aufeinander abbilden. Mithilfe des Company2Vec können wir die Relevanz von Keywords prüfen – hierbei prüft der Computer, ob ein Keyword auch bei anderen, ähnlichen Firmen verwendet wird. Falls ja, ist es ein „gutes“ bzw. hochrelevantes Keyword zu einer Firma. An weiteren Anwendungsfeldern arbeiten wir mit Hochdruck! Künftig sollen alle Modelle, bei denen die Tätigkeit von Unternehmen eine Rolle spielt (beispielsweise verbesserte Vorhersage des Umsatzes einer Firma, Next-Customer-Prediction und vieles mehr), auf Company2Vec aufbauen.

Ein Beispiel für die Funktionsweise von Company2Vec:

→ Firma, die Laborausstattung herstellt, sucht ähnliche Firmen zu Bestandskunden.

→ Dealfront Target (oder besser gesagt: Company2Vec) erkennt verschiedene Cluster: medizinische Labore, Schwimmbäder, Chemiebetriebe und vieles mehr

→ Ergebnis: Target spielt dem Laborausstatter gleich 350 neue hochinteressante Firmen inkl. Ansprechpartner und allen relevanten Details aus!

Cluster Dealfront

Blick in Tool: Alle Chancen mit Dealfront

Fall Du Dich gefragt hast, wie Künstliche Intelligenz sich konkret in unseren Tools auswirkt, haben wir ein paar Screenshots für Dich mitgebracht.

Dealfront Connect 

Hier siehst Du wie einen Teil des 360°-Firmenprofils in Connect aussieht, das Dich mit allen wichtigen Informationen zu Deinen Bestands- und Zielkunden versorgt:

 360° Firmenprofil am Beispiel von Dealfront Germany

Blick ins Tool: Connect

Dealfront Target

Ein anderer Teil unser Produkt-Suite, der immens von KI profitiert, ist unser Leadgenerierungs-Tool Target. Hier kannst Du anhand von über 100 Filteroptionen Deine Wunschkunden definieren, Leadlisten erstellen und so Deine Sales- und Marketing Funnel ordentlich füllen!

Filter overview in Dealfront Target

Blick ins Tool: Firmenfilter in Target

Gerade bei den Keyword- und Themensuche profitierst Du von zahlreichen Wahlmöglichkeiten – und Vorschlägen! – die Dir helfen, genau Deine Zielgruppe zu finden.

Keyword and topic search in Dealfront Target

Keyword- und Themensuche in Target

Fazit: Company2Vec verschafft Dir neue Möglichkeiten

Ganz abgesehen von der ganzen Technologie, die hinter Company2Vec steckt, brauchst Du Dir eigentlich nur merken, dass er Dir und Deinem Business Vorteile bringt! Einige davon wollen wir Dir mal aufzählen:

  • Spare Recherchezeit: Mit Company2Vec findest Du blitzschnell ähnliche Firmen zu Deinen Bestandskunden – vielleicht auch Firmen, die Du vorher gar nicht auf dem Schirm hattest.

  • Spezifische Pitches: Die gefundenen ähnlichen Firmen kannst Du mit einem ähnlichen, hochspezifischen Pitch überzeugen. Wieso? Nun, Deine Bestandskunden kennst Du schließlich bereits sehr gut und kannst ihre Use Cases direkt ummünzen!

  • Bessere Leads: Falls Leadqualität bei Dir mal ein Problem darstellt, schafft Company2Vec Abhilfe: Wenn Du dem System nur die besten Lead- oder Kundenlisten als Datenfutter bietest, findet es für Dich ähnliche Firmen, die ebenfalls Deinen Qualitätsstandards entsprechen.

Also worauf wartest Du? Lerne Dealfront gerne in einer unverbindlichen Demo kennen und probiere unsere KI-Tools selbst aus!

Intelligente B2B-Daten für Dein Business in Europa

Wir helfen Dir, Daten, Tools und Insights zu finden, um jeden europäischen Markt zu gewinnen.

Demo anfordern
cta-book-a-demo