Warum du wissen solltest, was ein CV-Parser ist

14.1.2023
Human Resources

Resume Parsing, auch bekannt als CV Parsing, Resume Extraction oder CV Extraction, ist die Umwandlung eines Freiform-Lebenslaufs (bspw. ein PDF, Word etc.) in strukturierte Daten und in durchsuchbaren Dateiformaten wie XML oder JSON. Dadurch werden die extrahierten Daten aus dem Lebenslauf für die Speicherung, Berichterstattung und Bearbeitung durch einen Computer aufbereitet und geeignet.

Personalvermittler / Personalberater, Jobbörsen und interne Personalverantwortliche arbeiten mit diversen Lebenslauf-Parsing-Tools, um die Speicherung und Analyse von Lebenslaufdaten zu automatisieren. Das spart den Recruitern oder Personalvermittlern Zeit, da sie nicht mehr jede Bewerbung und jeden Lebenslauf manuell bearbeiten müssen, und rationalisiert somit auch den Einstellungsprozess.

Aber die Basics zuerst, bevor wir in die Tiefe gehen: Das gängigste Format für einen Lebenslauf ist MS Word. Obwohl es für Menschen leicht zu lesen und zu verstehen ist, ist es für einen Computer ziemlich schwierig zu interpretieren. Im Gegensatz zu unserem Gehirn, das den Kontext durch das Verstehen der Situation und die Berücksichtigung der Wörter um sie herum gewinnt oder verbreitet, ist ein Lebenslauf für einen Computer nur eine lange Abfolge von Buchstaben, Zahlen und Interpunktionszeichen. Und dem wird durch einen CV Parser Abhilfe geschaffen. 

Was ist ein Lebenslauf-Parser?

Ein Lebenslauf-Parser ist Teil einer Rekrutierungssoftware, die ein Dokument analysiert und daraus die Elemente extrahiert. Im Falle eines Lebenslaufs geht es um verschiedene Informationen über den Bewerber, darunter Fähigkeiten, Berufserfahrung, Ausbildung, Kontaktdaten und Erfolge.

Die Aufgabe, Daten zu extrahieren und die Bedeutung zu interpretieren, ist eine überraschend schwierige Aufgabe für einen Computer, denn:

  • Die Sprache ist unendlich vielfältig. So gibt es zum Beispiel Hunderte von Möglichkeiten, ein Datum zu schreiben, und unzählige Möglichkeiten, die Tätigkeit in deinem letzten Job zu beschreiben. Ein Tool zum Parsen von Lebensläufen erfasst all diese verschiedenen Schreibweisen durch komplexe Regeln und statistische Algorithmen.

  • Die Sprache ist zweideutig. Ein und dasselbe Wort oder ein und derselbe Satz kann in verschiedenen Kontexten etwas anderes bedeuten.

Was macht ein Lebenslauf-Parser?

Ein Lebenslauf-Parser extrahiert Informationen wie die beruflichen Fähigkeiten, die Berufserfahrung, den Bildungsweg, die Kontaktdaten und die Leistungen eines Bewerbers aus seinem Lebenslauf. So können diese Informationen in einer Lebenslaufdatenbank oder einem Bewerbermanagementsystem gespeichert werden.

Die Software zum Parsen von Lebensläufen kann auch verwendet werden, um Daten aus Stellenbeschreibungen zu extrahieren, z. B. die Stellenbezeichnung, die Art der Stelle, den Ort der Position, Gehaltsangaben, Kontaktinformationen, erforderliche Qualifikationen und Fähigkeiten.

Ein leistungsstarker Lebenslauf-Parser erkennt und liefert Daten aus mehr Feldern als ein leistungsschwacher Parser. Gute Lebenslauf-Parser erkennen und extrahieren zum Beispiel Daten aus über 150 Feldern des Dokuments und wandeln diese extrahierten Felder in strukturierte XML- oder JSON-Daten um.

Dieser Lebenslauf-Parsing-Prozess stellt sicher, dass wichtige Bewerberinformationen in ein Format umgewandelt werden, das in eine Bewerberdatenbank und ein Bewerber-Tracking-System geladen und gespeichert werden kann.

Gibt es denn verschiedene Arten von Lebenslauf-Parsern?

Es gibt drei Arten von Lebenslauf-Parsern:

  • Schlagwort basierte Lebenslauf-Parser
  • Grammatik basierte Lebenslauf-Parser 
  • statistische Lebenslauf-Parser

Schlagwort (Keyword) basierte Parser sind am einfachsten und am wenigsten genau. Sie arbeiten, indem sie Wörter, Sätze und einfache Muster im Text des Lebenslaufs erkennen und dann Algorithmen auf den Text um diese Wörter herum anwenden.

Sie suchen zum Beispiel nach etwas, das wie eine Postleitzahl im Lebenslauf aussieht, und versuchen, die Wörter um die Postleitzahl herum als Adresse zu interpretieren. 

Diese Lebenslauf-Parser sind am wenigsten genau, weil sie keine Informationen extrahieren können, die nicht ein Schlüsselwort umgeben. Wenn ihre Schlüsselwörter mehrere Bedeutungen haben (z. B. die Qualifikation "Direktor"), dann wird ein Schlagwort basierter Parser häufig eine falsche Interpretation vornehmen. Daher ist es in der Regel schwierig, mit einem Schlagwort basierten Parser eine Genauigkeit von über 70 % zu erreichen.

Grammatik basierte Parser hingegen enthalten eine enorme Anzahl von grammatikalischen Regeln, die versuchen, den Kontext jedes einzelnen Wortes im Lebenslauf zu verstehen. Dieselben Grammatiken kombinieren auch Wörter und Phrasen zu komplexen Strukturen, die die Bedeutung jedes Satzes im Lebenslauf erfassen.

Diese Parser sind komplexer als Schlagwort basierte Parser, aber sie erfassen mehr Details und unterscheiden zwischen den verschiedenen Bedeutungen, die ein Wort oder ein Satz in anderen Kontexten haben kann. 

Mit grammatik basierten Parsern ist es möglich, hochpräzise Parser mit Genauigkeitsraten von über 90 % zu erstellen. Der Nachteil ist, dass sie viel manuelle Kodierung durch erfahrene Sprachingenieure und häufige Tests erfordern, um sicherzustellen, dass sich Verbesserungen in einem Bereich nicht negativ auf die Leistung in einem anderen auswirken.

Statistische Parser versuchen, numerische Textmodelle anzuwenden, um Strukturen in Lebensläufen zu erkennen. Wie Grammatik basierte Parser können statistische Parser zwischen verschiedenen Kontexten desselben Wortes oder Satzes unterscheiden und eine Vielzahl von Strukturen wie Adressen und Zeitleisten erfassen.

Um maximale Genauigkeit zu erreichen, müssen statistische Parser eine große Anzahl von Lebensläufen manuell mit allen Informationen versehen, die extrahiert werden müssen, bevor die Lebensläufe eingegeben werden. Daher schneiden rein statistische Parser in der Regel besser ab als Schlagwort basierte Parser, aber nicht so gut wie Grammatik basierte Parser, wenn es sich um Daten handelt, für die der Parser noch nicht trainiert wurde. 

Statistische Parser können jedoch sehr hohe Genauigkeiten bei Daten erreichen, auf denen sie trainiert wurden und die sie erkennen, aber das ist in der Regel nicht sehr nützlich, da es sich bei diesen Daten per Definition um alte Daten handelt, die man nicht wiedersehen wird.

Woran erkennt man einen guten Parser für Lebensläufe?

Verschiedene Lebenslauf-Parser machen unterschiedliche Angaben dazu, wie gut sie Lebensläufe analysieren. Die beiden wichtigsten Kriterien, auf die du bei einem Lebenslauf-Parser achten solltest, sind Abdeckungsgrad und Genauigkeit.

Der Abdeckungsgrad beschreibt, was ein Lebenslauf-Parser tatsächlich zu extrahieren versucht. Alle Parser versuchen, die Kontaktinformationen der Kandidaten zu extrahieren, und die meisten extrahieren Fähigkeiten, Berufserfahrung und Qualifikationen. Einige Lebenslauf-Parser (darunter auch der von Daxtra) extrahieren Referenzpersonen, Hobbys, Zusammenfassungen der Bewerber, Gehaltsvorstellungen, den gewünschten Standort, die Nationalität, Berufszertifikate und andere Felder. All diese Informationen werden benötigt, um einen vollständigen Datensatz für den Bewerber zu erstellen, und im Allgemeinen ist es umso besser, je mehr Informationen der Lebenslauf-Parser extrahiert.

Die Genauigkeit beschreibt, wie gut ein Lebenslauf-Parser Informationen aus einem Lebenslauf identifizieren kann. Die Genauigkeit misst, wie oft der Lebenslauf-Parser richtig liegt. Eine Genauigkeit von 95 % bei der Identifizierung von Namen bedeutet zum Beispiel, dass der Parser in 95 % aller eingehenden Lebensläufe den Namen des Bewerbers richtig herausfiltert. Dieser Wert ist wichtig, denn je niedriger die Genauigkeit ist, desto mehr kostet es dich, die Fehler des Parsers zu korrigieren. 

Die Zukunft der Lebenslauf-Parser & deren Einfluss auf den Bewerbungsprozess

Während aktuell viele Parser dafür verwendet werden, Informationen aus dem Lebenslauf automatisiert in eine Lebenslauf-Maske im Bewerbungstool des Unternehmens eingetragen zu werden, gibt es bereits viele Lebenslauf-Parser, die mit Unterstützung von Künstlicher Intelligenz arbeiten. Viele Parser verwenden auch gar nicht mehr den Lebenslauf, sondern schlichtweg auch das LinkedIn Profil, um die Bewerbungsmaske auszufüllen. 

Für die Zukunft des Bewerbens bedeutet das, dass es gut möglich sein kann, dass die Künstliche Intelligenz eine erste Sortierung - ein Ranking - der Bewerber vornimmt, und ein Recruiter oder Personalvermittler bereits eine vorgefertigte Liste der Bewerber ansieht. 

Für dich als Bewerber ist es wichtig, automatisiert ausgefüllte Bewerbungsmasken nochmal durchzulesen. Nimm dir die Zeit und korrigiere Fehler - denn diese werden passieren. 

Was du tun kannst, damit ein Parser wenige bis keine Probleme mit deinem Lebenslauf hat: verwende ein Wording, das verstanden wird und verzichte auf unternehmensinterne Bezeichnungen. Und benutze gängige Begriffe wie bspw. Beruflicher Werdegang, Berufserfahrung, etc. und keine ausgefallenen Überschriften wie “... was bisher geschah”, auch wenn das noch so verlockend ist, um dadurch aufzufallen. 

Du bist dir unsicher, ob dein Lebenslauf Parser-gerecht formuliert und formatiert ist? Buche unseren Lebenslauf-Check und du bekommst ein rasches Feedback mit unserem Input. 

Related Posts

Melde dich für den Newsletter an

Wir schreiben regelmäßig Artikel über Beruf, Motivation & Bewerbung.