KI durchforstet historische Jobanzeigen Wie KI den Wandel des Arbeitsmarktes entschlüsselt

Von Berk Kutsal 2 min Lesedauer

Anbieter zum Thema

Ein interdisziplinäres Team der Universität Graz analysiert mithilfe von Künstlicher Intelligenz und OCR historische Stellenanzeigen. Acht Millionen digitalisierte Zeitungsseiten sollen durchforstet werden, um den Wandel des Arbeitsmarktes zu dokumentieren. Doch das Projekt stößt auf technische Herausforderungen: Alte Schriftarten, fragmentierte Annoncen und fehlerhafte Texterkennung erschweren die Datenauswertung.

KI-gestütztes Projekt durchforstet Stellenanzeigen aus 100 Jahren. (Bild:  Jörn Kleinert/Universität Graz)
KI-gestütztes Projekt durchforstet Stellenanzeigen aus 100 Jahren.
(Bild: Jörn Kleinert/Universität Graz)

Der Arbeitsmarkt war noch nie statisch, sondern ein Abbild technologischer und gesellschaftlicher Entwicklungen. Doch wie lässt sich dieser Wandel mit Daten belegen? Ein Forscherteam der Universiät Graz unter der Leitung von Jörn Kleinert setzt auf maschinelle Texterkennung (Optical Character Recognition, OCR) und Künstliche Intelligenz (KI), um historische Jobanzeigen aus dem digitalen Zeitungsarchiv der Österreichischen Nationalbibliothek (ANNO) zu extrahieren und auszuwerten. Ziel ist es, die Evolution von Berufen, Anforderungsprofilen und Arbeitsbedingungen über einen Zeitraum von 100 Jahren nachzuzeichnen.

Dafür muss ein OCR-Algorithmus unterschiedlichste Schriftarten, Layouts und teils handgesetzte Drucktypen verarbeiten. Gerade Frakturschrift und verschnörkelte Initialen stellen die Technologie vor große Probleme: Standard-OCR-Engines scheitern häufig an der korrekten Erkennung. Hier setzt das Grazer Forscherteam auf ein Machine-Learning-Modell, das mit einem manuell kuratierten Trainingsdatensatz aus 12.500 historischen Stellenanzeigen optimiert wurde. Die Herausforderung dabei: Jobinserate sind oft unstrukturiert, verwenden unterschiedliche Terminologien und beinhalten teils nur stichpunktartige Informationen.

Vom Rohtext zur arbeitsmarktpolitischen Analyse

Ein großer Schritt war die Entwicklung eines robusten Text-Pipelines, die automatisiert Stellenanzeigen von redaktionellen Inhalten trennt. Hier kommen Methoden des Natural Language Processing (NLP) ins Spiel, die durch semantische Mustererkennung erkennen, ob es sich um eine Jobanzeige handelt oder um eine Nachrichtenspalte. Dabei werden unter anderem Named Entity Recognition (NER) und Word Embeddings eingesetzt, um typische Begriffe wie Berufsbezeichnungen oder Gehaltsangaben zu extrahieren.

Doch die reine Texterfassung reichte nicht aus. Die Daten mussten auch interpretiert werden. Ein Beispiel: Während es 1870 nur knapp 100 Berufe gab, sind es heute laut der Europäischen Klassifikation ESCO rund 3.700. Manche Berufe, wie die Typistin mit Stenokenntnissen, tauchten erst Anfang des 20. Jahrhunderts auf, während andere, wie der Landarbeiter, langsam aus den Annoncen verschwanden. Zusätzlich offenbaren die historischen Daten spannende Einblicke in das Arbeitsmarktverhalten: Die meisten Anzeigen waren nicht standardisiert, boten Verhandlungsspielraum oder richteten sich direkt an spezifische Personengruppen.

KI und historische Forschung – ein Erfolgsmodell für die Zukunft?

Die große Vision des Projekts: Am Ende sollen 1,3 Millionen Stellenanzeigen maschinenlesbar vorliegen. Diese Daten könnten nicht nur helfen, die Arbeitsmarktdynamik der Vergangenheit zu verstehen, sondern auch als Grundlage für moderne wirtschaftswissenschaftliche Analysen dienen. Beispielsweise lässt sich untersuchen, wie sich Jobanforderungen in Zeiten technologischer Umbrüche verändern oder wie sich Lohnstrukturen historisch entwickelt haben.

Doch das Projekt zeigt auch die Grenzen von KI im Forschungsumfeld auf: Trotz maschinellem Lernen bleibt menschliche Kontrolle immer noch unerlässlich. Jeder Schritt – von der Datenerhebung über die Textkorrektur bis zur finalen Analyse – erfordert manuelle Prüfungen, um Fehler und Bias zu minimieren.

(ID:50340084)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung