Forscher des Fraunhofer IPK haben eine App entwickelt, mit der sich einzelne Bauteile auch ohne Barcode innerhalb von Sekunden eindeutig identifizieren lassen. Das beschleunigt Prozesse beim Wareneingang. Basis der Lösung ist ein neuronales Netzwerk.
Benutzeroberfläche der App
(Bild: Fraunhofer IPK)
Unternehmen produzieren zunehmend an verschiedenen Standorten und arbeiten mit mehreren Zulieferfirmen zusammen. Doch nicht immer sind alle gelieferten Bauteile mit Barcodes oder Typenschildern ausgestattet. Am Wareneingang ist daher oftmals eine erneute Zuordnung der betreffenden Gegenstände notwendig.
Mitarbeiter sind dann gezwungen, manuell im Katalog nach ähnlichen Einzelteilen zu suchen, um diese für die logistische Weiterverarbeitung eindeutig identifizieren zu können. Das ist mühsam und kostet Zeit.
Eine eine automatisierte, digitalisierte Wiedererkennung könnte den Erfassungsprozess beschleunigen. Dieser Aufgabe widmen sich Forscherinnen und Forscher am Fraunhofer- Instituts für Produktionsanlagen und Konstruktionstechnik IPK in Berlin. Dabei bedienen sie sich der Methoden des maschinellen Lernens. Sie nutzen sogenannte Convolutional Neural Networks (CNNs) für die Wiedererkennung von Bauteilen aus dem Produktionsumfeld. Dazu gehören etwa Schrauben, Klemmen, Stutzen, Rohre, Schläuche, Kabel, Microcontroller und andere Elektronik.
Mit wenig Daten einen Algorithmus trainieren
„In der Bildverarbeitung haben sich CNNs durchgesetzt. Um verlässlich etwa 1.000 Objekte des alltäglichen Lebens zu erkennen, sind eine Million Bilder erforderlich, die diese Netze als Trainingsdaten nutzen. Unsere Aufgabe war es, auch mit wenig Daten einen Algorithmus für Industrieanwendungen zu generieren, um in unserem Fall Bauteile ohne Code automatisiert wiederzuerkennen und den Werker am Wareneingang zu entlasten. Ziel ist es, dass der Algorithmus problemlos auch stark ähnliche Objekte voneinander unterscheiden kann, wie etwa Schrauben der gleichen Norm, aber unterschiedlicher Größen, oder Turbolader unterschiedlicher Baureihen“, sagt Jan Lehr, Wissenschaftler am Fraunhofer IPK.
„Mithilfe von eigens entwickelten Algorithmen schränken wir den Suchradius auf fünf bis zehn Objekte ein. Der Mitarbeiter muss nicht mehr in der kompletten Palette suchen, die ein Großlager umfasst“, so der Wissenschaftler weiter.
Um dies zu realisieren, entwickelten Lehr und seine Kollegen mit dem Logic.Cube in einem vom Bundesministerium für Wirtschaft und Energie BMWi geförderten Projekt ein Erfassungssystem. Die zu erkennenden Objekte mit einer maximalen Kantenlänge von 40 Zentimetern werden in die würfelförmige Vorrichtung mit integrierter Waage gelegt und dort mit bis zu neun Kameras aufgenommen.
Ein Bildverarbeitungsalgorithmus vermisst Höhe, Breite und Länge der Gegenstände, um die Größe des erforderlichen Kartons oder des Regallagerplatzes berechnen zu können. Zeitgleich wird das fotografierte Bilderset zusammen mit der Materialnummer in einer Datenbank gespeichert. Die so generierten Bilddaten werden genutzt, um den KI-Algorithmus zu trainieren, sodass er in der Lage ist, die unterschiedlichsten Bauteile wiederzuerkennen.
Hohe Wiedererkennungsraten mit wenigen Bildern
Da nicht jedes Unternehmen die Anschaffung des Logic.Cube in Erwägung zieht, hat das Forscherteam am Fraunhofer IPK die Funktionalität des Erfassungssystems in eine browserbasierte, betriebssystemunabhängige App übertragen, die auf Smartphones, Tablets, Laptops und Desktop-Rechnern läuft. Dabei musste der Trainingsdatensatz mit Smartphone-Daten angereichert und neu trainiert werden.
Wiedererkennungsrate für verschiedene Szenen
(Bild: Fraunhofer IPK)
„Wir haben die Algorithmen mit hundert Bauteilen getestet, die in unterschiedlichsten Szenen fotografiert wurden. Pro Bauteil wurden 50 Bilder aufgenommen. Die App zeigt dem Anwender innerhalb von wenigen Sekunden fünf und weniger infrage kommende Bauteile an, unabhängig vom Licht, vom Hintergrund und von der Szenerie. Die Erkennung ist so robust, dass sie die manuelle Suche ersetzen kann“, sagt der Ingenieur. „Die Zeitersparnis für den Werker ist enorm. Es ist uns gelungen, mit möglichst wenig Bildern hohe Wiedererkennungsraten zu erzielen.“
Im Logic.Cube konnten die Forschenden Erkennungsraten von 98 Prozent erzielen, der Suchradius wurde von 4.500 Bildern auf fünf eingeschränkt. Eine ebensolche Erfolgsquote soll künftig mit der App erzielt werden.
Bildablage im Internet, Intranet in einer lokalen Edge-Cloud
Die Bilder werden übers Internet oder das firmeneigene Intranet in einer lokalen Edge-Cloud abgelegt. Dort findet auch die eigentliche Bildverarbeitung und Wiedererkennung statt. „Die KI-Algorithmen laufen auf dem Server. Die App, die auf dem Smartphone oder Tablet läuft, ist der Client", erklärt Lehr. Das Gesamtsystem ist so gestaltet, dass es bei der Benutzung fortlaufend weitere Daten sammelt, die nach einer bestimmten Zeit für ein erneutes Anlernen der Algorithmen verwendet werden können. So verbessert sich das System kontinuierlich selbst.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.
Derzeit arbeiten die Forschenden daran, das Set an Bilddaten zu erweitern, den Katalog zu digitalisieren und in die App zu integrieren. Alle nachfolgenden Prozesse, wie die Weiterbearbeitung und eventuelle Nachbestellung, sollen künftig über die Edge-Cloud angestoßen werden.
Zudem optimieren Lehr und seine Kollegen die Algorithmen, um auch stark ähnlich aussehende Objekte wiedererkennen zu können. In den erfolgten Testläufen war das System in der Lage, sogar Schrauben der gleichen Norm, aber unterschiedlicher Größe korrekt wiederzuerkennen.
KI-gestützte Bildverarbeitung inspiziert auch Oberflächen
Die App lässt sich nach Angaben der Wissenschaftler auch für die Oberflächeninspektion verwenden. Direkt am Wareneingang wird die Oberfläche von angelieferten Bauteilen mit KI-gestützter Bildverarbeitung darauf hin geprüft, ob Kratzer oder Korrosion vorhanden sind, ob es Transportschäden oder das Teil nur verschmutzt ist.
Mittels KI-Methoden werden die betreffenden Stellen auf dem Bild markiert, sodass Werker Schadstellen umgehend überprüfen können. „Produktionsunternehmen sind in Bezug auf KI oftmals noch zurückhaltend. Es würde uns freuen, wenn wir mit unseren Forschungsarbeiten dazu beitragen könnten, dieser Skepsis entgegen zu wirken und die Akzeptanz bei den Mitarbeitenden zu steigern“, so Lehr.