Definition Was ist Intersection over Union?

Von Dipl.-Ing. (FH) Stefan Luber 3 min Lesedauer

Intersection over Union (IoU) ist ein Ähnlichkeitsmaß für Mengen und andere Objekte. Die Kennzahl ist über das Verhältnis von Schnittmenge zur Vereinigungsmenge berechenbar. Typischer Einsatzbereich ist das maschinelle Sehen. IoU wird zur Beurteilung und Verbesserung der Genauigkeit von Objekterkennungsmodellen verwendet.

(Bild:  © aga7ta - stock.adobe.com)
(Bild: © aga7ta - stock.adobe.com)

Das Akronym für Intersection over Union lautet IoU. Es handelt sich um eine Kennzahl, die aus dem Verhältnis der Schnittmenge zur Vereinigungsmenge gebildet wird. Aus der Berechnungsweise leitet sich der Name der Kennzahl ab. Intersection ist das englische Wort für Schnittmenge und Union das für Vereinigungsmenge. Intersection over Union wird auch als Jaccard-Koeffizient oder Jaccard-Index bezeichnet. Diese Bezeichnung geht auf den Schweizer Botaniker Paul Jaccard zurück. Er veröffentlichte den Jaccard-Koeffizienten im Jahr 1902 und nannte ihn ursprünglich „coefficient de communauté florale“.

Der Jaccard-Index beziehungsweise Intersection over Union ist ein über das Verhältnis der Schnittmenge zur Vereinigungsmenge berechenbares Ähnlichkeitsmaß für Mengen, Vektoren und andere Objekte. Das Ähnlichkeitsmaß kommt in der Mathematik und in zahlreichen anderen Bereichen zum Einsatz. Durch die rasante Entwicklung im Bereich der Künstlichen Intelligenz, des maschinellen Sehens (Computer Vision) und der Objekterkennung hat die IoU-Ähnlichkeitskennzahl in den letzten Jahren wieder stark an Bedeutung gewonnen. Über Intersection over Union lässt sich die Genauigkeit von Objekterkennungsmodellen beurteilen und optimieren.

Mathematische Berechnung von Intersection over Union

Zur Berechnung von Intersection over Union wird die Größe der Schnittmenge (Anzahl gemeinsamer Elemente) durch die Größe der Vereinigungsmenge (Summe aller Elemente) zweier Mengen geteilt. Je ähnlicher zwei Mengen sind, desto mehr nähert sich das Verhältnis von Schnittmenge zur Vereinigungsmenge der Zahl eins an. Die beiden Extremwerte der Kennzahl sind 1 und 0. Bei dem Wert 1 besteht vollständige Übereinstimmung, beim Wert 0 keinerlei Übereinstimmung.

Die Formel für die Berechnung von Intersection over Union zweier Mengen A und B lautet:

IoU (A,B) = Schnittmenge (A,B) / Vereinigungsmenge (A,B)

IoU bei Computer Vision und bei der Objekterkennung

Intersection over Union ist eine wichtige Kennzahl im Bereich des computerbasierten, maschinellen Sehens (Computer Vision) und der Objekterkennung. Mithilfe der Kennzahl lässt sich die Genauigkeit von Objekterkennungsmodellen quantitativ bestimmen, beurteilen und optimieren.

Für die Berechnung der Genauigkeit einer Objekterkennung werden sogenannte Bounding Boxen (Begrenzungsrahmen) herangezogen. Über diese Bounding Boxen lokalisiert und klassifiziert ein Objekterkennungsmodell Objekte innerhalb von Bildern. Konkret geht es bei der IoU-Berechnung um die beiden Begrenzungsrahmen Ground Truth Bounding Box und Predicted Bounding Box.

Die Ground Truth Bounding Box ist ein rechteckiger Rahmen, der ein Objekt in einem Bild genau und vollständig einschließt. Der Rahmen definiert die exakte Position und die Größe des Objekts innerhalb eines Bilds und ist das kleinstmögliche Rechteck, in dem das Objekt vollständig enthalten ist. Die Ground Truth Bounding Box ist quasi die Referenz zur Bestimmung der Vorhersage eines Modells. Ground Truth Bounding Boxen werden beispielsweise durch manuelles Labeln von Bilddaten in den Trainings- und Testdaten für Objekterkennungsmodelle erstellt.

Die Predicted Bounding Box ist ein vom Modell vorhergesagter rechteckiger Rahmen, der ein Objekt in einem Bild lokalisieren und klassifizieren soll. Zur quantitativen Bewertung der Vorhersagegenauigkeit werden die Schnittmenge und die Vereinigungsmenge von Ground Truth Bounding Box und Predicted Bounding Box gebildet und ins Verhältnis gesetzt. IoU ist der Anteil der überlappenden Fläche an der Gesamtfläche. Je mehr sich Ground Truth Bounding Box und Predicted Bounding Box überlappen, desto mehr nähert sich Intersection over Union dem Wert 1 an und desto genauer ist die Vorhersage des Modells. Bei einer perfekten Überlappung der beiden Boxen ist der Wert 1.

Die Formel zur Bestimmung der Genauigkeit eines Objekterkennungsmodells lautet dementsprechend:

IoU = Schnittmenge von Ground Truth Bounding Box und Predicted Bounding Box / Vereinigungsmenge von Ground Truth Bounding Box und Predicted Bounding Box

Mithilfe der berechneten IoU-Werte können Entwickler die Algorithmen eines Objekterkennungsmodells anpassen und verfeinern. So lassen sich Vorhersagefehler minimieren und die Objekterkennungsfähigkeiten eines Modells verbessern. Auch für das Benchmarking und den Vergleich verschiedener Objekterkennungsmodelle ist Intersection over Union eine häufig genutzte Kennzahl.

Anwendungsbereiche und Beispiele

Neben der Objekterkennung kommt Intersection over Union im Umfeld des maschinellen Sehens auch in der Bildsegmentierung und der Informationsgewinnung aus Bilddaten (Information Retrieval) zum Einsatz. Der Anwendungsbereich der Kennzahl ist aber nicht auf Computer Vision begrenzt. Das Ähnlichkeitsmaß lässt sich auch im Bereich von Text- und Data-Mining (zum Beispiel Duplikaterkennung) und von Textverarbeitungs- und -generierungsmodellen verwenden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Anwendungsbeispiele von Intersection over Union sind:

  • Messung und Verbesserung der Genauigkeit von Vorhersagen in der medizinischen Bildgebung (zum Beispiel bei der Tumorerkennung)
  • Optimierung von Robotikanwendungen
  • Messung und Verbesserung der Genauigkeit von bildbasierten Wettervorhersagemodellen
  • Optimierung der Sicherheit des autonomen Fahrens durch verbesserte Genauigkeit der Objekterkennungsleistung von Fahrzeugen

(ID:50282383)