Suchen

Definition Was ist Kaggle?

| Autor / Redakteur: Dipl.-Ing. (FH) Stefan Luber / Nico Litzel

Kaggle ist eine Online-Plattform für den Wissensaustausch und Wettbewerbe rund um die Datenanalyse, Machine Learning (ML), Data Mining und Big Data. Zielgruppe der Plattform sind Datenwissenschaftler sowie Unternehmen und Organisationen aus unterschiedlichsten Branchen. Die Mitglieder entwickeln Modelle, Daten nach bestimmten Vorgaben zu analysieren. Für die besten Lösungen sind in der Regel hohe Geldpreise ausgeschrieben.

Firma zum Thema

(Bild: © aga7ta - stock.adobe.com)

Kaggle ist der Name einer Online-Plattform und -Community für Themen wie Datenanalyse, Machine Learning (ML), Data Mining und Big Data. Sie ist unter www.kaggle.com erreichbar und bietet ihren Mitgliedern die Möglichkeit, Wettbewerbe auszuschreiben, sich an ihnen zu beteiligen, Wissensaustausch zu betreiben und sich fortzubilden. Zielgruppe von Kaggle sind Datenwissenschaftler sowie Unternehmen oder Organisationen aus den unterschiedlichsten Branchen und Bereichen. Mitglieder dürfen beispielsweise Wettbewerbe ausschreiben. Hierfür stellen sie Daten ein, die nach spezifischen Vorgaben zu analysieren sind. Andere Mitglieder der Plattform entwickeln anschließend Datenmodelle, die die eingestellten Daten nach den Vorgaben bestmöglich auswerten.

Der Gewinner des Wettbewerbs erhält die zuvor ausgelobte Siegesprämie. Teilweise werden bis zu fünf- , sechs- oder siebenstellige Siegesprämien (US-Dollar) ausgeschrieben. Neben der Möglichkeit, Wettbewerbe durchzuführen, hat die Plattform ihr Leistungsportfolio rund um Data-Science-Themen kontinuierlich erweitert. Datenwissenschaftler betreiben über Kaggle Wissensaustausch, bilden sich fort, erforschen oder veröffentlichen Datensätze und diskutieren oder entwickeln Datenmodelle.

Ursprünglich gegründet wurde Kaggle von Anthony Goldbloom und Ben Hamner im Jahr 2010. 2017 übernahm Google die Plattform. Bereits zu diesem Zeitpunkt waren mehr als eine Million Nutzer auf Kaggle registriert. Viele der weltweit größten Unternehmen wie Microsoft oder Facebook sind auf www.kaggle.com aktiv. Zahlreiche Wettbewerbe wurden unter großer Beachtung verschiedener Institutionen und der Presse erfolgreich abgewickelt. Unter anderem ging es um Themen aus der medizinischen Forschung, um die Optimierung von Verkehrsflüssen oder um die Schrift- und Bilderkennung.

Zielgruppen der Kaggle-Plattform

Auf der Kaggle-Plattform sind Anwender, Wissenschaftler, Unternehmen und Organisationen aus verschiedenen Bereichen und Branchen aktiv. Die Services der Plattform richten sich prinzipiell an alle, die sich mit Themen wie Big Data, Data Mining, Machine Learning, Datenanalyse und Künstliche Intelligenz (KI) beschäftigen. Die Zielgruppen von Kaggle können Wettbewerbe ausschreiben, sich an ihnen beteiligen, sich fortbilden oder Wissensaustausch betreiben. Oft nutzen Datenwissenschaftler oder Unternehmen Kaggle, um Lösungen für spezifische Problem auf Basis vorliegender Datensätze zu finden.

Ablauf eines Kaggle-Wettbewerbs

Bei den auf Kaggle ausgeschriebenen Wettbewerben geht es in der Regel darum, Datenmodelle zu entwickeln, um vorhandene Datensätze gemäß einer Problemstellung möglichst effektiv zu analysieren. Einige der entwickelten Datenmodelle lassen sich anschließend unter Umständen auch für andere Problemstellungen nutzen. Die Daten und Fragestellungen werden vom Unternehmen oder von der Organisation bereitgestellt, die den Wettbewerb ausschreibt. Teilnehmer eines Wettbewerbs kann grundsätzlich jeder werden. Voraussetzung ist ein kostenloses Kontos auf Kaggle. Wettbewerbe auf Kaggle sind öffentlich oder privat. Der grundsätzliche Ablauf eines Wettbewerbs ist folgender:

  • der Initiator eines Wettbewerbs beschreibt sein Problem oder seine Fragestellung und bereitet die Daten vor, die zur Lösung verwendet werden sollen
  • die Daten und Fragestellungen werden zusammen mit einer Wettbewerbs-Deadline auf Kaggle veröffentlicht. Gleichzeitig kann der Initiator eine Prämie für die beste Lösung ausloben
  • die Teilnehmer des Wettbewerbs nutzen die Daten und entwickeln Techniken oder Datenmodelle, die nach ihrer Ansicht die Fragestellung am effektivsten beantworten. Ideen lassen sich öffentlich bereitstellen und diskutieren
  • ist ein gutes Modell gefunden, kann es eingereicht werden
  • anschließend findet die Bewertung des Datenmodells statt. Kriterien für die Bewertung sind beispielsweise Vorhersagegenauigkeiten, die mit nur dem Wettbewerbsinitiator bekannten Lösungsdaten ermittelt werden
  • die eingereichten Datenmodelle werden mit einer kurzen Zusammenfassung in einer Live-Rangliste veröffentlicht
  • Teilnehmer haben die Möglichkeit, ihre Modelle zu überarbeiten und zu optimieren. Anschließend können sie erneut eingereicht und bewertet werden
  • ist die Deadline abgelaufen, erhält der Teilnehmer mit der besten Lösung die ausgelobte Prämie
  • der Wettbewerbsinitiator darf die Lösung nutzen

Beispiele für Wettbewerbe auf Kaggle

Seit der Gründung von Kaggle im Jahr 2010 wurden viele Wettbewerbe aus unterschiedlichen Bereichen durchgeführt. Die Siegesprämien erreichten teils fünf-, sechs- oder siebenstellige US-Dollar-Beträge. Unter anderem ging es um Themen aus der medizinischen Forschung, um die Optimierung von Verkehrsflüssen oder um die Schrift- und Bilderkennung. Beispiele für Kaggle-Wettbewerbe sind:

  • US-Weltraumbehörde NASA: Aufspüren von dunkler Materie anhand von Galaxien-Bildern
  • HIV/AIDS-Forschung
  • Handschrifterkennung
  • Bildanalyse zur Früherkennung von Lungenkrebs
  • Erkennung und Bestimmung von Fischen

Weitere Angebote und Services von Kaggle

Neben der Durchführung von Data-Science-Wettbewerben bietet Kaggle weitere Services wie:

  • Kaggle Kernels: cloudbasierte Workbench zum Bereitstellen und Analysieren von Python- oder R-Code
  • Öffentliche Plattform zur Bereitstellung von Datensets
  • Kaggle Learn: Online-Lernplattform und Kurse zur KI-Ausbildung
  • Job-Plattform für Machine-Learning- und KI-Spezialiste

(ID:46744134)

Über den Autor