„Willkommen bei der großen BigData-Insider-Leserwahl!

Dipl.-Ing. (FH) Stefan Luber

IT-Service Luber

Stefan Luber ist Diplom-Ingenieur (FH) der Nachrichtentechnik und arbeitet mit über 30 Jahren Berufserfahrung als freiberuflicher Autor sowie technischer Redakteur. Er ist spezialisiert auf IT- und Telekommunikationsthemen und verfasst hochwertige, suchmaschinenoptimierte Inhalte, Whitepaper, Produkttests, Blog-Artikel und technische Dokumentationen.

Seine Expertise umfasst ein breites Spektrum an IT-Themen, darunter Netzwerke (DSL, Mobilfunk, TCP/IP, Routing, Switching, VoIP), Webhosting, E-Commerce, Content-Management-Systeme wie WordPress, Suchmaschinenoptimierung (SEO), Smart Home, Cloud Computing, Business Intelligence, Big Data, Künstliche Intelligenz, IoT und IT-Sicherheit.

Luber hat für verschiedene Unternehmenswebseiten, Blogs und Fachportale wie Security-Insider, BigData-Insider, Storage-Insider, CloudComputing-Insider und IP-Insider Artikel verfasst, in denen er komplexe technische Sachverhalte verständlich aufbereitet.

Neben seiner Tätigkeit als Autor bietet er IT-Services an und betreibt mit dem IT-Service Luber eine eigene Webseite, auf der er seine Dienstleistungen und Veröffentlichungen präsentiert.

Seine berufliche Laufbahn umfasst Positionen wie Systemingenieur Netzwerkplanung/Internetworking bei verschiedenen Systemhäusern und Netzbetreibern und Manager im Bereich IP-TV-Netze bei der Deutschen Telekom AG. Seit August 2011 ist er als freier Autor und technischer Redakteur tätig.

Artikel des Autors

Artificial Superintelligence (ASI) bezeichnet eine hypothetische Form von KI, deren Fähigkeiten die menschliche Intelligenz in nahezu allen Bereichen übertreffen würden. (Bild: KI-generiert)

Eine Artificial Superintelligence (ASI) ist eine softwarebasierte Künstliche Intelligenz, die die menschliche Intelligenz bei weitem übertrifft. Sie ist derzeit noch rein hypothetisch. Ihre Realisierung würde die technologische Singularität auslösen und einen Wendepunkt für die menschliche Zukunft bedeuten.

Artificial General Intelligence bezeichnet eine hypothetische KI mit universellen kognitiven Fähigkeiten, die Wissen flexibel auf unterschiedliche Aufgaben übertragen kann. (Bild: KI-generiert)

Während heutige KI-Systeme als „schwache“ oder „schmale“ Intelligenz hochspezialisierte Aufgaben lösen, zielt die Forschung bei der Artificial General Intelligence (AGI) auf ein System ab, das über kognitive Fähigkeiten verfügt, die denen des Menschen ebenbürtig oder überlegen sind. Eine solche „starke KI“ könnte unabhängig von ihrer Programmierung neues Wissen erwerben und komplexe Probleme über verschiedene Domänen hinweg lösen.

Nicht jedes Modell muss groß sein, um große Wirkung zu erzielen: Small Language Models (SLMs) arbeiten mit deutlich weniger Parametern als ihre großskaligen Gegenstücke, liefern aber in klar umrissenen Aufgabenfeldern vergleichbare Ergebnisse. (Bild: Midjourney / KI-generiert)

Ein Small Language Model (SLM) ist ein kleines Sprachmodell. Es verarbeitet und generiert natürliche Sprache, hat aber weniger Parameter im Vergleich zu großen Sprachmodellen. Small Language Models benötigen weniger Rechenleistung, arbeiten oft lokal auf Geräten und sollen dennoch natürliche Sprache verstehen und erzeugen. Ein Small Language Model ist für spezialisierte Aufgaben nutzbar und kann lokal auf ressourcenbeschränkten Geräten betrieben werden.

Ein neuronales Netz als Sprachdenker: Large Language Models verarbeiten Milliarden von Wörtern, um Sprache zu verstehen, zu strukturieren und neu zu erzeugen. (Bild: KI-generiert)

Large Language Models sind große generative Sprachmodelle mit Künstlicher Intelligenz (KI), die mit riesigen Mengen an Textdaten vortrainiert sind. Sie basieren auf neuronalen Netzen, in der Regel in Transformer-Architektur, und besitzen viele Milliarden Parameter. LLMs können natürliche Sprache verarbeiten, verstehen und generieren.

Agentic AI kombiniert Wahrnehmung, Planung und Aktion: Wie autonome KI-Agenten arbeiten, welche Architektur sie nutzen und wo sie eingesetzt werden. (Bild: KI-generiert)

Eine Agentic AI ist eine autonom und zielorientiert arbeitende Form einer Künstlichen Intelligenz (KI, engl. AI). Mit KI ausgestattete Agenten sind in der Lage, selbstständig zu lernen, Entscheidungen zu treffen, Maßnahmen zu ergreifen, Aktionen auszuführen, sich dynamisch anzupassen und Ziele zu verfolgen. Sie handeln proaktiv und adaptiv.

Was ist DeepSeek? Chinesisches Start-up setzt mit Open-Source-Modellen neue Maßstäbe (Bild: KI-generiert)

DeepSeek ist ein KI-Start-up-Unternehmen aus China. Es erlangte im Januar 2025 durch die Veröffentlichung des KI-Sprachmodells DeepSeek-R1 weltweite Bekanntheit. DeepSeek-R1 kann in puncto Leistungsfähigkeit mit aktuellen Sprachmodellen großer KI-Player wie OpenAI mithalten, ist aber wesentlich ressourcenfreundlicher.

Der EU AI Act bringt verbindliche Regeln für den Einsatz von Künstlicher Intelligenz. Der Beitrag zeigt, welche Anwendungen betroffen sind, welche Fristen gelten und welche Pflichten Unternehmen künftig erfüllen müssen. (Bild: KI-generiert)

Die Europäische Union setzt mit dem AI Act (Verordnung EU 2024/1689) neue Maßstäbe im Umgang mit Künstlicher Intelligenz. Anbieter und Anwender müssen jetzt umfassende Pflichten erfüllen – Verstöße können teuer werden. Was der AI Act konkret bedeutet, welche Systeme betroffen sind und welche Fristen gelten, erklärt dieser Beitrag.

AIOps ist längst mehr als nur ein Schlagwort. Mit generativer KI und Cloud-nativen Ansätzen drängt die Technologie in alle Bereiche des IT-Betriebs. Wo stehen Unternehmen heute – und wohin entwickelt sich das Feld? (Bild: KI-generiert)

Artificial Intelligence for IT Operations (AIOps) verwendet Künstliche Intelligenz (KI), Maschinelles Lernen (ML) und Big Data zur Überwachung, Optimierung und Automatisierung des IT-Betriebs. Die von den verschiedenen Geräten und IT-Systemen gelieferten Daten werden mithilfe Künstlicher Intelligenz analysiert, um Probleme oder Anomalien zu erkennen und passend darauf zu reagieren.

Agent2Agent (A2A) ist ein Open-Source-Protokoll von Google zur standardisierten Interaktion und Aufgabenverteilung zwischen KI-Agenten über Anbietergrenzen hinweg. (Bild: KI-generiert)

Agent2Agent (A2A) ist ein für die Interaktion von KI-Agenten von Google entwickeltes Open-Source-Protokoll. Es ermöglicht die Zusammenarbeit mehrerer KI-Agenten über standardisierte Schnittstellen und Sprachen. Über A2A lassen sich KI-Systeme erkennen, Daten sicher austauschen, Aufgaben gemeinsam bearbeiten und Ergebnisse teilen.

Prompt Engineering ist die Kunst, text- oder multimodal basierte Anweisungen („Prompts“) so zu designen, dass generative KI Modelle – von GPT 4.5 bis Gemini 2.5 – zielgerichtet, sicher und kosteneffizient arbeiten. (Bild: KI-generiert)

Prompt Engineering entwickelt sich rasant zu einer der strategisch wichtigsten Disziplinen im Kontext generativer KI. Ob Chatbots, Textgeneratoren oder Code-KI: Wer Maschinen bessere Fragen stellt, bekommt bessere Antworten und somit auch bessere Ergebnisse.

Label Flipping greift KI-Modelle dort an, wo sie am verwundbarsten sind. Einzelne manipulierte Labels reichen aus, um neuronale Netzwerke in ihrer Lernphase gezielt zu sabotieren und die späteren Entscheidungen der KI nachhaltig zu verzerren. Sichtbar wird die Bedrohung oft erst, wenn es bereits zu spät ist. (Bild: KI-generiert)

Label Flipping ist eine Angriffsmethode, die auf das maschinelle Lernen von KI-Modellen abzielt. Sie manipuliert die Label der Daten, mit denen die KI trainiert wird. Dadurch lässt sich das Verhalten der Modelle manipulieren. Label Flipping kann die Performance, Zuverlässigkeit und Genauigkeit der Künstlichen Intelligenz signifikant beeinträchtigen.

Apple Intelligence kombiniert lokale On-device-Modelle mit sicherer Cloud-Verarbeitung, um Funktionen wie Textgenerierung, Bildbearbeitung, intelligente Assistenz und erweiterte Siri-Interaktionen bereitzustellen. Dabei stehen Datenschutz und nahtlose Systemintegration im Fokus. (Bild: Apple)

Mit Apple Intelligence startet Apple eine neue Ära der Künstlichen Intelligenz auf iPhone, iPad, Mac und Vision Pro. Die intelligente Verzahnung von On-device- und serverbasierter Verarbeitung hebt KI-Features auf ein neues Niveau: persönlich, leistungsstark und sicher. Im Vergleich zu anderen Anbietern wie Microsoft oder Google setzt Apple konsequent auf Datenschutz und lokale Verarbeitung.

Generative KI basiert auf tiefen neuronalen Netzwerken wie der Transformer-Architektur und nutzt selbstüberwachtes Lernen, um neue Inhalte auf Basis probabilistischer Modelle zu erzeugen. (Bild: KI-generiert)

Generative AI (Artificial Intelligence) ist eine Form von Künstlicher Intelligenz (KI), die auf Basis von Vorgaben und vorhandenen Informationen Inhalte generiert. Es kommen KI-Verfahren und -Technologien wie trainierte neuronale Netzwerke, maschinelles Lernen (Deep Learning) und KI-Algorithmen zum Einsatz, um nach Anweisungen Texte, Bilder, Audio- und Videoinhalte, Programmcode, 3D-Modelle und anderes zu erzeugen.

MCP als universelle Schnittstelle: Das offene Protokoll verbindet KI-Modelle nahtlos mit Kontextsystemen und externen Ressourcen. (Bild: KI-generiert)

Das Model Context Protocol (MCP) ist ein von Anthropic entwickeltes Open-Source-Protokoll und einheitliches Framework zur Anbindung von KI-Modellen an externe Tools und Datenquellen. Es standardisiert die Interaktion zwischen Modellen und Kontextsystemen und vereinfacht die dynamische Integration solcher Ressourcen erheblich.

Künstliche Intelligenz (KI) bezeichnet die Fähigkeit von Maschinen, menschenähnliche kognitive Funktionen wie Lernen, Problemlösen und Entscheidungsfindung auszuführen. Sie basiert auf Algorithmen und Daten, um Muster zu erkennen, Vorhersagen zu treffen und automatisierte Aufgaben effizient zu erledigen. (Bild: Kenny - stock.adobe.com)

Künstliche Intelligenz ist ein Teilbereich der Informatik und beschäftigt sich damit, Maschinen menschenähnliche Intelligenzleistungen und Fähigkeiten zu verleihen. Es kommen hierfür Verfahren und Techniken wie Maschinelles Lernen, künstliche neuronale Netzwerke und Deep Learning zum Einsatz.

Google Gemini: Googles neuestes KI-Modell mit multimodalen Fähigkeiten. (Bild: Google)

Google Gemini ist ein multimodales KI-Modell, das auf Forschung von DeepMind basiert und von Google entwickelt wurde. Das Modell gehört zu einer neuen Generation von KI-Anwendungen, die komplexe Aufgaben in der Datenverarbeitung und -analyse bewältigen.

Tokenisierung in der KI: So zerlegen Sprachmodelle wie ChatGPT und Google Gemini Texte in verarbeitbare Einheiten. (Bild: grandfailure - stock.adobe.com)

Im Bereich der Künstlichen Intelligenz (KI) ist ein Token die kleinste Dateneinheit, die von KI-Modellen zur Verarbeitung natürlicher Sprache verwendet wird. Je nach Tokenisierungsverfahren repräsentiert ein Token ein Wort, ein Teilwort, ein Satzzeichen oder eine andere Zeichenkombination. Die Nutzung vieler Chatbots wird über die Anzahl der Token abgerechnet.

Was ist Embodied AI? Der Beitrag erklärt anschaulich, warum KI mit Körpern lernt, wo sie eingesetzt wird und warum Erfahrung für intelligente Systeme entscheidend ist. (Bild: © Xchip)

Eine Embodied AI ist eine verkörperte Künstliche Intelligenz (KI), die in physische Systeme eingebettet ist und mit ihrer Umgebung interagiert. Sie nutzt Sensoren, um ihre Umgebung zu erfassen, ist lern- und anpassungsfähig und überführt mit ihren motorischen oder reaktiven Fähigkeiten Wahrnehmungsprozesse in Handlungsprozesse.

KNIME ist eine Open-Source-Plattform für Datenanalyse und Machine Learning, die es Nutzern ermöglicht, komplexe Datenprozesse durch eine intuitive Drag-and-Drop-Oberfläche zu automatisieren – ganz ohne Programmierkenntnisse. (Bild: KNIME)

KNIME ist eine Open-Source-Software für die interaktive Analyse großer Datenmengen. Sie bietet eine intuitive, grafische Benutzeroberfläche, mit der datengetriebene Workflows ohne tiefgehende Programmierkenntnisse erstellt werden können. Neben der kostenlosen Kernversion existieren kommerzielle Erweiterungen für Unternehmen mit spezifischen Anforderungen.

Eine Gated Recurrent Unit (GRU) ist eine Art von künstlicher Intelligenz, die dabei hilft, sich an wichtige Informationen zu erinnern und unwichtige zu vergessen. (Bild: Bipul Kumar - stock.adobe.com)

Die Gated Recurrent Unit (GRU) ist eine fortschrittliche Architektur für rekurrente neuronale Netzwerke (RNNs), optimiert für die Verarbeitung sequenzieller Daten. Durch adaptive Gate-Mechanismen – das Update-Gate und das Reset-Gate – steuert sie effizient den Informationsfluss, minimiert Speicherbedarf und verbessert die Trainingsgeschwindigkeit. GRUs finden Anwendung in der Sprachverarbeitung, bei Zeitreihenanalysen und in KI-Systemen.

DALL-E ist ein KI-Modell von OpenAI, das Bilder aus Texteingaben generiert und so Kunst und Technologie vereint. (Bild: KI-generiert)

DALL-E ist ein von OpenAI entwickeltes KI-Modell. Es gehört zur Kategorie generativer KI (Generative AI), das aus natürlichsprachigen Texteingaben beeindruckende Bilder generieren kann. Die Technologie nutzt neuronale Netzwerke, um kreative und fotorealistische Darstellungen zu erschaffen. Seit der Integration in ChatGPT ist DALL-E für eine breite Nutzerschaft zugänglich und eröffnet neue kreative Möglichkeiten für Künstler, Designer und Technikbegeisterte.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Data Poisoning ist eine Cyberangriffsmethode, die auf KI-Modelle und maschinelles Lernen abzielt. Die Künstliche Intelligenz (KI) wird absichtlich mit manipulierten oder falschen Daten trainiert. Infolgedessen liefert die KI ungenaue oder falsche Ergebnisse oder trifft falsche Entscheidungen.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Als Deepfakes werden mithilfe von Künstlicher Intelligenz (KI) manipulierte Medieninhalte bezeichnet. Sie sind häufig nur schwer als Fälschungen zu erkennen. Deepfakes können manipulierte Bilder, Videos, Texte oder Audioinhalte sein. Die Fälschungen bergen ein hohes Missbrauchsrisiko und lassen sich für Betrug oder Desinformation einsetzen.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Single Source of Truth (SSOT) ist ein Konzept beziehungsweise ein Prinzip des Datenmanagements. Es schafft einen zentralen, allgemeingültigen und verlässlichen Datenbestand. SSOT verbessert die Datenqualität und sorgt dafür, dass in einem Unternehmen alle mit den gleichen, korrekten und aktuellen Daten arbeiten.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

DeepSeek-R1 ist ein großes Sprachmodell des chinesischen KI-Start-ups DeepSeek. Es steht unter Open-Source-Lizenz und kann hinsichtlich seiner Fähigkeiten mit den Sprachmodellen großer KI-Player mithalten. Aufsehen erregte das Modell aufgrund seines im Vergleich zu anderen Modellen geringen Ressourcenbedarfs.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Das Large Action Model (LAM) ist eine nächste Stufe in der KI-Entwicklung. Es basiert auf großen Sprachmodellen, die mit der Fähigkeit ausgestattet sind, Anweisungen in Aktionen umzusetzen und diese auszuführen. LAMs interagieren mit Anwendungen oder Systemen, indem sie lernen, GUIs zu bedienen, Eingaben zu tätigen und Output zu verstehen.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Ein Foundation Model ist ein großes, mit riesigen Datenmengen trainiertes KI-Basismodell. Es ist universell einsetzbar und eignet sich durch entsprechende Anpassung und Feinabstimmung für verschiedene spezialisierte Aufgaben. Technisch basieren Grundlagenmodelle auf Deep-Learning-fähigen neuronalen Netzwerken.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Die Kreuzvalidierung ist ein wichtiges und in der Künstlichen Intelligenz und im maschinellen Lernen häufig eingesetztes Verfahren. Mit ihr lassen sich die Zuverlässigkeit und Leistungsfähigkeit von Vorhersagemodellen bewerten und verbessern. Abhängig vom Anwendungsfall gibt es verschiedene Arten der Kreuzvalidierung.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Intersection over Union (IoU) ist ein Ähnlichkeitsmaß für Mengen und andere Objekte. Die Kennzahl ist über das Verhältnis von Schnittmenge zur Vereinigungsmenge berechenbar. Typischer Einsatzbereich ist das maschinelle Sehen. IoU wird zur Beurteilung und Verbesserung der Genauigkeit von Objekterkennungsmodellen verwendet.

0116267165v1 (Bild: © aga7ta - stock.adobe.com)

Als Multi-Hop Reasoning wird die Fähigkeit eines KI-Modells bezeichnet, Informationen aus verschiedenen Wissensquellen oder über einen größeren Kontext hinweg zu sammeln, sinnvoll zu verknüpfen und daraus Schlussfolgerungen zu ziehen. Mit Multi-Hop-Reasoning-fähigen Sprachmodellen lassen komplexe Aufgabenstellungen lösen.

(© aga7ta - stock.adobe.com)

Digitalisierung bezeichnet im ursprünglichen Sinn das Umwandeln von analogen Werten in digitale Formate. Diese Daten lassen sich informationstechnisch verarbeiten. Oft steht der Begriff Digitalisierung aber auch für die digitale Revolution oder die digitale Transformation.

(© aga7ta - stock.adobe.com)

Im Internet der Dinge (Englisch: Internet of Things, IoT) bekommen Gegenstände eine eindeutige Identität und können miteinander kommunizieren oder Befehle entgegennehmen. Mit dem Internet of Things lassen sich Anwendungen automatisieren und Aufgaben ohne Eingriff von außen erledigen.

(© aga7ta - stock.adobe.com)

Machine Learning, im Deutschen maschinelles Lernen, ist ein Teilgebiet der künstlichen Intelligenz. Durch das Erkennen von Mustern in vorliegenden Datenbeständen sind IT-Systeme in der Lage, eigenständig Lösungen für Probleme zu finden.

(© aga7ta - stock.adobe.com)

SAP BW ist ein Business-Intelligence-Paket von SAP und ermöglicht umfangreiche Auswertungen und Reports auf Basis von unterschiedlichsten Unternehmensdaten. Es besteht aus einer Kombination von Datenbanken, Datenbankmanagement-Tools sowie Analyse und Reporting-Anwendungen.

(© aga7ta - stock.adobe.com)

Die Abkürzung NLP steht für Natural Language Processing und beschreibt Techniken und Methoden zur maschinellen Verarbeitung natürlicher Sprache. Ziel ist eine direkte Kommunikation zwischen Mensch und Computer auf Basis der natürlichen Sprache.

(© aga7ta - stock.adobe.com)

Das Business Intelligence Dashboard, kurz BI Dashboard, beschreibt ein Tool, das wichtige Indikatoren eines Unternehmens übersichtlich und stark verdichtet visualisiert. Das Dashboard führt eine Vielzahl an Zahlen in einer grafischen Anzeige zusammen.

(© aga7ta - stock.adobe.com)

In einem Cyber-physischen System (cyber-physical system, CPS) sind mechanische Komponenten über Netzwerke und moderne Informationstechnik miteinander verbunden. Sie ermöglichen die Steuerung und die Kontrolle von komplexen Systemen und Infrastrukturen. Für die Industrie 4.0 spielen Cyber-physische Systeme eine zentrale Rolle.

(© aga7ta - stock.adobe.com)

Das Data Warehouse stellt ein zentrales Datenbanksystem dar, das zu Analysezwecken im Unternehmen einsetzbar ist. Das System extrahiert, sammelt und sichert relevante Daten aus verschiedenen heterogenen Datenquellen und versorgt nachgelagerte Systeme.

(© aga7ta - stock.adobe.com)

Künstliche Neuronale Netze (KNN) sind inspiriert durch das menschliche Gehirn und lassen sich für maschinelles Lernen und die Künstliche Intelligenz einsetzen. Es lassen sich mit diesen Netzen verschiedene Problemstellungen computerbasiert lösen.

(© aga7ta - stock.adobe.com)

Eine Entität in der Informatik ist ein einzelnes, eindeutig identifizierbares Informationsobjekt. Es kann sich sowohl um existierende als auch um abstrakte Objekte handeln. Entitäten sind zusammen mit den Entitätstypen und Attributen sowie den Beziehungen zwischen den Entitäten wesentliche Elemente der Datenmodellierung.

(© aga7ta - stock.adobe.com)

Deep Learning ist ein Teilbereich des Machine Learnings und nutzt neuronale Netze sowie große Datenmengen. Die Lernmethoden richten sich nach der Funktionsweise des menschlichen Gehirns und resultieren in der Fähigkeit eigener Prognosen oder Entscheidungen.

(© aga7ta - stock.adobe.com)

Der Begriff ACID (Atomicity, Consistency, Isolation, Durability) beschreibt Regeln und Eigenschaften zur Durchführung von Transaktionen in Datenbankmanagementsystemen (DBMS). Hält die Transaktion das ACID-Prinzip ein, gelten die Informationen in den Datenbanksystemen als verlässlich und konsistent.

(© aga7ta - stock.adobe.com)

CRISP-DM (Cross Industry Standard Process for Data Mining) ist ein von der EU gefördertes, branchenübergreifendes Standardmodell für das Data Mining. Es wurde 1996 unter Mitarbeit zahlreicher namhafter Konzerne entwickelt und definiert insgesamt sechs verschiedene Prozessphasen. CRISP-DM ist anwendungsneutral und in beliebigen Bereichen einsetzbar.

(© aga7ta - stock.adobe.com)

Bei einem Chatbot handelt es sich um ein technisches Dialogsystem, mit dem per Texteingabe oder Sprache kommuniziert werden kann. Chatbots werden häufig eingesetzt, um Anfragen automatisiert und ohne direkten menschlichen Eingriff zu beantworten oder zu bearbeiten.

(© aga7ta - stock.adobe.com)

Das Datenbankmanagementsystem, abgekürzt DBMS, ist neben den eigentlichen Daten der wichtigste Bestandteil einer jeden Datenbank. Es übernimmt die Aufgabe der Organisation und Strukturierung der Daten. Gleichzeitig kontrolliert es lesende und schreibende Zugriffe.

(© aga7ta - stock.adobe.com)

Data Mining ist die systematische Anwendung computergestützter Methoden, um in vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu finden. Zur Wissensentdeckung eingesetzte Algorithmen basieren unter anderem auf statistischen Methoden.

(© aga7ta - stock.adobe.com)

Relationale Datenbanken ist das am weitesten verbreitete Datenbankmodell. Es setzt auf das relationale Datenbankmodell, das auf der Speicherung von Informationen in verschiedenen Tabellen basiert, die untereinander über Beziehungen (Relationen) verknüpft sind.

(© aga7ta - stock.adobe.com)

Die Normalisierung findet bei relationalen Datenbankschemata statt und hat zum Ziel, Redundanzen, Inkonsistenzen und Anomalien zu vermeiden und zu beseitigen. Zur Durchführung kommen bis zu fünf verschiedene aufeinander aufbauende Normalformen zum Einsatz. Normalisierte Datenbanken folgen einem klar strukturierten Modell.

(© aga7ta - stock.adobe.com)

NoSQL steht für „Not only SQL“ und bezeichnet Datenbanksysteme, die einen nicht-relationalen Ansatz verfolgen. Diese Datenbanken, denen verschiedene Datenbankmodelle zugrunde liegen können, sind horizontal skalierbar und lassen sich für Big-Data-Anwendungen einsetzen.

(© aga7ta - stock.adobe.com)

Beim Data Lake handelt es sich um einen sehr großen Datenspeicher, der die Daten aus den unterschiedlichsten Quellen in ihrem Rohformat aufnimmt. Er kann sowohl unstrukturierte als auch strukturierte Daten enthalten und lässt sich für Big-Data-Analysen einsetzen.

(© aga7ta - stock.adobe.com)

Beim ETL-Prozess handelt es sich um mehrere Einzelschritte, durch die sich Daten aus verschiedenen Datenquellen per Extrahieren und Aufbereiten in ein Data Warehouse integrieren lassen. Der Prozess kommt häufig zur Verarbeitung großer Datenmengen im Big-Data- und Business-Intelligence-Umfeld zum Einsatz.

(© aga7ta - stock.adobe.com)

Random Forest ist ein Algorithmus, der sich für Klassifizierungs- und Regressionsaufgaben nutzen lässt. Er kombiniert die Ergebnisse vieler verschiedener Entscheidungsbäume, um bestmögliche Entscheidungen zu treffen. Der Lernalgorithmus gehört zu den Verfahren des überwachten Lernens und ist im Machine Learning einsetzbar. Das Verfahren ist relativ einfach und bietet kurze Trainingszeiten.

(© aga7ta - stock.adobe.com)

Bei Hadoop handelt es sich um ein auf Java basierendes Software Framework. Mit ihm lassen sich große Datenmengen auf verteilten Systemen in hoher Geschwindigkeit verarbeiten. Es ist zur Bewältigung der Datenverarbeitung im Big-Data-Umfeld geeignet.

(© aga7ta - stock.adobe.com)

Datenvalidierung prüft Daten auf Einhaltung bestimmter Validierungsregeln. Diese wurden zuvor aufgestellt und beinhalten beispielsweise Vorgaben zu Wertebereichen oder Formaten. Die Datenvalidierung verbessert die Ergebnisse der Datenverarbeitung und Datenanalyse. Sie kann bei der Eingabe der Daten, direkt vor dem Start oder während der Datenverarbeitung stattfinden.

(© aga7ta - stock.adobe.com)

Predictive Maintenance verfolgt als eine der Kernkomponenten von Industrie 4.0 einen vorausschauenden Ansatz und wartet Maschinen und Anlagen proaktiv, um Ausfallzeiten niedrig zu halten. Das Verfahren nutzt hierfür von Sensoren erfasste Messwerte und Daten.

(© aga7ta - stock.adobe.com)

Ein BLOB (Binary Large Object ) ist ein großes binäres Datenobjekt, das von Datenbanken meist in besonderer Form verarbeitet und gespeichert wird. Typische BLOBs sind Dateien wie Video-, Audio- oder Bilddateien

(© aga7ta - stock.adobe.com)

Das Convolutional Neural Network ist eine besondere Form des künstlichen neuronalen Netzwerks. Es besitzt mehrere Faltungsschichten und ist für maschinelles Lernen und Anwendungen mit Künstlicher Intelligenz (KI) im Bereich Bild- und Spracherkennung sehr gut geeignet.

(© aga7ta - stock.adobe.com)

Unstrukturierte Daten sind Informationen, die in einer nicht identifizierbaren und nicht normalisierten Datenstruktur vorliegen. Es kann sich beispielsweise um Texte, Bilder oder Audio- und Videodateien handeln. Im Big-Data-Umfeld haben unstrukturierte Daten eine große Bedeutung.

(© aga7ta - stock.adobe.com)

Eine Pivot-Tabelle strukturiert in Tabellenform vorliegende Daten, fasst sie zusammen und ermöglicht ihre Auswertung. Die Tabellenart gehört zu den Grundfunktionen aller gängigen Tabellenkalkulationsanwendungen. Für die Erstellung einer Pivot-Tabelle sind nur wenige Grundbedingungen zu erfüllen. Komplexe Formeln oder das Anwenden von SQL-Datenbankabfragen sind dank Pivot-Tabellen zum Teil überflüssig.

(© aga7ta - stock.adobe.com)

Apache Kafka ist eine Open Source Software, die die Speicherung und Verarbeitung von Datenströmen über eine verteilte Streaming-Plattform ermöglicht. Sie stellt verschiedene Schnittstellen bereit, um Daten in Kafka-Cluster zu schreiben, Daten zu lesen oder in und aus Drittsysteme zu importieren und zu exportieren.

(© aga7ta - stock.adobe.com)

Bei ODBC (Open Database Connectivity) handelt es sich um eine standardisierte, offene Schnittstelle für den Zugriff auf unterschiedliche Datenbankmanagementsysteme. Über ODBC-Treiber können Anwendungen direkt Anweisungen an Datenbanken erteilen oder Abfragen ausführen.

(© aga7ta - stock.adobe.com)

Das ARIMA-Modell ermöglicht die Beschreibung und Analyse von Zeitreihen. Es handelt sich um eine leistungsstarke Modellklasse, die den autoregressiven Teil und den gleitenden Mittelwertbeitrag des ARMA-Modells um die Differenzierung und Integration zur Trendbeseitigung und Herstellung der Stationarität erweitert.

(© aga7ta - stock.adobe.com)

Die Support Vector Machine (SVM) ist eine mathematische Methode, die im Umfeld des maschinellen Lernens zum Einsatz kommt. Sie gestattet das Klassifizieren von Objekten und ist vielfältig nutzbar. Unterstützt werden die lineare und die nicht-lineare Objektklassifizierung. Typische Anwendungsbereiche sind die Bild-, Text- oder Handschrifterkennung.

(© aga7ta - stock.adobe.com)

Big Data Analytics ermöglicht es, große Datenmengen aus unterschiedlichen Quellen zu analysieren. Die gewonnenen Informationen oder erkannten Muster lassen sich einsetzen, um beispielsweise Unternehmensprozesse zu optimieren.

(© aga7ta - stock.adobe.com)

Das Industrial Internet of Things (IIoT) stellt die industrielle Ausprägung des Internet of Things (IoT) dar. Es repräsentiert im Gegensatz zum IoT nicht die verbraucherorientierten Konzepte, sondern konzentriert sich auf die Anwendung des Internets der Dinge im produzierenden und industriellen Umfeld.

(© aga7ta - stock.adobe.com)

In einer Smart City werden moderne Technologien aus den Bereichen Energie, Mobilität, Stadtplanung, Verwaltung und Kommunikation so miteinander vernetzt, dass sich die Lebensqualität für die Bewohner steigert. Gleichzeitig profitiert die Nachhaltigkeit der Stadt.

Generative AI (Artificial Intelligence) ist eine Form von Künstlicher Intelligenz (KI), die auf Basis von Vorgaben und vorhandenen Informationen Inhalte generiert. Es kommen KI-Verfahren und -Technologien wie trainierte neuronale Netzwerke, maschinelles Lernen (Deep Learning) und KI-Algorithmen zum Einsatz, um nach Anweisungen Texte, Bilder, Audio- und Videoinhalte, Programmcode, 3D-Modelle und anderes zu erzeugen.

(© aga7ta - stock.adobe.com)

Die Smart Factory steht im Zentrum der sogenannten Industrie 4.0. Sie stellt eine Produktionsumgebung zur Verfügung, die sich im Idealfall ohne menschlichen Eingriff selbst organisiert. Dazu zählen Fertigungsanlagen und Logistiksysteme. Kernkomponenten sind cyber-physische Systeme und die intelligente Vernetzung.

(© aga7ta - stock.adobe.com)

Bei einem Management-Informationssystem (MIS) handelt es sich um ein computerunterstütztes Informationssystem, das wichtige Unternehmensinformationen für die Führungsebene sammelt und aufbereitet. Auf Basis der Informationen lassen sich Analysen durchführen, Probleme lösen oder strategische Entscheidungen treffen.

(© aga7ta - stock.adobe.com)

Ein Digitaler Zwilling repräsentiert ein reales Objekt in der digitalen Welt. Es kann sich um materielle oder immaterielle Objekte handeln. Die Digitalen Zwillinge sind aus Daten und Algorithmen aufgebaut und können über Sensoren mit der realen Welt gekoppelt sein. Für die Prozesse der Industrie 4.0 stellen Digitale Zwillinge die Basis dar.

(© aga7ta - stock.adobe.com)

Python ist eine Programmiersprache, die dank ihrer klaren Syntax und einfachen Lesbarkeit leicht zu erlernen ist und sich sehr vielseitig einsetzen lässt. Für die gängigen Betriebssysteme ist Python frei verfügbar. Die üblichen Programmierparadigmen wie die objektorientierte oder funktionale Programmierung werden unterstützt.

(© aga7ta - stock.adobe.com)

Der k-Means-Algorithmus ist ein Rechenverfahren, das sich für die Gruppierung von Objekten, die sogenannte Clusteranalyse, einsetzen lässt. Dank der effizienten Berechnung der Clusterzentren und dem geringen Speicherbedarf eignet sich der Algorithmus sehr gut für die Analyse großer Datenmengen, wie sie im Big-Data-Umfeld üblich sind.

(© aga7ta - stock.adobe.com)

Data Literacy oder Datenkompetenz beschreibt die Fähigkeit, mit Daten kompetent umzugehen. Sie umfasst verschiedene Einzelkompetenzen, um Daten zu erfassen, anzupassen, zu verändern, zu interpretieren und zu präsentieren. Die Datenkompetenz ist Grundlage und wichtiger Skill der Digitalisierung.

(© aga7ta - stock.adobe.com)

XGBoost ist eine frei verfügbare Bibliothek mit Open-Source-Lizenz. Sie ermöglicht überwachtes maschinelles Lernen mit dem Boosted-Tree-Algorithmus, einem Baumalgorithmus mit Gradient Boosting. Die Bibliothek ist für Betriebssysteme wie Linux, Windows oder macOS verfügbar und arbeitet mit Programmiersprachen wie C++, Java, Python, R und Julia.

(© aga7ta - stock.adobe.com)

Total Cost of Ownership, abgekürzt TCO, ist eine ganzheitliche Kostenbetrachtung von Produkten, Gütern oder Services, die nicht nur die Anschaffungskosten, sondern auch laufende direkte und indirekt Kosten über den kompletten Lebenszyklus hinweg berücksichtigt. Die Kostenbetrachtung bietet wichtige Hilfestellungen zur Beantwortung betriebswirtschaftlicher Fragestellungen wie Investitionsentscheidungen.

(© aga7ta - stock.adobe.com)

Die IT-Strategie macht Vorgaben über die zukünftige Entwicklung der Informationstechnik (IT) und IT-Infrastruktur eines Unternehmens. Sie folgt immer der Unternehmensstrategie und ist eine zentrale Komponente des IT-Managements. Ziel der Strategie ist es, durch das Management der IT und die Definition der Rahmenbedingungen die langfristigen Unternehmensziele zu erreichen.

(© aga7ta - stock.adobe.com)

OPC UA (Open Platform Communications Unified Architecture) ist eine Sammlung von Standards für die Kommunikation und den Datenaustausch im Umfeld der Industrieautomation. Mithilfe von OPC UA werden sowohl der Transport von Machine-to-Machine-Daten als auch Schnittstellen und die Semantik von Daten beschrieben. Die komplette Architektur ist serviceorientiert aufgebaut.

(© aga7ta - stock.adobe.com)

Neben dem Data Owner hat der Data Steward eine Schlüsselposition in der Umsetzung der Data Governance inne. Er ist verantwortlich für die Einhaltung der Datenqualität und setzt die strategischen Vorgaben der Data Governance fachlich um. Innerhalb des Unternehmens agiert er als Ansprechpartner für die verschiedenen Fachabteilungen bei Fragen oder Problemen zur Datenqualität.

(© aga7ta - stock.adobe.com)

Ein Key Performance Indicator, kurz KPI, ist eine aussagekräftige Kennzahl, mit der sich die Leistung einer Aktivität einer Organisation oder eines Unternehmens messen lässt. Es existieren viele verschiedene KPIs für unterschiedlichen Unternehmensbereiche und Tätigkeiten. Die leicht verständlichen Leistungsindikatoren können zur kontinuierlichen Überprüfung der Zielerreichung eingesetzt werden.

(© aga7ta - stock.adobe.com)

Data Science ist eine angewandte, interdisziplinäre Wissenschaft. Ziel der Datenwissenschaft ist es, Wissen aus Daten zu generieren, um beispielsweise die Unternehmenssteuerung zu optimieren oder die Entscheidungsfindung zu unterstützen. Es kommen Methoden und Wissen aus verschiedenen Bereichen wie Mathematik, Statistik, Stochastik, Informatik und Branchen-Know-how zum Einsatz.

1
2
3
4
...
16