Dipl.-Ing. (FH) Stefan Luber ♥ BigData-Insider

Dipl.-Ing. (FH) Stefan Luber

Stefan Luber arbeitet als freiberuflicher Autor und technischer Redakteur für IT-Fachthemen und deckt als Dipl.-Ing. (FH) der Nachrichtentechnik ein breites Spektrum an IT-Themen ab.

Artikel des Autors

0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist der AI Act?

Der AI Act ist eine EU-Verordnung zur Regulierung von Künstlicher Intelligenz. Er liegt als Vorschlag vor und soll nach der endgültigen Annahme in der Europäischen Union in Kraft treten. Die KI-Verordnung verfolgt einen risikobasierten Ansatz und teilt KI-Technologien und -Systeme in verschiedene Risikoklassen ein. Entsprechend dem jeweiligen Risiko sind bestimmte Anforderungen zu erfüllen. KI-Systeme mit nicht akzeptablem Risiko sollen verboten werden.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist ein Recurrent Neural Network (RNN)?

Bei einem Recurrent Neural Network sind die künstlichen Neuronen des neuronalen Netzwerks so verschaltet, dass sie Rückkopplungen zu gleichen oder anderen Neuronen aufweisen. Dadurch ist das neuronale Netzwerk in der Lage, Ausgabeinformationen erneut als Eingabeinformationen einzuspeisen und eine Art Gedächtnis aufzubauen. Typische Anwendung eines RNN ist die Verarbeitung sequenzieller Daten, wie sie beispielsweise bei natürlicher Sprache oder bei Zeitreihendaten auftreten.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was sind Open Services for Lifecycle Collaboration?

Open Services for Lifecycle Collaboration (OSLC) ist eine Initiative, welche die Integration von Werkzeugen des kompletten Lebenszyklus der Software- und Produktentwicklung vereinfachen soll. Die Initiative hat eine Reihe von offenen Spezifikationen entwickelt und wird heute als OASIS Open Project geführt. OSLC baut auf der Webarchitektur und dem Web of Data auf und verwendet HTTP-URIs zur Adressierung und das Resource Description Framework (RDF) zur Ressourcenabbildung.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist I-JEPA?

I-JEPA ist ein von Meta mitentwickeltes KI-Modell aus dem Bereich des maschinellen Sehens. Es arbeitet bei der Bilderkennung nicht wie bisherige Modelle mit Analysen auf Pixelebene, sondern mit abstrakten Repräsentationen von Objekten. Die Lernvorgänge des Modells sind dem menschlichen Lernen ähnlicher. I-JEPA kann Details nicht sichtbarer Bildteile vorhersagen. Das Modell soll ein erster Schritt zu einer allgemeinen Künstlichen Intelligenz mit Common Sense sein.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist CLIP?

CLIP (Contrastive Language-Image Pre-training) ist ein von OpenAI entwickeltes KI-Verfahren. Es handelt sich um ein mit einer großen Menge Bild-Text-Paaren trainiertes neuronales Netzwerk, das die relevanteste Bildunterschrift zu einem gegebenen Bild vorhersagen kann. CLIP besitzt Zero-Shot-Fähigkeiten und lässt sich beispielsweise einsetzen, um mit Textbeschreibungen nach Bildern zu suchen oder Bilder automatisch zu beschriften. Der Text-zu-Bild-Generator DALL-E von OpenAI verwendet CLIP.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist GLIDE?

GLIDE ist ein von OpenAI entwickeltes, textgeführtes Diffusionsmodell zum Erzeugen und Bearbeiten von Bildern auf Basis natürlichsprachiger Textanweisungen. Das Diffusionsmodell erzielt trotz deutlich niedrigere Parameteranzahl bessere Ergebnisse als die erste Version des Text-zu-Bild-Generators DALL-E von OpenAI. In DALL-E2 nutzt OpenAI GLIDE mit weiteren KI-Verfahren wie CLIP für noch bessere Ergebnisse beim Erzeugen und Bearbeiten von Bildern.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist AutoGPT?

AutoGPT ist ein quelloffener, experimenteller KI-Agent. Er erledigt mithilfe des GPT-4-Sprachmodells von OpenAI selbstständig komplexe Aufgabenstellungen. Der KI-Agent zerlegt die Aufgaben in einzelne Tasks und arbeitet sie automatisiert ab. Zur Erledigung der Aufgaben kann er Informationen im Internet recherchieren, Websites besuchen und Tools oder Anwendungen nutzen.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Midjourney?

Midjourney ist eine generative Künstliche Intelligenz. Der Text-zu-Bild-Generator erstellt auf Basis von Anweisungen in Textform hochauflösende Bilder, Gemälde, Zeichnungen, Fotos und andere Arten digitale Bilder. Nutzbar ist Midjourney über Textanweisungen (Prompts) an einen Discord-Bot. Die grundsätzliche Funktionalität von Midjourney ist vergleichbar mit anderen Text-zu-Bild-Generatoren wie DALL-E oder Stable Diffusion.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist ein Large Language Model?

Large Language Models sind große generative Sprachmodelle mit Künstlicher Intelligenz, die mit riesigen Mengen an Textdaten vortrainiert sind. Sie basieren auf neuronalen Netzen, in der Regel in Transformer-Architektur, und besitzen viele Milliarden Parameter. LLMs können natürliche Sprache verarbeiten, verstehen und generieren. Große Sprachmodelle eignen sich für zahlreiche Anwendungen und sind beispielsweise die Grundlage für KI-Chatbots wie ChatGPT oder Google Bard.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist EnCodec?

EnCodec ist ein von Meta entwickelter Audio-Codec. Er verwendet Verfahren der Künstlichen Intelligenz und erzielt ein hohes Komprimierungsverhältnis. Im Vergleich zu MP3 erreicht er bei vergleichbarer Qualität eine bis zu zehnfach höhere Komprimierungsrate. EnCodec unterstützt sowohl Mono-Audio mit 24 kHz als auch Stereo-Audio mit 48 kHz. Der Code von EnCodec steht auf GitHub frei zur Verfügung.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Jarvis?

Jarvis ist ein KI-Projekt von Microsoft. Es ermöglicht die Nutzung mehrerer verschiedener KI-Modelle für eine bestimmte Aufgabenstellung. Mit Jarvis lassen sich komplexe Aufgabenstellungen an eine Künstliche Intelligenz (KI) lösen, indem die Aufgaben zerlegt, an jeweils geeignete KI-Modelle übergeben und deren Antworten zusammengeführt werden. Jarvis steht unter Open-Source-Lizenz und ist frei verfügbar.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Apache Iceberg?

Apache Iceberg ist ein unter Open-Source-Lizenz stehendes, offenes Datentabellenformat. Es wurde speziell für die Anforderungen von Datentabellen im Petabytebereich entwickelt und eignet sich für die schnelle und effiziente Verarbeitung und Analyse großer, in Data Lakes gespeicherter Datenmengen. Das Tabellenformat lässt sich in viele gängige Datensysteme und Datenverarbeitungs-Frameworks wie Apache Hive, Apache Spark, Apache Flink oder Presto integrieren.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Asset Administration Shell (AAS)?

Die Asset Administration Shell ermöglicht eine standardisierte digitale Repräsentation von Assets. Ein Asset ist eine Komponente einer Industrie-4.0-Lösung wie ein physisches Objekt, eine Software oder ein Dokument. Die AAS wird auch als Standard zur Umsetzung des digitalen Zwillings in der Industrie 4.0 bezeichnet. Mithilfe der Asset Administration Shell werden Merkmale, Verhaltensweisen, Funktionen und andere relevante Informationen von Assets in einem einheitlichen Datenmodell beschrieben.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was sind Amazon Titan FMs?

Die Amazon Titan FMs sind von Amazon entwickelte und vortrainierte KI-Basismodelle (Foundation Models). Sie sind Bestandteil des AI-as-a-Service-Angebots Amazon Bedrock der Amazon Web Services. Es handelt sich um Sprachmodelle, die für verschiedene Aufgaben wie das Erzeugen, Zusammenfassen oder Klassifizieren von Texten einsetzbar sind. Die Modelle lassen sich mit eigenen Daten weiter trainieren und für spezifische Zwecke anpassen. Die Rechenleistung für die KI-Modelle stellt AWS zur Verfügung.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Amazon CodeWhisperer?

Amazon CodeWhisperer ist ein Programmcodegenerator mit Künstlicher Intelligenz. Er ist als Coding-Begleiter und Programmierhilfe einsetzbar. CodeWhisperer basiert auf einem mit Milliarden von Codezeilen trainierten künstlichen neuronalen Netzwerk und beherrscht 15 verschiedene Programmiersprachen wie Java, JavaScript oder Python. Die Nutzung der Programmierhilfe ist für Einzelpersonen kostenlos. Für Unternehmen gibt es eine kostenpflichtige Professional-Version des KI-Coding-Begleiters.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist ein Prompt Engineer?

Prompt Engineer ist ein noch recht junges, durch generative Künstliche Intelligenz entstandenes Berufsbild. Aufgabe eines Prompt Engineers ist es, die Eingabebefehle (Prompts) an ein KI-Modell so zu optimieren, dass es bestmögliche Ergebnisse liefert. Der Vorgang der Prompt-Optimierung wird als Prompt Engineering bezeichnet. Prompt Engineering kommt beispielsweise bei generativen Sprachmodellen und Text-to-Image-Modellen wie GPT-3 oder Midjourney und Chatbots wie ChatGPT zum Einsatz.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist EleutherAI?

EleutherAI ist ein Non-Profit-Projekt für die Entwicklung und Förderung von Künstlicher Intelligenz und maschinellem Lernen. Die Non-Profit-Forschungsgruppe hat unter anderem mehrere frei verfügbare, große Sprachmodelle wie GPT-J oder GPT-NeoX erstellt, trainiert und veröffentlicht. Auch der 825 Gigabyte große Texttrainingsdatensatz „The Pile“ stammt von EleutherAI. Ein weiterer Schwerpunkt von EleutherAI ist die Forschung im Bereich Interpretierbarkeit und Alignment großer KI-Modelle.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist ein Graph Neural Network (GNN)?

Das Graph Neural Network gehört zur Kategorie der künstlichen neuronalen Netzwerke (KNN). Es arbeitet mit Daten in Graphenstruktur. Das GNN verwendet Deep Learning, um aus graphenbasierten Daten zu lernen. Es nutzt Daten in Form von Knoten und Kanten und erkennt Beziehungen und Muster in den Graphen. Auf Basis der Graphendaten lassen sich Aufgaben wie Klassifizierungen durchführen oder Vorhersagen treffen.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Generative Pretrained Transformer 4 (GPT-4)?

GPT-4 ist das neueste generative Sprachmodell aus der GPT-Familie. Es wurde von OpenAI entwickelt und trainiert. Es basiert wie die Vorgängermodelle auf der Transformer-Architektur. Das Modell ist multimodal und versteht neben Texteingaben auch Bildeingaben. Es kann Texte in vielen Sprachen verfassen, Fragen beantworten, Dialoge führen, Texte zusammenfassen, programmieren und vieles mehr. GPT-4 ist in Microsoft Bing und in die kostenpflichtige Version des Chatbots ChatGPT integriert.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist OpenGPT-X?

OpenGPT-X ist ein europäisches Forschungs- und Entwicklungsprojekt. Es wird vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK) gefördert und soll ein an europäischen Bedürfnissen, Werten und Datenschutzanforderungen ausgerichtetes KI-Sprachmodell entwickeln und bereitstellen. Die technische Basis für das Sprachmodell bildet die europäische Gaia-X-Infrastruktur. Zu den Gründungsmitgliedern von OpenGPT-X zählen Unternehmen, Forschungsinstitute und Medienanstalten.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist OpenAI Whisper?

Whisper ist ein Spracherkennungssystem von OpenAI. Es basiert auf einem KI-Modell mit Encoder-Decoder-Transformer-Architektur und ist als Open-Source-Modell frei verfügbar. Das System wurde mit vielen tausend Stunden Sprachmaterial trainiert und kann in fünf verschiedenen Modellgrößen heruntergeladen und auf einem lokalen Rechner genutzt werden. Mittlerweile existiert auch eine API zu einer gehosteten Version von Whisper, deren Nutzungskosten sich nach Transkriptionslänge berechnen.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Mindverse?

Mindverse ist der Name eines auf Künstlicher Intelligenz basierenden All-in-One-Tools für die Content-Erstellung. Das Tool deckt die komplette Kette der Content-Erstellung ab und liefert Texte inklusive dazu passender Bilder. Mindverse stammt von einem Berliner AI-Start-up-Unternehmen und ist auf deutsche Inhalte spezialisiert. Das Tool eignet sich für zahlreiche verschiedene Textarten, KI-Brainstorming, Text- und SEO-Analysen und vieles mehr.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist AutomationML?

AutomationML ist ein offener Standard für das Speichern, Modellieren und Austauschen von Engineering-Daten. Mithilfe des auf XML basierenden Datenformats lassen sich die für den Engineering-Prozess relevanten Aspekte mechatronischer Einzelobjekte und kompletter Fertigungsanlagen beschreiben. Der Standard wird vom AutomationML e. V. weiterentwickelt und gepflegt. AutomationML hat hohe Relevanz für Prozesse der Industrie 4.0.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Bard?

Bard ist der Name eines von Google entwickelten und bereitgestellten Chatbots mit künstlicher Intelligenz. Er basiert auf dem Large Language Modell (LLM) PaLM 2 und ist seit Mai 2023 in 180 Ländern für die Öffentlichkeit eingeschränkt verfügbar. Mit Bard lassen sich menschenähnliche Dialoge führen, vergleichbar mit dem Chatbot ChatGPT von OpenAI. Google plant, die eigenen Suchmaschinenfunktionen mit dem Chatbot zu ergänzen.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist SuperGLUE?

SuperGLUE ist ein Benchmark zur Evaluierung des Sprachverständnisses und der NLU-Fähigkeiten (Natural Language Understanding) von KI-Sprachmodellen. Das Verständnis natürlicher Sprache wird mit Aufgaben aus insgesamt aus acht verschiedenen Kategorien getestet und beurteilt. SuperGLUE ist der Nachfolger des GLUE-Benchmarks. Für die Sprachmodelle ist SuperGLUE schwieriger zu lösen. Die Ergebnisse lassen sich über ein Online-Leaderboard veröffentlichen und vergleichen.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Stable Diffusion?

Stable Diffusion ist ein Text-zu-Bild-Generator von Stability AI. Er gehört zur Kategorie generative Künstlicher Intelligenz und erzeugt digitale Bilder auf Basis natürlichsprachiger Textanweisungen. Stable Diffusion ist Open Source und in Zusammenarbeit von Stability AI mit anderen Institutionen entstanden. Der Bildgenerator wurde 2022 veröffentlicht und verwendet ein Diffusionsmodell wie vergleichbare Text-zu-Bild-KI-Lösungen. Stable Diffusion kann online über Weboberflächen oder lokal auf einem Rechner genutzt werden.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist DALL-E?

DALL-E ist ein Text-zu-Bild-Generator von OpenAI. Er gehört zur Kategorie generativer KI (Generative AI) und ist in der Lage, auf Basis von natürlichsprachigen Textanweisungen digitale Bilder zu erstellen. Ein Jahr nach Veröffentlichung von DALL-E im Jahr 2021 erschien 2022 mit DALL-E 2 eine verbesserte Version des Text-zu-Bild-Generators. DALL-E kann prinzipiell von jedem über eine Weboberfläche genutzt werden. Die Abrechnung erfolgt über ein Credit-System.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Generative AI?

Generative AI (Artificial Intelligence) ist eine Form von Künstlicher Intelligenz, die auf Basis von Vorgaben und vorhandenen Informationen neue Inhalte generiert. Es kommen KI-Verfahren und -Technologien wie trainierte neuronale Netzwerke, maschinelles Lernen (Deep Learning) und KI-Algorithmen zum Einsatz, um nach Anweisungen Texte, Bilder, Audio- und Videoinhalte, Programmcode, 3D-Modelle und anderes zu erzeugen.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Prompt Engineering?

Der Begriff Prompt Engineering beschreibt ein Konzept und einen Prozess aus dem KI-Umfeld. Textbasierte Eingaben über die Befehlszeile werden so gestaltet und optimiert, dass die Künstliche Intelligenz bestmögliche Ergebnisse liefert. Prompt Engineering kommt bei generativer KI mit Texteingabeschnittstellen wie großen Sprachmodellen, Chatbots oder Text-to-Image-Modellen zum Einsatz. Aus dem Prompt Engineering hat sich die Stellenbeschreibung des Prompt Engineers entwickelt.

Weiterlesen
0102192446 (Bild: © aga7ta - stock.adobe.com)
Definition

Was ist Amazon Bedrock?

Amazon Bedrock ist der Produktname eines im April 2023 von Amazon vorgestellten und angekündigten AI-as-a-Service-Angebots. Es stellt generative Künstliche Intelligenz auf Basis der Amazon Web Services zur Verfügung. Zum Portfolio gehören mehrere große, generative KI-Modelle für Texte und Bilder von verschiedenen KI-Start-ups und von Amazon selbst. Die sogenannten Foundation Models lassen sich mit eigenen Daten feinabstimmen und für individuelle Anwendungen anpassen und verwenden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Digitalisierung?

Digitalisierung bezeichnet im ursprünglichen Sinn das Umwandeln von analogen Werten in digitale Formate. Diese Daten lassen sich informationstechnisch verarbeiten. Oft steht der Begriff Digitalisierung aber auch für die digitale Revolution oder die digitale Transformation.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist SAP BW?

SAP BW ist ein Business-Intelligence-Paket von SAP und ermöglicht umfangreiche Auswertungen und Reports auf Basis von unterschiedlichsten Unternehmensdaten. Es besteht aus einer Kombination von Datenbanken, Datenbankmanagement-Tools sowie Analyse und Reporting-Anwendungen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist das Internet of Things?

Im Internet der Dinge (Englisch: Internet of Things, IoT) bekommen Gegenstände eine eindeutige Identität und können miteinander kommunizieren oder Befehle entgegennehmen. Mit dem Internet of Things lassen sich Anwendungen automatisieren und Aufgaben ohne Eingriff von außen erledigen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Machine Learning?

Machine Learning, im Deutschen maschinelles Lernen, ist ein Teilgebiet der künstlichen Intelligenz. Durch das Erkennen von Mustern in vorliegenden Datenbeständen sind IT-Systeme in der Lage, eigenständig Lösungen für Probleme zu finden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Natural Language Processing?

Die Abkürzung NLP steht für Natural Language Processing und beschreibt Techniken und Methoden zur maschinellen Verarbeitung natürlicher Sprache. Ziel ist eine direkte Kommunikation zwischen Mensch und Computer auf Basis der natürlichen Sprache.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Cyber-physisches System (CPS)?

In einem Cyber-physischen System (cyber-physical system, CPS) sind mechanische Komponenten über Netzwerke und moderne Informationstechnik miteinander verbunden. Sie ermöglichen die Steuerung und die Kontrolle von komplexen Systemen und Infrastrukturen. Für die Industrie 4.0 spielen Cyber-physische Systeme eine zentrale Rolle.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Data Warehouse?

Das Data Warehouse stellt ein zentrales Datenbanksystem dar, das zu Analysezwecken im Unternehmen einsetzbar ist. Das System extrahiert, sammelt und sichert relevante Daten aus verschiedenen heterogenen Datenquellen und versorgt nachgelagerte Systeme.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Neuronales Netz?

Künstliche Neuronale Netze (KNN) sind inspiriert durch das menschliche Gehirn und lassen sich für maschinelles Lernen und die Künstliche Intelligenz einsetzen. Es lassen sich mit diesen Netzen verschiedene Problemstellungen computerbasiert lösen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Deep Learning?

Deep Learning ist ein Teilbereich des Machine Learnings und nutzt neuronale Netze sowie große Datenmengen. Die Lernmethoden richten sich nach der Funktionsweise des menschlichen Gehirns und resultieren in der Fähigkeit eigener Prognosen oder Entscheidungen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist CRISP-DM?

CRISP-DM (Cross Industry Standard Process for Data Mining) ist ein von der EU gefördertes, branchenübergreifendes Standardmodell für das Data Mining. Es wurde 1996 unter Mitarbeit zahlreicher namhafter Konzerne entwickelt und definiert insgesamt sechs verschiedene Prozessphasen. CRISP-DM ist anwendungsneutral und in beliebigen Bereichen einsetzbar.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Datenbankmanagementsystem?

Das Datenbankmanagementsystem, abgekürzt DBMS, ist neben den eigentlichen Daten der wichtigste Bestandteil einer jeden Datenbank. Es übernimmt die Aufgabe der Organisation und Strukturierung der Daten. Gleichzeitig kontrolliert es lesende und schreibende Zugriffe.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine relationale Datenbank?

Relationale Datenbanken ist das am weitesten verbreitete Datenbankmodell. Es setzt auf das relationale Datenbankmodell, das auf der Speicherung von Informationen in verschiedenen Tabellen basiert, die untereinander über Beziehungen (Relationen) verknüpft sind.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Data Mining?

Data Mining ist die systematische Anwendung computergestützter Methoden, um in vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu finden. Zur Wissensentdeckung eingesetzte Algorithmen basieren unter anderem auf statistischen Methoden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Entität?

Eine Entität in der Informatik ist ein einzelnes, eindeutig identifizierbares Informationsobjekt. Es kann sich sowohl um existierende als auch um abstrakte Objekte handeln. Entitäten sind zusammen mit den Entitätstypen und Attributen sowie den Beziehungen zwischen den Entitäten wesentliche Elemente der Datenmodellierung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist NoSQL?

NoSQL steht für „Not only SQL“ und bezeichnet Datenbanksysteme, die einen nicht-relationalen Ansatz verfolgen. Diese Datenbanken, denen verschiedene Datenbankmodelle zugrunde liegen können, sind horizontal skalierbar und lassen sich für Big-Data-Anwendungen einsetzen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ACID?

Der Begriff ACID (Atomicity, Consistency, Isolation, Durability) beschreibt Regeln und Eigenschaften zur Durchführung von Transaktionen in Datenbankmanagementsystemen (DBMS). Hält die Transaktion das ACID-Prinzip ein, gelten die Informationen in den Datenbanksystemen als verlässlich und konsistent.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Chatbot?

Bei einem Chatbot handelt es sich um ein technisches Dialogsystem, mit dem per Texteingabe oder Sprache kommuniziert werden kann. Chatbots werden häufig eingesetzt, um Anfragen automatisiert und ohne direkten menschlichen Eingriff zu beantworten oder zu bearbeiten.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Data Lake?

Beim Data Lake handelt es sich um einen sehr großen Datenspeicher, der die Daten aus den unterschiedlichsten Quellen in ihrem Rohformat aufnimmt. Er kann sowohl unstrukturierte als auch strukturierte Daten enthalten und lässt sich für Big-Data-Analysen einsetzen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Normalisierung?

Die Normalisierung findet bei relationalen Datenbankschemata statt und hat zum Ziel, Redundanzen, Inkonsistenzen und Anomalien zu vermeiden und zu beseitigen. Zur Durchführung kommen bis zu fünf verschiedene aufeinander aufbauende Normalformen zum Einsatz. Normalisierte Datenbanken folgen einem klar strukturierten Modell.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Hadoop?

Bei Hadoop handelt es sich um ein auf Java basierendes Software Framework. Mit ihm lassen sich große Datenmengen auf verteilten Systemen in hoher Geschwindigkeit verarbeiten. Es ist zur Bewältigung der Datenverarbeitung im Big-Data-Umfeld geeignet.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Validierung?

Datenvalidierung prüft Daten auf Einhaltung bestimmter Validierungsregeln. Diese wurden zuvor aufgestellt und beinhalten beispielsweise Vorgaben zu Wertebereichen oder Formaten. Die Datenvalidierung verbessert die Ergebnisse der Datenverarbeitung und Datenanalyse. Sie kann bei der Eingabe der Daten, direkt vor dem Start oder während der Datenverarbeitung stattfinden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ETL (Extract, Transform, Load)?

Beim ETL-Prozess handelt es sich um mehrere Einzelschritte, durch die sich Daten aus verschiedenen Datenquellen per Extrahieren und Aufbereiten in ein Data Warehouse integrieren lassen. Der Prozess kommt häufig zur Verarbeitung großer Datenmengen im Big-Data- und Business-Intelligence-Umfeld zum Einsatz.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Predictive Maintenance?

Predictive Maintenance verfolgt als eine der Kernkomponenten von Industrie 4.0 einen vorausschauenden Ansatz und wartet Maschinen und Anlagen proaktiv, um Ausfallzeiten niedrig zu halten. Das Verfahren nutzt hierfür von Sensoren erfasste Messwerte und Daten.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Random Forest?

Random Forest ist ein Algorithmus, der sich für Klassifizierungs- und Regressionsaufgaben nutzen lässt. Er kombiniert die Ergebnisse vieler verschiedener Entscheidungsbäume, um bestmögliche Entscheidungen zu treffen. Der Lernalgorithmus gehört zu den Verfahren des überwachten Lernens und ist im Machine Learning einsetzbar. Das Verfahren ist relativ einfach und bietet kurze Trainingszeiten.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Apache Kafka?

Apache Kafka ist eine Open Source Software, die die Speicherung und Verarbeitung von Datenströmen über eine verteilte Streaming-Plattform ermöglicht. Sie stellt verschiedene Schnittstellen bereit, um Daten in Kafka-Cluster zu schreiben, Daten zu lesen oder in und aus Drittsysteme zu importieren und zu exportieren.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein BLOB?

Ein BLOB (Binary Large Object ) ist ein großes binäres Datenobjekt, das von Datenbanken meist in besonderer Form verarbeitet und gespeichert wird. Typische BLOBs sind Dateien wie Video-, Audio- oder Bilddateien

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Convolutional Neural Network?

Das Convolutional Neural Network ist eine besondere Form des künstlichen neuronalen Netzwerks. Es besitzt mehrere Faltungsschichten und ist für maschinelles Lernen und Anwendungen mit Künstlicher Intelligenz (KI) im Bereich Bild- und Spracherkennung sehr gut geeignet.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ODBC?

Bei ODBC (Open Database Connectivity) handelt es sich um eine standardisierte, offene Schnittstelle für den Zugriff auf unterschiedliche Datenbankmanagementsysteme. Über ODBC-Treiber können Anwendungen direkt Anweisungen an Datenbanken erteilen oder Abfragen ausführen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was sind unstrukturierte Daten?

Unstrukturierte Daten sind Informationen, die in einer nicht identifizierbaren und nicht normalisierten Datenstruktur vorliegen. Es kann sich beispielsweise um Texte, Bilder oder Audio- und Videodateien handeln. Im Big-Data-Umfeld haben unstrukturierte Daten eine große Bedeutung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Pivot-Tabelle?

Eine Pivot-Tabelle strukturiert in Tabellenform vorliegende Daten, fasst sie zusammen und ermöglicht ihre Auswertung. Die Tabellenart gehört zu den Grundfunktionen aller gängigen Tabellenkalkulationsanwendungen. Für die Erstellung einer Pivot-Tabelle sind nur wenige Grundbedingungen zu erfüllen. Komplexe Formeln oder das Anwenden von SQL-Datenbankabfragen sind dank Pivot-Tabellen zum Teil überflüssig.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Big Data Analytics?

Big Data Analytics ermöglicht es, große Datenmengen aus unterschiedlichen Quellen zu analysieren. Die gewonnenen Informationen oder erkannten Muster lassen sich einsetzen, um beispielsweise Unternehmensprozesse zu optimieren.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist das Industrial Internet of Things (IIoT)?

Das Industrial Internet of Things (IIoT) stellt die industrielle Ausprägung des Internet of Things (IoT) dar. Es repräsentiert im Gegensatz zum IoT nicht die verbraucherorientierten Konzepte, sondern konzentriert sich auf die Anwendung des Internets der Dinge im produzierenden und industriellen Umfeld.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Smart Factory?

Die Smart Factory steht im Zentrum der sogenannten Industrie 4.0. Sie stellt eine Produktionsumgebung zur Verfügung, die sich im Idealfall ohne menschlichen Eingriff selbst organisiert. Dazu zählen Fertigungsanlagen und Logistiksysteme. Kernkomponenten sind cyber-physische Systeme und die intelligente Vernetzung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Smart City?

In einer Smart City werden moderne Technologien aus den Bereichen Energie, Mobilität, Stadtplanung, Verwaltung und Kommunikation so miteinander vernetzt, dass sich die Lebensqualität für die Bewohner steigert. Gleichzeitig profitiert die Nachhaltigkeit der Stadt.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Digitaler Zwilling?

Ein Digitaler Zwilling repräsentiert ein reales Objekt in der digitalen Welt. Es kann sich um materielle oder immaterielle Objekte handeln. Die Digitalen Zwillinge sind aus Daten und Algorithmen aufgebaut und können über Sensoren mit der realen Welt gekoppelt sein. Für die Prozesse der Industrie 4.0 stellen Digitale Zwillinge die Basis dar.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Support Vector Machine?

Die Support Vector Machine (SVM) ist eine mathematische Methode, die im Umfeld des maschinellen Lernens zum Einsatz kommt. Sie gestattet das Klassifizieren von Objekten und ist vielfältig nutzbar. Unterstützt werden die lineare und die nicht-lineare Objektklassifizierung. Typische Anwendungsbereiche sind die Bild-, Text- oder Handschrifterkennung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist XGBoost?

XGBoost ist eine frei verfügbare Bibliothek mit Open-Source-Lizenz. Sie ermöglicht überwachtes maschinelles Lernen mit dem Boosted-Tree-Algorithmus, einem Baumalgorithmus mit Gradient Boosting. Die Bibliothek ist für Betriebssysteme wie Linux, Windows oder macOS verfügbar und arbeitet mit Programmiersprachen wie C++, Java, Python, R und Julia.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist das ARIMA-Modell?

Das ARIMA-Modell ermöglicht die Beschreibung und Analyse von Zeitreihen. Es handelt sich um eine leistungsstarke Modellklasse, die den autoregressiven Teil und den gleitenden Mittelwertbeitrag des ARMA-Modells um die Differenzierung und Integration zur Trendbeseitigung und Herstellung der Stationarität erweitert.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Data Literacy?

Data Literacy oder Datenkompetenz beschreibt die Fähigkeit, mit Daten kompetent umzugehen. Sie umfasst verschiedene Einzelkompetenzen, um Daten zu erfassen, anzupassen, zu verändern, zu interpretieren und zu präsentieren. Die Datenkompetenz ist Grundlage und wichtiger Skill der Digitalisierung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Management-Informationssystem (MIS)?

Bei einem Management-Informationssystem (MIS) handelt es sich um ein computerunterstütztes Informationssystem, das wichtige Unternehmensinformationen für die Führungsebene sammelt und aufbereitet. Auf Basis der Informationen lassen sich Analysen durchführen, Probleme lösen oder strategische Entscheidungen treffen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Python?

Python ist eine Programmiersprache, die dank ihrer klaren Syntax und einfachen Lesbarkeit leicht zu erlernen ist und sich sehr vielseitig einsetzen lässt. Für die gängigen Betriebssysteme ist Python frei verfügbar. Die üblichen Programmierparadigmen wie die objektorientierte oder funktionale Programmierung werden unterstützt.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist OPC UA?

OPC UA (Open Platform Communications Unified Architecture) ist eine Sammlung von Standards für die Kommunikation und den Datenaustausch im Umfeld der Industrieautomation. Mithilfe von OPC UA werden sowohl der Transport von Machine-to-Machine-Daten als auch Schnittstellen und die Semantik von Daten beschrieben. Die komplette Architektur ist serviceorientiert aufgebaut.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist TCO (Total Cost of Ownership)?

Total Cost of Ownership, abgekürzt TCO, ist eine ganzheitliche Kostenbetrachtung von Produkten, Gütern oder Services, die nicht nur die Anschaffungskosten, sondern auch laufende direkte und indirekt Kosten über den kompletten Lebenszyklus hinweg berücksichtigt. Die Kostenbetrachtung bietet wichtige Hilfestellungen zur Beantwortung betriebswirtschaftlicher Fragestellungen wie Investitionsentscheidungen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine IT-Strategie?

Die IT-Strategie macht Vorgaben über die zukünftige Entwicklung der Informationstechnik (IT) und IT-Infrastruktur eines Unternehmens. Sie folgt immer der Unternehmensstrategie und ist eine zentrale Komponente des IT-Managements. Ziel der Strategie ist es, durch das Management der IT und die Definition der Rahmenbedingungen die langfristigen Unternehmensziele zu erreichen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist der k-Means-Algorithmus?

Der k-Means-Algorithmus ist ein Rechenverfahren, das sich für die Gruppierung von Objekten, die sogenannte Clusteranalyse, einsetzen lässt. Dank der effizienten Berechnung der Clusterzentren und dem geringen Speicherbedarf eignet sich der Algorithmus sehr gut für die Analyse großer Datenmengen, wie sie im Big-Data-Umfeld üblich sind.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein KPI (Key Performance Indicator)?

Ein Key Performance Indicator, kurz KPI, ist eine aussagekräftige Kennzahl, mit der sich die Leistung einer Aktivität einer Organisation oder eines Unternehmens messen lässt. Es existieren viele verschiedene KPIs für unterschiedlichen Unternehmensbereiche und Tätigkeiten. Die leicht verständlichen Leistungsindikatoren können zur kontinuierlichen Überprüfung der Zielerreichung eingesetzt werden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Data Science?

Data Science ist eine angewandte, interdisziplinäre Wissenschaft. Ziel der Datenwissenschaft ist es, Wissen aus Daten zu generieren, um beispielsweise die Unternehmenssteuerung zu optimieren oder die Entscheidungsfindung zu unterstützen. Es kommen Methoden und Wissen aus verschiedenen Bereichen wie Mathematik, Statistik, Stochastik, Informatik und Branchen-Know-how zum Einsatz.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Data Steward?

Neben dem Data Owner hat der Data Steward eine Schlüsselposition in der Umsetzung der Data Governance inne. Er ist verantwortlich für die Einhaltung der Datenqualität und setzt die strategischen Vorgaben der Data Governance fachlich um. Innerhalb des Unternehmens agiert er als Ansprechpartner für die verschiedenen Fachabteilungen bei Fragen oder Problemen zur Datenqualität.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist CUDA?

CUDA ist eine von NVIDIA entwickelte Technologie und Programmierschnittstelle, mit der sich die Rechenleistung von Grafikprozessoren (GPUs) für Anwendungen nutzen lässt. Aufgrund der hohen Rechenleistung und parallelen Arbeitsweise der GPUs sind bei bestimmten Anwendungen enorme Performancegewinne erzielbar.

Weiterlesen