Dipl.-Ing. (FH) Stefan Luber ♥ BigData-Insider

Dipl.-Ing. (FH) Stefan Luber


IT-Service Luber

Stefan Luber ist Diplom-Ingenieur (FH) der Nachrichtentechnik und arbeitet mit über 30 Jahren Berufserfahrung als freiberuflicher Autor sowie technischer Redakteur. Er ist spezialisiert auf IT- und Telekommunikationsthemen und verfasst hochwertige, suchmaschinenoptimierte Inhalte, Whitepaper, Produkttests, Blog-Artikel und technische Dokumentationen.

Seine Expertise umfasst ein breites Spektrum an IT-Themen, darunter Netzwerke (DSL, Mobilfunk, TCP/IP, Routing, Switching, VoIP), Webhosting, E-Commerce, Content-Management-Systeme wie WordPress, Suchmaschinenoptimierung (SEO), Smart Home, Cloud Computing, Business Intelligence, Big Data, Künstliche Intelligenz, IoT und IT-Sicherheit.

Luber hat für verschiedene Unternehmenswebseiten, Blogs und Fachportale wie Security-Insider, BigData-Insider, Storage-Insider, CloudComputing-Insider und IP-Insider Artikel verfasst, in denen er komplexe technische Sachverhalte verständlich aufbereitet.

Neben seiner Tätigkeit als Autor bietet er IT-Services an und betreibt mit dem IT-Service Luber eine eigene Webseite, auf der er seine Dienstleistungen und Veröffentlichungen präsentiert.

Seine berufliche Laufbahn umfasst Positionen wie Systemingenieur Netzwerkplanung/Internetworking bei verschiedenen Systemhäusern und Netzbetreibern und Manager im Bereich IP-TV-Netze bei der Deutschen Telekom AG. Seit August 2011 ist er als freier Autor und technischer Redakteur tätig.

Artikel des Autors

 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Translate?

Amazon Translate ist ein Cloud-Dienst für neuronale, maschinelle Übersetzungen. Er wendet Methoden des Deep Learnings an und liefert qualitativ hochwertige Übersetzungen in vielen Sprachen. Der Übersetzungsservice lässt sich im Echtzeitmodus oder im Batch-Modus nutzen und ist über eine API in eigene Anwendungen integrierbar. Das Pricing ist nutzungsbasiert und von der Zahl der übersetzten Zeichen abhängig.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Transcribe?

Amazon Transcribe ist ein im Rahmen der Amazon Web Services erbrachter Cloud-Dienst, mit dem sich Sprache in Text umwandeln lässt. Er verwendet die auf Deep Learning basierende Automatic-Speech-Recognition-Technologie und beherrscht verschiedene Sprachen. Die Nutzung des Services ist im Batch- und im Streaming-Modus möglich. Speziell für die Transkription medizinischer Sprachaufzeichnungen steht Amazon Transcribe Medical zur Verfügung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Textract?

Amazon Textract ist ein im Rahmen der Amazon Web Services erbrachter Cloud-Dienst, der gedruckten oder handgeschriebenen Text aus eingescannten Dokumenten, Bildern oder PDF-Dateien extrahiert. Der Funktionsumfang geht über klassisches OCR hinaus, da Amazon Textract nicht nur die Zeichenerkennung beherrscht, sondern auch strukturierte Informationen aus Tabellen oder Formularen erfasst.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Polly?

Amazon Polly ist ein im Rahmen der Amazon Web Services erbrachter, voll verwalteter Cloud-Dienst, mit dem sich Text in natürliche Sprache umwandeln lässt. Der Service nutzt die auf Deep Learning basierende neuronale Text-to-Speech-Technologie (NTTS). Amazon Polly beherrscht zahlreiche Sprachen und stellt unterschiedliche männliche oder weibliche Stimmen mit verschiedenen Sprachstilen zur Verfügung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist OpenAI Gym?

OpenAI Gym ist ein Toolkit und eine frei verfügbare Software der Non-Profit-Organisation OpenAI. Mit dem Toolkit lassen sich Algorithmen des Reinforcement Learnings entwickeln und vergleichen. Es stellt eine ganze Reihe Simulationsumgebungen zur Verfügung, in denen sich Agenten (Algorithmen) testen, weiterentwickeln und vergleichen lassen. Die Algorithmen können mit ML-Frameworks und Bibliotheken wie TensorFlow oder Theano erstellt sein.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Logica?

Logica ist eine von Google entwickelte, frei verfügbare Open-Source-Programmiersprache. Die deklarative, logische Programmiersprache ist für Datenverarbeitungs- und -manipulationsaufgaben vorgesehen und kompiliert zu SQL. Sie lässt sich beispielsweise zum Erstellen von komplexen Abfragen für Googles Cloud Data Warehouse BigQuery verwenden. Die Software steht unter Apache-2.0-Lizenz.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Lex?

Amazon Lex ist ein im Rahmen der Amazon Web Services erbrachter voll verwalteter Service, mit dem sich Konversationsschnittstellen für Text und Sprache erstellen lassen. Der Service nutzt Methoden der Künstliche Intelligenz und Deep-Learning-Technologien, wie sie auch für Amazon Alexa zum Einsatz kommen. Typischer Anwendungsbereich sind Chatbots.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist der Amazon Fraud Detector?

Der Amazon Fraud Detector ist ein voll verwalteter, im Rahmen der Amazon Web Services erbrachter Online-Service. Mit ihm lassen sich betrügerische Aktivitäten im Online-Umfeld automatisiert erkennen. Ein mit eigenen Daten trainiertes Machine-Learning-Modell identifiziert betrügerische Online-Aktivitäten wie Identitätsbetrug oder Zahlungsbetrug. Der Service lässt sich über eine API für die Erkennung in Echtzeit ansprechen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Forecast?

Amazon Forecast ist ein voll verwalteter, im Rahmen der Amazon Web Services (AWS) erbrachter Service zur Erstellung von Vorhersagen aus Zeitreihendaten. Der Service verwendet Künstliche Intelligenz (KI) und Machine Learning (ML), benötigt aber kein tieferes KI- und ML-Know-how des Anwenders. Die Abrechnung des Services erfolgt nutzungsbasiert.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon DevOps Guru?

DevOps Guru ist ein von Amazon bereitgestellter, voll gemanagter Cloud-Service, mit dem sich die Verfügbarkeit und die Performance von Anwendungen überwachen und verbessern lässt. Der Service nutzt Machine Learning, um Probleme oder Risiken im Betrieb einer Anwendung zu erkennen und gibt intelligente Empfehlungen zu deren Behebung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon CodeGuru?

Amazon CodeGuru ist der Name eines Cloud-Services von Amazon, mit dem sich Programmcode automatisiert prüfen und optimieren lässt. Zudem ermittelt CodeGuru die Codezeilen mit den höchsten Performanceansprüchen und hilft, Leistungsengpässe aufzuspüren und zu beheben. Amazon CodeGuru besteht aus den beiden Komponenten CodeGuru Reviewer und CodeGuru Profiler.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Jukebox OpenAI?

Jukebox ist eine Künstliche Intelligenz (KI) des gemeinnützigen Forschungsunternehmens OpenAI. Sie generiert Musik inklusive Gesang. Als Vorgaben genügen Jukebox eine Stilrichtung, Liedtexte oder Künstler. Die KI basiert auf einem Künstlichen Neuronalen Netzwerk (KNN), das mit über einer Million Musikstücken trainiert wurde.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist OMA LWM2M?

OMA LWM2M steht für das Open-Source-Protokoll Lightweight M2M der Open Mobile Alliance. Es ist ein Gerätemanagementprotokoll für Machine-to-Machine-Umgebungen und Sensornetzwerke. Das Protokoll basiert auf dem Client-Server-Prinzip und ist speziell für Geräte mit geringer Rechenleistung und geringem Energiebedarf konzipiert. Neben der Remote-Konfiguration unterstützt das Protokoll die Geräteüberwachung und Firmwareupdates.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Comprehend?

Amazon Comprehend ist ein im Rahmen der Amazon Web Services erbrachter voll verwalteter NLP-Service (Natural Language Processing Service). Mithilfe des Services lassen sich Einblicke in Texte gewinnen und Bedeutungen oder Beziehungen erkennen. Er basiert auf einem trainierten Modell des maschinellen Lernens und ermöglicht beispielsweise Schlüsselbegriff-Extraktionen, Stimmungsanalysen oder die Erkennung von Entitäten.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Augmented AI?

Amazon Augmented AI ist ein im Rahmen der Amazon Web Services erbrachter und von Amazon gemanagter Service, mit dem sich Vorhersagen von Machine-Learning-Modellen von Menschen prüfen und verifizieren lassen. Der Service erlaubt das Erstellen der hierfür benötigten Workflows und macht Eigenentwicklungen überflüssig. Die Abrechnung der Leistungen erfolgt nutzungsabhängig.

Weiterlesen
Default article image (Maks Lab - stock.adobe.com)
Definition

Was ist Grafana?

Grafana ist eine Open Source Software, mit der sich Daten in dynamischen, interaktiven Dashboards visualisieren lassen. Die Software ist mit vielen Datenquellen kompatibel und kommt häufig für Monitoring-Aufgaben und die Visualisierung von Messdaten beziehungsweise zur Alarmierung zum Einsatz. Grafana arbeitet mit zahlreichen Zeitreihen-Datenbanken wie InfluxDB, Prometheus oder Graphite zusammen und unterstützt zudem relationale Datenbanken.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist der Generative Pretrained Transformer 3 (GPT-3)?

Der Generative Pretrained Transformer 3 (GPT-3) ist ein Sprachmodell, das auf einem per Deep Learning trainierten Künstlichen Neuronalen Netz (KNN) basiert. Es ist der Nachfolger von GPT-2 und in der Lage, selbstständig Texte zu verfassen, Fragen zu beantworten, Dialoge zu führen oder Programmcode zu erstellen. Entwickelt hat GPT-3 die von Elon Musk gegründete US-Organisation OpenAI.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Presto?

Presto eignet sich für SQL-Abfragen großer Datenmengen mit niedrigen Latenzzeiten. Es handelt sich um eine verteilte SQL-Abfrage-Engine auf Open-Source-Basis, die ursprünglich von Facebook entwickelt wurde. Die Engine arbeitet mit unterschiedlichen Datenquellen wie dem Hadoop Distributed File System, MySQL, Amazon S3, PostgreSQL, Apache Cassandra, Microsoft SQL Server, MongoDB und vielen anderen zusammen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Apache Hudi?

Apache Hudi ist ein Data Lake Framework, mit dem sich Datensätze in verteilten Dateisystemen wie dem Hadoop Distributed File System (HDFS) oder in Cloud Stores effizient verwalten lassen. Es kommt im Big-Data-Umfeld zum Einsatz und eignet sich für das Erstellen und Verwalten von Data Lakes im Petabyte-Bereich. Hudi ermöglicht ein streambasiertes Lesen und Schreiben der Daten. Die Software ist frei verfügbar und steht unter Apache-2.0-Lizenz.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Amazon Kendra?

Amazon Kendra ist ein auf Machine Learning und Künstlicher Intelligenz basierender Suchservice von Amazon. Er ist für Unternehmen gedacht und erlaubt die Formulierung der Suchanfragen in natürlichen Sätzen. Kunden benötigen für die Nutzung des Suchdienstes keine eigenen Server. Die Anbindung der Datenquellen an den Suchindex von Kendra erfolgt über Konnektoren. Kendra unterstützt zahlreiche AWS-interne und externe Datensysteme.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Ray?

Ray ist ein auf Open Source Software basierendes Framework, mit dem sich Python-Code und Python-Anwendungen auf verteilten Computing-Architekturen ausführen lassen. Das Framework verteilt die auszuführenden Befehle auf die verschiedenen Rechner und verwaltet die Prozesse. Ray erlaubt das Erstellen hoch skalierbarer Anwendungen und kommt beispielsweise im Machine-Learning-Umfeld zum Einsatz.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Jupyter?

Das Jupyter-Projekt ist eine nicht gewinnorientierte Initiative mit der Zielsetzung, Open Source Software und offene Standards für interaktives Arbeiten zu entwickeln und bereitzustellen. Eines der bekanntesten Produkte des Projekts ist Jupyter Notebook. Es handelt sich um eine Client-Server-Anwendung für das Erstellen und Teilen interaktiver Arbeitsblätter. Weitere Produkte sind JupyterLab, JupyterHub und Voilà.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Generative Adversarial Network (GAN)?

Ein Generative Adversarial Network, kurz GAN, ist ein Machine-Learning-Modell, das in der Lage ist, Daten zu generieren. Es besteht aus zwei konkurrierenden Künstlichen Neuronalen Netzwerken (KNN). Eines hat die Aufgabe, echt wirkende Daten zu erzeugen, das andere klassifiziert die Daten als echt oder künstlich. Durch ständiges Lernen und viele Iterationsschritte werden die generierten Daten immer besser. Typischer Einsatzbereich ist das Erstellen echt wirkender künstlicher Bilder.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Capsule Neural Network?

Das Capsule Neural Network ist eine Klasse Künstlicher Neuronaler Netzwerke (KNN). Es ergänzt das Convolutional Neural Network (CNN) mit sogenannten Kapseln. Zwischen diesen Kapseln lassen sich Informationen vektorgerichtet dynamisch routen. Vorteil dieses Konzepts ist es, dass in Anwendungen wie etwa der Bilderkennung bessere Ergebnisse erzielbar sind. Das Lernverhalten ist dem menschlichen Erkennen von Objekten ähnlicher.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Voilà?

Voilà wurde entwickelt, um Jupyter Notebooks in Standalone-Webapplikationen zu konvertieren. Aus einem Jupyter Notebook lassen sich beispielsweise Slideshows oder interaktive Dashboards erzeugen. Die Voilà-Webapplikationen vereinfachen das Teilen mit nicht-technischen Zielgruppen und verhindern, dass Anwender beliebigen Code ausführen. Voilà ist ein Unterprojekt des Jupyter-Projekts. Die Voilà Gallery stellt ist eine Sammlung von frei zugänglichen Beispielen zur Verfügung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Prefect?

Prefect ist eine Plattform zur Automatisierung und zur Verwaltung von Dataflows und Workflows. Es besteht aus der Open-Source-basierten Workflow Engine Prefect Core und der Cloud-basierten Orchestrierungsplattform Prefect Cloud. Prefect untergliedert Workflows in einzelne Tasks. Tasks lassen sich mithilfe von Python-Funktionen beschreiben. Die Kombination von Prefect Core und Prefect Cloud erlaubt hybrides Workflow-Management.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Flask?

Flask ist ein schlankes Mikro-Webframework zum Programmieren von Webanwendungen mit Python. Es wurde von dem österreichischen Open-Source-Entwickler Armin Ronacher entworfen. Das Framework ist als Bibliothek für Python installierbar und verfolgt einen minimalistischen Ansatz. Es benötigt das WSGI-Toolkit „Werkzeug“ und die Template-Engine „Jinja“. Die Software steht unter BSD-Lizenz und ist frei verfügbar.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist VIGRA (Vision with Generic Algorithms)?

VIGRA ist eine Bibliothek für die Programmiersprache C++, die sich für Aufgaben der Bildverarbeitung und Bildanalyse einsetzen lässt. Sie wurde von Ullrich Köthe entwickelt und stellt für eigene Zwecke einfach anpassbare Algorithmen und Datenstrukturen zur Verfügung. Für die Programmiersprache Python existiert mittlerweile ebenfalls eine VIGRA-Schnittstelle. Die Bibliothek steht unter MIT-Open-Source-Lizenz und ist im Netz frei verfügbar.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Waikato Environment for Knowledge Analysis (WEKA)?

Waikato Environment for Knowledge Analysis ist eine unter Open-Source-Lizenz stehende freie Datenverarbeitungssoftware. Sie wurde an der neuseeländischen University of Waikato entwickelt und lässt sich für Data Mining und Maschinelles Lernen (ML) einsetzen. Die Software ist in Java programmiert, plattformunabhängig einsetzbar und verfügt über eine grafische Benutzeroberfläche.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Digitalisierung?

Digitalisierung bezeichnet im ursprünglichen Sinn das Umwandeln von analogen Werten in digitale Formate. Diese Daten lassen sich informationstechnisch verarbeiten. Oft steht der Begriff Digitalisierung aber auch für die digitale Revolution oder die digitale Transformation.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist das Internet of Things?

Im Internet der Dinge (Englisch: Internet of Things, IoT) bekommen Gegenstände eine eindeutige Identität und können miteinander kommunizieren oder Befehle entgegennehmen. Mit dem Internet of Things lassen sich Anwendungen automatisieren und Aufgaben ohne Eingriff von außen erledigen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Machine Learning?

Machine Learning, im Deutschen maschinelles Lernen, ist ein Teilgebiet der künstlichen Intelligenz. Durch das Erkennen von Mustern in vorliegenden Datenbeständen sind IT-Systeme in der Lage, eigenständig Lösungen für Probleme zu finden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist SAP BW?

SAP BW ist ein Business-Intelligence-Paket von SAP und ermöglicht umfangreiche Auswertungen und Reports auf Basis von unterschiedlichsten Unternehmensdaten. Es besteht aus einer Kombination von Datenbanken, Datenbankmanagement-Tools sowie Analyse und Reporting-Anwendungen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Natural Language Processing?

Die Abkürzung NLP steht für Natural Language Processing und beschreibt Techniken und Methoden zur maschinellen Verarbeitung natürlicher Sprache. Ziel ist eine direkte Kommunikation zwischen Mensch und Computer auf Basis der natürlichen Sprache.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Cyber-physisches System (CPS)?

In einem Cyber-physischen System (cyber-physical system, CPS) sind mechanische Komponenten über Netzwerke und moderne Informationstechnik miteinander verbunden. Sie ermöglichen die Steuerung und die Kontrolle von komplexen Systemen und Infrastrukturen. Für die Industrie 4.0 spielen Cyber-physische Systeme eine zentrale Rolle.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Data Warehouse?

Das Data Warehouse stellt ein zentrales Datenbanksystem dar, das zu Analysezwecken im Unternehmen einsetzbar ist. Das System extrahiert, sammelt und sichert relevante Daten aus verschiedenen heterogenen Datenquellen und versorgt nachgelagerte Systeme.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Neuronales Netz?

Künstliche Neuronale Netze (KNN) sind inspiriert durch das menschliche Gehirn und lassen sich für maschinelles Lernen und die Künstliche Intelligenz einsetzen. Es lassen sich mit diesen Netzen verschiedene Problemstellungen computerbasiert lösen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Entität?

Eine Entität in der Informatik ist ein einzelnes, eindeutig identifizierbares Informationsobjekt. Es kann sich sowohl um existierende als auch um abstrakte Objekte handeln. Entitäten sind zusammen mit den Entitätstypen und Attributen sowie den Beziehungen zwischen den Entitäten wesentliche Elemente der Datenmodellierung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Deep Learning?

Deep Learning ist ein Teilbereich des Machine Learnings und nutzt neuronale Netze sowie große Datenmengen. Die Lernmethoden richten sich nach der Funktionsweise des menschlichen Gehirns und resultieren in der Fähigkeit eigener Prognosen oder Entscheidungen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ACID?

Der Begriff ACID (Atomicity, Consistency, Isolation, Durability) beschreibt Regeln und Eigenschaften zur Durchführung von Transaktionen in Datenbankmanagementsystemen (DBMS). Hält die Transaktion das ACID-Prinzip ein, gelten die Informationen in den Datenbanksystemen als verlässlich und konsistent.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist CRISP-DM?

CRISP-DM (Cross Industry Standard Process for Data Mining) ist ein von der EU gefördertes, branchenübergreifendes Standardmodell für das Data Mining. Es wurde 1996 unter Mitarbeit zahlreicher namhafter Konzerne entwickelt und definiert insgesamt sechs verschiedene Prozessphasen. CRISP-DM ist anwendungsneutral und in beliebigen Bereichen einsetzbar.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Chatbot?

Bei einem Chatbot handelt es sich um ein technisches Dialogsystem, mit dem per Texteingabe oder Sprache kommuniziert werden kann. Chatbots werden häufig eingesetzt, um Anfragen automatisiert und ohne direkten menschlichen Eingriff zu beantworten oder zu bearbeiten.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Datenbankmanagementsystem?

Das Datenbankmanagementsystem, abgekürzt DBMS, ist neben den eigentlichen Daten der wichtigste Bestandteil einer jeden Datenbank. Es übernimmt die Aufgabe der Organisation und Strukturierung der Daten. Gleichzeitig kontrolliert es lesende und schreibende Zugriffe.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Data Mining?

Data Mining ist die systematische Anwendung computergestützter Methoden, um in vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu finden. Zur Wissensentdeckung eingesetzte Algorithmen basieren unter anderem auf statistischen Methoden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine relationale Datenbank?

Relationale Datenbanken ist das am weitesten verbreitete Datenbankmodell. Es setzt auf das relationale Datenbankmodell, das auf der Speicherung von Informationen in verschiedenen Tabellen basiert, die untereinander über Beziehungen (Relationen) verknüpft sind.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Normalisierung?

Die Normalisierung findet bei relationalen Datenbankschemata statt und hat zum Ziel, Redundanzen, Inkonsistenzen und Anomalien zu vermeiden und zu beseitigen. Zur Durchführung kommen bis zu fünf verschiedene aufeinander aufbauende Normalformen zum Einsatz. Normalisierte Datenbanken folgen einem klar strukturierten Modell.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist NoSQL?

NoSQL steht für „Not only SQL“ und bezeichnet Datenbanksysteme, die einen nicht-relationalen Ansatz verfolgen. Diese Datenbanken, denen verschiedene Datenbankmodelle zugrunde liegen können, sind horizontal skalierbar und lassen sich für Big-Data-Anwendungen einsetzen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Data Lake?

Beim Data Lake handelt es sich um einen sehr großen Datenspeicher, der die Daten aus den unterschiedlichsten Quellen in ihrem Rohformat aufnimmt. Er kann sowohl unstrukturierte als auch strukturierte Daten enthalten und lässt sich für Big-Data-Analysen einsetzen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ETL (Extract, Transform, Load)?

Beim ETL-Prozess handelt es sich um mehrere Einzelschritte, durch die sich Daten aus verschiedenen Datenquellen per Extrahieren und Aufbereiten in ein Data Warehouse integrieren lassen. Der Prozess kommt häufig zur Verarbeitung großer Datenmengen im Big-Data- und Business-Intelligence-Umfeld zum Einsatz.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Random Forest?

Random Forest ist ein Algorithmus, der sich für Klassifizierungs- und Regressionsaufgaben nutzen lässt. Er kombiniert die Ergebnisse vieler verschiedener Entscheidungsbäume, um bestmögliche Entscheidungen zu treffen. Der Lernalgorithmus gehört zu den Verfahren des überwachten Lernens und ist im Machine Learning einsetzbar. Das Verfahren ist relativ einfach und bietet kurze Trainingszeiten.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Hadoop?

Bei Hadoop handelt es sich um ein auf Java basierendes Software Framework. Mit ihm lassen sich große Datenmengen auf verteilten Systemen in hoher Geschwindigkeit verarbeiten. Es ist zur Bewältigung der Datenverarbeitung im Big-Data-Umfeld geeignet.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Validierung?

Datenvalidierung prüft Daten auf Einhaltung bestimmter Validierungsregeln. Diese wurden zuvor aufgestellt und beinhalten beispielsweise Vorgaben zu Wertebereichen oder Formaten. Die Datenvalidierung verbessert die Ergebnisse der Datenverarbeitung und Datenanalyse. Sie kann bei der Eingabe der Daten, direkt vor dem Start oder während der Datenverarbeitung stattfinden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Predictive Maintenance?

Predictive Maintenance verfolgt als eine der Kernkomponenten von Industrie 4.0 einen vorausschauenden Ansatz und wartet Maschinen und Anlagen proaktiv, um Ausfallzeiten niedrig zu halten. Das Verfahren nutzt hierfür von Sensoren erfasste Messwerte und Daten.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein BLOB?

Ein BLOB (Binary Large Object ) ist ein großes binäres Datenobjekt, das von Datenbanken meist in besonderer Form verarbeitet und gespeichert wird. Typische BLOBs sind Dateien wie Video-, Audio- oder Bilddateien

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Convolutional Neural Network?

Das Convolutional Neural Network ist eine besondere Form des künstlichen neuronalen Netzwerks. Es besitzt mehrere Faltungsschichten und ist für maschinelles Lernen und Anwendungen mit Künstlicher Intelligenz (KI) im Bereich Bild- und Spracherkennung sehr gut geeignet.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was sind unstrukturierte Daten?

Unstrukturierte Daten sind Informationen, die in einer nicht identifizierbaren und nicht normalisierten Datenstruktur vorliegen. Es kann sich beispielsweise um Texte, Bilder oder Audio- und Videodateien handeln. Im Big-Data-Umfeld haben unstrukturierte Daten eine große Bedeutung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Pivot-Tabelle?

Eine Pivot-Tabelle strukturiert in Tabellenform vorliegende Daten, fasst sie zusammen und ermöglicht ihre Auswertung. Die Tabellenart gehört zu den Grundfunktionen aller gängigen Tabellenkalkulationsanwendungen. Für die Erstellung einer Pivot-Tabelle sind nur wenige Grundbedingungen zu erfüllen. Komplexe Formeln oder das Anwenden von SQL-Datenbankabfragen sind dank Pivot-Tabellen zum Teil überflüssig.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Apache Kafka?

Apache Kafka ist eine Open Source Software, die die Speicherung und Verarbeitung von Datenströmen über eine verteilte Streaming-Plattform ermöglicht. Sie stellt verschiedene Schnittstellen bereit, um Daten in Kafka-Cluster zu schreiben, Daten zu lesen oder in und aus Drittsysteme zu importieren und zu exportieren.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ODBC?

Bei ODBC (Open Database Connectivity) handelt es sich um eine standardisierte, offene Schnittstelle für den Zugriff auf unterschiedliche Datenbankmanagementsysteme. Über ODBC-Treiber können Anwendungen direkt Anweisungen an Datenbanken erteilen oder Abfragen ausführen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist das ARIMA-Modell?

Das ARIMA-Modell ermöglicht die Beschreibung und Analyse von Zeitreihen. Es handelt sich um eine leistungsstarke Modellklasse, die den autoregressiven Teil und den gleitenden Mittelwertbeitrag des ARMA-Modells um die Differenzierung und Integration zur Trendbeseitigung und Herstellung der Stationarität erweitert.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Support Vector Machine?

Die Support Vector Machine (SVM) ist eine mathematische Methode, die im Umfeld des maschinellen Lernens zum Einsatz kommt. Sie gestattet das Klassifizieren von Objekten und ist vielfältig nutzbar. Unterstützt werden die lineare und die nicht-lineare Objektklassifizierung. Typische Anwendungsbereiche sind die Bild-, Text- oder Handschrifterkennung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Big Data Analytics?

Big Data Analytics ermöglicht es, große Datenmengen aus unterschiedlichen Quellen zu analysieren. Die gewonnenen Informationen oder erkannten Muster lassen sich einsetzen, um beispielsweise Unternehmensprozesse zu optimieren.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist das Industrial Internet of Things (IIoT)?

Das Industrial Internet of Things (IIoT) stellt die industrielle Ausprägung des Internet of Things (IoT) dar. Es repräsentiert im Gegensatz zum IoT nicht die verbraucherorientierten Konzepte, sondern konzentriert sich auf die Anwendung des Internets der Dinge im produzierenden und industriellen Umfeld.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Smart City?

In einer Smart City werden moderne Technologien aus den Bereichen Energie, Mobilität, Stadtplanung, Verwaltung und Kommunikation so miteinander vernetzt, dass sich die Lebensqualität für die Bewohner steigert. Gleichzeitig profitiert die Nachhaltigkeit der Stadt.

Weiterlesen
Definition

Was ist Generative AI?

Generative AI (Artificial Intelligence) ist eine Form von Künstlicher Intelligenz (KI), die auf Basis von Vorgaben und vorhandenen Informationen Inhalte generiert. Es kommen KI-Verfahren und -Technologien wie trainierte neuronale Netzwerke, maschinelles Lernen (Deep Learning) und KI-Algorithmen zum Einsatz, um nach Anweisungen Texte, Bilder, Audio- und Videoinhalte, Programmcode, 3D-Modelle und anderes zu erzeugen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine Smart Factory?

Die Smart Factory steht im Zentrum der sogenannten Industrie 4.0. Sie stellt eine Produktionsumgebung zur Verfügung, die sich im Idealfall ohne menschlichen Eingriff selbst organisiert. Dazu zählen Fertigungsanlagen und Logistiksysteme. Kernkomponenten sind cyber-physische Systeme und die intelligente Vernetzung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Management-Informationssystem (MIS)?

Bei einem Management-Informationssystem (MIS) handelt es sich um ein computerunterstütztes Informationssystem, das wichtige Unternehmensinformationen für die Führungsebene sammelt und aufbereitet. Auf Basis der Informationen lassen sich Analysen durchführen, Probleme lösen oder strategische Entscheidungen treffen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Digitaler Zwilling?

Ein Digitaler Zwilling repräsentiert ein reales Objekt in der digitalen Welt. Es kann sich um materielle oder immaterielle Objekte handeln. Die Digitalen Zwillinge sind aus Daten und Algorithmen aufgebaut und können über Sensoren mit der realen Welt gekoppelt sein. Für die Prozesse der Industrie 4.0 stellen Digitale Zwillinge die Basis dar.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Python?

Python ist eine Programmiersprache, die dank ihrer klaren Syntax und einfachen Lesbarkeit leicht zu erlernen ist und sich sehr vielseitig einsetzen lässt. Für die gängigen Betriebssysteme ist Python frei verfügbar. Die üblichen Programmierparadigmen wie die objektorientierte oder funktionale Programmierung werden unterstützt.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist der k-Means-Algorithmus?

Der k-Means-Algorithmus ist ein Rechenverfahren, das sich für die Gruppierung von Objekten, die sogenannte Clusteranalyse, einsetzen lässt. Dank der effizienten Berechnung der Clusterzentren und dem geringen Speicherbedarf eignet sich der Algorithmus sehr gut für die Analyse großer Datenmengen, wie sie im Big-Data-Umfeld üblich sind.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Data Literacy?

Data Literacy oder Datenkompetenz beschreibt die Fähigkeit, mit Daten kompetent umzugehen. Sie umfasst verschiedene Einzelkompetenzen, um Daten zu erfassen, anzupassen, zu verändern, zu interpretieren und zu präsentieren. Die Datenkompetenz ist Grundlage und wichtiger Skill der Digitalisierung.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist XGBoost?

XGBoost ist eine frei verfügbare Bibliothek mit Open-Source-Lizenz. Sie ermöglicht überwachtes maschinelles Lernen mit dem Boosted-Tree-Algorithmus, einem Baumalgorithmus mit Gradient Boosting. Die Bibliothek ist für Betriebssysteme wie Linux, Windows oder macOS verfügbar und arbeitet mit Programmiersprachen wie C++, Java, Python, R und Julia.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist TCO (Total Cost of Ownership)?

Total Cost of Ownership, abgekürzt TCO, ist eine ganzheitliche Kostenbetrachtung von Produkten, Gütern oder Services, die nicht nur die Anschaffungskosten, sondern auch laufende direkte und indirekt Kosten über den kompletten Lebenszyklus hinweg berücksichtigt. Die Kostenbetrachtung bietet wichtige Hilfestellungen zur Beantwortung betriebswirtschaftlicher Fragestellungen wie Investitionsentscheidungen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist eine IT-Strategie?

Die IT-Strategie macht Vorgaben über die zukünftige Entwicklung der Informationstechnik (IT) und IT-Infrastruktur eines Unternehmens. Sie folgt immer der Unternehmensstrategie und ist eine zentrale Komponente des IT-Managements. Ziel der Strategie ist es, durch das Management der IT und die Definition der Rahmenbedingungen die langfristigen Unternehmensziele zu erreichen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist OPC UA?

OPC UA (Open Platform Communications Unified Architecture) ist eine Sammlung von Standards für die Kommunikation und den Datenaustausch im Umfeld der Industrieautomation. Mithilfe von OPC UA werden sowohl der Transport von Machine-to-Machine-Daten als auch Schnittstellen und die Semantik von Daten beschrieben. Die komplette Architektur ist serviceorientiert aufgebaut.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein Data Steward?

Neben dem Data Owner hat der Data Steward eine Schlüsselposition in der Umsetzung der Data Governance inne. Er ist verantwortlich für die Einhaltung der Datenqualität und setzt die strategischen Vorgaben der Data Governance fachlich um. Innerhalb des Unternehmens agiert er als Ansprechpartner für die verschiedenen Fachabteilungen bei Fragen oder Problemen zur Datenqualität.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist ein KPI (Key Performance Indicator)?

Ein Key Performance Indicator, kurz KPI, ist eine aussagekräftige Kennzahl, mit der sich die Leistung einer Aktivität einer Organisation oder eines Unternehmens messen lässt. Es existieren viele verschiedene KPIs für unterschiedlichen Unternehmensbereiche und Tätigkeiten. Die leicht verständlichen Leistungsindikatoren können zur kontinuierlichen Überprüfung der Zielerreichung eingesetzt werden.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Data Science?

Data Science ist eine angewandte, interdisziplinäre Wissenschaft. Ziel der Datenwissenschaft ist es, Wissen aus Daten zu generieren, um beispielsweise die Unternehmenssteuerung zu optimieren oder die Entscheidungsfindung zu unterstützen. Es kommen Methoden und Wissen aus verschiedenen Bereichen wie Mathematik, Statistik, Stochastik, Informatik und Branchen-Know-how zum Einsatz.

Weiterlesen