„Willkommen bei der großen BigData-Insider-Leserwahl!

Nico Litzel ♥ BigData-Insider

Nico Litzel

Chefredakteur BigData-Insider
Vogel IT-Medien

Nico Litzel ist Chefredakteur von BigData-Insider und begleitet die digitale Transformation der Unternehmenswelt seit über zwei Jahrzehnten journalistisch.

Seine Themenschwerpunkte reichen von Big Data Analytics über Künstliche Intelligenz und Business Intelligence bis hin zu IoT und Industrie 4.0. Dabei nimmt er technologische Entwicklungen und deren strategische Relevanz für Unternehmen in den Blick.

Nach dem Volontariat bei IT-BUSINESS und eGovernment Computing (2002 bis 2004) war Nico Litzel zunächst als Redakteur für eGovernment Computing, später für SearchStorage und Storage-Insider tätig. Seit 2014 verantwortet er als Chefredakteur den Auf- und Ausbau von BigData-Insider und hat das Portal zu einer etablierten Informationsquelle für datengetriebene Innovationen im Business-Umfeld gemacht. Mit journalistischer Erfahrung und einem feinen Gespür für Trends setzt er in seinen Beiträgen auf Relevanz, Einordnung und Praxisnähe.

Artikel des Autors

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 21. Folge sprechen wir über das Spannungsfeld von Künstlicher Intelligenz und Kreativität. Zu Gast ist Prof. Dr. Bastian Martschink, Professor für Data-driven Marketing, Analytics und Data Science in Unternehmen an der Hochschule Düsseldorf und Autor der beiden Krimi-Romane „Finn Dever: Letzter Blick“ und „Finn Dever: Täuschung“.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 20. Folge sprechen wir darüber, wie wichtig es ist, sogenannte Low-Resource-Sprachen – wie etwa Minderheitensprachen – in KI-Modelle zu integrieren. Zu Gast ist Prof. Dr. Alexander Fraser, Inhaber des Lehrstuhls für Data Analytics & Statistics an der TU München, Campus Heilbronn.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 19. Folge sprechen wir über Web Scraping, das maschinellen Auslesen von Online-Inhalten. Zu Gast ist Dr. Christoph Matras, Rechtsanwalt für Gewerblichen Rechtsschutz sowie Urheber- und Medienrecht bei der Kanzlei FPS in Frankfurt.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 18. Folge sprechen wir über das Internet of Things (IoT) in Deutschland. Zu Gast ist Dr. Michael Opitz, Partner im Münchener Büro der Managementberatung Arthur D. Little und Leiter der Kompetenzgruppe IoT im eco – Verband der Internetwirtschaft.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 17. Folge sprechen wir über den Bericht „Tech Horizon for Generative AI“. Zu Gast ist Annette Zimmermann, Vice President Analyst im Team „Emerging Technologies and Trends“ beim Marktforschungsunternehmen Gartner.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 16. Folge sprechen wir über Künstliche Intelligenz bei der IHK Region Stuttgart. Zu Gast ist Thorsten Eller, Leiter für Projektmanagement und digitale Transformation bei der IHK Region Stuttgart.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 15. Folge sprechen wir über die Non-Profit-Organisation appliedAI Institute for Europe. Zu Gast ist Dr. Frauke Goll, Geschäftsführerin des appliedAI Institute for Europe.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 14. Folge sprechen wir über Trustworthy AI, auf Deutsch vertrauenwürdige Künstliche Intelligenz (KI). Zu Gast ist Dr. Scott Thiebes von der Technischen Universität München, Campus Heilbronn.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der 13. Folge sprechen wir über Chancen und Risiken von KI in Unternehmen – und über die Bedeutung von Potenzialanalysen zu Beginn. Zu Gast ist Anna Maria Vollmer, Managerin für Business Innovation & Transfer am Fraunhofer-Institut für Experimentelles Software Engineering (IESE) in der Abteilung Data Science.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der zwölften Folge sprechen wir über den „Emerging Tech Impact Radar: Artificial Intelligence“ von Gartner. Zu Gast ist Annette Zimmermann, Vice President Analyst im Team „Emerging Technologies and Trends“ beim Marktforschungsunternehmen Gartner.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der elften Folge sprechen wir über die Bedeutung von Datenqualität im Kontext von Künstlicher Intelligenz (KI). Zu Gast ist Jan Bentz, Gründer und Geschäftsführer des IT-Beratungsunternehmens Brandmauer AI.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der zehnten Folge sprechen wir über das Spannungsfeld von Künstlicher Intelligenz (KI) und Urheberrecht. Zu Gast ist Jonas Weimert, Rechtsanwalt und Associate im Münchener Büro der international tätigen Rechtsanwaltskanzlei Reed Smith.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der neunten Folge sprechen wir über die Regulierung von Künstlicher Intelligenz (KI). Zu Gast ist Frau Prof. Dagmar Schuller, Professorin für Wirtschaftsinformatik und angewandte KI an der Hochschule Landshut, Geschäftsführerin und Mitgründerin von audEERING und gewählte Vizepräsidentin der IHK für München und Oberbayern.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der achten Folge sprechen wir über den Einsatz von Künstlicher Intelligenz (KI) bei der Analyse von Wirtschaftsdaten. Zu Gast ist Christian Breitung, Doktorand an der TUM Campus Heilbronn und Mitgründer des auf die Analyse von Wirtschaftsdaten spezialisierten Unternehmens Qannual.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der siebten Folge sprechen wir über den AI Act der Europäischen Union. Zu Gast ist Dr. Andreas Splittgerber, Rechtsanwalt und Partner im Münchener Büro der Rechtsanwaltskanzlei Reed Smith LLP.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der sechsten Folge sprechen wir über das Potenzial von offen zugänglichen Gesundheitsdaten und Open-Source-KI im Gesundheitswesen. Zu Gast ist Bart de Witte von der Hippo AI Foundation.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datananalyse und AI. In der fünften Folge sprechen wir über die Auswirkungen von Künstlicher Intelligenz (KI) auf die Arbeitswelt. Zu Gast ist Prof. Dr. Sabine Pfeiffer, Inhaberin des Lehrstuhls für Soziologie (Technik – Arbeit – Gesellschaft) an der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) und Mitglied im Rat der Arbeitswelt.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der vierten Folge sprechen wir über Künstliche Intelligenz und Recht. Zu Gast ist Prof. Dr. Renate Schaub, Inhaberin des Lehrstuhls für Bürgerliches Recht, Internationales Privatrecht und Rechtsvergleichung, Handels- und Wirtschaftsrecht an der Ruhr-Universität Bochum.

Das sind die Gewinner der BigData-Insider Readers' Choice Awards 2023. (Bild: krassevideos.de / VIT)

Die Gewinner der IT-Awards 2023 stehen fest. Im Rahmen einer festlichen Gala wurden am 26. Oktober 2023 in Augsburg die Gewinner der Readers' Choice Awards der sieben Insider-Portale gekürt.

BigData-Insider verleiht heute die IT-Awards 2023 in sechs Kategorien. (Bild: Vogel IT-Medien)

Die sieben Insider-Portale der Vogel IT-Medien haben ihre Leserinnen und Leser zum neunten Mal dazu aufgerufen, ihre Anbieter und Hersteller des Jahres zu wählen. Heute Abend werden die Gewinner der Leserbefragung im Rahmen einer großen Abendgala ausgezeichnet.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der dritten Folge sprechen wir über Künstliche Intelligenz im Ingenieurwesen. Zu Gast ist Dieter Westerkamp, Mitglied der Geschäftsführung beim VDI sowie Bereichsleiter Technik und Gesellschaft.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der zweiten Folge sprechen wir über Industrie 4.0. Zu Gast ist Dr. Harald Schöning, Sprecher der Industrie im Forschungsbeirat Industrie 4.0 bei acatech und Vice President Research für die öffentlich geförderten Forschungsprojekte der Software AG.

Breaking Data – der Podcast von BigData-Insider (Bild: Vogel IT-Medien)

„Breaking Data“ – der Podcast zu Datenanalyse und AI. In der ersten Folge sprechen wir über Künstliche Intelligenz (KI) und Ethik. Zu Gast ist Dr. Christian Müller vom Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI).

Dr. Carsten Bange, Gründer und Geschäftsführer des Business Application Research Center (BARC) (Knud Dobberke)

Die DATA Storage & Analytics Technology Conference 2020, die am 17. September in Würzburg und am 24. September in Neuss stattfindet, verspricht spannende Keynotes. BigData-Insider hat als Mitveranstalter und Medienpartner die Keynote-Speaker im Vorfeld um eine Preview gebeten. Hier im Interview: Dr. Carsten Bange, Gründer und Geschäftsführer des Business Application Research Center (BARC).

Dr. Carsten Bange, Gründer und Geschäftsführer des Business Application Research Center (BARC) (Knud Dobberke)

Die DATA Storage & Analytics Technology Conference 2020, die aufgrund der Coronakrise am 30. April und 12. Mai dieses Jahres online sowie am 17. September in Würzburg und am 24. September in Neuss stattfindet, verspricht spannende „Keynotes“. BigData-Insider hat als Mitveranstalter und Medienpartner die Keynote-Speaker im Vorfeld um eine Preview gebeten. Hier im Interview: Dr. Carsten Bange, Gründer und Geschäftsführer des Business Application Research Center (BARC).

Bei der Teradata Universe EMEA 2017 in Nizza stand der Nutzen von Analytics im Vordergrund und nicht die Technik dahinter. (Teradata)

Teradata lud Anfang April ins südfranzösische Nizza zur europäischen Ausgabe der Hausmesse Teradata Universe ein. Rund 1.000 Teilnehmer ergriffen die Gelegenheit und informierten sich über aktuelle Analytics-Kundenprojekte.

Nach Einschätzung des Marktforschungsunternehmens Experton Group wird Big Data eines der wichtigsten IT-Themen der kommenden Jahre sein. (Bild: Experton Group)

Das Marktforschungsunternehmen Experton Group hat zum zweiten Mal in Folge den Big-Data-Markt in Deutschland unter die Lupe genommen. Für die kommenden Jahre geht das Analystenhaus von einem jährlichen Wachstum von rund 24 Prozent aus. Im Jahr 2019 sollen in Deutschland nach Einschätzung der Marktforscher rund drei Milliarden Euro mit Produkten und Services umgesetzt werden.

(© aga7ta - stock.adobe.com)

Digitalisierung bezeichnet im ursprünglichen Sinn das Umwandeln von analogen Werten in digitale Formate. Diese Daten lassen sich informationstechnisch verarbeiten. Oft steht der Begriff Digitalisierung aber auch für die digitale Revolution oder die digitale Transformation.

(© aga7ta - stock.adobe.com)

SAP BW ist ein Business-Intelligence-Paket von SAP und ermöglicht umfangreiche Auswertungen und Reports auf Basis von unterschiedlichsten Unternehmensdaten. Es besteht aus einer Kombination von Datenbanken, Datenbankmanagement-Tools sowie Analyse und Reporting-Anwendungen.

(© aga7ta - stock.adobe.com)

Im Internet der Dinge (Englisch: Internet of Things, IoT) bekommen Gegenstände eine eindeutige Identität und können miteinander kommunizieren oder Befehle entgegennehmen. Mit dem Internet of Things lassen sich Anwendungen automatisieren und Aufgaben ohne Eingriff von außen erledigen.

(© aga7ta - stock.adobe.com)

Das Business Intelligence Dashboard, kurz BI Dashboard, beschreibt ein Tool, das wichtige Indikatoren eines Unternehmens übersichtlich und stark verdichtet visualisiert. Das Dashboard führt eine Vielzahl an Zahlen in einer grafischen Anzeige zusammen.

(© aga7ta - stock.adobe.com)

Machine Learning, im Deutschen maschinelles Lernen, ist ein Teilgebiet der künstlichen Intelligenz. Durch das Erkennen von Mustern in vorliegenden Datenbeständen sind IT-Systeme in der Lage, eigenständig Lösungen für Probleme zu finden.

(© aga7ta - stock.adobe.com)

Die Abkürzung NLP steht für Natural Language Processing und beschreibt Techniken und Methoden zur maschinellen Verarbeitung natürlicher Sprache. Ziel ist eine direkte Kommunikation zwischen Mensch und Computer auf Basis der natürlichen Sprache.

(© aga7ta - stock.adobe.com)

Künstliche Neuronale Netze (KNN) sind inspiriert durch das menschliche Gehirn und lassen sich für maschinelles Lernen und die Künstliche Intelligenz einsetzen. Es lassen sich mit diesen Netzen verschiedene Problemstellungen computerbasiert lösen.

(© aga7ta - stock.adobe.com)

Das Data Warehouse stellt ein zentrales Datenbanksystem dar, das zu Analysezwecken im Unternehmen einsetzbar ist. Das System extrahiert, sammelt und sichert relevante Daten aus verschiedenen heterogenen Datenquellen und versorgt nachgelagerte Systeme.

(© aga7ta - stock.adobe.com)

CRISP-DM (Cross Industry Standard Process for Data Mining) ist ein von der EU gefördertes, branchenübergreifendes Standardmodell für das Data Mining. Es wurde 1996 unter Mitarbeit zahlreicher namhafter Konzerne entwickelt und definiert insgesamt sechs verschiedene Prozessphasen. CRISP-DM ist anwendungsneutral und in beliebigen Bereichen einsetzbar.

(© aga7ta - stock.adobe.com)

Deep Learning ist ein Teilbereich des Machine Learnings und nutzt neuronale Netze sowie große Datenmengen. Die Lernmethoden richten sich nach der Funktionsweise des menschlichen Gehirns und resultieren in der Fähigkeit eigener Prognosen oder Entscheidungen.

(© aga7ta - stock.adobe.com)

Der im Internet und in den Unternehmen verfügbare Datenberg – diese Tatsache wird als Big Data umschrieben – wird immer größer, unübersichtlicher und lässt sich nur schwer verarbeiten. Immer technologisch anspruchsvollere Tools und Programme sollen die Datenflut zähmen.

(© aga7ta - stock.adobe.com)

Relationale Datenbanken ist das am weitesten verbreitete Datenbankmodell. Es setzt auf das relationale Datenbankmodell, das auf der Speicherung von Informationen in verschiedenen Tabellen basiert, die untereinander über Beziehungen (Relationen) verknüpft sind.

(© aga7ta - stock.adobe.com)

In einem Cyber-physischen System (cyber-physical system, CPS) sind mechanische Komponenten über Netzwerke und moderne Informationstechnik miteinander verbunden. Sie ermöglichen die Steuerung und die Kontrolle von komplexen Systemen und Infrastrukturen. Für die Industrie 4.0 spielen Cyber-physische Systeme eine zentrale Rolle.

(© aga7ta - stock.adobe.com)

Bei einem Chatbot handelt es sich um ein technisches Dialogsystem, mit dem per Texteingabe oder Sprache kommuniziert werden kann. Chatbots werden häufig eingesetzt, um Anfragen automatisiert und ohne direkten menschlichen Eingriff zu beantworten oder zu bearbeiten.

Der Autor: Frank Moritz ist Chief Customer Officer bei der Alexander Thamm GmbH sowie Leiter der Data Academy (Alexander Thamm GmbH)

Die Nutzbarmachung von Daten, etwa mittels Künstlicher Intelligenz (KI), ist eine der Herausforderungen aber vor allem auch Chance der Gegenwart. Für Unternehmen ist es von strategischer Bedeutung, genügend gut ausgebildete Mitarbeiterinnen und Mitarbeiter zu beschäftigen. Nicht alle bringen jedoch die erforderlichen Kenntnisse aus ihrer Ausbildung mit. Deswegen ist die nebenberufliche Weiterbildung ein wichtiger Hebel.

(© aga7ta - stock.adobe.com)

Data Mining ist die systematische Anwendung computergestützter Methoden, um in vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu finden. Zur Wissensentdeckung eingesetzte Algorithmen basieren unter anderem auf statistischen Methoden.

(© aga7ta - stock.adobe.com)

Das Datenbankmanagementsystem, abgekürzt DBMS, ist neben den eigentlichen Daten der wichtigste Bestandteil einer jeden Datenbank. Es übernimmt die Aufgabe der Organisation und Strukturierung der Daten. Gleichzeitig kontrolliert es lesende und schreibende Zugriffe.

(© aga7ta - stock.adobe.com)

Bei Hadoop handelt es sich um ein auf Java basierendes Software Framework. Mit ihm lassen sich große Datenmengen auf verteilten Systemen in hoher Geschwindigkeit verarbeiten. Es ist zur Bewältigung der Datenverarbeitung im Big-Data-Umfeld geeignet.

(© aga7ta - stock.adobe.com)

NoSQL steht für „Not only SQL“ und bezeichnet Datenbanksysteme, die einen nicht-relationalen Ansatz verfolgen. Diese Datenbanken, denen verschiedene Datenbankmodelle zugrunde liegen können, sind horizontal skalierbar und lassen sich für Big-Data-Anwendungen einsetzen.

(© aga7ta - stock.adobe.com)

Predictive Maintenance verfolgt als eine der Kernkomponenten von Industrie 4.0 einen vorausschauenden Ansatz und wartet Maschinen und Anlagen proaktiv, um Ausfallzeiten niedrig zu halten. Das Verfahren nutzt hierfür von Sensoren erfasste Messwerte und Daten.

(© aga7ta - stock.adobe.com)

Beim Data Lake handelt es sich um einen sehr großen Datenspeicher, der die Daten aus den unterschiedlichsten Quellen in ihrem Rohformat aufnimmt. Er kann sowohl unstrukturierte als auch strukturierte Daten enthalten und lässt sich für Big-Data-Analysen einsetzen.

(© aga7ta - stock.adobe.com)

Eine Entität in der Informatik ist ein einzelnes, eindeutig identifizierbares Informationsobjekt. Es kann sich sowohl um existierende als auch um abstrakte Objekte handeln. Entitäten sind zusammen mit den Entitätstypen und Attributen sowie den Beziehungen zwischen den Entitäten wesentliche Elemente der Datenmodellierung.

(© aga7ta - stock.adobe.com)

Der Begriff ACID (Atomicity, Consistency, Isolation, Durability) beschreibt Regeln und Eigenschaften zur Durchführung von Transaktionen in Datenbankmanagementsystemen (DBMS). Hält die Transaktion das ACID-Prinzip ein, gelten die Informationen in den Datenbanksystemen als verlässlich und konsistent.

(© aga7ta - stock.adobe.com)

Datenvalidierung prüft Daten auf Einhaltung bestimmter Validierungsregeln. Diese wurden zuvor aufgestellt und beinhalten beispielsweise Vorgaben zu Wertebereichen oder Formaten. Die Datenvalidierung verbessert die Ergebnisse der Datenverarbeitung und Datenanalyse. Sie kann bei der Eingabe der Daten, direkt vor dem Start oder während der Datenverarbeitung stattfinden.

(© aga7ta - stock.adobe.com)

Apache Kafka ist eine Open Source Software, die die Speicherung und Verarbeitung von Datenströmen über eine verteilte Streaming-Plattform ermöglicht. Sie stellt verschiedene Schnittstellen bereit, um Daten in Kafka-Cluster zu schreiben, Daten zu lesen oder in und aus Drittsysteme zu importieren und zu exportieren.

(© aga7ta - stock.adobe.com)

Bei ODBC (Open Database Connectivity) handelt es sich um eine standardisierte, offene Schnittstelle für den Zugriff auf unterschiedliche Datenbankmanagementsysteme. Über ODBC-Treiber können Anwendungen direkt Anweisungen an Datenbanken erteilen oder Abfragen ausführen.

(© aga7ta - stock.adobe.com)

Ein Digitaler Zwilling repräsentiert ein reales Objekt in der digitalen Welt. Es kann sich um materielle oder immaterielle Objekte handeln. Die Digitalen Zwillinge sind aus Daten und Algorithmen aufgebaut und können über Sensoren mit der realen Welt gekoppelt sein. Für die Prozesse der Industrie 4.0 stellen Digitale Zwillinge die Basis dar.

(© aga7ta - stock.adobe.com)

Big Data Analytics ermöglicht es, große Datenmengen aus unterschiedlichen Quellen zu analysieren. Die gewonnenen Informationen oder erkannten Muster lassen sich einsetzen, um beispielsweise Unternehmensprozesse zu optimieren.

(© aga7ta - stock.adobe.com)

Die Normalisierung findet bei relationalen Datenbankschemata statt und hat zum Ziel, Redundanzen, Inkonsistenzen und Anomalien zu vermeiden und zu beseitigen. Zur Durchführung kommen bis zu fünf verschiedene aufeinander aufbauende Normalformen zum Einsatz. Normalisierte Datenbanken folgen einem klar strukturierten Modell.

(© aga7ta - stock.adobe.com)

Unstrukturierte Daten sind Informationen, die in einer nicht identifizierbaren und nicht normalisierten Datenstruktur vorliegen. Es kann sich beispielsweise um Texte, Bilder oder Audio- und Videodateien handeln. Im Big-Data-Umfeld haben unstrukturierte Daten eine große Bedeutung.

(© aga7ta - stock.adobe.com)

Das Industrial Internet of Things (IIoT) stellt die industrielle Ausprägung des Internet of Things (IoT) dar. Es repräsentiert im Gegensatz zum IoT nicht die verbraucherorientierten Konzepte, sondern konzentriert sich auf die Anwendung des Internets der Dinge im produzierenden und industriellen Umfeld.

(© aga7ta - stock.adobe.com)

Beim ETL-Prozess handelt es sich um mehrere Einzelschritte, durch die sich Daten aus verschiedenen Datenquellen per Extrahieren und Aufbereiten in ein Data Warehouse integrieren lassen. Der Prozess kommt häufig zur Verarbeitung großer Datenmengen im Big-Data- und Business-Intelligence-Umfeld zum Einsatz.

(© aga7ta - stock.adobe.com)

In einer Smart City werden moderne Technologien aus den Bereichen Energie, Mobilität, Stadtplanung, Verwaltung und Kommunikation so miteinander vernetzt, dass sich die Lebensqualität für die Bewohner steigert. Gleichzeitig profitiert die Nachhaltigkeit der Stadt.

(© aga7ta - stock.adobe.com)

Die Smart Factory steht im Zentrum der sogenannten Industrie 4.0. Sie stellt eine Produktionsumgebung zur Verfügung, die sich im Idealfall ohne menschlichen Eingriff selbst organisiert. Dazu zählen Fertigungsanlagen und Logistiksysteme. Kernkomponenten sind cyber-physische Systeme und die intelligente Vernetzung.

(© aga7ta - stock.adobe.com)

Ein BLOB (Binary Large Object ) ist ein großes binäres Datenobjekt, das von Datenbanken meist in besonderer Form verarbeitet und gespeichert wird. Typische BLOBs sind Dateien wie Video-, Audio- oder Bilddateien

Cassandra Enterprise umfasst zahlreiche Leistungsmerkmale, die für Unternehmensnutzer wichtig sind. (Datastax)

NoSQL-Datenbanken wurden aus der Notwendigkeit heraus entwickelt, große, unterschiedliche Mengen von Dimensionen wie Raum, Zeit und Lokation auf möglichst effiziente Weise zu speichern und zu verarbeiten. Mittlerweile sind sie die unabdingbare Alternative zu relationalen SQL-basierten Datenbanken. Doch nicht jede NoSQL-Datenbank eignet sich für jeden Zweck. Tatsächlich sind die meisten sogar recht spezialisiert.

Messpunkte und deren Abstand von einer nach der Methode der kleinsten Quadrate bestimmten Funktion. Hier wurde eine logistische Funktion als Modellkurve gewählt. (gemeinfrei)

Regressionsanalysen dienen dazu, Prognosen zu erstellen und Abhängigkeiten in Beziehungen aufzudecken. Will ein Smartphone-Hersteller herausfinden, mit welchem Preis er in welchem Kundenkreis welchen Umsatz erzielen kann, so kennt er nur eine Variable – den Preis – aber nicht die anderen Variablen. Heute gibt es eine große Zahl solcher Verfahren, denn sie werden für zahlreiche Zwecke benötigt, etwa in der Epidemiologie.

(© aga7ta - stock.adobe.com)

Random Forest ist ein Algorithmus, der sich für Klassifizierungs- und Regressionsaufgaben nutzen lässt. Er kombiniert die Ergebnisse vieler verschiedener Entscheidungsbäume, um bestmögliche Entscheidungen zu treffen. Der Lernalgorithmus gehört zu den Verfahren des überwachten Lernens und ist im Machine Learning einsetzbar. Das Verfahren ist relativ einfach und bietet kurze Trainingszeiten.

(© aga7ta - stock.adobe.com)

OPC UA (Open Platform Communications Unified Architecture) ist eine Sammlung von Standards für die Kommunikation und den Datenaustausch im Umfeld der Industrieautomation. Mithilfe von OPC UA werden sowohl der Transport von Machine-to-Machine-Daten als auch Schnittstellen und die Semantik von Daten beschrieben. Die komplette Architektur ist serviceorientiert aufgebaut.

(© aga7ta - stock.adobe.com)

Das Convolutional Neural Network ist eine besondere Form des künstlichen neuronalen Netzwerks. Es besitzt mehrere Faltungsschichten und ist für maschinelles Lernen und Anwendungen mit Künstlicher Intelligenz (KI) im Bereich Bild- und Spracherkennung sehr gut geeignet.

(© aga7ta - stock.adobe.com)

XGBoost ist eine frei verfügbare Bibliothek mit Open-Source-Lizenz. Sie ermöglicht überwachtes maschinelles Lernen mit dem Boosted-Tree-Algorithmus, einem Baumalgorithmus mit Gradient Boosting. Die Bibliothek ist für Betriebssysteme wie Linux, Windows oder macOS verfügbar und arbeitet mit Programmiersprachen wie C++, Java, Python, R und Julia.

(© aga7ta - Fotolia)

In der heutigen Zeit stehen Unternehmen Herausforderungen gegenüber, die rasches Handeln erfordern. Hier setzt die Business Intelligence (BI) an, die das Ziel hat, die Entscheidungsfindung in Unternehmen zu unterstützen.

(© aga7ta - stock.adobe.com)

Bei einem Management-Informationssystem (MIS) handelt es sich um ein computerunterstütztes Informationssystem, das wichtige Unternehmensinformationen für die Führungsebene sammelt und aufbereitet. Auf Basis der Informationen lassen sich Analysen durchführen, Probleme lösen oder strategische Entscheidungen treffen.

(© aga7ta - stock.adobe.com)

Python ist eine Programmiersprache, die dank ihrer klaren Syntax und einfachen Lesbarkeit leicht zu erlernen ist und sich sehr vielseitig einsetzen lässt. Für die gängigen Betriebssysteme ist Python frei verfügbar. Die üblichen Programmierparadigmen wie die objektorientierte oder funktionale Programmierung werden unterstützt.

(© aga7ta - stock.adobe.com)

Die Support Vector Machine (SVM) ist eine mathematische Methode, die im Umfeld des maschinellen Lernens zum Einsatz kommt. Sie gestattet das Klassifizieren von Objekten und ist vielfältig nutzbar. Unterstützt werden die lineare und die nicht-lineare Objektklassifizierung. Typische Anwendungsbereiche sind die Bild-, Text- oder Handschrifterkennung.

(© aga7ta - stock.adobe.com)

Eine Pivot-Tabelle strukturiert in Tabellenform vorliegende Daten, fasst sie zusammen und ermöglicht ihre Auswertung. Die Tabellenart gehört zu den Grundfunktionen aller gängigen Tabellenkalkulationsanwendungen. Für die Erstellung einer Pivot-Tabelle sind nur wenige Grundbedingungen zu erfüllen. Komplexe Formeln oder das Anwenden von SQL-Datenbankabfragen sind dank Pivot-Tabellen zum Teil überflüssig.

HPCC Systems kann auch in Amazon Web Services betrieben werden. (HPCC Systems)

Bei Big Data spielen Open-Source-Lösungen eine besondere Rolle. Das liegt unter anderem daran, dass große Unternehmen Big-Data-Lösungen entwickeln und dann der Community zur Verfügung stellen, um diese zu verbessern.

(© aga7ta - stock.adobe.com)

Data Literacy oder Datenkompetenz beschreibt die Fähigkeit, mit Daten kompetent umzugehen. Sie umfasst verschiedene Einzelkompetenzen, um Daten zu erfassen, anzupassen, zu verändern, zu interpretieren und zu präsentieren. Die Datenkompetenz ist Grundlage und wichtiger Skill der Digitalisierung.

(© aga7ta - stock.adobe.com)

Die Data Quality bestimmt, wie gut sich Datenbestände für vorgesehene Aufgaben eignen. Das können beispielsweise Anwendungen aus dem Business-Intelligence-Umfeld sein. Es existieren zahlreiche Kriterien, anhand derer sich die Data Quality bewerten lässt.

(© aga7ta - stock.adobe.com)

CUDA ist eine von NVIDIA entwickelte Technologie und Programmierschnittstelle, mit der sich die Rechenleistung von Grafikprozessoren (GPUs) für Anwendungen nutzen lässt. Aufgrund der hohen Rechenleistung und parallelen Arbeitsweise der GPUs sind bei bestimmten Anwendungen enorme Performancegewinne erzielbar.

1