Michael Matzer ♥ BigData-Insider

Michael Matzer

Michael Matzer arbeitet als Journalist, Übersetzer, Rezensent und Buchautor und lebt in der Nähe von Stuttgart. Seine Themen sind u.a. IT-Security, Big Data, Unternehmenssoftware, E-Commerce und HPC.

Artikel des Autors

Mit Salesforce Genie hält die Echtzeit-Datennutzung Einzug ins Customer Relationship Management, in Analytics (mit Einstein AI & Tableau) und in die Workflow-Automatisierung (mit Flow). (Bild: Salesforce)
Nachbericht Dreamforce 2022

Im CRM bricht mit Salesforce Genie das Echtzeitalter an

Salesforce hat auf der Hausmesse Dreamforce 2022 seiner Customer Data Platform „Customer 360“ das Modul „Genie“ hinzugefügt. Die auf dem Metadaten-Modell von Salesforce basierende Technologie vereint Kundendaten aus allen Kanälen und Interaktionen zu einem in Echtzeit aktualisierten Kundenprofil. „Genie“ steht für alle Salesforce Clouds, MuleSoft, Tableau und Slack zur Verfügung.

Weiterlesen
Das E-Book „Data Preparation“ steht ab sofort für alle registrierten Leserinnen und Leser von BigData-Insider kostenlos zum Download bereit. (Bild: Vogel IT-Medien)
E-Book von BigData-Insider

Data Preparation

Der Prozess der Datenaufbereitung (engl. Data Preparation) umfasst die Zusammenführung, Reinigung, Normalisierung, Umwandlung und Mischung von Daten, damit sie für analytische und andere Aufgaben in optimaler Qualität bereitstehen. Das E-Book „Data Preparation“ von BigData-Insider zeigt auf: Nur mit erstklassigen Daten lassen sich beispielsweise Lösungen für Machine Learning und Künstliche Intelligenz effizient, sicher und zuverlässig versorgen.

Weiterlesen
Die optische Kontrolle pharmazeutischer Produkte überwacht das gesamte „Fließband“ auf Unregelmäßigkeiten, etwa bei der Befüllung von kleinen Behältern (blau). (Bild: InspectifAI)
Künstliche Intelligenz

Das leistet KI in der Produktion und der Pharmazie

Künstliche Intelligenz (KI) gewinnt eine immer größere Bedeutung und wird im Jahr 2030 einen Wirtschaftswert von 13 bis 15 Billionen US-Dollar erreichen, sagt McKinsey voraus. Doch es gibt viele Hürden auf dem Weg zu erfolgreichen KI-Projekten zu überwinden, v. a. in Europa und Deutschland. Ein Roundtable von Experten und Praktikern hat sich über Erfahrungen und Ansichten über diese wichtige Entwicklung in der Technologie ausgetauscht.

Weiterlesen
Ali Ghodsi, CEO und Mitgründer von Databricks, stellte in San Francisco die Neuerungen in Delta Lake 2.0 vor.  (Bild: Databricks)
Nachbericht Data + AI Summit

Databricks erweitert Delta Lake 2.0 und MLflow 2.0

Databricks hat seine auf Apache Spark aufbauende Delta-Lake-Plattform nicht nur deutlich ausgebaut, sondern auch alle Neuerungen der Linux Foundation zur Verfügung gestellt. Zu den wichtigsten Neuerungen in Delta Lake 2.0 zählen die Schnittstelle Spark Connect, mit der Benutzer von jedem Gerät aus auf Spark zugreifen können, und MLflow Pipelines für automatisierte Machine-Learning-Projekte

Weiterlesen
Ab sofort steht das E-Book „Data Literacy – Datenkompetenz“ von BigData-Insider kostenlos zum Download bereit. (Bild: Vogel IT-Medien)
E-Book von BigData-Insider

Data Literacy – Datenkompetenz

Das jüngste E-Book von BigData-Insider beleuchtet Data Literacy. Data Literacy, oder Datenkompetenz, ist für die heutige und jede kommende Generation so wichtig wie das Lesen für ältere oder vergangene Generationen. Sie kommt dem Erwerb eines Führerscheins gleich. Datenkompetenz beschreibt die Fähigkeit, mit Daten kompetent, effizient und produktiv umzugehen. Sie umfasst verschiedene Einzelkompetenzen, um Daten zu erfassen, anzupassen, zu verändern, zu interpretieren und zu präsentieren. Gleichzeitig ist sicherzustellen, dass die Daten sicher, stimmig, vertrauenswürdig und rechtskonform sind.

Weiterlesen
Das Auditorium war bei den beiden Keynotes bis auf den letzten Platz gefüllt.  (Bild: ALEX TREADWAY)
Nachbericht AWS Summit Berlin

Machine Learning ermöglicht Nachhaltigkeit

Auf dem AWS Summit Berlin haben sich dieses Jahr rund 7.000 Besucher eingefunden, um sich über zwei zentrale Themen zu informieren: „Sicherheit im Cloudbereich“ und „Machine Learning für alle“. Constantin Gonzalez, Principal Solutions Architect bei Amazon Web Services (AWS) erläutert im Gespräch mit BigData-Insider, wie KI nicht nur Rechenleistung und Erkenntnisse ermöglicht, sondern auch Nachhaltigkeit fördert.

Weiterlesen
Der Aufbau der SAS Customer Data Platform (CDP) ist in der Grundform übersichtlich. (SAS)
Datenanalysen in der Cloud

SAS bringt drei neue Cloud-Lösungen auf den Markt

SAS hat kürzlich drei neue Lösungen für die Datenanalyse vorgestellt. Mit „SAS 360 Match“ sollen es den von Abo-Verlusten geplagten Streaming-Riesen gelingen, weiterhin profitabel zu bleiben. Mit der „SAS Clinical Enrollment Simulation Cloud“ soll das Anwerben für klinische Studien simuliert werden können. Energieversorger sollen sich mit „SAS Grid Guardian AI“ rechtzeitig vor Netzausfällen schützen können.

Weiterlesen
Das Logo der AWS Innovate AI/ML Edition (AWS)
Nachbericht AWS Innovate AI & ML Edition 2022

AWS-Innovate-Tag animiert zum Einsatz von KI und Machine Learning

Unter dem Motto „Umdenken möglich: Innovations-Erfahrungen“ präsentierte Amazon Web Services kürzlich auf der „AWS Innovate AI/ML Edition“, einer Veranstaltung für geschäftliche Anwender, eine Reihe von innovativen Projekten, die Deep Learning & Machine Learning, Supercomputing, Robotik und Analytik nutzen. Die Anwender, die sich auf der Konferenz vorstellten, wollen mithilfe von AWS-Diensten Neuerungen schnell vorantreiben, aktuelle Probleme lösen, das Wachstum ihres Unternehmens beschleunigen und – nomen est omen – Umdenken möglich machen.

Weiterlesen
Die EU will dafür sorgen, dass zumindest grundlegende Standards für die Qualität und Anwendung von KI-Algorithmen eingehalten werden.  (© Alexander - stock.adobe.com)
Künstliche Intelligenz und Ethik

Digitale Ethik mithilfe von KI-Werkzeugen realisieren

KI-Modelle, die Entscheidungen unterstützen oder gar automatisch ausführen, müssen nach ethischen Prinzipien fungieren. Doch beim Trainieren der Modelle tritt immer wieder einseitige, unfaire Voreingenommenheit auf. Während also KI-basierte Entscheidungen Erfolg haben werden, sind Werkzeuge nötig, die für die Fairness, Transparenz und Erklärbarkeit der KI-Modelle sorgen. Der Artificial-Intelligence-Act der EU soll künftig den rechtlichen Rahmen dafür bereitstellen.

Weiterlesen
Christian Geckeis, bei Informatica General Manager in der DACH-Region  (Informatica)
Datenmanagement

Informatica stellt Cloud Data Marketplace vor

Mit seinem Cloud Data Marketplace stellt Informatica, ein Anbieter von Enterprise Cloud Data Management Software, eine Drehscheibe für firmeninterne Daten vor. Diese verbindet einen Datenkatalog mit Data Governance und soll den Nutzern so den sicheren Zugriff auf vertrauenswerte Daten und Analysen gewährleisten.

Weiterlesen
Ab sofort steht das E-Book „DataOps für IoT Analytics“ kostenlos für registrierte Leserinnen und Leser von BigData-Insider zum Download bereit. (Vogel IT-Medien)
E-Book von BigData-Insider

DataOps für IoT Analytics

Das E-Book „DataOps für IoT Analytics“ von BigData-Insider stellt einen wachsenden Markt vor, der an Bedeutung gewinnt, weil Unternehmen und andere Organisationen zunehmend Daten für ihr Geschäft nutzen wollen und dafür auf eine optimale Qualität und Bereitstellung von Daten angewiesen sind.

Weiterlesen
Ab sofort steht das E-Book „NoSQL-Daenbanken“ für registrierte Leserinnen und Leser von BigData-Insider kostenlos zum Download bereit.  (Vogel IT-Medien)
E-Book von BigData-Insider

NoSQL-Datenbanken

Aus dem täglichen Umgang mit dem Internet ist die Nutzung von verknüpften Daten nicht mehr wegzudenken. Seien es Freundschaftskreise auf Facebook und LinkedIn, Taxi-Anforderungen auf Uber oder Empfehlungen auf Amazon und Ebay – immer tritt im Hintergrund eine Datenbank in Aktion, die verwandte Daten sucht und miteinander in Beziehung setzt. Dabei handelt es sich in den meisten Fällen um eine NoSQL-Datenbank.

Weiterlesen
Das Logo der Tibco Now 2021 (Tibco)
Nachbericht Tibco Now 2021

Tibco führt neues Werkzeug für Datenqualität ein

Tibco hat auf der Anwenderkonferenz Tibco Now 2021 eine Reihe von Neuheiten in den drei Sparten Connect, Predict und Unify präsentiert. Die meisten sind Weiterentwicklungen des Vorhandenen, doch Tibco Omni-gen DQ ist neu in der Tibco-Produktfamilie. Dieses Werkzeug erzeugt „kuratierte“ Daten, die von anderen Applikationen konsumiert werden, und bildet damit eine DQ-Firewall zur Standardisierung und Qualitätssicherung von Daten.

Weiterlesen
Ab sofort steht das E-Book „Streaming-Analytics-Plattformen“ für leser von BigData-Insider kostenlos zum Download bereit. (Vogel IT-Medien)
E-Book von BigData-Insider

Streaming Analytics verbindet die Realwelt mit Erkenntnissen in Echtzeit

Events ereignen sich überall in der modernen Welt. Sei es eine Online-Bestellung, sei es das Buchen einer Lyft-Fahrt, die Log-Meldung eines IoT-Geräts oder die Transaktion in einem Banksystem – überall wird eine Kette von Events ausgelöst. Diese Event Streams lassen sich nicht nur in der jeweils passenden „Echtzeit“ erfassen, sondern auch flexibel verteilen, weiterverarbeiten und sogar „zurückspulen“. Ein Event-Streaming-System ist sowohl fehlertolerant als auch skalierbar – und leicht mit Apps zu nutzen.

Weiterlesen
Cassandra Enterprise umfasst zahlreiche Leistungsmerkmale, die für Unternehmensnutzer wichtig sind. (Datastax)
NoSQL

NoSQL-Datenbanken im Vergleich

NoSQL-Datenbanken wurden aus der Notwendigkeit heraus entwickelt, große, unterschiedliche Mengen von Dimensionen wie Raum, Zeit und Lokation auf möglichst effiziente Weise zu speichern und zu verarbeiten. Mittlerweile sind sie die unabdingbare Alternative zu relationalen SQL-basierten Datenbanken. Doch nicht jede NoSQL-Datenbank eignet sich für jeden Zweck. Tatsächlich sind die meisten sogar recht spezialisiert.

Weiterlesen
Messpunkte und deren Abstand von einer nach der Methode der kleinsten Quadrate bestimmten Funktion. Hier wurde eine logistische Funktion als Modellkurve gewählt. (gemeinfrei)
Grundlagen Statistik & Algorithmen, Teil 11

Methoden der Linearen Regressionsanalyse

Regressionsanalysen dienen dazu, Prognosen zu erstellen und Abhängigkeiten in Beziehungen aufzudecken. Will ein Smartphone-Hersteller herausfinden, mit welchem Preis er in welchem Kundenkreis welchen Umsatz erzielen kann, so kennt er nur eine Variable – den Preis – aber nicht die anderen Variablen. Heute gibt es eine große Zahl solcher Verfahren, denn sie werden für zahlreiche Zwecke benötigt, etwa in der Epidemiologie.

Weiterlesen
Kernel-Maschinen werden verwendet, um nichtlinear trennbare Funktionen zu berechnen, um so eine linear trennbare Funktion höherer Ordnung zu erhalten.  (Kernel Machine.svg / Alisneaky, svg version by User:Zirguezi / CC BY-SA 4.0)
Grundlagen Statistik & Algorithmen, Teil 5

Optimale Clusteranalyse und Segmentierung mit dem k-Means-Algorithmus

Der k-Means-Algorithmus ist ein Rechenverfahren, das sich für die Gruppierung von Objekten, die sogenannte Clusteranalyse, einsetzen lässt. Dank der effizienten Berechnung der Clusterzentren und dem geringen Speicherbedarf eignet sich der Algorithmus sehr gut für die Analyse großer Datenmengen, wie sie im Big-Data-Umfeld üblich sind, so etwa in der Bildverarbeitung und in der Kundensegmentierung.

Weiterlesen
COVID-19 gelangt höchstwahrscheinlich über das Protein ACE2 in menschliche Lungenzellen. Dieser Prozess – Endozytose genannt – wird reguliert durch AAK1 (ein anderes Protein). Baricitinib hemmt AAK1 und könnte möglicherweise so auch das Eindringen von COVID-19 in die Lungenzellen verhindern.  (Data Revenue)
Künstliche Intelligenz gegen COVID-19

So helfen KI-Modelle und Algorithmen im Kampf gegen das Corona-Virus

Machine Learning ist ein bedeutendes Instrument im Kampf gegen die Corona-Pandemie. Wenn Bürger, Behörden und Unternehmen diese Gelegenheit nutzen, um Daten zu sammeln, vorhandenes Wissen zu vereinen und ihre Fachkenntnisse zusammenzubringen, können viele Leben gerettet werden – sowohl heute als auch in der Zukunft. Wie vielfältig die Einsatzgebiete von Machine Learning in diesem Rahmen sind, soll diese Übersicht zeigen, die von Data Revenue erstellt wurde.

Weiterlesen
Gierige Algorithmen bestimmen z. B. die Mindestmenge an Münzen für das jeweils nötige Wechselgeld. Im Bild sind die Schritte abgebildet, die ein Mensch gehen würde, um einen gierigen Algorithmus zu imitieren, der 36 Cents herausgibt, indem er Münzen mit den Werten {1, 5, 10, 20} verwendet. Die Münze mit dem höchsten Wert, der unter dem geschuldeten Betrag liegt, ist das „lokale Optimum“.  (gemeinfrei)
Grundlagen Statistik & Algorithmen, Teil 9

Der Greedy-Algorithmus

Greedy-Algorithmen, oder gierige Algorithmen, bilden eine spezielle Klasse von Optimierungsalgorithmen, die in der Informatik auftreten. Sie zeichnen sich dadurch aus, dass sie schrittweise den Folgezustand auswählen, der zum Zeitpunkt der Wahl den größten Gewinn bzw. das beste Ergebnis (berechnet durch eine Bewertungsfunktion) verspricht z. B. Gradientenverfahren, so etwa die Berechnung von Wechselgeld oder des kürzesten Wegs. Greedy-Algorithmen sind oft schnell, lösen viele Probleme aber nicht optimal.

Weiterlesen
Bestmögliche Gerade durch die „Punktwolke“ einer Messung (gemeinfrei)
Grundlagen Statistik & Algorithmen, Teil 10

Mit einfacher Regressionsanalyse Mittelwerte in Prognosen ermitteln

Regressionsanalysen dienen dazu, Prognosen zu erstellen und Abhängigkeiten in Beziehungen aufzudecken. Will ein Smartphone-Hersteller herausfinden, mit welchem Preis in welchem Kundenkreis er welchen Umsatz erzielen kann, so kennt er nur eine Variable – den Preis – aber nicht die anderen Variablen. Um 1760 erfunden, gibt es heute eine große Zahl solcher Verfahren. Dieser Beitrag beginnt mit dem einfachsten, der Einfachen Linearen Regression (ELR).

Weiterlesen
Wie funktioniert der Random-Forest-Algorithmus? Antworten gibt der 12. Teil unserer Grundlagenreihe.   (© momius - stock.adobe.com)
Grundlagen Statistik & Algorithmen, Teil 12

Der Random-Forest-Klassikator als Entscheidungshilfe

Der Random-Forest-Algorithmus ist ein sogenanntes beaufsichtigtes Klassifikationsverfahren, das aus mehreren unkorrelierten Entscheidungsbäumen besteht, die eine Klassifizierung oder Vorhersage liefern. Weil sich die Entscheidungsbäume parallel verarbeiten lassen, kann der Algorithmus – bei entsprechend paralleler Ausführung – sehr schnell ausgeführt werden. Die Skalierung ist also leicht zu berechnen. Random Forests können auch der Regressionsanalyse dienen.

Weiterlesen
Data Preparation kostet Zeit, ist aber unerlässlich. Geeignete Tools können den Prozess beschleunigen und vereinfachen. (© momius - stock.adobe.com)
Data Preparation

Datenaufbereitung ist ein unterschätzter Prozess

Der Prozess der Datenaufbereitung umfasst die Reinigung, Formung und Mischung von Daten, damit sie für analytische und andere Aufgaben in optimaler Qualität bereitstehen. Nur mit erstklassigen Daten lassen sich beispielsweise Lösungen für Machine Learning und Künstliche Intelligenz effizient, sicher und zuverlässig versorgen.

Weiterlesen
IBMs neuer CEO Arvind Krishna eröffnete den IBM Data & AI Summit 2020. (2019 John O’Boyle)
Nachbericht IBM Data & AI Summit 2020

IBM liefert erweiterte KI-Fähigkeiten für Chatbots und Debattier-Software

Auf dem Online-Event „IBM Data & AI Summit 2020“ stellte Big Blues neuer CEO Arvind Krishna u. a. Erweiterungen für die KI-Technologien „Watson Assistant“ und „Project Debater“ vor. Während Watson Assistant als Framework die Erstellung von Chatbots für Banken, Callcenter und andere Funktionen erlaubt, nutzt Project Debater Sprachverarbeitungsmethoden, um virtuelle Debatten zu ermöglichen.

Weiterlesen
60.000 angemeldete Teilnehmer aus über 100 Ländern besuchten den von Databricks organisierten Spark+AI Summit 2020. (Databricks)
Nachbericht Spark+AI Summit 2020

Databricks erweitert Machine Learning Framework

Der von Databricks veranstaltete Spark+AI Summit startete kürzlich mit 60.000 angemeldeten Teilnehmern aus über 100 Ländern, die sich über die neuesten Trends und Entwicklungen aus der Welt der KI und des ML innerhalb der Apache Spark Community informierten. Databricks, der Erfinder und Betreuer von Apache Spark, hat sein 2018 vorgestelltes ML-Framework MLflow erweitert und der Open Source Community übergeben. Auf der neuen Version 3.0 von Spark bauen die neuen oder erweiterten Plattformkomponenten Delta Lake, Delta Engine und Redash auf.

Weiterlesen
„Artificial Intelligence of Things“: Die Verknüpfung von KI und dem IoT ermöglicht eine ganzheitliche Optimierung der Fertigung. (KUKA Group)
KUKA & AIoT

Maßgeschneiderte, KI-gestützte Lösungen im IIoT-Umfeld

Zunehmend wird Machine Learning im IIoT-Umfeld genutzt. Der Anwendungsfall Predictive Maintenance greift jedoch viel zu kurz, warnt Christian Liedtke, Head of Strategic Alliances bei KUKA. Doch wenn man KI und IoT ganzheitlich zu AIoT kombiniere und in einer optimierten Smart Factory umsetze, könnten die Unternehmen Effizienzsteigerungen von bis zu 30 Prozent erzielen

Weiterlesen
Ereigniszeitanalyse mit zensierten Daten für die Vertriebsabteilung: die Überlebensfunktion für Vertriebstechniker (durchgezogene Linie) und für Vertreter (gestrichelte Linie) in einem Kaplan-Meier-Schätzer. Vertriebstechniker sind ihrer Stelle wesentlich stärker und länger treu als Vertreter. Der blaue und rötliche Hintergrund deckt sich mit der jeweiligen Kurve. (SAS)
Grundlagen Statistik & Algorithmen, Teil 6

Die Ereigniszeitanalyse – wenn Anfang und Ende die Erfolgsrate bestimmen

Die Ereigniszeitanalyse bzw. Survival Analysis umfasst eine Reihe von Werkzeugen der Statistik, mit denen die Zeit bis zum Eintritt eines bestimmten Ereignisses zwischen Gruppen verglichen wird. Auf diese Weise will man die Wirkung von prognostischen Faktoren, einer medizinischen Behandlung oder von schädlichen Einflüssen abschätzen. Bei dem Ereignis kann es sich um etwas so Endgültiges wie den Tod handeln, aber auch um den Verlust einer Arbeitsstelle, eine Scheidung oder einen Beginn, etwa um eine Geburt oder einen Heilungseintritt.

Weiterlesen
Ab sofort steht das E-Book „IoT-Echtzeitanalyse“ kostenlos zum Download bereit.  (Vogel IT-Medien)
E-Book von BigData-Insider

IoT-Echtzeitanalyse

Das Sensor-gestützte Lieferketten-Management, die vorausschauende Wartung einer Windkraftanlage, der Arbeitsschutz von Mitarbeitern oder die KFZ-Versicherung eines vernetzten Autofahrers – sie alle haben eines gemeinsam: Ihre Daten werden in Echtzeit erfasst und einer zeitnahen Auswertung unterworfen. Das Internet der Dinge (Internet of Things, IoT) ist einer der größten Wachstumsbereiche der Industrie weltweit.

Weiterlesen
Operationalisierung von Advanced Analytics bedeutet die Überführung und Anwendung der aus dem Data Lab gewonnenen Erkenntnisse in die operativen Prozesse. (BARC, Tim Grosser)
Evolution

Der Übergang von Business Intelligence zu Advanced Analytics

Wenn einem BI-Nutzer Reports und Dashboards nicht mehr reichen, wird es Zeit für Prognose-Tools, die in den Disziplinen Advanced Analytics (AA) und Data Science zu finden sind. Doch AA-Modelle sind nur von begrenztem Wert, wenn man sie nicht in die Prozesse integriert. Wie der Übergang von BI zu AA gelingen kann, zeigt ein Webinar von BARC-Experte Timm Grosser.

Weiterlesen
Das Hauptgebäude (Gartenansicht) der Munich Re (© Munich Re / Marcus Buck, München)
Enterprise-Data-Warehouse-Plattform bei Munich Re

Migration auf SAP Analytics Cloud erfolgreich bewältigt

Munich RE hat Mitte vergangenen Jahres ein Projekt zur Einführung eines neuen Enterprise Data Warehouses (EDWH) für Rückversicherungsdaten erfolgreich abgeschlossen. Dabei wurde das klassische Reporting von Rückversicherungsdaten im Legacy-System „Global Data Warehouse (GDWH)“ auf eine moderne Business-Intelligence-Plattform migriert, die auf SAP BW on HANA basiert. Ziel des Projekts war die Implementierung der technischen Voraussetzung für die Anwendung moderner Business Intelligence für Rückversicherungsdaten.

Weiterlesen
Illustration des Satzes von Bayes durch Überlagerung der beiden ihm zugrundeliegenden Entscheidungsbäume bzw. Baumdiagramme. (Qniemiec / CC BY-SA 3.0)
Grundlagen Statistik & Algorithmen, Teil 2

So verfeinert das Bayes-Theorem Spam-Filter – und mehr

Mithilfe des Satzes von Bayes lassen sich Parameter schätzen und Hypothesen induktiv testen. In einem Spamfilter können so wahrscheinliche Spam-Mails ermittelt werden. Und aus den Symptomen, die bei einem bekannten Test auftreten, lassen sich wahrscheinliche Krankheitsursachen aufspüren. Der Satz von Bayes, der bedingte Wahrscheinlichkeiten beschreibt, ist also ein nahezu universell nutzbares Werkzeug der Statistik.

Weiterlesen
Ab sofort steht das E-Book „Big-Data-Datenbanken“ für registrierte Leser von BigData-Insider kostenlos zum Download bereit.  (Vogel IT-Medien)
E-Book von BigData-Insider

Big-Data-Datenbanken

Big-Data-Datenbanken sollen die unterschiedlichsten Datentypen schnell und effizient verarbeiten. Sie lösen die herkömmlichen, überwiegend relationalen Datenbanktypen ab, die meist ein Data Warehouse unterstützen. Sie lösen sie ab, um neue Geschäftsmodelle zu ermöglichen, oder sie ergänzen die Data-Warehouse-Architektur mit notwendige Fähigkeiten, etwa für Data Discovery, Realtime Analytics und Advanced Analytics (Prognose).

Weiterlesen
Ab sofort steht das E-Book „Wie Maschinen selbst lernen“ kostenlos für registrierte Leserinnen und Leser von BigData-Insider zum Download bereit. (Vogel IT-Medien)
E-Book von BigData-Insider

Wie Maschinen selbst lernen

Das E-Book „Wie Maschinen selbst lernen“ stellt Methoden, Technologien und Produkte vor, mit denen Unternehmen Machine-Learning-Modelle und Algorithmen für nutzbringende Anwendungsfälle verwenden können. Die Technologie um Machine Learning und Deep Learning, allgemein „Künstliche Intelligenz“ (KI) genannt, hat in den vergangenen Jahren einen rasanten Aufschwung erlebt. Es gibt kaum noch einen Anwendungsbereich, in dem noch keine Algorithmen in den Prozessen werkeln, ober in der Fabrik oder im Weltall.

Weiterlesen
Das E-Book „Predictive Analytics“ steht ab sofort für registrierte Leser von BigData-Insider kostenlos zum Downlload bereit. (Vogel IT-Medien)
Kostenloses E-Book

Predictive Analytics

Predictive Analytics ist ein Teilbereich von Business Intelligence, der sich in erster Linie mit zu erwartenden und möglichen Ereignissen beschäftigt. Er fragt, was unter welchen Voraussetzungen passieren wird oder passieren sollte. Das ermöglicht Prognosen in zahlreichen Wirtschaftsbereichen, sei es im Vertrieb, in der Fertigung, im Einzelhandel oder in der Luftfahrt. Die Prognoseresultate werden in der Regel mit ergänzender Software visualisiert und interaktiv in Teams diskutiert, weitergeleitet und bearbeitet.

Weiterlesen
Machine Learning ist die einfachste Einstiegsform in Algorithmen für Software Services, die sich selbst optimieren. Diese Algorithmen eignen sich beispielsweise, um unscharfe Grenzbereiche genauer abzugrenzen oder um widersprüchliche Informationen aufzudecken, etwa im Bereich Kreditkartenbetrug. (© Weissblick - Fotolia.com)
Machine Learning

So bereitet Machine Learning Big Data auf

Seit 2014 haben Anbieter wie Microsoft, IBM, Amazon und die Apache Software Foundation das maschinelle Lernen (Machine Learning, ML) gefördert und in der Cloud zur Verfügung gestellt. Erzwungen durch den Mangel an Data Scientists, bieten ML-Algorithmen einen leicht erlernbaren Weg, um Prognosen zu erstellen.

Weiterlesen
Clemens Mewald, Director of Product Management, Data Science and Machine Learning bei Databricks (Databricks)
Nachbericht Databricks Data + AI Summit 2020

Databricks unterstützt BI-Analysten im Data-Lake-Umfeld

Das von den ursprünglichen Entwicklern von Apache Spark gegründete Unternehmen Databricks hat seine Unified Analytics Platform um eine weitere Komponente erweitert. Zu den vorhandenen Komponenten Delta Lake, Delta Engine und Redash, die auf der neuen Version 3.0 von Spark aufbauen, kommt nun SQL Analytics hinzu. Dieser SQL-Editor unterstützt mit Konnektoren bislang die BI-Lösungen von Tableau und Microsoft.

Weiterlesen
Kernidee von LOF ist, die lokale Dichte eines Punktes mit der seiner Nachbarn zu vergleichen- (gemeinfrei)
Grundlagen Statistik & Algorithmen, Teil 7

So deckt der Local Outlier Factor Anomalien auf

Um Trends zu erkennen, wird oft die Clusteranalyse herangezogen. Der k-Means-Algorithmus etwa zeigt an, wo sich Analyseergebnisse in einer Normalverteilung ballen. Für manche Zwecke ist es aber aufschlussreicher, Ausreißer zu untersuchen, denn sie bilden die Antithese zum „Normalen“, etwa im Betrugswesen. Der Local-Outlier-Factor-Algorithmus (LOF) ist in der Lage, den Abstand von Ausreißern zu ihren Nachbarn zu berechnen und deckt so Anomalien auf.

Weiterlesen
Eine Wagon-Intelligence-Telematikeinheit an einem Containertragwagen. Bereits über 25.000 Wagen wurden damit ausgerüstet. Die gesamte Flotte folgt bis 2020. (amspire lab/DB Cargo)
Splunk im Einsatz bei der DB Cargo

Digitalisierung für mehr Qualität und Service im Schienengüterverkehr

Splunk Enterprise, das Hauptprodukt des Operational-Intelligence-Spezialisten Splunk, ist bei DB Cargo im Einsatz, der Güterbahnsparte der Deutschen Bahn. Im Zuge der Digitalisierung und Automatisierung des Güterverkehrs und des Fuhrparks hilft Splunk Enterprise bei der Datenerfassung und -analyse in den Projekten „Wagon Intelligence“ und „TechLOK“. Die Software-Entwicklung der beiden Projekte findet im DB Cargo amspire lab in Frankfurt am Main statt.

Weiterlesen
Sport-Analytik erlaubt zeitnahe Auwertungen von Spielen, Sportlern und Statistiken für die Zuschauer, aber auch für Vereine und Trainer und Verbände.  (© kentoh - stock.adobe.com)
Big-Data-Analysen im Sport

Die Sportwelt profitiert von intelligenter Analytik

Die drei Analytik-Anbieter SAS, Exasol und Amazon Web Services haben den Sport als Wachstumsmarkt entdeckt. Zudem sind Organisationen wie die Deutsche Bundesliga auf Innovationen bei ihren Zuschauerangeboten angewiesen, um konkurrenzfähig zu bleiben. Mit den Lösungen der drei Anbieter reicht das Angebot von der einfachen Sportgrafik bis hin zu KI-basierten Angaben und Vorhersagen, die in Echtzeit angezeigt werden.

Weiterlesen
Ab sofort steht das E-Book „Cognitive Computing“ kostenlos zum Download bereit. (Vogel IT-Medien)
E-Book von BigData-Insider

So funktioniert Cognitive Computing

Überall sprechen die IT-Anbieter von Künstlicher Intelligenz (KI), ohne jedoch genau zu definieren, was sie damit meinen. Der KI-Hype überwiegt zunehmend das, was im Kern an Nutzen für den IT-Nutzer verborgen ist. Höchste Zeit, dass die Disziplinen, die sich hinter KI verbergen, beleuchtet werden. Neben Machine Learning ist hier vor allem Cognitive Computing zu nennen.

Weiterlesen
Prinzipbild des Rete-Algorithmus. Deutlich sind zwei Netzwerke (Alpha, Beta) zu erkennen und dass darin jeweils sehr viel Speicher benötigt wird. Dieser hohe Speicherbedarf ist einer der wenigen Nachteile des Rete-Algorithmus.  (gemeinfrei)
Grundlagen Statistik & Algorithmen, Teil 3

Speed für Mustererkennung mit dem Rete-Algorithmus

Geschäftsregeln halten zahlreiche Unternehmensprozesse am Laufen, deshalb können sie mitunter sehr umfangreich werden. Der Umfang macht ihre Ausführung zeitaufwendig, weshalb jede Methode, sie zu beschleunigen, willkommen ist. Der Rete-Algorithmus beschleunigte 1979 die damals bestehenden Systeme für die Verarbeitung von Business Rules um den Faktor 3.000. Er ist bis heute die Grundlage zahlreicher Expertensysteme, etwa in der Mustererkennung.

Weiterlesen
Das IBM Watson IoT Center in München ragt mit zwei Türmen in den bajuwarischen Himmel. (IBM)
In München

IBM eröffnet globalen Watson-IoT-Hauptsitz

Die IBM hat am 16. Februar offiziell die Türen des neuen globalen Hauptsitzes für ihren neuen Geschäftsbereich Watson IoT in München geöffnet. Ziel der 200-Millionen-US-Dollar-Investition ist es, die technischen und wirtschaftlichen IoT-Potenziale weiter auszuloten. Zudem gab IBM den offiziellen Startschuss für den Aufbau eines neuen, weltweiten Innovationsökosystems rund um künstliche Intelligenz (AI) und IoT. Mitglied dieses Ökosystems ist unter anderem BMW. Weitere Partnerschaften betreffen Bosch und Visa.

Weiterlesen
Großes Interesse: IBM konnte zahlreiche Gäste auf dem IBM Watson Summit 2017 begrüßen.  ( IBM  )
IBM Watson Summit 2017

Digitalisierung schlau umgesetzt

Auf dem IBM Watson Summit 2017 in Frankfurt/Main haben führende europäische Unternehmen wie Kone, Lufthansa, Siemens oder Telekom ihre Digitalisierungsprojekte vorgestellt, die sie auf der Basis von Watson realisiert haben oder demnächst vorstellen. Darunter befand sich auch einer der ersten deutschen Chatbots.

Weiterlesen
Neo4j 4.0 antwortet auf komplizierte Herausforderungen in der Entwicklung moderner Applikationen wie etwa unbegrenzte Skalierbarkeit, intelligenter Kontext von Daten und robuste Datensicherheit für Unternehmen. (Neo4j)
Neo4j v.4.0

Graph-Datenbank Neo4j wird noch skalierbarer

Neo4j, ein marktführender Anbieter von Graph-Datenbanktools, hat die Version 4.0 seiner Plattform verfügbar gemacht. Zu den Neuerungen gehören unbegrenzte Skalierbarkeit, mandantenfähige Multi-Datenbank-Nutzung, die Integration von Apache Kafka und die besonders für Unternehmen wichtige feingranulare Steuerung von Datensicherheit und Datenschutz.

Weiterlesen
Die Architektur von Stackable umfasst Operatoren, Agenten sowie zahlreiche Services, die unter anderem von Gaia-X und OpenTelemetry kommen können. (Stackable)
Big Data in der Enterprise Cloud

Big-Data-Projekte mit Stackable in der Ionos-Cloud

Das deutsche Start-up Stackable bietet Big-Data-Lösungen in der Enterprise Cloud an, die von Ionos betrieben wird. Im Unterschied zu den Angeboten der Hyperscaler basiert das Angebot von Stackable auf einer offenen und flexiblen Plattform, die durchgängig auf Open-Source-Komponenten setzt. Kunden haben hier die freie Wahl, welche Tools sie in welcher Version kombinieren möchten. So sollen sich maßgeschneiderte, Open-Source-basierte Lösungen erstellen lassen, die den Kunden nicht an einen bestimmten Anbieter binden.

Weiterlesen
Künstliche Intelligenz muss transparent arbeiten. Nur wenn die Ergebnisse nachvollziehbar sind, sind sie vertrauenswürdig. (© willyam - stock.adobe.com)
Trusted AI

So wird Künstliche Intelligenz vertrauenswürdig

Mit der Ausbreitung von KI-Anwendungen stellen sich Schöpfern wie Benutzern zwei zentrale Fragen: Was befindet sich in der Black Box, die den Algorithmus und das Deep-Learning-Modell verbirgt? Und zweitens: Wie lässt sich sicherstellen, dass kein Unbefugter diese Software für seine Zwecke manipuliert hat? Manche KI-Hersteller und -Berater haben darauf bereits eine Antwort.

Weiterlesen
Position der Datenvirtualisierungsschicht in der Enterprise-Architektur. (Forrester 2015)
Big Data und Virtual Data Warehouse

Das Virtual Data Warehouse verhilft zur schnelleren digitalen Transformation

Das traditionelle Data Warehouse ist auf die Verarbeitung strukturierter Daten ausgelegt, welche es effizient und performant erledigt. Doch Big Data besteht aus unstrukturierten Daten, Datenströmen, die in großen Mengen und mit hoher Geschwindigkeit eintreffen. Um Leistung und Effizienz zu erhalten, aber Flexibilität hinzuzugewinnen, bietet das Virtual Data Warehouse eine vielversprechende Alternative.

Weiterlesen