Illustration des Satzes von Bayes durch Überlagerung der beiden ihm zugrundeliegenden Entscheidungsbäume bzw. Baumdiagramme. (Qniemiec / CC BY-SA 3.0)
Grundlagen Statistik & Algorithmen, Teil 2

So verfeinert das Bayes-Theorem Spam-Filter – und mehr

Mithilfe des Satzes von Bayes lassen sich Parameter schätzen und Hypothesen induktiv testen. In einem Spamfilter können so wahrscheinliche Spam-Mails ermittelt werden. Und aus den Symptomen, die bei einem bekannten Test auftreten, lassen sich wahrscheinliche Krankheitsursachen aufspüren. Der Satz von Bayes, der bedingte Wahrscheinlichkeiten beschreibt, ist also ein nahezu universell nutzbares Werkzeug der Statistik.

Weiterlesen
Der Autor: Bernard Doering ist Regional Director Central Europe bei Cloudera (Bild: Cloudera)
Kommentar von Bernard Doering, Cloudera

Neue Lösungen machen Hadoop unternehmensreif

Mit Big Data lassen sich Daten analysieren, um daraus Neues zu lernen, Theorien mit Fakten zu untermauern oder neue Produkte und vor allem Dienstleistungen zu entwickeln. Analysen versprechen Erkenntnisse für klügere geschäftliche Entscheidungen, Wettbewerbsvorteile, bessere Kundenbeziehungen sowie ganz neue Produkte. Basis für jedes Big-Data-Projekt ist jedoch zuerst einmal das Handling der riesigen Datenmengen.

Weiterlesen
„Die Administratoren haben einen Migrationsschritt vor sich“, erklärt Gerhard Schlabschi, EMEA-Direktor für Cloud-Technology bei Oracle. „Sie entwickeln sich zum Daten-Manager.“  (Oracle)
Data Warehouse Workloads

Oracles autonome Datenbank gibt es nur als Service

Im Herbst 2017 auf der „OpenWorld“ angekündigt, hat Oracle die „Autonomous Database“ jetzt freigegeben – allerdings nicht für den Do-it-yourself-Betrieb. Die Datenbank-Software, die sich selbst administrieren soll, läuft entweder im Rechenzentrum des Anbieters oder als von Oracle gemanagte Lösung beim Kunden („Oracle at Customer“). Der Service für Data Warehouse Workloads ist laut Oracle der erste in einer ganzen Reihe weiterer „autonomer“ Dienste.

Weiterlesen
Der Autor: Stefan Müller ist Director Business Intelligence & Big Data bei IT-Novum (Bild: IT-Novum)
Stefan Müller, IT-Novum, zu Marketing Analytics

Daten analysieren und Kunden gewinnen

Die Zeiten, in denen Manager sich rein auf ihr Bauchgefühl verlassen konnten, sind schon lange vorbei. Zwar spielen auch heute Instinkt, Erfahrung und die menschliche Bewertung von Situationen bei der Entscheidungsfindung eine Rolle. Grundlage dieser Entscheidungen sind aber immer Fakten. Egal, ob es sich um Vertrieb, Produktion oder Logistik handelt, ohne eine genaue Analyse von Aktivitäten und Vorhaben können Entscheidungen nicht getroffen werden.

Weiterlesen
Der Autor: Neil Barton ist Chief Technology Officer bei Wherescape  (Wherescape)
Kommentar von Neil Barton, Wherescape

Wenn schon Big Data, dann aber richtig

Nach der Anfangseuphorie hat sich im Bereich Big Data Ernüchterung breit gemacht. Nicht wenige Unternehmen haben kräftig in Big Data investiert und müssen sich nun die Frage gefallen lassen, ob den getätigten Investition denn auch entsprechende Werte für ihr Unternehmen gegenüberstehen. Tatsächlich mündet nur ein Bruchteil von Big-Data-Projekten in der Produktion. Mit diesen fünf grundlegenden Planungstipps kann man Fehlinvestitionen schon in der Planungsphase vermeiden und Big Data im Unternehmen zum Erfolg führen.

Weiterlesen
 (© aga7ta - stock.adobe.com)
Definition

Was ist Vaex?

Vaex ist eine Python-Bibliothek, die große, in Tabellenform vorliegende Datenmengen performant verarbeitet und visualisiert. Dank des Out-of-Core-Konzepts der Library lassen sich die Daten unabhängig von der Größe des verfügbaren Arbeitsspeichers des Rechners verarbeiten. In Teilen ist Vaex mit dem Pandas API kompatibel und kann als Pandas-Ersatz genutzt werden.

Weiterlesen