Thomas Joos ♥ BigData-Insider

Thomas Joos

Freiberuflicher Autor und Journalist

Thomas Joos ist ein deutscher IT-Experte, Autor und freiberuflicher Journalist mit über 30 Jahren Berufserfahrung. Nach seinem Abitur und einem Informatikstudium arbeitete er als IT-Administrator und IT-Leiter, bevor er sich frühzeitig als selbstständiger Consultant etablierte. Heute konzentriert er sich hauptsächlich auf das Schreiben und hat über 100 Fachbücher sowie mehrere tausend Fachartikel verfasst.

Seine Expertise umfasst Bereiche wie Microsoft-Produkte, Netzwerksicherheit, Cloud-Technologien (Microsoft Azure, Microsoft 365, Amazon Web Services), Virtualisierung mit vSphere, Big Data, Unternehmensanwendungen, SAP, Datenanalyse, Blockchain, Security und Künstliche Intelligenz. Er arbeitet eng mit verschiedenen Unternehmen im IT-Bereich zusammen, bleibt dabei jedoch kritisch und unabhängig. Neben Büchern für Microsoft Press schreibt er auch für andere Verlage und zahlreiche IT-Fachzeitschriften und -Portale. Zudem ist er für die Deutsche Presse-Agentur (dpa) tätig.

Joos erstellt auch Unternehmens-interne Texte für Firmen wie Microsoft, Dell, IBM und HPE. Seine Leidenschaft für IT-Themen und das Schreiben spiegelt sich in seiner Arbeit wider, die er mit großer Begeisterung ausübt.

Artikel des Autors

Neo4j kann auf Linux-Servern installiert werden, aber auch auf Rechnern mit Unix, Mac OS X und Windows. (T. Joos)
Graphdatenbanken

Daten effizient modellieren mit Neo4j

Datenbanken wie Neo4j bieten die für die Modellierungsphase im Vergleich zu relationalen Datenbanken wesentlich mehr Möglichkeiten für die Verarbeitung komplexer, unstrukturierter Daten. Vernetzte Daten lassen sich mit Produkten wie Neo4j besser in Beziehung miteinander setzen und so später effizienter weiterverarbeiten.

Weiterlesen
Datapine BI hilft beim einfachen Erstellen von Berichten aus verschiedenen Datenquellen. (Bild: Datapine)
Datapine BI

Business Intelligence mit deutschem Datenschutz

Die BI-Software von Datapine wird als Software-as-a-Service angeboten. Der Vorteil dabei liegt auf der Hand: Unternehmen aller Größenordnungen können die Analysefunktionen schnell und einfach implementieren, da keinerlei eigene IT-Ressourcen notwendig sind. Die Cloud-Server stehen in Frankfurt und unterliegen dem deutschen Datenschutz.

Weiterlesen
Das Basho-Riak-Logo (Bild: Basho)
Open-Source-Datenbank fürs Internet der Dinge

Riak – die Big-Data-Datenbank

Mit der Open-Source-Datenbank Riak können Unternehmen NoSQL-, Zeitreihen- und Objekt-Speicher realisieren, vor allem im Zusammenspiel mit IoT-Szenarien (Internet of Things). Die Lösung arbeitet mit Apache Spark, Redis und Apache Solr zusammen. In Big-Data-Umgebungen und Hybrid-Clouds werden darüber hinaus ebenfalls leistungsstarke und skalierbare Datenbanken benötigt. Auch hier kann Riak interessant sein.

Weiterlesen
Nachdem CouchDB installiert wurde, können Entwickler über das Webinterface auf die Einstellungen zugreifen. (Bild: The Apache Software Foundation/T. Joos)
Apache CouchDB

Eine Datenbank für das Web

Mit der Open-Source-Datenbank CouchDB speichern Entwickler ihre Daten über JSON-Dokumente. Der Zugriff kann über einen Webbrowser mit HTTP erfolgen. Die gespeicherten Dokumente lassen sich mit JavaScript transformieren. Der Vorteil der Datenbanklösung ist, dass diese auch mit modernen Apps zusammenarbeiten kann und mobil funktioniert.

Weiterlesen
Atlas kann Metadaten mit anderen Tools und Prozessen in einer Big-Data-Umgebung mit Hadoop austauschen. Unternehmen erhalten dadurch plattformunabhängige Governance-Steuerelemente, um Compliance-Anforderungen optimal umsetzen zu können. (Bild: adrian_ilie825 – Fotolia.com)
Apache Atlas

So integrieren Sie Data Governance für Hadoop

Mit Apache Atlas können Unternehmen in Hadoop ein zentrales Auditing, eine Datenklassifizierung und Abstammungsfunktionen mit einer eigenen Richtlinien-Engine integrieren. Metadaten und die Speicherung von Audits spielen zusammen mit entsprechenden Richtlinien eine wichtige Rolle im Projekt, Data Governance steht also im Zentrum.

Weiterlesen
Microsoft Azure Machine Learning steht als Clouddienst in Microsoft Azure zur Verfügung. (Bild: T. Joos/Microsoft)
Microsoft Azure Machine Learning

Wachsende Datenmengen effizient analysieren

In Zeiten ständig wachsender Datenmengen, die analysiert werden müssen, spielt die Möglichkeit der effizienten Verwaltung dieser Daten eine wichtige Rolle – vor allem, wenn es um die Skalierbarkeit geht. Vorhersagen von Verkaufsergebnissen, Kaufempfehlungen im eigenen Online-Shop und Vieles mehr lassen sich mit Data Science durchführen. Microsoft stellt dazu den passenden Clouddienst zur Verfügung.

Weiterlesen
Power BI bietet die Möglichkeit, Daten aus der Cloud heraus zu analysieren und die Informationen auch mobil zu nutzen. (Bild: T. Joos/Microsoft)
Microsoft Power BI 2.0

Business Intelligence aus der Cloud

Mit Power BI bietet Microsoft eine BI-Lösung an, die an interne Server angebunden werden kann, aber auch Ressourcen in Microsoft Azure unterstützt. Zusammen mit der Cortana Analytics Suite und anderen Analysetools in Microsoft Azure bietet Power BI ein mächtiges Werkzeug zum Erstellen von effizienten Datenauswertungen. Für einige Einsatzbereiche steht die Lösung kostenlos zur Verfügung.

Weiterlesen
Grok 3

Was die KI von xAI technisch wirklich kann

Grok 3 steht derzeit kostenfrei für Nutzer von X zur Verfügung, allerdings nur vorübergehend. Elon Musk kündigt bereits an, dass der Zugriff später auf zahlende Abonnenten beschränkt werde. Schon jetzt unterscheidet xAI zwischen freien Nutzern, Premium+ und der neuen Stufe „SuperGrok“. Wer nicht zahlt, darf alle zwei Stunden zehn Textanfragen und zehn Bildgenerierungen absenden. Die Bildanalyse ist auf drei Durchgänge pro Tag beschränkt. Eine erweiterte Nutzung erfordert mindestens den Premium+-Zugang.

Weiterlesen
Auto-GPT und GPT4All

So lassen sich Aufgaben mit KI automatisieren

Mit Auto-GPT können Anwender KI-Aufgaben vollständig automatisieren. Dazu kann die kostenlose Open Source Software selbstständig Prompts erstellen und auch komplexe Aufgaben durch Stapelverarbeitung und Python-Skripte automatisch abwickeln. GPT4All ermöglicht wiederum den Betrieb einer eigenen KI ohne Internetanbindung.

Weiterlesen
Apache Beam kann als Programmiermodell für die verteilte Datenverarbeitung bezeichnet werden. Das Modell ist dazu in der Lage, über APIs Datentypen und Data Frames zu verarbeiten. (gemeinfrei)
Parallel Computing Framework

Das leistet Apache Beam

Apache Beam ermöglicht als Parallel Computing Framework das Verarbeiten von nahezu unbegrenzten Datenmengen. Die Open Source Software bietet über verschiedene SDKs das Definieren von Batch-Pipelines oder Pipelines für Streaming-Data-Processing und unterstützt Hadoop, Spark und andere Engines.

Weiterlesen
Amazon Web Services (AWS) bietet verwaltete Dienste im Pay-as-you-go-Modell. Es müssen also nur die Dienstleistungen bezahlt werden, die Unternehmen auch verbrauchen. (gemeinfrei)
Überblick

Datenanalysen mit AWS

AWS ist die Cloud-Infrastruktur mit dem größten Marktanteil. Das liegt unter anderem auch daran, dass es in der Cloudplattform umfassende Möglichkeiten zur Analyse von Daten gibt. Wir geben in diesem Beitrag einen Überblick.

Weiterlesen