Apache ORC ist ein ursprünglich für Apache Hive und Hadoop entwickeltes Dateiformat. Es ist selbstbeschreibend, typerkennend und spaltenbasiert. Mithilfe des Dateiformats lassen sich große Datenmengen mit hoher Performance lesen, schreiben, komprimieren und verarbeiten. Typischer Einsatzbereich des Optimized-Row-Columnar-Dateiformats ist das Big-Data-Umfeld. Es verhält sich wesentlich effizienter als Dateiformate wie CSV oder JSON und ist unter Apache License 2.0 frei verfügbar.
Weiterlesen