Apache ORC

formato de almacenamiento de datos orientado a columnas From Wikipedia, the free encyclopedia

Apache ORC (Optimized Row Columnar) es un formato de almacenamiento de datos orientado a columnas, gratuito y de código abierto del ecosistema Apache Hadoop. Es similar a los otros formatos de archivo de almacenamiento en columnas disponibles en el ecosistema de Hadoop, como RCFile y Parquet. Es compatible con la mayoría de los marcos de procesamiento de datos en el entorno Hadoop.

Datos rápidos Información general, Tipo de programa ...
Apache ORC
Información general
Tipo de programa Sistema de archivos distribuido
Desarrollador Apache Software Foundation
Lanzamiento inicial 12 de mayo de 2015
Licencia Apache License 2.0
Estado actual Activo
Idiomas inglés
Información técnica
Plataformas admitidas Java
Versiones
Última versión estable 2.1.010 de enero de 2025
Enlaces
Cerrar

En febrero de 2013, el formato de archivo Optimized Row Columnar (ORC) fue anunciado por Hortonworks en colaboración con Facebook.[1] Un mes después, se anunció el formato Apache Parquet, desarrollado por Cloudera y Twitter.[2]

Véase también

Referencias

Related Articles

Wikiwand AI