Apache ORC
formato de almacenamiento de datos orientado a columnas
From Wikipedia, the free encyclopedia
Apache ORC (Optimized Row Columnar) es un formato de almacenamiento de datos orientado a columnas, gratuito y de código abierto del ecosistema Apache Hadoop. Es similar a los otros formatos de archivo de almacenamiento en columnas disponibles en el ecosistema de Hadoop, como RCFile y Parquet. Es compatible con la mayoría de los marcos de procesamiento de datos en el entorno Hadoop.
Lanzamiento inicial
12 de mayo de 2015
| Apache ORC | ||
|---|---|---|
|
| ||
| Información general | ||
| Tipo de programa | Sistema de archivos distribuido | |
| Desarrollador | Apache Software Foundation | |
| Lanzamiento inicial | 12 de mayo de 2015 | |
| Licencia | Apache License 2.0 | |
| Estado actual | Activo | |
| Idiomas | inglés | |
| Información técnica | ||
| Plataformas admitidas | Java | |
| Versiones | ||
| Última versión estable | 2.1.010 de enero de 2025 | |
| Enlaces | ||
En febrero de 2013, el formato de archivo Optimized Row Columnar (ORC) fue anunciado por Hortonworks en colaboración con Facebook.[1] Un mes después, se anunció el formato Apache Parquet, desarrollado por Cloudera y Twitter.[2]
Véase también
Portal:Software libre. Contenido relacionado con Software libre.- Apache Hive
- Pig (herramienta de programación)
- Apache Spark