Apache Arrow

Informations
Développé par	Wes McKinney, Antoine Pitrou (d), Sutou Kouhei (d), Matt Topol (d) et Dremio (d)
Dernière version	23.0.1 (16 février 2026)
Dépôt	github.com/apache/arrow
Licence	Apache License 2.0
Site web	arrow.apache.org

Développé par Wes McKinney, Antoine Pitrou (d), Sutou Kouhei (d), Matt Topol (d) et Dremio (d)

Dernière version 23.0.1 (16 février 2026)^[1]

Dépôt github.com/apache/arrow

Licence Apache License 2.0

Apache Arrow est un framework logiciel indépendant du langage, conçu pour le développement d'applications d'analyse de données traitant des données colonnaires. Il utilise un format de mémoire standardisé, orienté colonnes, capable de représenter des données plates et hiérarchiques pour des opérations analytiques efficaces sur les processeurs et cartes graphiques modernes^[2]^,^[3]^,^[4]^,^[5]^,^[6]. Ceci réduit, voire élimine, les facteurs limitant la faisabilité du traitement de grands ensembles de données, tels que le coût, la volatilité ou les contraintes physiques de la mémoire vive dynamique.

[1]

[2]

[3]

[4]

[5]

[6]

Apache Arrow

Applications

Comparaison avec Apache Parquet et ORC

Gouvernance

Références

Liens externes

Voir aussi

Related Articles

Related Articles

Apache Arrow: Lining Up The Ducks In A Row... Or Column

Apache Arrow: The little data accelerator that could

Apache Arrow aims to speed access to big data

Big data gets a new open-source project, Apache Arrow: It offers performance improvements of more than 100x on analytical workloads, the foundation says.