Pandas
From Wikipedia, the free encyclopedia
|
Pandas の公式ロゴマーク。 | |||
| 作者 | The PyData Development Team | ||
|---|---|---|---|
| 開発元 | コミュニティ開発 | ||
| 最終版 |
| ||
| 最新評価版 |
3.0[2]
/ 2025 | ||
| リポジトリ | |||
| プログラミング 言語 | Python | ||
| 対応OS | クロスプラットフォーム | ||
| サポート状況 | サポート中 | ||
| 種別 | 数値計算、統計 | ||
| ライセンス | BSDライセンス | ||
| 公式サイト |
pandas | ||
pandasは、プログラミング言語Pythonにおいて、データ解析・数値計算・統計・機械学習を支援する機能を提供する自由かつオープンソースソフトウェアのライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する[3]。PandasはBSDライセンスのもとで提供されている[4]。
- データ操作のための高速で効率的なデータフレーム (
DataFrame) オブジェクト - メモリ内のデータ構造とその他のフォーマットのデータ間で相互に読み書きするためのツール群。フォーマット例: CSV、テキストファイル、Excel、SQLデータベース、HDF5フォーマットなど
- データの調整および統合された欠損値処理
- データセットの柔軟な変形およびピボット
- ラベルに基づいたスライス、fancyインデクシング、巨大なデータセットのサブセット取得
- データセットに対するsplit-apply-combine操作を可能にするエンジンが提供するpowerful groupを使ったデータの集計および変換
- 高性能なデータセットのマージと結合
- 時系列データ: 日付範囲生成[5]、周波数変換、移動窓を用いた統計値や線形回帰、シフトと遅延、など
- パフォーマンスのための高度な最適化。重要なコードはCythonまたはC言語で実装されている[6]。
歴史
開発者であるWes McKinneyは、財務データを定量分析するための高性能で柔軟なツールを欲しており、AQR Capital Managementにて2008年にpandasの開発を開始した。 AQRを去る前に上司を説得し、ライブラリの一般公開が可能となった[7]。
別のAQR従業員であるChang Sheは、2012年からこのライブラリの2番目の主要コントリビューターとなった。同時期に、Pythonコミュニティでライブラリが普及し、さらに多くのコントリビューターがプロジェクトに加わることになった。
2015年、pandasはNumFOCUS(アメリカ合衆国における501(c)(3)非営利慈善団体)の財政出資プロジェクトとして署名した[8]。