Apache Beam

From Wikipedia, the free encyclopedia

Apache Beamは、ETLバッチおよびストリーム処理を含むデータ処理パイプライン英語版を定義・実行するためのオープンソースの統合プログラミングモデルである[2]。提供されているSDKの1つを使用してBeam Pipelinesと呼ばれるデータ処理パイプラインを定義し、Apache Flink英語版Apache Samza英語版Apache SparkGoogle Cloud Dataflow英語版などのBeamがサポートするRunner分散処理バックエンド)の1つを使用してパイプラインを実行する[3]

初版 2016年6月15日 (9年前) (2016-06-15)
最新版
2.63.0 / 2025年2月18日 (13か月前) (2025-02-18)[1]
概要 作者, 開発元 ...
Apache Beam
作者 Google
開発元 Apache Software Foundation
初版 2016年6月15日 (9年前) (2016-06-15)
最新版
2.63.0 / 2025年2月18日 (13か月前) (2025-02-18)[1]
リポジトリ Beam Repository
プログラミング
言語
Java, Python, Go
対応OS クロスプラットフォーム
ライセンス Apache License 2.0
公式サイト beam.apache.org
テンプレートを表示
閉じる

歴史

Apache Beam[3]は、Dataflowモデルの論文の実装の1つである[4]。Dataflowモデルは、Googleでの分散処理の抽象化、特にFlumeJava[5]とMillwheelに関する過去の成果に基づいて設計されている[6][7]

2014年、Googleは、DataflowモデルのオープンSDK実装と、Dataflowをローカル(非分散)およびGoogle Cloud Platformサービス上で実行する環境をリリースした。

2016年、GoogleはコアSDK、ローカルランナーの実装、およびGoogle Cloud Platformのデータサービスにアクセスするための一連のIO(データコネクタ)をApache SoftwareFoundationに寄贈した。他の企業やコミュニティのメンバーは、既存の分散実行プラットフォームのRunnerや、Beam Runnerを既存のデータベース、Key-Valueストア、メッセージシステムと統合するための新しいIOをコントリビュートしている。さらに、Beamモデルに加えて特定のドメインのニーズをサポートするための新しいDSLが提案されている[要出典]

関連項目

  • Apache Software Foundationプロジェクトの一覧英語版

出典

Related Articles

Wikiwand AI