Apertium
機械翻訳のプラットフォーム。オープンソースのルール基準型
From Wikipedia, the free encyclopedia
Apertiumは、スペイン政府とカタルーニャ州政府がアリカンテ大学に資金援助して開発されている機械翻訳プラットフォーム。自由ソフトウェアであり、GNU General Public License でリリースされている。
|
| |
| 最新版 |
3.9.4
/ 2023年12月28日 |
|---|---|
| リポジトリ | |
| プログラミング 言語 | C++ |
| 対応OS | POSIX互換 |
| 対応言語 | 多言語 |
| 種別 | 機械翻訳 |
| ライセンス | GNU General Public License |
| 公式サイト | www.apertium.org |
もともとはOpenTradというプロジェクトの一環として開発され始めた複数の機械翻訳エンジンの1つであり、言語的に近い言語間での翻訳向けに設計されていた。その後、もっと離れた言語間の翻訳も扱うよう拡張されてきた。新たな言語を対象として加えるには、言語データ(辞書、ルールなど)を既定のXMLフォーマットで作成すればよい。
言語データ作成には、ビーゴ大学、カタルーニャ工科大学、ポンペウ・ファブラ大学が協力している。既に(安定版で)言語データが作成済みの言語としては、バスク語、ブルトン語、カタルーニャ語、英語、エスペラント、フランス語、ガリシア語、アイスランド語、オック語、ポルトガル語、ルーマニア語、スペイン語、ウェールズ語がある。今ではいくつかの企業もApertium開発に参加している(Prompsit Language Engineering、Imaxin Software、Eleka Ingeniaritza Linguistikoa など)。
Apertiumは「浅い」機械翻訳システムであり、有限状態トランスデューサを使って語彙の変換を行い、隠れマルコフモデルを使って品詞タグ付けや単語カテゴリの曖昧さの処理を行う。言語の組合せによっては(例えば、ブルトン語とフランス語)制約文法タグ付け器も使うことがある。
2009年の Google Summer of Code では9プロジェクトが採用された[1]。