Apertium
From Wikipedia, the free encyclopedia
|
| |
| 最新版 |
3.9.4
/ 2023年12月28日 |
|---|---|
| リポジトリ | |
| プログラミング 言語 | C++ |
| 対応OS | POSIX互換 |
| 対応言語 | 多言語 |
| 種別 | 機械翻訳 |
| ライセンス | GNU General Public License |
| 公式サイト | www.apertium.org |
Apertiumは、スペイン政府とカタルーニャ州政府がアリカンテ大学に資金援助して開発されている機械翻訳プラットフォーム。自由ソフトウェアであり、GNU General Public License でリリースされている。
もともとはOpenTradというプロジェクトの一環として開発され始めた複数の機械翻訳エンジンの1つであり、言語的に近い言語間での翻訳向けに設計されていた。その後、もっと離れた言語間の翻訳も扱うよう拡張されてきた。新たな言語を対象として加えるには、言語データ(辞書、ルールなど)を既定のXMLフォーマットで作成すればよい。
言語データ作成には、ビーゴ大学、カタルーニャ工科大学、ポンペウ・ファブラ大学が協力している。既に(安定版で)言語データが作成済みの言語としては、バスク語、ブルトン語、カタルーニャ語、英語、エスペラント、フランス語、ガリシア語、アイスランド語、オック語、ポルトガル語、ルーマニア語、スペイン語、ウェールズ語がある。今ではいくつかの企業もApertium開発に参加している(Prompsit Language Engineering、Imaxin Software、Eleka Ingeniaritza Linguistikoa など)。
Apertiumは「浅い」機械翻訳システムであり、有限状態トランスデューサを使って語彙の変換を行い、隠れマルコフモデルを使って品詞タグ付けや単語カテゴリの曖昧さの処理を行う。言語の組合せによっては(例えば、ブルトン語とフランス語)制約文法タグ付け器も使うことがある。
2009年の Google Summer of Code では9プロジェクトが採用された[1]。
参考文献
- Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86
- Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.