Senna
From Wikipedia, the free encyclopedia
概要
特徴
- 高速なインデックスの更新
- 高精度な検索
- 単語ベースのインデックスを作成することにより、単語境界と一致する文書を優先的に検索する。よって、適合率の高い検索を行うことができる。適合率の高い検索とは、ノイズの少ない検索のことを指す。
- また、転置インデックスのキーとして、部分一致が可能な単語表を採用している。よって、単語境界と一致しない文書も検索することができる。よって、再現率の高い検索を行うことができる。再現率の高い検索とは、漏れの少ない検索のことを指す。
- 組み込み型ライブラリ
- Sennaは単体では機能しない、ライブラリ形式として提供される。
- MySQLにパッチを当てることによって、MySQLの全文検索機能でSennaを利用することが可能となる。MySQLの全文検索機能は、バージョン5.1までは日本語に対応していないが、Sennaを利用することによって、高速な日本語検索が可能となる。
- PostgreSQLも、Ludiaもしくはtextsearch_sennaを利用することにより、Sennaによる全文検索が可能となる。
バインディング
利用されているアプリケーション
- MySQL
- Tritonnを用いて全文検索を行うことができる。
- PostgreSQL
- Ludia: NTTデータが開発したPostgreSQLの組み込み全文検索。LGPLに沿ってソースコードが公開されている。
- textsearch_senna: PostgreSQL 8.3 以降にも対応した組み込み全文検索。
利用されているWebサービス
以下のWebサービスにおいて、Sennaが利用されている。