March 28, 2005

組み込み型全文検索エンジン Senna

[ Linux & UNIX ]
Sennaは組み込み型の全文検索エンジンです。DBMSやスクリプト言語処理系等に組み込むことによって、その全文検索機能を強化することができます。 n-gramインデックスと単語インデックスの特徴を兼ね備えた、高速かつ高精度な転置インデックスタイプのエンジンです。コンパクトな実装ですが、大規模な文書量と検索要求を処理できるように設計されています。

未来検索ブラジルによる、オープンソース(GPL2)の組み込み型検索エンジン Senna。まだサイトが立ち上がったばかりなのでドキュメントが揃っていないのですが、これは多言語アプリケーションにとって非常に期待の大きいソフトウェアです。

「DBMSやスクリプト言語処理系等への組み込み易さを重視しています。」とあるように、Namazu その他の検索エンジンとは異なり、単独で動作するエンジンではなく他のソフトウェアに組み込まれて動作する検索エンジンです。つまりは、Senna を使えば MySQL で日本語による全文検索が可能になるということです。

実は、はてなブックマークのブックマーク検索はこの Senna + MySQL で実現されています。実際の内部での検索クエリは MySQL の full text search と同じ SQL で実行できます。ソースを見ていただければ分かりますが、Senna の MySQL バインディングは、今のところシングルバイトのみの対応になっている組み込みの full text search にフックして、日本語の全文検索が可能となるような仕組みになっています。

つまりは、日本語で検索して任意のカラムでソートが可能ということです。これを待ち焦がれていた MySQL ユーザーは多いはず。検索インデックスの生成もインクリメンタルなので、データを追加してから検索インデックスが作成されるのに必要なオーバーヘッドも最小限で済みます。

いまのところ、Subversion 経由でソースが取得できるのですが、コンパイルして環境を整えるのにはちょっと一苦労すると思いますが、そのあたりは立ち上がったばかりのプロジェクトなので今後に期待です。

Posted by naoya at March 28, 2005 10:10 PM | トラックバック (3)  b_entry.gif
トラックバック [3件]
TrackBack URL: http://mt.bloghackers.net/mt/suck-tbspams.cgi/1522
組み込み型全文検索エンジン Senna
Excerpt: 組み込み型全文検索エンジン Senna : NDO::Weblog「DBMSやスクリプト言語処理系等への組み込み易さを重視しています。」とあるように、Namaz...
Weblog: ここギコ!
Tracked: April 1, 2005 06:04 AM
組み込み型全文検索エンジン Senna
Excerpt: 組み込み型全文検索エンジン Senna : NDO::Weblog「DBMSやスクリプト言語処理系等への組み込み易さを重視しています。」とあるように、Namaz...
Weblog: ここギコ!
Tracked: April 1, 2005 06:06 AM
Sennaメモ その壱 (with patch)
Excerpt: Senna 先月末より公開された、未来検索ブラジルの成果物。 N-gram&MeCabな全文検索システムです。 たとえば・・・ 組み込み型全文検索エンジン Se...
Weblog: YappoLogs
Tracked: April 4, 2005 10:11 PM
コメント [1件]

近頃、全文検索関連の動きが目立ってますね。
いろいろググッてたら家の近所にも開発してる人がいました^^;びっくら

[1] Posted by: kase at March 31, 2005 01:36 PM [返信]
コメントする









名前、アドレスを登録しますか?