|
|
|
|
chasen (形態素解析システム)を Ruby から使うには、yu-yan 作の gyokuro ライブラリが便利でずっと愛用していたのだが、最近の UTF-8 な chasen だと相性が悪いみたい。困ってても仕方ないので、とりあえず自作。chasen の受け皿として chawan と命名。
http://github.com/maiha/chawan
% gem install chawan |
|
parse で Chawan::Node (形態素解析の1要素) の配列が返る。
Chawan::Node
キー情報は直接文字列を利用しているので、値を直接比較して利用する。
|
|
Chawan では利用する形態素解析エンジンを Analyzer として定義している。これは、chasen だけでなく mecab を同じように利用するためである。このエンジン切り替え時に Analyzer を意識しないで済むように、Chawa::Node では利用するキー情報を定数化せずに直接文字列を利用している。
Analyzerの切り替えChawan の "analyzer" メソッドで現在のデフォルトの Analyzer が返る。また、引数に名前を与えることで利用する Analyzer を明示できる。ちなみに、Chawan.parse は "analyzer.parse" への delegate である。
Chawan と言いつつも、現在実装されてるのは MecabAnalyzer のみで、chasen はまだ利用できない。 |
| JRuby | Rails | Berryz | ℃-ute | エッグ | jQuery |
| 前 | 2010年 1月 |
次 | ||||
| 日 | 月 | 火 | 水 | 木 | 金 | 土 |
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 | ||||||