日本語機能表現辞書つつじの「XML→CSV」変換スクリプト xml2list.rb を公開しました。
$ wget -c http://quruli.ivory.ne.jp/download/20110408_tsutsuji.tar.gz $ gzip -cd 20110408_tsutsuji.tar.gz | tar xvf - $ cd 20110408_tsutsuji $ make
上記の操作で L*.list (CSV ファイル) が生成されます。 xml2list.rb 単体で動かす場合は以下の通りです。
$ ruby -Ku xml2list.rb [options] < tsutsuji1.1.xml | iconv -f 'UTF-8' -t 'ECU-JP' > output.csv
出力の文字コードが UTF-8
である以外は、つつじ付属の xml2list.perl と同じ挙動です。
違いはインタプリタの非標準モジュールを使用しているか否か
(xml2list.rb は普通にインストールした Ruby 単体で動く) です。
$ wget -c http://home.hiroshima-u.ac.jp/nyoho/slMacOSX.tar.gz $ gzip -cd slMacOSX.tar.gz | tar xvf - $ cd slMacOSX $ wget -c http://quruli.ivory.ne.jp/download/slMacOSX.diff.gz $ gzip -cd slMacOSX.diff.gz | patch -p1 $ make $ sudo mkdir -p /usr/local/bin $ sudo cp sl /usr/local/bin/