Windows 上で動く高機能なタブ型 web browser。
大手町で開催中の NTT グループのイベント。
予約が必要だが、機会があれば行ってみたい。
* [computer] IT Text 音声認識システムの付属 CD-ROM のツールに関して
postprocess.pl と suuzi_shori.pl は書き直したいなと思う。
例えば前者は、茶筌の出力を直接受ける仮定をつけ、
もっとシンプルな記述にした方が便利だと思う。
品詞情報を作り出すためだけに、
わざわざ茶筌の辞書データを読み込むのは無駄だろう。
後者は意外に使われていない気もする。
大量のテキストから言語モデルを作るのであれば、
表記の揺れを吸収させるのは、基本的には必要だと思うのだけれど。