«前の日記(2010.05.24 / Monday) 最新 次の日記(2010.05.29 / Saturday)» 編集

Hena Hena Nikki

2003|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|10|11|12|
2012|01|02|03|04|05|06|07|08|10|12|
2013|01|02|04|06|

2010.05.26 / Wednesday [長年日記]

* [computer] wikipedia ダンプから Ngram と IDF データを作りました

小町さんの blog 記事経由で。 メモ。

以前もこの日記で書いたはずだが、 Wikipedia から生成した back-off N-gram の Julius 用バイナリが 公開されている

* [computer] グルメ&レシピ・コーパス@May, 2010

以前、少し書いた料理関係の blog データ、 5 月の時点で形態素数約 2.2 億、文数約 960 万になった。 未解析のデータがまだかなりあるので、作業に着手できたら更に数割程度は増えるはず。

以下、参考として、上記 Wikipedia の back-off N-gram のサイトから引用。

コーパス形態素数
Wikipedia (2008年11月時点)約 1.6 億
毎日新聞 (1991〜2002年)約 3.4 億
Julius ディクテーション・キット付属言語モデルの学習コーパス約 2.3 億

料理という単一のテーマでこの規模まで集めたら、けっこういろいろ出来そうな気がする (というか、遊びで試したことに限定すれば、それなりに面白いことが出来ている)。

* [computer/update] VMware Fusion ver.3.1

Mac OS X 上で Linux や Windows を動作させる仮想化環境。

* [computer] Darwin Streaming Server の IP アドレス設定について

設定ファイル /Library/QuickTimeStreaming/Config/streamingserver.xml 中の bind_ip_addr の箇所を 0 (デフォルト値) にしておくと、 Darwin Streaming Server が自ホストの IP アドレスを自動で判別してくれるのだが、 これが誤った値になってしまうことがあり、結果としてうまくムービー配信できなくなることがある。 この箇所を 192.168.0.1 のように IP アドレスを直接指定することで正確な値にでき、 問題なくムービー配信できるようになるみたいだ…が、こんな罠を用意しないで欲しい。

* [computer/update] MacUIM ver.0.6.8-1

Mac OS X の通常のアプリケーションで Anthy や PRIME を利用できるようにするツール。


  • この日記には本日 名の方が訪問してくださっているようです。 また、昨日は 名の方が訪問してくださったようです。
  • この日記の更新情報の取得には antenna.lirs を利用するのがおすすめです。