«前の日記(2008.05.01 / Thursday) 最新 次の日記(2008.05.03 / Saturday)» 編集

Hena Hena Nikki

2003|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|05|06|07|08|09|10|11|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|04|05|06|07|08|09|10|11|12|
2011|01|02|03|04|05|06|07|08|10|11|12|
2012|01|02|03|04|05|06|07|08|10|12|
2013|01|02|04|06|

2008.05.02 / Friday [長年日記]

* [computer/update] PHP ver.5.2.6

動的な web page 作成に向いているスクリプト言語。 約半年ぶりの version up。

* [computer/update] Mozilla Thunderbird 2.0.0.14

multi plat-home な message user agent。

* [computer/update] VLGothic 20080429

M+ FONTS とさざなみフォントをミックスした後、更に改良した和文フォント。

* [computer] 英単語の読みテーブル

音声認識で使う言語モデルを作る際の形態素解析で、 英単語をちゃんと扱いたいと考えていて、 「英単語→カタカナ読み/発音」テーブルの基礎データになるものを探している。

ライセンスの確認を終えてないけど、とりあえず上記が候補になりそう。

「NAD のカタカナ語辞書」の文字コードは Shift_JISX0213 みたい? いじってる時、ちょっとはまった。

iconv -f SHIFT_JISX0213 -t UTF-8 < input.txt | tr '\r' '\n' > output.txt

「う"」が化けるなぁ…。


  • この日記には本日 名の方が訪問してくださっているようです。 また、昨日は 名の方が訪問してくださったようです。
  • この日記の更新情報の取得には antenna.lirs を利用するのがおすすめです。