動的な web page 作成に向いているスクリプト言語。 約半年ぶりの version up。
multi plat-home な message user agent。
M+ FONTS とさざなみフォントをミックスした後、更に改良した和文フォント。
音声認識で使う言語モデルを作る際の形態素解析で、 英単語をちゃんと扱いたいと考えていて、 「英単語→カタカナ読み/発音」テーブルの基礎データになるものを探している。
ライセンスの確認を終えてないけど、とりあえず上記が候補になりそう。
「NAD のカタカナ語辞書」の文字コードは Shift_JISX0213 みたい? いじってる時、ちょっとはまった。
iconv -f SHIFT_JISX0213 -t UTF-8 < input.txt | tr '\r' '\n' > output.txt
「う"」が化けるなぁ…。