軽快な pager 兼 web browser。 約 1 ヶ月ぶりの version up。
伝説のゲーム NetHack の日本語版。 約 2 ヶ月ぶりの version up。
w3m の表示とインターフェイスの部分を emacsen 上で動かす elisp な tool。 約 9 月ぶりの version up。
レンダリングに Gecko エンジンを利用した web browser。 もちろん 1 ヶ月ぶりの version up。
MacOS X の通常のアプリケーションで Anthy や PRIME を利用できるようにするツール。 約 10 日ぶりの version up。
某機能の設計と某研修の準備をダラダラと。 このプロジェクトに参加させられてからずっと、休日出勤させられまくってるなぁ…。 :(
明日は某研修で時間が潰れるだろうから、某機能の実装を完了させるの、ちょっと厳しいかも。
とりあえず、昼過ぎまでは大阪にいるはずなので、どうにか Zinnia さんとお会いできそう。 で、適当な時間になったら新幹線で静岡へ戻る予定。 と言うわけで、宜しくお願いします。 :D
5/6 に乗るアーバンライナー・ネクスト用にチケット購入しないと。 明日は残業前に金券ショップ行こう。
伝説のゲーム NetHack の日本語版。 約 3 ヶ月半ぶりの version up。
シンプルなメモリ最適化ユーティリティ for Windows。
6/22 発売予定のカバー集。
オレンジニュースから。 後で読もう。 :)
上田新聞 blog 版から。 「G5 と他 MPU の比較なんて、最近の人にとってはどうでもいいことなんじゃないかなぁ」なんて改めて思ったりして。 とりあえず、掲載されている内容は今も昔も「Apple 最強!」です。
レンダリングに Gecko エンジンを利用した web browser。 1 ヶ月ぶりの version up。
Windows な高機能 IRC client。 約 1 ヶ月ぶりの version up。
新しくやることになった某研究開発の下準備とか。 どうにか京都から離れずに済んだけど、これって良いことだったのかどうか。 名古屋 or 豊橋の方が集中し易い環境を得られた可能性が高いし。
今回の仕事で使うために MacBook Pro を発注。 「Mac OS X が必要」というより、「無難な UNIX 系 OS 環境が欲しかった」だけ。 …初 Intel Mac は仕事用か。 orz
NAIST 松本研究室関係の自然言語処理ツール群が Mac OS X で普通に組めるので、実はけっこう助かってる (安心している)。 同研究室に在籍されている 小町さんも Mac OS X を使ってるみたいだし、 Mac OS X って実はこの分野でも標準的な存在として考えて良いものなのかもしれない。
Apple Developer Connection から落としてきて入れただけ。 まだ何も作業してない。
std::string
のインスタンスの文字列値を見るのに、インスタンスの階層を少し辿る必要が発生した?
(単にサマリ表示・データフォーマッタがおかしくなってるだけだと思うけど…?)最近は大してものを買ってない。 特に DVD。 …京都に来てから購入枚数が確実に減ったな。
書籍は以前から欲しかったものを注文した感じ。
CD はあるお店のキャンペーンに乗じて思わず購入 (+20bit K2 なので買い直し?)。
「ここまでやるか!」と思わずにはいられない sl の一つ。 ハッキリ言ってやり過ぎ。
Fink な人は fink install sl すれば入る。
UNIX 系 OS 上で動く Windows API の実装。 約 2 週間ぶりの version up。
複数の文字コードに対応した C の正規表現ライブラリ (BSD ライセンス)。
レンダリングに Gecko エンジンを利用した web browser。
CFLAGS
はお好みで。
$ wget -c http://www.sqlite.org/sqlite-3.3.17.tar.gz $ zcat sqlite-3.3.17.tar.gz | tar xvf - $ cd sqlite-3.3.17/ $ ./configure --enable-threadsafe $ make && make test $ sudo make install
libreadline は最初から入っているもの (実体は代替の libedit) を 使う方が無難のようだ。
ある先生から博士課程の子の新卒採用について相談された。 本人を少し知っていることから、自分の所属企業に来てもらうことに躊躇いがある。 同僚のある方がおっしゃっていた通り最近の雰囲気の悪さは本当に酷いので、 真面目なこの子を迎えるのに不安が多い…。 さてさて、どうしたものか…。 とりあえず信頼できる方々に相談すべきか…。
もちろん要 Ruby。
CFLAGS
は ruby 組み立て時のものが自動的に適用されるようだ。
$ wget -c http://globalbase.dl.sourceforge.jp/rskkserv/15241/rskkserv-2.95.4.tar.gz $ zcat rskkserv-2.95.4.tar.gz | tar xvf - $ cd rskkserv-2.95.4/ $ ./configure $ make $ sudo make install
ここで doc/rskkserv.conf.sample を環境に合わせてカスタマイズし、適当な場所にコピー。 その後、launchd に登録して (Lingon を使うと楽) 作業完了。
サーバー情報が付加される様に更新してみた。 これはもちろん意味のある情報ではない。 :-p
AquaSKK のサーバー機能などに合わせて、いくつか修正を加えた。 もう少し様子を見ないと危険か。
Filesystem in USErspace の Mac OS X における実装。
RealMedia 形式のメディア・ファイルを再生するライブラリなどの詰合せ for Windows。
ChaSen の出力の数詞列に適当な発音情報をふってから ChaWan に入力すれば、 音声認識の N-gram 言語モデルで使う分には問題ない出力を得られるようだ。
というわけで、それを実現する chashaku.rb という Ruby スクリプトを書いてみた。 既に自然言語処理方面で茶杓があるので、これは仮の名前だ。 もう少し機能を追加したら適当な名前をつけて公開しよう。
ちなみに僕が自宅で言語モデルを作るときは、 以下の様 (実際には chashaku.rb が入る) なシェル・スクリプトを使って形態素解析させている。
#! /usr/bin/env sh
nkf -e -Lu \ | chasen -C -F "%m\t%a0\t%M\t%h/%t/%f\n" \ | chawan -c \ | postprocess -c \ | iconv -f EUC-JP -t UTF-8 \ | sed -r 's|^([^\t]+)\t([^\t]*)\t[^\t]*\t([^\t]+)$|\1:\2:\3|' \ | sed -r 's|(\W[0-9]+)\/0\/0$|\1|' \ | tr '\n' '\t' \ | sed -r 's|(\t*EOS)+\t*|\n|g' \ | sed -r 's|^(.+)$|<s>\t\1\t</s>|'
これだと各形態素の表記は 「私:{ワタシ/ワタクシ}:14」や「行く:イク:47/9/1」の様になる。
必要に応じて Makefile の CFLAGS
を書き換えること。
$ wget -c http://www.bzip.org/1.0.5/bzip2-1.0.5.tar.gz $ zcat bzip2-1.0.5.tar.gz | tar xvf - $ cd bzip2-1.0.5/ $ wget -c http://quruli.ivory.ne.jp/download/bzip2-1.0.5.diff.gz $ zcat bzip2-1.0.5.diff.gz | patch -p1 $ make $ sudo make install
1.0.3 の時のパッチを書き直しただけだけど、とりあえず問題なく動いてるようだ。
やっと半分くらい読み終えた。 同じ作者の 夜は短し歩けよ乙女を 面白いと感じた人は読むべきだと思う。 学生時代を京都で過ごした人は特に楽しめるだろう。
意外なことに閲覧した方がけっこういたので、 もうちょっといじって置き直した (oda_tex.pdf)。 変更点は以下。
teTeX 3.0 と ptetex 20080616 の組み合わせだと、
txfonts がちょっと古いことに気が付いた。
とりあえず更新するためのファイル群を用意した。
伸長して適当に ${teTeX}/share/texmf-dist
を上書きするだけ。
最近 Mac OS X 上で TeX 環境をいろいろいじっていたけど、 最新の環境を追いたければやはり角藤先生の Windows 用パッケージ群がいちばん無難だという結論に落ち着いた (TeX のためだけに Windows を使うのは嫌だけど、TeX Live はなぁ…)。
6/10 発売予定の新作。 けっこう久々か。
企業科学/システムズ・マネジメント・コースのオープンキャンパスが、 6/13 (Sat) 13:30〜17:00 に開催されるようだ。 詳細は東京キャンパス 社会人大学院 (夜間) の web site にて。
月・火と調子が悪かったのだが、最近の安定しない気温にやられたのか、どうも風邪をひいてしまったらしい。 ウイルス性の風邪ではなく (くしゃみが出るくらいで、かつ鼻水はほぼサラッとした水)、 身体を冷やしたことが原因らしく、今日ずっと暖かくして寝てたらかなり回復した。
今更になってしまったが、自然/音声言語処理ツールや TeX を満足のいく形でインストールし終えた (最適化をかけた Mach-O/x86_64 バイナリを組み上げた)。 例外は南瓜で、これだけがまだうまく動かない。 簡単な文章を入力するだけで、「Segmentation fault」と出て死んでしまう。 make check は問題なく通るだけに、スッキリしないが…。
Debian GNU/Linux ベースのインストールが容易なディストリビューション。
ツッコミ機能やプラグイン機能が楽しい Ruby による web log 環境。
前回の更新で追加した機能はそのままに、Boost C++ Libraryを最新版に入れ替えて組み立て直した (20110426_mitlm.0.4.tar.xz)。
事前に gettext, iconv, GMP を入れておくと良い。
$ wget -c http://ftp.gnu.org/gnu/coreutils/coreutils-8.12.tar.gz $ gzip -cd coreutils-8.12.tar.gz | tar xvf - $ cd coreutils-8.12/ $ ./configure --disable-assert $ make && make check $ sudo make install
CFLAGS
などはお好みで。
やはり make check でコケる。
分散型バージョン管理システム。
事前に GNU bison, FLEX をインストールしておくと良い。
$ wget -c http://people.csail.mit.edu/ilh/fst/libfst-1.4.0.zip $ unzip libfst-1.4.0.zip $ cd libfst-1.4.0/ $ autoreconf -fvi $ mkdir work $ cd work $ ../configure $ make $ sudo make install
CXXFLAGS
などはお好みで。
事前に gettext, iconv, libidn, zlib, libssh2 あたりを入れておくと良い。
$ wget -c http://curl.haxx.se/download/curl-7.21.6.tar.bz2 $ bzip2 -cd curl-7.21.6.tar.bz2 | tar xvf - $ cd curl-7.21.6/ $ ./configure --with-libssh2 --enable-ldaps --with-gssapi $ make && make check $ sudo make install
CFLAGS
などはお好みで。
Mac OS X上で動作するWindowsリモート・デスクトップ・クライアント。