オブジェクト指向の関数型プログラミング言語。
GNU プロジェクトの標準 C ライブラリ。
事前に新しめの GNU m4 をインストールしておくと良い。
$ wget -c http://ftp.gnu.org/gnu/autoconf/autoconf-2.67.tar.xz $ xz -cd autoconf-2.67.tar.xz | tar xvf - $ cd autoconf-2.67/ $ ./configure $ make && make check $ sudo make install
定番ネタ。 実施環境は iMac Late 2006 (Mac OS X 10.6, Core 2 Duo 2.0GHz, DDR2 667MHz 3GB)。
$ sed --version GNU sed 4.2.1版 [...] $ file `which sed` /usr/local/bin/sed: Mach-O 64-bit executable x86_64 $ ls -l 合計 102M -rw-r--r-- 1 shindoh staff 102M 2010-07-11 00:25 sample.txt.lzma $ lzma -cd sample.txt.lzma | wc -c 1356818519 $ lzma -cd sample.txt.lzma > /dev/null 13.476u 0.630s 0:14.35 98.2% 0+0k 0+1io 0pf+0w $ lzma -cd sample.txt.lzma | sed -r 's|[ \t]+([^ \t:]+):[^ \t]+| \1|g' > /dev/null 625.557u 10.268s 10:30.86 100.7% 0+0k 0+0io 0pf+0w $ lzma -cd sample.txt.lzma | env LC_CTYPE="C" sed -r 's|[ \t]+([^ \t:]+):[^ \t]+| \1|g' > /dev/null 465.192u 8.666s 7:50.56 100.6% 0+0k 0+1io 0pf+0w
ちなみに sample.txt.lzma は
「<s> とても:トテモ:56 簡単:カンタン:18 で:デ:74/55/4 、:、:79 玄米:ゲンマイ:2 ごはん:ゴハン:2 に:ニ:61 バッチリ:バッチリ:56 。:。:78 </s>
」
といった感じの形態素解析結果。
www.linux.or.jp の編集権が移ったことの影響か、JM の検索が出来なくなっている。 Google 使ってひっかけることもできるけど、やっぱり不便な印象が。
popen() でバイナリ・データを扱わないように修正したバイナリをアップロードした。 置き場所は前回と一緒。 ついでに xz, lzma, lzip 形式の入出力ファイルを扱えるようにしておいた。
ちゃんと追ってないから分からないけど、 どうも一回の処理で popen() を複数使おうとすると妙なエラーになるようだ。
仮想 x86 環境。
multi plat-home な message user agent。
Windows 上で動く高機能な DVD 系メディアのリッピング・ツール。
事前に iconv, gettext をインストールしておくと良い。
$ wget -c http://ftp.gnu.org/gnu/bison/bison-2.4.3.tar.bz2 $ bzip2 -cd bison-2.4.3.tar.bz2 | tar xvf - $ cd bison-2.4.3/ $ ./configure $ make && make check $ sudo make install
CFLAGS
はお好みで。
GNU Bison は更新されるのだけれど、一方 Flex の方はなかなか更新されない。
事前に iconv, gettext, ncurses を入れておくと良い。
$ wget -c http://ftp.gnu.org/gnu/nano/nano-2.2.5.tar.gz $ gzip -cd nano-2.2.5.tar.gz | tar xvf - $ cd nano-2.2.5/ $ ./configure --enable-extra --enable-color --enable-multibuffer --enable-nanorc --enable-utf8 $ make $ sudo make install
CFLAGS
などはお好みで。
形態素数約 1.3 億、文数約 5.7 百万、異なり形態素数約 43 万。
異なり形態素数のわりに形態素の総数が少ない。 後で実際に試してみる予定だが、恐らく 4-gram では品質が確保できないと思われる。
定期的に読みたくなる記事だな…。
ちなみに仮に「逃げ出すべきプロジェクト」が分かっていたとしても、逃げ出すことができるとは限らない。 もちろん、転職するという手段を用いる気があれば別だが。 いや、その状況は本人にとってデメリット以外の何ものでもないのは間違いないだろうから、転職を含めどんな手を選択しても不思議じゃない。 そう考えれば『〜する気があれば別』なんて表現はちょっと甘過ぎるか。
「逃げ出すべきプロジェクト」って書かれてるけど、本当は「プロジェクト」単位じゃないもっと抽象的な単位の気がする。
久々に読んだけど、まあ、ありがちかつ嫌な事実だな。 この文書自体は開発に関して述べたものだけど、基本的には見積もりの発生する全ての分野 (発生しない分野があるのか?) に言えることだと思う。
NASM を作り直した、x86, x86_64 対応のアセンブラ。
複数のプラットフォーム上で動く BitTorrent クライアント。
Windows 上で動く高機能な DVD 系メディアのリッピング・ツール。
Texinfo のソース・ファイルを HTML ファイルに変換するツール。
表記揺れや複合語の情報を付与した形態素解析辞書。 和布蕪用。
nokuno さんの blog 記事。 僕も実装する時間が欲しい…。
9/8 発売予定の新作。
Mac OS X 上で Linux や Windows を動作させる仮想化環境。
熟練により作業効率が高く向上する定番のテキスト・エディタ。
非常に有用で高機能な C++ ライブラリ群。
Apple 社が公開している multimedia のコンポーネント群。 メンテナンス・リリース。
object-oriented programming を意識して作られた interpreted scripting language。
object-oriented programming を意識して作られた interpreted scripting language。
事前に libreadline, zlib, bzip2 をインストールしておくと良い。
$ wget -c ftp://ftp.csx.cam.ac.uk/pub/software/programming/pcre/pcre-8.10.tar.bz2 $ bzip2 -cd pcre-8.10.tar.bz2 | tar xvf - $ cd pcre-8.10/ $ ./configure --enable-rebuild-chartables --enable-pcregrep-libz --enable-pcregrep-libbz2 --enable-pcretest-libreadline $ make && make check $ sudo make install
CFLAGS
などはお好みで。
事前に zlib をインストールしておくと良い。
$ wget -c http://downloads.sourceforge.net/project/freetype/freetype2/2.4.2/freetype-2.4.2.tar.bz2 $ bzip2 -cd freetype-2.4.2.tar.bz2 | tar xvf - $ cd freetype-2.4.2/ $ ./configure $ make $ sudo make install
CFLAGS
などはお好みで。
object-oriented programming を意識して作られた interpreted scripting language。
Windows 上で使用できる X Window Server。
非常に多くのフォーマットに対応したマルチ・プラットホームのメディア・プレーヤ。
Adobe 純正の PDF ビューワ。
Mac OS X の通常のアプリケーションで Anthy や PRIME を利用できるようにするツール。
UNIX 系 OS 上で動く Windows API の実装。 開発版。
分散型バージョン管理システム。
軽快・軽量な SQL データベース・エンジン。
Windows 上で動く高機能な DVD 系メディアのリッピング・ツール。
メモ。 けっこう大きいコーパスを使っている。
MMX や各 SSE, 3DNow! などをサポートした x86, x86_64 環境向けアセンブラ。
Emacsen にリモート・ファイル編集機能を提供するパッケージ。
Windows 上で動く高機能な DVD 系メディアのリッピング・ツール。
本質的なシンプルさを備えているスクリプト言語。 メンテナンス・リリース。
MMX や各 SSE, 3DNow! などをサポートした x86, x86_64 環境向けアセンブラ。
美しいペン習字風 font。
やっと正式版が出た。
さっそく試すつもりした。
相変わらずこれが無料とは信じられないくらいに素晴らしい。
重み付き有限状態トランスデューサの編集ツール。
Cocoa な Gecko 系 web browser。
非常に多くのフォーマットに対応したマルチ・プラットホームのメディア・プレーヤ。
CXXFLAGS
などはお好みで。
$ wget -c http://mohri-lt.cs.nyu.edu/twiki/pub/FST/FstDownload/openfst-1.2.1.tar.gz $ gzip -cd openfst-1.2.1.tar.gz | tar xvf - $ cd openfst-1.2.1/ $ ./configure --enable-static --enable-bin $ make && make check $ sudo make install
事前に readline, ncurses をインストールしておくと良い。
$ wget -c http://www.sqlite.org/sqlite-amalgamation-3.7.2.tar.gz $ gzip -cd sqlite-amalgamation-3.7.2.tar.gz | tar xvf - $ cd sqlite-3.7.2/ $ ./configure $ make && make check $ sudo make install
CFLAGS
等はお好みで。
事前に gettext, iconv をインストールしておくと良い。
$ wget -c http://ftp.gnu.org/gnu/sharutils/sharutils-4.10.tar.bz2 $ bzip2 -cd sharutils-4.10.tar.bz2 | tar xvf - $ cd sharutils-4.10/ $ ./configure $ make && make check $ sudo make install
CFLAGS
はお好みで。
Emacsen 上での高速で効率的な日本語入力を目指す環境。