w3m の表示とインターフェイスの部分を emacsen 上で動かす elisp な tool。 約 1 ヶ月ぶりの version up。
Windows な application を emacsen ライクな使い勝手にする tool。 約 1 週間ぶりの version up。
無料で使える virus 対策 tool for Windows。
とりあえず、一番簡単そうな方法で実装してみた。 …まあ、こう言っては何だけど、もっとちゃんとした方法で作るべきみたいだね。
/** * @file prime.hpp * @brief テーブルを利用した素数判定クラス */
#ifndef _PRIME_HPP_ #define _PRIME_HPP_
// ヘッダ・ファイル #include <vector> #include <cmath>
/** * @brief テーブルを利用した素数判定クラス * @note UINT_TYPE には (unsigned 系の) 整数型を適用すること。 */ template<typename UINT_TYPE> class PrimeChecker { // 型 private:
typedef std::vector<UINT_TYPE> TABLE_TYPE; /// テーブルの型 typedef typename TABLE_TYPE::size_type SIZE_TYPE; /// テーブルの幅の型
// インスタンス・フィールド private:
TABLE_TYPE primes_; /// 奇数の素数によるテーブル UINT_TYPE next_check_; /// 素数テーブル追加探索をまだしてない最小奇数
// インスタンス・メソッド public:
/** * @brief デフォルト・コンストラクタ * @note 最小のテーブル {3} により構成される。 */ inline PrimeChecker(void) : primes_(1, 3), next_check_(5) { ; }
/** * @brief 引数 number 以下の全ての素数を含むようにテーブルを拡張 * @param number [in] テーブルを拡張する際の素数の上限 * @return テーブルに格納されてる最大の素数 * @note 引数 number が既存のテーブルの最大素数より小さい場合、 * 何も起こらない。 */ inline void extendTable(const UINT_TYPE number) { UINT_TYPE sqrt_target; SIZE_TYPE i; bool divisible; UINT_TYPE target(next_check_); while (target <= number) { sqrt_target = std::sqrt(target); divisible = false; for (i = 0; primes_[i] <= sqrt_target; ++i) { if (target % primes_[i] == 0) { divisible = true; break; } } if (!divisible) { primes_.push_back(target); } target += 2; } next_check_ = target; }
/** * @brief テーブルを構築できるコンストラクタ * @param number [in] テーブルを拡張する際の素数の上限 */ inline PrimeChecker(const UINT_TYPE number) : primes_(1, 3), next_check_(5) { extendTable(number); }
/** * @brief 素数か否かのチェック * @param target [in] チェック対象の数 * @return * - true: 引数 target は素数 * - false: 引数 target は合成数か、1 以下の数 */ inline bool checkPrime(const UINT_TYPE target) { if (target % 2 == 0) return target == 2; if (target < 2) return false; SIZE_TYPE i(0); SIZE_TYPE size = primes_.size(); while (i < size) { if (target % primes_[i] == 0) { return target == primes_[i]; } ++i; } UINT_TYPE divisor(next_check_); const UINT_TYPE sqrt_target = std::sqrt(target); while (divisor <= sqrt_target) { for (i = 0; i < size; ++i) { if (divisor % primes_[i] == 0) break; } if (i >= size) { primes_.push_back(divisor); ++size; if (target % divisor == 0) { next_check_ = divisor + 2; return false; } } divisor += 2; } next_check_ = divisor; return true; } };
#endif // _PRIME_HPP_
ついでにこのクラスを試用するためのコマンド。
/** * @file main.cpp * @brief 素数の個数を算出するコマンド */
// ヘッダ・ファイル #include <iostream> #include <cctype> #include "prime.hpp"
// 名前の解決 using namespace std;
/** * @brief 使用方法の表示 * @param command [in] コマンド名 */ void PrintUsage(const char* const command) { cerr << "Usage: " << command << " [integer (>1)]" << endl; }
/** * @brief 素数の個数を算出するコマンド */ int main(int arg_count, char** arg_strings) { // 引数のチェック int max_value(10000000); if (arg_count > 2) { PrintUsage(arg_strings[0]); return -1; } else if (arg_count == 2) { const char* arg_string = arg_strings[1]; while (*arg_string != '\0') { if (isdigit(*arg_string) == 0) { PrintUsage(arg_strings[0]); return -2; } ++arg_string; } max_value = atoi(arg_strings[1]); if (max_value <= 1) { PrintUsage(arg_strings[0]); return -3; } }
// 計算開始の出力 clog << "Calculating..." << endl;
// 素数チェッカーの準備 PrimeChecker<int> pchecker;
// 素数のチェック size_t number_of_results(0); int i(1); int largest_prime(2); do { ++i; if (pchecker.checkPrime(i)) { ++number_of_results; largest_prime = i; } if (i % 10000000 == 0) { clog << "> " << number_of_results << " primes exist... (" << i << '/' << max_value << ')' << endl; } } while (i < max_value);
// 結果の出力 clog << number_of_results << " primes exist in {1, ..., " << max_value << "}.\n" << largest_prime << " is largest prime in {1, ..., " << max_value << "}." << endl;
return 0; }
残念ながら、「動いてるかな?」程度の成果物。
$ g++ -Wall -O3 main.cpp -o primes $ time ./primes 2147483647 [...] 105097565 primes exist in {1, ..., 2147483647}. 2147483647 is largest prime in {1, ..., 2147483647}. 6709.182u 9.502s 1:52:02.18 99.9% 0+0k 0+2io 0pf+0w
この結果で当ってるのかな?
少しいじってみた。
PrimeChecker::checkPrime()
で算出した数値の再利用は実装してない。
もちろん、テスト用と位置付けてる main()
の方で工夫する気はない。
$ g++ -Wall -O3 main.cpp -o primes $ time ./primes 2147483647 [...] 105097565 primes exist in {1, ..., 2147483647}. 2147483647 is largest prime in {1, ..., 2147483647}. 6597.111u 12.122s 1:50:23.99 99.7% 0+0k 0+0io 0pf+0w
10/13 発売予定の新作。 けっこう久々だったかな。
Mac で Mac OS X と Windows の dual boot を実現するためのツール。 所謂人柱版。
本質的なシンプルさを備えているスクリプト言語。 所謂人柱版。
複数の文字コードに対応した C の正規表現ライブラリ (BSD ライセンス)。 約 2 週間ぶりの version up。
PGP を置き換える完全かつフリーなソフトウェア。 2.0 系としては約 1 ヶ月ぶりの version up。
複数の文字コードに対応した C の正規表現ライブラリ (BSD ライセンス)。 メンテナンス・リリース。
開発者向けに font-lock のキーワードを追加する elisp。 約 2 ヶ月ぶりの version up。
さすがにそろそろ ruby-mode への本格対応をさせたいなぁ。
SQLite の Ruby インターフェイス。 近い将来使う予定なのでメモ。
Mail Transport Agent。
Windows 上で動く高機能な DVD 系メディアのリッピング・ツール。
事前に iconv, gettext, ncurses を入れておくと良い。
$ wget -c ftp://ftp.vim.org/pub/vim/unix/vim-7.2.tar.bz2 $ wget -c ftp://ftp.vim.org/pub/vim/extra/vim-7.2-extra.tar.gz $ wget -c ftp://ftp.vim.org/pub/vim/extra/vim-7.2-lang.tar.gz $ bzcat vim-7.2.tar.bz2 | tar xvf - $ zcat vim-7.2-extra.tar.gz | tar xvf - $ zcat vim-7.2-lang.tar.gz | tar xvf - $ ./configure --enable-multibyte --enable-gui=no --with-features=big $ make && make test $ sudo make install
CFLAGS
はお好みで。
まだ patch は出てない模様。
事前に iconv, gettext, ncurses を入れておくと吉。
$ wget -c http://ftp.gnu.org/gnu/nano/nano-2.1.4.tar.gz $ zcat nano-2.1.4.tar.gz | tar xvf - $ cd nano-2.1.4/ $ ./configure --enable-extra --enable-color --enable-multibuffer --enable-nanorc --enable-utf8 $ make $ sudo make install
CFLAGS
はお好みで。
音声認識用単語 N-gram 言語モデルの作成は、ちゃんと整形されている大量のコーパスがあれば比較的簡単。 もちろん、認識させたいテーマ (純粋な主題だけでなく、細かな表現なども含む) に合ったコーパスであることが必要。 問題はこれらの条件を満たさない時だろう。 やってみれば分かると思うが、想像以上に面倒なことになると思う。
例えば、くだけた話し言葉を認識させたい時は web 上の文書を利用することが多いと思うが、 目的に合った文書を中心に大量に収集するのは意外に難しい (特に時間がなければ) し、 また、web 上の文書を形態素解析してモデリングすると予想以上に多種多様なゴミが混じりモデルに悪影響を及ぼす。 前者はテーマの近い既存コーパスを混ぜることである程度解決するが、テーマのズレはモデルにしっかりと残る (1)。 後者は形態素解析辞書の強化や文書整形処理の充実などでカバーできるが、けっこうな労力がかかる (2)。
結論としては、モデルの設計段階で考えるコーパスの収集方法が肝要だと思う。 (1) はコーパスの質と量で解決できる問題。 (2) は、どんなテーマでも多少は発生する、特に新規のテーマで回避することは不可能な問題 (コーパスの質である程度抑えることは可能だが…)。 こう考えれば当然だと思う。
熟練により作業効率が高く向上する定番のテキスト・エディタ。
非常に有用で高機能な C++ ライブラリ群。
Apple 社が公開している multimedia のコンポーネント群。 メンテナンス・リリース。