7. 組み込みライブラリ

7.1 instance_methods(true)は何を返しますか
7.2 randがいつも同じ乱数列を出しますが
7.3 0から51の中から重複のない5つをランダムに選ぶにはどうしますか
7.4 Fixnum、Symbol、true、nil、falseが即値だということですが、参照との違いは何ですか
7.5 nilとfalseはどう違いますか
7.6 ファイルを読み込んで書き換えても変化しません
7.7 同じ名前のファイルに書き戻したいのですが
7.8 ファイルに書き込んでそのファイルをコピーしましたが、全部コピーされません
7.9 パイプでlessに文字列を渡したのですが、表示されません
7.10 参照されないFileオブジェクトはどうなりますか
7.11 ファイルをcloseしないのは気持ちが悪いのですが
7.12 ファイルを時間の新しい順にソートしたいのですが
7.13 ファイル中の単語の出現頻度を調べたいのですが
7.14 条件に文字列を使ったとき、文字列が空("")の時にもtrueになります
7.15 英語文字列の配列を辞書順にソートしたいのですが
7.16 "abcd"[0]は、何を返しますか
7.17 タブをスペースに展開したいのですが
7.18 バックスラッシュをエスケープするにはどうしますか
7.19 subとsub!はどう違うのですか
7.20 \Zのマッチする場所はどこですか
7.21 範囲オブジェクトのコンストラクタ..と...はどう違いますか
7.22 関数ポインタはありますか
7.23 スレッドとプロセスのフォークはどう使い分けるのですか
7.24 Marshalの使い方を教えてください
7.25 例外処理はありますか
7.26 trapはどのように使いますか
7.27 ファイルの行数を数えたいのですが
7.28 配列からハッシュへの変換はどうすればできますか
7.29 文字列からArrayを作るのは %w(...) でできますが、同じように文字列からHashを作るにはどうすればよいですか
7.30 例外 NameError が捕捉できません
7.31 succがあってprevがないのはなぜですか

7.1 `instance_methods(true)`は何を返しますか

klass.instance_methods は、あるクラス(またはモジュール) klass で定義されたインスタンスメソッドだけを返しますが、 klass.instance_methods(true) は、スーパークラスから引き継いだものも含めてすべてのインスタンスメソッドを返します。 (ただし、public メソッドのみ)

private_instance_methods、 protected_instance_methods の引数の意味も同様です。

^*1

7.2 `rand`がいつも同じ乱数列を出しますが

ruby 1.4.2以前ではrandは、プログラムが実行される度に同じ乱数列を生成します。異なる乱数列を生成させるためには、srandで毎回異なる乱数の種を与えてやる必要があります。srandを引数なしで呼ぶと、その時の時間を種にしますので、異なる乱数列を生成させることができます。

7.3 0から51の中から重複のない5つをランダムに選ぶにはどうしますか

次のメソッドは、0からnまでの数の中からm個をランダムに選んだ配列を返します。

def sample(n, m)
  if m.zero?
    []
  else
    s = sample(n-1, m-1)
    t = rand(n+1)
    s.concat s.include?(t) ? [n] : [t]
  end
end

再帰形でなく書けば、次のとおりです。

def sample(n, m)
  s = []
  ((n-m)...n).each do |j|
    t = rand(j+2)
    s.concat s.include?(t) ? [j+1] : [t]
  end
  s
end

7.4 Fixnum、Symbol、`true`、`nil`、`false`が即値だということですが、参照との違いは何ですか

特異メソッドを定義できないという制限があります。 ^*2

また、同じ数を表わすFixnumのインスタンスは常に同じものになりますので、インスタンス変数を定義した場合には、それも同じものを示すことになります。

7.5 `nil`と`false`はどう違いますか

持っているメソッドの違いは、nil.methods - false.methodsと false.methods - nil.methodsを表示してください。

メソッドが真偽を返す時は、true、falseを、そうでない時は値かnilを返すようにすることが好まれます。

?のつくメソッドは、真偽を返すのが一般的ですが、そうでないものもあります(組み込みでは nonzero? のみ)。

7.6 ファイルを読み込んで書き換えても変化しません

open("example", "r+").readlines.each_with_index{|l, i|
  l[0,0] = (i+1).to_s + ": "}

とやっても、exampleに行番号がつきません。ファイルを書き換えているのではなく、readlinesで読み込んだ文字列を変えているだけです。ファイルに書き戻してやらなければいけません。

io = open("example", "r+")
ary = io.readlines
ary.each_with_index{|l, i| l[0,0] = (i+1).to_s + ": "}
io.rewind
io.print ary
io.close

この例の場合、ファイルサイズは増える方向なので問題ないのですがファイルサイズが小さくなるような変更に対しては

io.flush
io.truncate(io.pos)

を io.close の直前に実行する必要があります。

7.7 同じ名前のファイルに書き戻したいのですが

コマンドラインオプションの-i、もしくは、組み込み変数$-i に""を指定することにより、同じ名前のファイルに書き戻すことができます。

上の問題は、次のように書くことができます。

$ ruby -i -ne 'print "#$.: #$_"' example

元のファイルを残しておきたければ、-i.bakなどとしてください。

7.8 ファイルに書き込んでそのファイルをコピーしましたが、全部コピーされません

open('file', 'w').print "This is a file.\n"
system 'cp file copy'

とやったのでは、コピーする時にfileに内容がフラッシュされていません。きちんとcloseしてからコピーしましょう。

f = open('file', 'w')
f.print "This is a file.\n"
f.close
system "cp file copy"

7.9 パイプで`less`に文字列を渡したのですが、表示されません

f = open '|less', 'w'
f.print "abc\n"

とやっても、直ちに終了してしまい、lessで眺めることができません。 closeしてやると、そこでlessの終了を待ちます。

f = open '|less', 'w'
f.print "abc\n"
f.close

最初の行は、f = IO.popen 'less', 'w'としても同じ結果となります。

7.10 参照されないFileオブジェクトはどうなりますか

open("file").readというように参照されないFile オブジェクトは、次のガーベッジコレクションでcloseされて捨てられます。

7.11 ファイルを`close`しないのは気持ちが悪いのですが

参照されなくなったFileオブジェクトは、GCで自動的にクローズされますが、明示的にクローズするには、次の4つの構文から選んで下さい (コードの長さ順に並べました)。

File.foreach('filename') {|line| print line }

File.readlines('filename').each {|line| print line }

File.open('filename') {|f|
  f.each {|line| print line }
}

begin
  f = File.open('filename')
  f.each {|line| print line }
ensure
  f.close if f
end

7.12 ファイルを時間の新しい順にソートしたいのですが

Dir.glob("*").collect{|f| [File.mtime(f), f] }.
        sort{|a,b| b[0]<=>a[0] }.collect{|e| e[1] }

とすると、カレントディレクトリの"."、".."以外のファイルを更新時間の新しい順にソートした配列を返します。更新時間の古い順にソートするなら、sortの後ろのブロックはなしにしても、いいですね。

Dir.glob("*").sort{|a,b| File.mtime(b)<=>File.mtime(a)}

でもソートすることができますが、比較する度にファイルにアクセスして更新時間を調べますので、ソートするのに時間がかかります。

この問題を解決するもう一つの方法に個々のファイルの更新時間をキャッシュするオブジェクトを用意する方法があります。

cache = {}
def cache.mtime(x)
  self[x] ||= File.mtime(x)
end
Dir.glob("*").sort{|a,b| cache.mtime(b) <=> cache.mtime(a)}
cache = nil

また ruby 1.7 では前者の例を簡単に実行するためのメソッド Enumerable#sort_by が追加されています。

Dir.glob("*").sort_by {|f| File.mtime(f)}.reverse

7.13 ファイル中の単語の出現頻度を調べたいのですが

ハッシュのデフォルト値に0を指定して、次のようにすることができます。

freq = Hash.new(0)
open("file").read.scan(/\w+/){|w| freq[w] += 1}
freq.keys.sort.each {|k| print k, "--", freq[k], "\n"}

7.14 条件に文字列を使ったとき、文字列が空("")の時にも`true`になります

Rubyでは、nilとfalseだけが偽で、それ以外はすべて真になります。文字列が空かどうかを知るには、""と比較、empty?を使う、 lengthを0と比較するなどの方法があります。

7.15 英語文字列の配列を辞書順にソートしたいのですが

ary.collect{|f| [f.downcase, f]}.sort.collect{|e| e[1]}

とします。downcaseで等しくなった場合に、元の文字列で比較を行うのが tipsです。

7.16 `"abcd"[0]`は、何を返しますか

文字aのコード97(Fixnum)を返します。これが文字aと一致するかどうか調べるには、?aと比較します。

7.17 タブをスペースに展開したいのですが

以下のような定石があります。

# 非破壊的
def expand_tab( str )
  str.gsub(/([^\t]{8})|([^\t]*)\t/n) { [$+].pack("A8") }
end

# 破壊的
def expand_tab!( str )
  1 while str.sub!(/(^[^\t]*)\t(\t*)/) { $1 + ' ' * (8-$1.size%8+8*$2.size) }
end

# 破壊的 (2)
def expand_tab!( str )
  1 while str.sub!(/\t(\t*)/) {' ' * (8-$~.begin(0)%8+8*$1.size) }
end

7.18 バックスラッシュをエスケープするにはどうしますか

正規表現の場合は Regexp.quote('\\')でエスケープできます。

gsubを使う場合には、gsub(/\\/, '\\\\')では、置換文字列が構文解析で一度'\\'に変換され、実際に置き換えるときにもう一度'\'と解釈されるので、 gsub(/\\/, '\\\\\\')とする必要があります。\&がマッチ文字列をあらわすことを使えば、gsub(/\\/,'\&\&')と書けます。

gsub(/\\/){'\\\\'}とブロックを使う形にすれば、エスケープが1回しか解釈されませんので、求める結果が得られます。

7.19 `sub`と`sub!`はどう違うのですか

subの場合はレシーバの状態は変化しません。文字列のコピーが作られ、それに置換がほどこされて(置換が必要なければそのまま)返されます。

sub!ではレシーバそのものが変更されます。変更がない時には nilが返されます。

sub!のようにレシーバの状態を変化させるメソッドを破壊的メソッドと呼びます。Rubyでは同名のメソッドで破壊的なものとそうでないものがある場合、破壊的なメソッドには慣例的に!をつけます。

def foo(str)
  str = str.sub(/foo/, "baz")
end

obj = "foo"
foo(obj)
print obj
#=> "foo"

def foo(str)
  str = str.sub!(/foo/, "baz")
end

foo(obj)
print obj
#=> "baz"

sub!のように破壊的なメソッドは予期しない効果をもたらすことがあるので、使用する場合は十分注意してください。

7.20 \Zのマッチする場所はどこですか

\Zは、文字列の最後の文字が\nでない時は文字列の末尾に、 \nのときはこの改行の前にマッチします。

\n に関らず、文字列の最後にマッチさせたい場合は \z を使います。

7.21 範囲オブジェクトのコンストラクタ`..`と`...`はどう違いますか

..は終端を含み、...は終端を含みません。

7.22 関数ポインタはありますか

Proc.new、proc、lambdaでProcオブジェクトを作れば、関数ポインタのような働きをさせることができます。

また、MethodオブジェクトやUnboundMethodオブジェクトも関数ポインタに近いものです。

7.23 スレッドとプロセスのフォークはどう使い分けるのですか

スレッドとプロセスのフォークにはそれぞれ以下のような特徴があります。

違うプロセスはメモリ空間を共有しない
どちらも切り替わるタイミングは不定
RubyスレッドはどんなOSでも動く
Rubyスレッドは、なんらかの理由でブロックすると全体が止まる (non preemptive)
Rubyスレッドはスラッシング (※) が起きない

※ スラッシングとは、プロセスやスレッドが多くなりすぎたときに、切り替え処理に時間がかかりすぎて本来の処理が行われなくなってしまうことを言います。

一般に、プロセスフォークとスレッドは混ぜて使うべきではありません。

またRubyのスレッドはタイムシェアリング方式なので、スレッドを使うことによって処理が速くなることはまずありません。またユーザレベルスレッドなのでマルチプロセッサの恩恵も受けられません。

7.24 Marshalの使い方を教えてください

オブジェクトをバイト列に変換する (シリアライズ serialize する) ためのものです。オブジェクトをファイルに保存しておいて後から復活させたり、ネットワーク経由で転送することができるようになります。例えばオブジェクトobjをバイト列にするには

Marshal.dump(obj)

とします。このメソッドは文字列を返すので、次のように普通にファイルを使って書き込めます。

File.open('filename', 'w') {|f|
    f.write Marshal.dump(obj)
}

このようにバイト列化したオブジェクトをファイルに書き込むことはよくあるので、以下のような簡約表現も用意されています。

Marshal.dump(obj, io)

ioには書き込み可能なIOオブジェクトです。またこの形式だと大きなオブジェクトをバイト列化するときでも巨大な文字列を作らずに済みます。

一方、バイト列化したオブジェクトを再生するには次のようにします。まずは文字列から戻す場合です。

obj = Marshal.load(str)

以下はIOオブジェクトから直接戻す場合です。

obj = Marshal.load(io)

7.25 例外処理はありますか

あります。次のような構文を使います。

begin
  (例外が発生しそうな処理)
rescue (例外クラス)
  (例外が発生した場合の処理)
else
  (例外が発生しなかった場合の処理)
ensure
  (必ず実行したい処理)
end

begin節で例外が発生するとrescue節が実行されます。例外が発生しなければelseが実行されます。 ensure節は例外が発生してもしなくても必ず実行されます。rescue, else,ensure節はそれぞれ省略できます。 rescueの後ろに例外クラスが指定されなかった場合は StandardErrorが指定されたものとみなされ、StandardErrorのサブクラスである例外が捕捉されます。

この式の値は、ensure 節を実行する直前の値です。

最後に起こった例外はグローバル変数$!により参照できます。発生した例外の種類は$!.classにより調べることができます。

7.26 `trap`はどのように使いますか

以下により、シグナル SIGPIPE が発生するとブロックが実行されます (そして、例外が発生します)。

trap("PIPE") {raise "SIGPIPE"}

7.27 ファイルの行数を数えたいのですが

ファイルの最後にも改行があるものと仮定すれば、次の方法が一番簡単でしょう。

open("filename").read.count("\n")

7.28 配列からハッシュへの変換はどうすればできますか

array という配列があった場合、

h = Hash[*array]

とすれば、array の奇数番目の値をキー、偶数番目の値を値とした h というハッシュが作られます。このとき array の要素は偶数個でなければいけません。

array = [1,2,3,4]
h = Hash[*array]
p h

=> {1=>2, 3=>4}

なお、arrayの前の「*」は、メソッド呼び出しのところで紹介されている、引数の展開用の記号です。

7.29 文字列からArrayを作るのは %w(...) でできますが、同じように文字列からHashを作るにはどうすればよいですか

Arrayのように直接Hashを作るリテラルはありません。そのかわり、

p h = Hash[*%w(1 foo 2 bar)]

=> {"1"=>"foo", "2"=>"bar"}

などと、いったんArrayを作るようにすれば、そこから簡単にHashを作れます。 (ただし、この場合ハッシュのキーと値は文字列に限定されます)

7.30 例外 NameError が捕捉できません

以下のコードは、バージョン 1.4 以前には rescue 節がちゃんと実行されていましたが、バージョン 1.6 ではできなくなっています。

begin
  foo
rescue
  puts "TRAP : #$!"
end

-:2: undefined local variable or method `foo' for #<Object:0x401bece0> (NameError)
ruby 1.6.7 (2002-03-20) [i586-linux]

これは、例外クラス NameError が StandardError のサブクラスではなくなったためです(例外クラスを指定しない rescue は StandardError 配下の例外クラスだけを捕捉します)。このような場合は明示的に NameError を指定する必要があります。

begin
  foo
rescue NameError
  puts "**TRAP** : #$!"
end

ruby 1.6.7 (2002-03-20) [i586-linux]
**TRAP** : undefined local variable or method `foo' for #<Object:0x401bece0>

なお、バージョン 1.7 では NameError クラスは StandardError のサブクラスに戻っています。どの例外がデフォルトで捕捉できるかは例外クラスで、クラス階層を確認してください。

7.31 succがあってprevがないのはなぜですか

Integer#prevは簡単に定義できます。しかしsuccほど有用とは思えません。

一方String#prevはうまく定義できません。例えば

'09'.succ == '9'.succ #=> true

というように、succ前と後の文字列が一対一対応でない場合があるため、 str.prev.succ == str.succ.prevが必ずしも成立しないからです。

^*1この項がFAQなのは引数の意味が昔リファレンスに載っていなかったためです
^*2ruby 1.6 feature: true/false/nil に対しては version 1.6 からは定義できます。