1. 概要
GNU Wgetは,Webから対話的ではないファイルのダウンロードを行なうためのフ
リーのユーティリティです.HTTP,HTTPS,そしてFTPをサポー
トしていて,HTTPプロキシからの回収も同様にサポートしています.
この章は,Wgetの機能の部分的な概要となっています.
-
Wgetは対話的ではなく,つまりそれはユーザがログオンしていない間にバック
グラウンドで動作可能なことを意味しています.このため,Wgetに仕事を完了
させるため,回収を開始し,システムとの接続を終了する(システムと離れてい
る)ことが可能になっています.それと比較して,ほとんどのウェブブラウザは
常にユーザの存在を要求し,それは大量のデータを転送しているときは,大き
な障害となります.
-
Wgetは,HTMLページとXHTMLページのリンクをたどり,遠隔地のウェ
ブサイトのローカルバージョンを作成し,それはオリジナルサイトのディレク
トリ構造を完全に再生成します.これは“再帰的なダウンロード”と言われる
こともあります.こうしている間,WgetはRobot Exclusion Standard
(‘/robots.txt’)を考慮します.オフラインで閲覧するために,ダウンロー
ドされたHTMLファイルのリンクをローカルのファイルに変換するよう,
Wgetに指示することが可能です.
-
ファイル名のワイルドカードへの一致と,ディレクトリの再帰的なミラーは,
FTPで回収するときに利用可能です.Wgetは,HTTPサーバと
FTPサーバの両方でタイムスタンプ情報を読み込み,それをローカルに保
存することが可能です.それにより,Wgetはリモートファイルが前回の回収か
ら変化しているかどうかを理解し,変化がある場合は新しいバージョンを自動
的に回収することが可能になっています.これで,Wgetがホームページと同様
にFTPサイトのミラーに適するようになっています.
-
Wgetは,遅く不安定なネットワークの接続越しでも耐性があるように設計され
てきました.ネットワークの問題でダウンロードに失敗した場合,ファイル全
体が回収されるまで再試行を続けます.サーバが再収集をサポートしている場
合,残っている場所からダウンロードを続けるようサーバに伝えます.
-
Wgetはプロキシサーバをサポートし,それはネットワークの負荷を軽くし,回
収の速度を上げ,そしてファイアーウォール経由でのアクセスを提供すること
を可能にします.しかし,socks形式のゲートウェイの使用が必要なファイアー
ウォール経由の場合,socksライブラリを入手しsocksサポートを用いてWgetを
ビルドすることで可能となります.Wgetは,受動的なFTPダウンロードも
デフォルトでサポートしていて,アクティブFTPはオプションとなってい
ます.
-
Wgetは次世代のIPであるIPバージョン6をサポートしています.IPv6はコンパイ
ル時に自動的に検出され,ビルド時または実行時に利用不可にすることが可能
です.IPv6サポートでビルドされたバイナリは,IPv4のみでも両方使える環境
でも,正しく動作します.
-
組込みの機能は,希望するリンクをたどることを調整するメカニズムを提供し
ます(see section リンクの追跡).
-
個別のダウンロードの進捗は,進捗表示機(progress gauge)を使用して表示さ
れます.対話的なダウンロードでは,“温度計”形式で表示されますが,対話
的ではないときはドットで表示され,それぞれのドットは受信したデータの固
定量(デフォルトで1KB)を表現しています.これらの表示は好みによりカスタマ
イズ可能です.
-
ほとんどの機能は完全に構成を変更することができ,それらは,コマンドライ
ンオプションや初期化ファイル‘.wgetrc’(see section スタートアップファイル)を通じ
て行います.Wgetでは,サイト設定に対してグローバル(global)なスター
トアップファイル(デフォルトで‘/usr/local/etc/wgetrc’)で定義可能に
なっています.
-
最後になりますが,GNU Wgetはフリーソフトウェアです.このことは,Free
Software Foundationが出版しているGNU一般公有使用許諾書
(see section コピーについて)の用語の下で,誰もが,使用し,再配布し,そして/または
修正が可能だということを意味します.
この文書は新堂 安孝によって2009年9月22日にtexi2html 1.82を用いて生成されました。