nikki

アクセスカウンタ

zoom RSS Internet Archive および Wayback Machine

<<   作成日時 : 2006/03/11 18:15   >>

ブログ気持玉 0 / トラックバック 0 / コメント 0

昔どこかで見た記憶があったけど、
ようやくきちんと調べてみた。

http://www.archive.org/web/web.php

http://protist.i.hosei.ac.jp/GBIF/DB_list/About_wayback.html

Internet Archiveでは,ネット上に公開された情報は人類の貴重な歴史遺産として残していくべきだ,という考えに立ち,1996年からインターネット上にある収集可能な情報を蓄積し保存する活動を続けています。収集した情報については,これまではプライバシーや著作権保護の観点から,その利用を制限してきましたが,昨年末,すべての情報を一般に公開し,Wayback machineという手法で誰もが簡単に利用できるようにしました。


http://internet.watch.impress.co.jp/cda/news/2005/04/19/7336.html

この差がなんとも。

Internet Archiveはこれらのデータを、現在は米Amazon.comの子会社となっているAlexaから定期的に寄贈されることによって補充している。それが今回、データ提供を受けた後にWayBack Machineのインデックスをアップデートした結果、検索できるページ数が従来の300億ページから400億ページへと増加した。近年におけるインターネットの爆発的な増大に伴ってページの数も増えている様子がわかる。


なお、サービスの種類は異なるが、サーチエンジンで最も多くのWebページをインデックスしているとされるGoogleは現在80億ページ強をインデックスしている。


http://d.hatena.ne.jp/keyword/Internet%20Archive

こう言われると随分雰囲気変わるよね。

デジタル形式のデータを永続的に提供する「インターネット図書館」を作るため、1996年に設立された非営利団体の名前。


http://ja.wikipedia.org/wiki/Internet_Archive

またInternet Archiveのデータベース的側面としては、現在の特定URLを必要とする形以外のアクセス方法として、2003年9月、Internet Archiveに保存されたウェブページ全体を対象にした検索エンジン「Recall」のベータ版が公開された。検索した単語の頻度をグラフ化して表示する機能があり(2byte文字は未対応)、ネットワーク上の流行調査などに有益なものだったが2004年9月中旬に停止した。これは「Recall」の開発者であったAnna Pattersonがプロジェクトから離れたためである。Internet Archiveのフォーラムでは新たな検索システムの構築を望む声が多くあがっており、動向が注目される。


ああー残念。

http://internet.watch.impress.co.jp/cda/news/2003/09/08/377.html

昔のニュースで、

Recallは、Internet Archiveに登録されている“1996年から現在までのおよそすべてのWebサイト約110億ページ”をインデックスしており、これらすべてのHTMLのテキストに対して全文検索が行なえる。これまでInternet Archiveは、特定のWebサイトのURLを入力するとそのWebサイトの歴史が表示されるという機能しか持っていなかったため、Recallの登場によってアーカイブの利用方法も大幅に増えそうだ。


こんなこと言っているから、そいつは便利だって考えたんだけど、
使えないのね。。。

基本的にはGoogle使って、Googleでないときは、
こいつを使ってみるか。。。

月別リンク

ブログ気持玉

クリックして気持ちを伝えよう!
ログインしてクリックすれば、自分のブログへのリンクが付きます。
→ログインへ

トラックバック(0件)

タイトル (本文) ブログ名/日時

トラックバック用URL help


自分のブログにトラックバック記事作成(会員用) help

タイトル
本 文

コメント(0件)

内 容 ニックネーム/日時

コメントする help

ニックネーム
URL(任意)
本 文
Internet Archive および Wayback Machine  nikki/BIGLOBEウェブリブログ
文字サイズ:       閉じる