QUICK REVIEW

[論文レビュー] Memento: Time Travel for the Web

Herbert Van de Sompel, Michael L. Nelson|ArXiv.org|Nov 5, 2009

Peer-to-Peer Network Technologies参考文献 27被引用数 134

ひとこと要約

この論文では、HTTPに日時ベースのコンテンツネゴシエーション（DT-conneg）を拡張することで、Web上の時間旅行を可能にするプロトコルベースのソリューション「Memento」を提案している。これにより、ユーザーおよびエージェントは元のURIを介して、スムーズにアーカイブ済みのリソースバージョンにアクセスできる。主な貢献は、既存の慣習を損なわず、Webアーカイブとバージョン管理されたコンテンツをWebアーキテクチャの根幹に統合する、標準化され相互運用性のあるフレームワークを提供することである。

ABSTRACT

The Web is ephemeral. Many resources have representations that change over time, and many of those representations are lost forever. A lucky few manage to reappear as archived resources that carry their own URIs. For example, some content management systems maintain version pages that reflect a frozen prior state of their changing resources. Archives recurrently crawl the web to obtain the actual representation of resources, and subsequently make those available via special-purpose archived resources. In both cases, the archival copies have URIs that are protocol-wise disconnected from the URI of the resource of which they represent a prior state. Indeed, the lack of temporal capabilities in the most common Web protocol, HTTP, prevents getting to an archived resource on the basis of the URI of its original. This turns accessing archived resources into a significant discovery challenge for both human and software agents, which typically involves following a multitude of links from the original to the archival resource, or of searching archives for the original URI. This paper proposes the protocol-based Memento solution to address this problem, and describes a proof-of-concept experiment that includes major servers of archival content, including Wikipedia and the Internet Archive. The Memento solution is based on existing HTTP capabilities applied in a novel way to add the temporal dimension. The result is a framework in which archived resources can seamlessly be reached via the URI of their original: protocol-based time travel for the Web.

研究の動機と目的

HTTPに時間的機能が欠如しているため、リソースの以前のバージョンにアクセスしづらいというWebの耐久性の欠如という根本的問題に対処すること。
ユーザーおよびソフトウェアエージェントが、手動での発見や複数回のリンク遷移を必要とせず、元のリソースURIを用いてアーカイブ済みのリソース表現を取得できるようにすること。
既存のWebインfraストラクチャーやWebアーカイブ（例：インターネットアーカイブ、ウィキペディア）と統合可能な、アーカイブ済みコンテンツにアクセスするための標準化された方法を定義すること。
時間旅行によるアクセスが現在のWebナビゲーションと同様にスムーズな、グローバルかつ相互運用性のあるWebアーカイブグリッドを促進すること。
HTTPに時間次元を追加するコンテンツネゴシエーションを通し、後方互換性を保ちつつ、時間ベースのリソース参照を可能にする

提案手法

DT-conneg（日時ベースのコンテンツネゴシエーション）を提案。クライアントが日時ヘッダーを用いて、リソースの特定の過去の表現を要求できるメカニズムである。
'Accept-Datetime'ヘッダーを用いて希望の時刻を指定し、応答で'Memento-Datetime'ヘッダーを用いてアーカイブ済み表現の日時を示す。
Memento（時間指定のリソース表現）の概念を導入。標準化されたHTTPネゴシエーションを通じて、元のリソースURIからアクセス可能となる。
既存のHTTPインfraストラクチャーとコンテンツネゴシエーションメカニズムを活用し、後方互換性を損なわず、時間次元を追加する。
クライントが元のリソースURIを問い合わせ、Memento-Datetimeヘッダーのチェーンをたどることで、Mementoを発見するためのディスcoveryメカニズムを採用。
主なアーカイブサービス（ウィキペディア、インターネットアーカイブなど）を対象としたプロトタイプ実験を通じて、アプローチの妥当性を検証。エンドツーエンドの時間旅行機能が実証された。

実験結果

リサーチクエスチョン

RQ1元のURIを用いて、リソースの以前のバージョンにスムーズにアクセスできるように、Webをどのように拡張できるか？
RQ2Webアーカイブとバージョン管理済みコンテンツを、標準化され、プロトコルレベルのメカニズムとして、HTTPの基本モデルに統合できるか？
RQ3HTTPコンテンツネゴシエーションに時間次元を追加することで、アーカイブ済みコンテンツの発見可能性および相互運用性にどのような影響を与えるか？
RQ4既存のWebアーカイブおよびコンテンツ管理システムを、現在の運用を損なわず、統一された時間旅行フレームワークに統合できるか？
RQ5時間ベースのリソース取得をサポートする標準化され拡張可能なプロトコルを通じて、グローバルでフェデレーテッドなWebアーカイブグリッドを実現できるか？

主な発見

Mementoフレームワークは、HTTPヘッダーを用いて元のURIと指定された日時を介してアーカイブ済み表現を取得できるため、プロトコルベースの時間旅行を成功裏に実現した。
プロトタイプ実装により、ウィキペディアやインターネットアーカイブを含む主要サービスで機能的な時間旅行が実証され、このアプローチの実現可能性が確認された。
DT-connegは、Webアーカイブとバージョン管理済みコンテンツを標準的なWebナビゲーションスタックにスムーズに統合でき、時間旅行が現在のWebアクセスと同程度に発見可能になった。
このソリューションは、既存のHTTP慣習を保持しており、コアプロトコルの変更は不要。時間という新しい次元をコンテンツネゴシエーションに拡張するにとどまる。
フレームワークは、サーバーサイドおよびクライントサイドの両方のアーカイブ済みコンテンツ発見をサポートし、過去のバージョンを手動で検索したりリンクを追いかけたりする依存度を低下させた。
このアプローチにより、404エラー発生時に自動的にアーカイブ済みコンテンツにリダイレクトするなど、知能的なクライント動作が可能になった。既存のアーカイブ発見技術を活用した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。