ウェブアーカイブについての覚書

ページ名:ウェブアーカイブについての覚書

マイティー問題にこだわらずアーカイブを辿る上で一般的に役立つと思われる事項を挙げていく。

アーカイブサイトの種類

Ghost Archive

メリット

  • YouTube動画も保存できる(具体例)。
    • 動画ページを保存したい場合はURLのうち.comの部分を.co.jpや.co.krに変えて取得するとなぜかうまくいくことがある。

デメリット

  • 一部動画はずっと取得中のメッセージが出たままでいっこうに保存される気配がないことがある。
    • 保存できる場合と保存できない場合との差は不明である。

archive.today

サイト運営者がはっきりしておらず謎が多いサイト。

メリット

  • 一部のウェブサイトでは、閲覧するためにログインを要するようなページであってもarchive.today側が用意したアカウントでログインしてアーカイブすることができるようである(Facebook, Linkedin等)。
    • X(旧Twitter)は現在非対応となってしまったようである(かつては可能だったようだ(資料)が、現在は非ログイン状態でアーカイブされている。このためいいね欄のアーカイブに失敗してしまう)。
  • YouTubeのコメント欄の「続きを読む」は展開したうえでアーカイブされるようだ。
  • 権利者からの削除要請に応じないことが多いとされる。
  • アステリスク記号(ワイルドカード)を用いたアーカイブ検索機能
  • シンプルなUI

デメリット

  • 2024年現在、X(旧Twitter)やYouTubeのアーカイブに失敗する事例が目立つようになってきている(アーカイブ処理の画面が長時間ループした後でNot Found (yet?)などと表示される)。

Wayback Machine

米カリフォルニア州の非営利団体のインターネットアーカイブが運営するサイト。

メリット

  • クローラーによる巡回と手動によるURLの入力の両方でアーカイブされる。
  • 視覚的で見やすいAI
  • Save Outlink機能によりリンク先のURLも保存可能
  • URLsタブから同ディレクトリ内のアーカイブファイルを探索できる

デメリット

  • 動作が重め
  • YouTubeのコメント欄の保存に問題を抱えている。
  • ページによってはアーカイブでのみ読み込みが無限ループするような場合がある(ユーザ側でjavascriptをオフにする必要がある)

ウェブ魚拓

株式会社アフィリティーが運営するWebサイト。

メリット

  • 動作は軽い方だと思われる

デメリット

  • 最近X(旧Twitter)のアーカイブの調子が悪い
  • アーカイブの検索機能が弱め

検索エンジンGoogleのcache機能 ※廃止

Chromeブラウザ等でURLの先頭にcache:を付加することでサイトの以前の状態を閲覧できる場合がある。

メリット

  • リンク先のコンテンツが消えて間もない場合に役立つことがある

デメリット

  • しばらくするとアーカイブが破棄される
  • 2024年現在Googleはこの機能を廃止予定である→実際に廃止\

ノウハウ集

URL変更関連

YouTube

YouTubeチャンネルのURLはチャンネルIDのものとYouTubeハンドルのものとがサポートされている。古いアーカイブはチャンネルIDでアーカイブを探す必要がある。

上のリンクがチャンネルID、下のリンクがYouTubeハンドルである。

X(旧Twitter)

XのURLがtwitter.comからx.comへと変更になる見込みである。

シェアボタン: このページをSNSに投稿するのに便利です。

コメント

返信元返信をやめる

※ 悪質なユーザーの書き込みは制限します。

最新を表示する

NG表示方式

NGID一覧