ウェブアーカイブ/魚拓サービス

ページ名:ウェブアーカイブ_魚拓サービス

登録日: 2017/06/27 Tue 11:17:52
更新日:2024/02/06 Tue 13:51:21NEW!
所要時間:約 5 分で読めます



タグ一覧
魚拓 ネット用語 賛否両論 ウェブサイト アーカイブ インターネット ウェブアーカイブ ウェブ魚拓 スナップショット 魚拓サービス 知る権利 忘れられる権利




ウェブアーカイブとは、特定のウェブページのスナップショットを収集・取得し、後世のために保存するサービスである。
釣った魚の形を写す作業になぞらえて、「魚拓(サービス)」とも呼ばれる。
「魚拓」と呼ぶ場合、スマホのスクリーンショットやPDFでの保存も含まれる。



概要

上述した通り、ウェブページを後年の研究者や一般大衆のために残しておくことを目的としたサービス。
記録に残すことで、「かつてこんな文化があった」「このページはこういう変遷を辿った」などといったことを後の世代に伝えることができる。
クローラ(自動化プログラム)を使って自動収集しているタイプと、完全に手動でスナップショットを収集するタイプとがある。
サービスや元ページの設定によっては、画像や動画も観ることが可能。
芸能人のブログなどは引退後しばらく経つと消えることがあるので、こういうサービスは便利だろう。


手動収集の場合、「お気に入りのサイトの保存」「何らかの事情で消えそうなサイトの保存」といった名目の他、
「誰かの(炎上しそうな)問題発言」「自身に対する誹謗中傷」などの証拠を消されない内に取得するという目的で行われることがある。
ウェブサービスにおける誹謗中傷を記録した魚拓が、裁判の証拠として認められた事もあり、その影響力は無視できない。
スクショに比べて改ざんが困難なため、裁判などでは有利に働くこともあるようだ。


最大手は『Wayback Machine』(自動)を運営するInternet Archiveだろう。
日本では『ウェブ魚拓』(手動)が非常に有名であり、「魚拓」の語源も恐らくここ。
また各国の国立図書館もウェブアーカイブの重要性を認識しており、本邦でも国立国会図書館が行っている。
これら具体的なサービスについては後述。


ちなみに我らがアニヲタWiki(仮)も更新内容をちゃんと保存できる*1ので、「ページを作成した時」や「ページを大幅に更新した時」の記録をチェックすれば、荒らしや誤消去に出くわしても何とかなるかもしれない*2
多くのページのログをとっておけばクローラも自動でアニヲタwikiを収集してくれるようになる…といいなあ。



課題

上述したように様々な長所がある一方で、法的な内容を中心に様々な課題がある。


まず著作権の問題が挙げられる。
ウェブアーカイブとは、言ってしまえば誰かが作ったものを勝手に保存して公開しているものなので、日本では著作権法違反に該当する恐れがある。
何でアメリカは大丈夫なのかというと、フェアユースの法理*3から、「とりあえず使用してみて問題があれば裁判で決める」という方向性で成り立っているため。
じゃあ、アメリカにサーバーがあれば良いのかというと、日本からアメリカのサーバーへコピーした場合やアメリカのサーバーから日本へコピーした場合、動作拠点が日本であるため日本の法律で裁くことができるとの判例がある。
一方で、日本でも裁判の証拠として活用されたり、弁護士や国会図書館のサイトで使用方法が掲載されている事実もあり、今後の動向が注目される。


次に、本人が残したくない内容が半永久的に残ってしまう、いわゆる「忘れられる権利」に関する問題
例えば前述した「芸能人のブログ」が消える理由は、「引退後は一般人に戻る為」に他ならない。
にも関わらず、ブログなどが不特定多数の目に触れられる状況では、一般人として生活することに支障が出る可能性もある。
一般人であっても、期間限定で公開したはずの自撮りや痛々しい投稿が保存されてしまうなど、決して他人事ではない。
特にSNSの利用が当たり前になっている現在では、そうした投稿が知らず知らずの内に保存されている可能性もあるのだ。
一方で、安易な規制・削除は「知る権利」や「表現の自由」を侵害するという意見もあり、相対する両方の権利をいかに両立していくかが今後の課題となっている。


当然ではあるが、わいせつ物の保存も摘発される恐れがある。


ホームページによってはロボット対策をしていることもあり、自動・手動共に取得できない場合がある。
また、リンク先にないホームページにはなかなかクローラがたどり着けない場合もある。



有名なサービス

  • Wayback Machine

世界最大のアーカイブサイトで、1996年開設という老舗。クローラ型だが、利用者が手動で収集することもできる。
また、ログが存在するのであればアドレスを入力して探すこともできる。
Webサイト以外の資料*4も収集しているが、日本においては著作権法上の問題があるので注意する事。
保存総量がとんでもなく莫大*5なため、データセンターもシャレにならないデカさを誇る。


近年はサイエントロジー(宗教団体)を批判するサイトのスナップショットが法的根拠の弱い理由で削除されてしまったり、グレイトフル・デッド(ロックバンド)のライブ音源の扱いで一悶着あったりもした。



  • archive.today(旧:archive.is)

海外の手動魚拓サービス。
画像の保存にも対応しているが、その場合はサブドメインの「archive.fo」で検索する必要があるなど面倒。



  • ウェブ魚拓

株式会社アフィリティーが運営する、国産のアーカイブサイト。利用者による手動型。
画像データやFLASHなどにまで対応するため保存精度は高い。
かつてはトップページにドンと魚が映っていた。今は控えめ。



  • 国立国会図書館インターネット収集保存事業(WARP)

2002年から始まった、日本の国会図書館が運営するウェブアーカイブサービス。クローラ型。
国会図書館法に基づき、政府省庁や市区町村といった公的機関のWebサイトを収集している。
サイトによっては全文検索も可能。






追記・修正はスナップショットを残してからお願いします。


[#include(name=テンプレ2)]

この項目が面白かったなら……\ポチッと/
#vote3(time=600,2)

[#include(name=テンプレ3)]


  • 個人サイトくらいにしか載ってなかった情報欲しい時はありがたいサービス -- 名無しさん (2020-05-20 12:44:02)

#comment

*1 ただしopencloseなどには対応していない。
*2 一応、現在はIPユーザーによるログ流し対策がされている。
*3 権利者に無断で著作物を利用しても、それが公正な利用(フェアユース)に該当するとみなされれば、著作権の侵害にならないとする考え。
*4 書籍・雑誌・映画・ゲームetc…と多岐に渡る。
*5 2012年時点で10ペタバイトを超えている。

シェアボタン: このページをSNSに投稿するのに便利です。

コメント

返信元返信をやめる

※ 悪質なユーザーの書き込みは制限します。

最新を表示する

NG表示方式

NGID一覧