シャドウライブラリ
From Wikipedia, the free encyclopedia
シャドウライブラリ(英: shadow libraries)、または海賊版ライブラリ(英: pirate libraries)、ブラックオープンアクセス(英: black open access)は、ペイウォールで保護、デジタル著作権管理でアクセスが制限、など様々な理由で容易に入手できないデジタルメディアを、自由に利用可能な形で収集して提供するオンラインリポジトリである[1][2]。学術出版物や電子書籍などテキスト資料が多く、ソフトウェア、音楽、映画など他のデジタルメディアも含有する。
Anna's Archive、Library Genesis、Sci-Hub、UbuWeb、Z-Libraryは、書籍や学術文献を対象とした最も有名なシャドウライブラリの一部である[1][3][4]。

シャドウライブラリの前身と当初期は書籍、学術文献、その他テキストメディアの非公式な海賊版デジタルコピーの収集で、多くの場合にメーリングリスト、インターネットフォーラム、ソーシャルメディアサイトなどを通じて小規模なグループで共有された[1]:1。科学者らのオンラインコミュニティも、ペイウォールで保護された文献を相互に共有するために協力した[5]。

シャドウライブラリの多くは、ソビエト連邦時代から続くサミズダートの豊かな歴史があるロシアで発祥した。ソビエト時代の厳格な国家検閲と印刷物の統制に反発し、検閲された作品や地下文書は複写して流通された。ソビエト連邦の崩壊と公式検閲制度の終焉後も、広範な経済的困難によりこの共有慣行は続いた[1]。ロシア国内でコンピュータとインターネットへアクセスが普及するとテキストは広くデジタル化され、ロシアの FidoNet システムで共有された。デジタル化されたテキストの初期コレクションの一つは、マクシム・モシュコフによる1994年のマクシム・モシュコフ図書館 (Lib.ru) である[1] 。2000年代初頭に科学文献をダウンロードまたはデジタル化してFTPサーバーやDVDに保存していたコミュニティは、ロシアのコルホーズ・コレクションを作成し、これは最終的に約5万点の文書に成長した[1]。
これら初期のコレクションのいくつかは、ボランティア司書らの支援を得てアーカイブ内容を分類し、のちにシャドウライブラリへ進化した。2000年代の初期の学術系シャドウライブラリに、Textz.org、Monoskop、Gigapedia(のちのLibrary.nu)がある。
Gigapediaは他の主に文学作品を収蔵するシャドウライブラリと異なり、学術文献に重点を置いた[1]。2006年または2007年頃、Gigapediaはコルホーズ・コレクションによって蓄積されたファイルを取り込み[1]、2010年までには最大のシャドウライブラリとなっていた[1] 。その後GigapediaはLibrary.nuと改名され、ハーパーコリンズ、オックスフォード大学出版局、マクミラン出版社を含む17の出版社連合による訴訟により、2012年に閉鎖された[1][6]。
Library Genesis(LibGen)は、2007年または2008年頃にロシアの科学者グループによって設立され、コルホーズ・コレクションやLib.ruなどのソースから収集されたロシアの科学技術文献のトレントサイト上でのコレクションを整理することから始まった[1]。2011年、LibGenはLibrary.nuのコレクションを吸収し、Library.nuが閉鎖を強いられた後もそれをアクセス可能な状態に保った。当時、LibGenはそのオープンな図書館インフラに注力していた点でユニークであり、コレクション、カタログ、ソースコードの自由な共有を重視することで、他の多くのプロジェクトがこの活動をミラーし、フォークすることによってシャドウライブラリ全体のレジリエンスを高めることを奨励していた[1]。
動機
シャドウライブラリはオープンアクセスおよびオープンナレッジ運動の一部である[7][2][1]。これらは学術的研究やその他のメディアの自由な流通を目指しており、知識を自由に利用可能にすることが道徳的要請であると主張することが多い。
LibGenの運営者は、貧しい人々への情報アクセスの提供と、エリート学術機関による知識の囲い込みへの反対を同サイトの使命として説明している。ある管理者は「LibGenの対象は貧者である。アフリカ、インド、パキスタン、イラン、イラク、中国、ロシア、旧ソ連諸国などに住む人々、そして別の観点では、学術界に属さない人々である。大学に所属していなければ、何もアクセスできない。あるいは、アクセスできたとしても非常に困難であり、進歩することは不可能に近い」と記している[1]。
Sci-Hubの創設者であるアレクサンドラ・エルバキアンは、同サイトを正当化する理由として、学術研究へのオープンアクセスの欠如が、国際連合の世界人権宣言第27条に規定された人間の科学と文化に対する権利を侵害していると主張している。この条文には「すべて人は、自由に社会の文化生活に参加し、芸術を鑑賞し、及び科学の進歩とその恩恵とにあずかる権利を有する。」[8]とある[9]。エルバキアンはまた「知識に反するいかなる法律も根本的に不正である」とも主張している[10]。
アメリカの活動家アーロン・スワーツは、2008年の『ゲリラオープンアクセス宣言』において、多くのシャドウライブラリの動機を次のように表現した[1]。
世界中の科学的および文化的遺産は、何世紀にもわたって書籍や学術誌に発表されてきたが、それがますますデジタル化され、ひと握りの民間企業によって囲い込まれている。…これらのリソースにアクセスできる者――学生、図書館員、科学者――は特権を与えられ、知識という饗宴にあずかることができる。一方で、世界の残りの人々は締め出されている。しかし、あなたたちはその特権を自分たちだけのものにしておく必要はない――いや、道徳的に言えば、そのようにすることは許されないのである。—アーロン・スワーツ、『ゲリラオープンアクセス宣言』[11]
シャドウライブラリはまた、学術文献や書籍の価格が高騰している現状、すなわち「シリアルズ・クライシス」を問題として挙げている[12]。
技術
| ファイル共有 |
|---|
一部のシャドウライブラリ(またはそのコンテンツデータベース)は、耐障害性の向上や負荷分散のために、BitTorrent(主にデータベースダンプのため)やダークウェブ、IPFSといった技術を利用している[13][14][3][2][15]。
LibGenやAnna's Archiveを含むシャドウライブラリは、ソフトウェアをオープンソースソフトウェアとして開発・公開しており、誰でもコードの開発に参加でき、ミラーやフォークも促進されている[1][16]。
Anna's Archiveは「我々が閉鎖されても、すぐに他の場所で復活できる。なぜなら、すべてのコードとデータが完全にオープンソースであるからだ」と主張している[16]。
法的地位
シャドウライブラリは、多くの国において著作権者の同意なしに著作物をホストまたはリンクすることがあり、違法または法的に疑わしいとされている[1]。このようなライブラリは海賊版ライブラリ(英: pirate libraries)とも呼ばれている[10][1]。多くのシャドウライブラリは、ファイルそのもののホスティングとは別に書誌情報のカタログを維持している。これは組織的な利便性であると同時に、法的な挑戦に対する防御策でもある。なぜなら、著作権のあるコンテンツのホスティングとインデックス作成の違いについては、法的に曖昧な点が多いためである。しかし、いくつかのシャドウライブラリのカタログは、差止命令や削除要求の標的となってきた[1]。
2000年代に西洋の音楽および映画産業がオンラインファイル共有サイトに対して取った積極的な法的戦略は、学術または文芸の出版社がシャドウライブラリに対して行ったものとは大きく異なっていた。しかし、シャドウライブラリが大規模かつ可視化するにつれて、より多くの法的挑戦を受けるようになった。Library.nu(以前のGigapedia)は、ハーパーコリンズ、オックスフォード大学出版局、マクミランを含む17の出版社の連合による訴訟によって2012年に閉鎖された[1][6]。2015年には、学術出版社エルゼビアがアメリカの裁判所でLibGenおよびSci-Hubを提訴し、「国際的な海賊版および著作権侵害ネットワークを運営している」と非難した[17]。エルゼビアはこの2団体に対して欠席判決を勝ち取り、1500万ドルの損害賠償を命じられたが、LibGenの運営者が不明であり、Sci-Hubの運営者が米国の法的手続きの及ばない場所にいるため、賠償金は回収されていない[18]。エルゼビアの訴訟において、裁判官はシャドウライブラリが使用していたいくつかのドメインに対して差止命令を出し、一時的にそれらをオフラインにしたが、ライブラリはすぐに新たなドメインおよび.onionに移行した[19][17]。2017年にはアメリカ化学会がSci-Hubに対して訴訟を起こし、480万ドルの損害賠償命令を勝ち取った[18]。2022年11月、FBIはZ-Libraryに関連するドメインを押収し、その運営者2名を著作権侵害、通信詐欺、資金洗浄の罪で起訴した[20]。デンマーク、フランス、ドイツ、ロシア、イギリスを含む国々では、裁判所がインターネットサービスプロバイダに対し、海賊版ライブラリへのアクセスをブロックするよう命じている[21][22]が、これらのブロックは限定的な効果しか持たない[23]。
シャドウライブラリへの誘導の合法性は未確定である。著作権侵害素材へのリンクが使用者責任や著作権の寄与侵害を構成するという法理論は存在するが、これに基づく訴訟は提起されていない。2019年には、エルゼビアが文献管理ツールの開発者であるCitationsyに対し、Sci-Hubへのリンクを含むブログ記事を掲載したとして法的措置を警告し、Citationsyはリンクを削除した[24]。
多くの学者は自身の出版物を無料で配布しても処罰されることはないが、学術出版社は自身の研究を共有または再出版したとして科学者を脅迫してきた[25]。
一部の出版社は、Sci-Hubを含むシャドウライブラリが学術データベースへのログイン資格情報を不正に取得していると非難しているが、Sci-Hubはそれらの資格情報が自発的に提供されたものであると主張している[26]。
2023年6月、作家ポール・G・トレンブレーとモナ・アワドを代表とする集団訴訟が、ChatGPTの開発元であるOpenAIに対して提起され、同社が自社の大規模言語モデルの訓練データとしてシャドウライブラリを使用したと主張された[27][28][29]。
Metaもまた、AIモデルの訓練にシャドウライブラリからのデータを使用したとされている[30][31]。
DeepSeekのVision-Language (VL)モデルは、シャドウライブラリであるAnna's Archiveのデータを用いて訓練された[32]。