ウィキメディア財団は、長期的な持続可能性を確保するために、オンライン行動の変化の中で、Wikipediaのコンテンツを訓練・活用するためのAI企業との新たな提携を発表しました。これらの契約は、ウィキメディアのコンテンツの大規模な再利用者や配信者向けに設計された商用製品であるWikimedia Enterpriseを通じて締結されました。新規登録にはEcosia、Microsoft、Mistral AI、Perplexity、Pleias、ProRataが含まれ、既存のパートナーであるAmazon、Google、Metaとともに参加しています。 「AI時代において、Wikipediaとその人間が作成・キュレーションした知識はかつてないほど価値があります」と財団は声明で述べました。 「その知識は、生成AIチャットボット、検索エンジン、音声アシスタントなどに活用されています。Wikipediaは、大規模言語モデルの訓練に使用される最高品質のデータセットの一つです。」
この発表は、Wikipediaの25周年記念に関連したアップデートの一環として行われました。 オンライン百科事典は、世界で最も訪問されるウェブサイトのトップ10に入り、その中で唯一非営利組織が運営するサイトです。財団によると、3億以上の言語で公開された6500万以上の記事は、月間約150億回閲覧されています。 しかし、トラフィックのパターンが変化していることも警告しています。10月には、Wikipediaへの人間の訪問が前年比8%減少したと述べ、その原因をAI生成の要約に頼るユーザーの増加にあると指摘しました。Google検索の約60%はクリックされず、ページ内の回答はしばしばWikipediaのコンテンツに基づいています。
AI対出版社 これらの契約は、AI企業がどのように訓練データを取得しているかについての広範な議論の中で行われています。大規模言語モデルは、膨大なオンライン資料を用いて訓練されることが一般的ですが、著作権で保護された作品を許可なく使用することは侵害だと批判されています。 その中で、Redditは、モデル訓練のためにコンテンツを使用したとして複数の訴訟に巻き込まれていますが、Googleなどとライセンス契約を結んでいます。 木曜日には、大手書籍出版社のHachette Book GroupとCengage Groupが、Googleに対して既存の集団訴訟に参加する動議を提出し、同社のGemini AIプラットフォーム構築のために「歴史的な著作権侵害」を行ったと非難しました。訴訟は、Googleが適切なライセンスなしに書籍をコピーしたと主張しています。最初の訴訟は2023年に複数の著者によって提起されました。 OpenAIも、「ゲーム・オブ・スローンズ」の作家ジョージ・R・R・マーティンを含む原告から同様の訴訟を受けています。 エンターテインメント企業もこの問題に取り組んでいます。12月中旬、DisneyはGoogleに対して著作権侵害の停止命令を送りました。同時に、DisneyはOpenAIとAI生成動画用の数百のキャラクターに関するライセンス契約を結びました。Disneyは他のAI企業にも同様の通知を出しており、大手スタジオとともに画像生成企業Midjourneyに対して訴訟を進めています。 同月、作家、俳優、技術者の連合が、新たな業界団体を立ち上げ、エンターテインメント分野におけるAIの訓練と利用に関する規範の施行を推進しています。ナタリー・ポートマン、ケイト・ブランシェット、ベン・アフレック、ギレルモ・デル・トロ、タイカ・ワイティティなど、500人以上の著名人がこのイニシアチブを支持しています。 欧州委員会も、Googleが出版社やYouTubeのコンテンツを利用してAIサービスを展開し、公正な補償や同意なしにEUの競争規則に違反したかどうかについて、正式な反トラスト調査を開始しました。 著作権者が最終的に救済措置を見つけられるかどうかは不確かです。米国の連邦裁判官は最近、MetaとAnthropicに対して、著作権で保護された書籍をAIモデルの訓練に使用したことはフェアユースに該当すると部分的に認める判決を下しましたが、一方で、これらの企業が違法コピーの作品を永続的に保存していることを批判しました。