Reddit、AIモデルのトレーニングにおけるユーザーデータの不正使用でAnthropicを提訴


主要なフィンテックニュースとイベントをチェック!

FinTech Weeklyのニュースレターを購読する

JPモルガン、Coinbase、Blackrock、Klarnaなどの経営陣が読む


Anthropicに対し、ユーザーデータの無断使用で訴訟を提起するReddit

Redditは、人工知能(AI)企業のAnthropicに対して法的措置を取り、同社が利用規約に違反し、プラットフォームが「違法かつ不公正なビジネス行為」と呼ぶものに関与したと非難した。水曜日に連邦裁判所へ提出された訴訟は、商業用AIシステムの学習に用いるための、公に利用可能なWebコンテンツの利用をめぐる緊張をさらに高めるものだ。

訴状によれば、Redditは、Anthropicが必要な許諾またはライセンスを取得せずに、大量のRedditのユーザー生成コンテンツにアクセスし、それを利用してAIモデルを学習させたと主張している。ソーシャルプラットフォームは、これは同社の方針に違反するだけでなく、同意なしにユーザーの貢献を商業的な利益のために搾取していると論じている。

この案件は、生成AIの時代においてオンラインコンテンツの所有が誰に帰属するのか、また企業はプライバシーに対する期待やコミュニティの信頼というニュアンスを含む公開データをどのように扱うべきか、というより広範な問いを浮き彫りにしている。

コンテンツ利用と商業的利益に根ざした法的争い

Redditは、倫理に基づくAI企業であると自らを示しているにもかかわらず、AnthropicはRedditのプラットフォーム規則を軽視する行動を取ったと主張している。

訴状の中心にあるのは、Anthropicが(とりわけClaudeとして知られる)AIモデルを、無断でスクレイピングされたRedditデータで学習させたという主張だ。Redditは、プラットフォームの利用規約とユーザー保護に準拠するライセンス契約を結んだOpenAIやGoogleとは異なり、Anthropicは同様の許諾を確保できていないと指摘している。

この違いは、AI企業が学習データの調達と取り扱い方法を明確化するよう、ますます圧力を受けていることを踏まえると、訴訟における重要な要因になり得る。特に、そのデータがユーザーが投稿したコンテンツを持つプラットフォームから来ている場合だ。

AIブームとプラットフォーム間の緊張

2022年後半以降、生成AIはテクノロジー業界全体に大きな変化をもたらし、Redditのようなプラットフォームは、人間が生み出した洞察、議論、アドバイスの高価値な蓄積場所になっている。こうした特性は、より能力が高く、文脈に即したモデルを構築しようとするAI開発者にとって魅力的だ。

Reddit自身もAI経済に踏み込んでおり、最近、OpenAIやGoogleとパートナーシップを結び、特定のライセンス条件のもとでそれらの企業がRedditコンテンツを利用できるようにすると発表した。これらの契約は、プラットフォームの20年分のコンテンツから収益を生み出しつつ、ユーザーのプライバシーを維持することを目的としている。

一方で、訴訟によれば、AnthropicによるRedditデータの利用は、そうした合意なしに行われた。ソーシャルプラットフォームは、これにより、競合他社の製品を強化するための同社データの無断の商業利用によって、直接的な財務的・評判上の損害が生じたと主張している。

Redditの法務チームは、プラットフォーム規則を尊重することは任意ではないと強調した。特に、透明性やコンプライアンスが、ユーザーと規制当局の双方からますます厳しく見られているフィンテックやAIの分野ではそうだ。

市場への示唆と業界の反応

訴訟の発表を受け、水曜日にRedditの株価は6%以上上昇し、同社がデータ権を行使するという判断に対して投資家の支持が示された。2024年初めに上場した同社の時価総額は、現在およそ220億ドルだ。

その一方で、AnthropicはAI業界で最も資金が厚く投じられているスタートアップの1つとして、急速に存在感を高めている。同社は3月に615億ドルと評価されており、Amazon、Salesforce Ventures、Cisco Investmentsのような主要プレイヤーからの支援を受けていた。

AnthropicはRedditの主張に同意していないと述べているが、訴訟の結果は、AI企業がデータ収集にどう取り組むかについて長期的な影響を及ぼす可能性がある。また、プラットフォームが訓練目的で自社コンテンツへのアクセスをどう価格設定し、あるいはどう制限するかにも影響を与えるかもしれない。

業界関係者は、AI開発がしばしば公開領域からのデータスクレイピングを伴うとしても、「公に利用可能」と「商業的に利用可能」の境界は、いまだ不明確だと指摘している。このような訴訟は、革新と倫理的なコンテンツ利用のバランスを取るための、より明確な枠組みを求める動きにつながり得る。

AIにおけるデータ倫理への注目が高まる

Redditによる今回の法的措置は、プラットフォームが、AI企業による搾取だと捉えるものに対して反撃し始めているという、より広い流れの一部だ。より多くのテック企業が自社のデータ資産を収益化しようとしているため、コンテンツのライセンスが争点になっている。

Redditは、訴状で、自社データのAI学習での使用に反対しているのではなく、無断での使用に反対しているのだと明確にしている。OpenAIやGoogleのように同社の条件を尊重する企業と、そうでないとされる企業とを区別することで、Redditは、自身をAIにとって好意的でありつつ、ユーザーのコミュニティを守る存在として位置づけようとしている。

訴状では、RedditとのOpenAIの既存パートナーシップが指摘されており、元取締役で主要株主でもあるRedditとOpenAI CEOのSam Altmanとのつながりが、訴訟をめぐる背景にさらなる複雑さを加えている。

次に来るもの

裁判手続が進むにつれ、オープンなインターネット上のコンテンツと、専有的な学習データのあいだにある曖昧な境界線が、法制度によってどう扱われるのかに注目が集まる。この訴訟は、コンテンツプラットフォームとAI開発者の間で今後起こり得る紛争に対する先例となり得る。

現時点では、Redditの法的挑戦は、AIモデルがどのように学習されるのか、そしてプラットフォームの所有者が、ユーザーが提供したデータへのアクセスをどこまで管理でき、また管理すべきなのかという点をめぐる緊張を、ますます高めるものとなっている。

さらに、この訴訟は、規制のないデータスクレイピングの時代が終わりに近づいているというメッセージも裏付けている。特に、データ権に対する世間の認知が広がり、プラットフォームが、AIアプリケーションで自社コンテンツがどう使われるかについて、より多くの統制を主張しようとしている中ではなおさらだ。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン