AIと著作権の最前線 — 生成AI学習データの著作権問題

知的財産法の領域において、生成AIの登場は従来の著作権理論を根底から問い直す課題をもたらしている。ChatGPTやその他の大規模言語モデルが社会への浸透を深める中で、これらのシステムが学習に用いる膨大なデータセットが既存の著作物をいかに扱うべきかという問題は、単なる技術企業の内部的な関心事ではなく、法制度全体の適応能力を試す試金石となっている。本稿では、生成AIと著作権の交差点における最新の法的動向、特にニューヨーク・タイムズ対OpenAI訴訟の意義、並びに各国の規制的応答を構造的に分析する。

生成AIの仕組みと著作権法上の論点整理
NYT vs OpenAI訴訟の概要と法的争点
各国のAI著作権に対するアプローチの違い
AI生成物の著作物性 — Thaler v. Perlmutter判決とその含意
今後の法的枠組みの展望とクリエイターへの影響

生成AIの仕組みと著作権法上の論点整理

生成AIシステムの基盤となる大規模言語モデル（LLM）は、インターネット上から収集された膨大なテキストデータに対して機械学習を適用することで構築される。この学習プロセスそのものが著作権問題の核心を形成している。従来の著作権法は、ある著作物を「複製」する行為を原則として権利者の許可を必要とするものとして設計されてきた。しかし、生成AIの学習過程は、この「複製」という概念と単純には合致しない複雑性を持つ。

機械学習の観点から見れば、学習プロセスは著作物のテキストそのものを直接的に保有するのではなく、その統計的パターンを抽出し、数学的な重み付けパラメータとして蓄積する処理である。この点について、学習段階での複製は法的に許容可能な「変形的利用」（transformative use）に該当するのか、あるいは著作権侵害の対象となるべき複製行為なのかが、著作権法学の中核的な議論となっている。

論点の中心：学習データとしての著作物の使用が、著作権法上の「fair use」（米国）または「引用」「私的使用」などの例外に該当するか否か、並びに出力結果が元の著作物と実質的に類似している場合の法的責任の帰属問題が、今後の法制度を規定することになる。

日本の著作権法では、著作物の複製は原則として著作権者の許可を必要とするが、第三十条の四では「情報解析の用に供する場合」として一定の例外が認められている。しかし、この条文が生成AIの学習プロセスに十分に対応しているかについては議論がある。著作権者の補償請求権が明記されていない点、また研究開発目的と商業的利用の区別が明確でない点が、適用上の課題となっている。

著作権法の本来的な目的は、クリエイターに対するインセンティブを通じて創作活動を促進することにある。しかし、生成AIが著作物を学習する際に、その学習成果が元の著作者に対していかなる経済的還元ももたらさないという構造的な非対称性は、著作権保護の正統性そのものを問う根本的な課題である。

NYT vs OpenAI訴訟の概要と法的争点

ニューヨーク・タイムズ紙がOpenAIおよびマイクロソフトを相手方として提起した訴訟は、2023年11月に米国南部地区連邦地裁に提出された。同訴訟は、ChatGPTの学習に用いられたデータセット内に同紙の著作物が無許可で含まれていたこと、並びにChatGPTがニューヨーク・タイムズのコンテンツと実質的に同一のテキストを生成する能力を有していることを主張の中心としている。

訴訟における請求の根拠は、複数の法的理論に基づいている。第一に、直接的な著作権侵害である。学習段階における著作物の複製が、著作権法第一条で保護される複製権の侵害に当たるとの主張である。第二に、ニューヨーク・タイムズのコンテンツを学習したモデルが、本来は有料で提供されるべき著作物に相応する価値を有するテキストを生成する能力を持つことで、同紙の著作物の市場価値を減損させているとの不当利得的な主張である。

訴訟の主要な法的争点：

学習段階での著作物の複製が「fair use」に該当するか否か
生成されたテキストが元の著作物と実質的に類似している場合、その責任は誰に帰属するか
商業的利用を目的とした生成AIの学習において、変形的利用の概念がいかに適用されるべきか
著作権者に対する事前許可・事後補償の必要性

OpenAIおよびマイクロソフトの主張は、学習段階における著作物の使用が変形的利用（transformative use）に該当し、fair useの原則で保護されるべきであるというものである。変形的利用論は、米国の著作権判例法（特に Harper & Row v. Nation Enterprises事件やBeth Israel Hospital v. NLRB事件の先例）で確立された概念であり、元の著作物をアルゴリズムの学習に用いることは、元の著作物の潜在的な市場を奪うものではなく、むしろ新たな創作活動を支援する補助的な利用であるとの論理である。

しかし、ニューヨーク・タイムズ側は、ChatGPTが生成するテキストがしばしば同紙の記事の実質的な内容を復製していることを指摘し、これは単なる学習段階での利用ではなく、生成モデルを通じた二次的な複製に相当するとして反論している。さらに、OpenAIが有料サービスを通じてこの能力を商業化していることは、著作権者の潜在的な市場を直接的に侵害するものであると主張している。

本訴訟は、米国著作権法のもっとも複雑かつ重要な問題領域を焦点としている。その判断は、単にOpenAIの法的責任を決定するものではなく、AI時代における著作権保護の枠組みそのものを再定義する可能性を持つ。特に、fair useの四要因テスト（使用の目的・性質、著作物の性質、使用された部分の量と実質性、市場価値への影響）がいかに適用されるかについて、法的基準を確立することになる。

各国のAI著作権に対するアプローチの違い

生成AIと著作権の関係に対する各国の規制的応答は、それぞれの法体系の基本的性質と産業政策の優先順位を反映した大きな相違を示している。以下の比較表は、主要国における現在のアプローチを構造的に整理したものである。

国・地域	法的フレームワーク	学習許諾の要件	著作権例外	規制の特徴
米国	Copyright Act（1976年版）	Fair useで許容される（現状）	Section 107（変形的利用）	判例主導、Fair use基準の拡張的解釈
欧州連合	デジタル著作権指令（改正案）	原則として許諾必須	テキスト・データマイニング例外（限定的）	権利者保護重視、オプトアウト制度の導入
日本	著作権法第三十条の四	許諾不要（情報解析）	情報解析の用途で一定認可	条文規定による明確化、補償請求権の検討中
英国	Copyright, Designs and Patents Act	テキスト・データマイニング例外	Section 29A（研究・教育目的）	柔軟性と権利者保護のバランス

米国のアプローチは、判例法伝統に基づく柔軟性を特徴とする。Fair useの四要因テストは、具体的な状況に応じた個別判断を可能にする一方で、その適用結果の予測可能性については課題を残している。生成AIに関する現在の米国の立場は、変形的利用論を通じてAI企業に有利な解釈を示す傾向がある。しかし、ニューヨーク・タイムズ訴訟の進展により、この立場が再考される可能性は高い。

欧州連合は、より権利者保護重視の立場を採っている。デジタル著作権指令の改正案では、テキスト・データマイニングのための著作物の利用について、著作権者が明示的にオプトアウトすることを条件として認める制度を導入する方向性が示されている。これは、デフォルトでは利用を禁止し、著作権者の明示的意思に基づいて利用を許可する構造であり、著作権者の権利を実質的に強化するものである。また、EUのAI規制法案では、著作物の無許可利用に対する透明性要件と補償メカニズムの検討が組み込まれている。

日本の著作権法は、第三十条の四で「情報解析の用に供する場合」として、著作物の複製を許諾なく認める制度を有している。この条文は、テキストマイニングおよび機械学習を想定して導入されたものであり、形式上は生成AIの学習を許容する構造を持つ。しかし、条文では補償請求権が明記されておらず、また商業的利用と研究開発目的の区別が曖昧であるという実務的な課題を抱えている。文化庁は2024年度から著作権制度の見直しを進めており、特に生成AIと著作権の関係について、より詳細な規定を設ける方向での検討が予定されている。

英国は、テキスト・データマイニングに関して比較的柔軟な例外を認めながらも、著作権者の権利保護とのバランスを意識した慎重なアプローチを採っている。Section 29A は研究・教育目的の利用を明確に保護する一方で、商業的な生成AI開発への適用については制限的な解釈がなされる傾向がある。

規制の方向性：グローバルな流れとしては、著作権者の権利保護と透明性要件を強化する方向が主流となりつつあり、単純な「許容」ではなく、何らかの形での著作権者への通知・補償メカニズムの導入が検討されている。

AI生成物の著作物性 — Thaler v. Perlmutter判決とその含意

AI生成物の著作物性に関する重要な判例として、米国著作権局（USCO）の行政訴訟である Thaler v. Perlmutter 事件（2023年8月）が存在する。本件は、AI技術によって生成された芸術作品に対する著作権登録を巡る事件である。

事件の背景は以下の通りである。Stephen Thaler は、自身が開発した「Creativity Machine」というAIシステムを用いて生成した画像に対して、著作権登録を米国著作権局に出願した。USCOは、著作権法の保護対象は「人間による創作」であることを根拠として、登録申請を却下した。これに対して、Thaler は米国連邦地方裁判所（東部地区）に行政訴訟を提起した。

連邦地方裁判所は、USCOの判断を支持する判決を下した。判決の要点は、米国著作権法が保護する著作物は「人間の独創的創作」を本質的前提とするものであり、AI自動生成物がこの要件を満たさないというものである。判決は、著作権保護の目的が人間のクリエイターに対するインセンティブを提供することにあり、AI生成物に著作権保護を与えることは、この基本的目的と合致しないと述べた。

しかし、この判決は単に「AI生成物には著作権がない」という単純な結論を示すものではない。判決文には、以下のような重要な示唆が含まれている。第一に、AIが人間のクリエイターの創作過程を補助するツール（例えば、フィルター機能、スタイル変更機能）として機能する場合には、人間による創作的選択がある限り、著作権保護が認められる可能性が示唆されている。第二に、AIが生成したコンテンツに対して人間が実質的な編集・改変を加えた場合、その編集行為を「創作的寄与」（creative input）として著作権保護の対象とすることが可能である。

Thaler判決の法的含意：

完全自動化されたAI生成物には、現在の米国法では著作権保護が及ばない
ただし、人間による創作的な選択・編集が含まれる場合は保護の可能性がある
この区別は、今後のAI関連著作物の登録審査において実務的な基準となる
著作権登録制度の見直しが必要な課題として提示されている

本判決は、AI時代における著作権制度の適応課題を明確にした意味で重要である。特に、「創作性」の定義が人間の意図や創造性に本質的に結びついているという点は、AI技術の発展に伴い、制度的な再検討を迫るものである。

日本の著作権法でも、著作物の定義は「思想または感情を創作的に表現したもの」（第二条）とされており、創作性の要件が中心的であることは米国と共通している。ただし、日本法では「創作的表現」をいかに解釈するかについて、より柔軟な余地がある可能性も指摘されている。例えば、AIが生成したテキストや画像であっても、その利用者が特定の目的のもとでAIパラメータを調整し、生成結果の選択・編集を行った場合、その人間による選択行為を創作的寄与として評価することも理論的には可能である。

また、Thaler判決は、AI開発企業の法的責任問題にも影響を与える。もしAIが自動生成した著作物に著作権がないとすれば、AI企業がそうした著作物を利用者に提供する際の法的責任をいかに構成するかが問題になる。特に、利用者がAI生成物を利用して商業活動を行う場合、その商業化に伴う責任が誰に帰属するのかについて、これまでとは異なる法的構成が必要になる可能性がある。

今後の法的枠組みの展望とクリエイターへの影響

生成AIと著作権の問題は、単に法的構成の技術的な問題ではなく、知識経済における価値分配と創作インセンティブの根本的な問題に関わっている。今後の法的枠組みの展望を、複数の観点から整理する必要がある。

第一に、国際的な規制調和の必要性である。現在、各国が異なるアプローチを採っており、これは国際的なデジタル商取引において大きな課題を生じさせている。AI企業が複数国で活動する際、各国の異なる規制に対応することのコストは、結果として小規模なクリエイターに比べて大規模な企業に有利に働く可能性が高い。国際的な知的財産権機関（WIPO）では、生成AIと著作権に関する国際的なコンセンサスの形成に向けた作業が進められている。ただし、各国の産業政策的利益が対立しているため、統一的な国際規範の成立には時間を要する見通しである。

第二に、透明性と説明責任の強化である。今後の規制では、AI企業が学習に用いたデータセットの開示、特にどの著作物が含まれていたかについての明確な情報提供が求められる傾向が強まるだろう。これは、EU のAI規制法案に盛り込まれている「透明性要件」と呼応する発展である。こうした透明性強化により、著作権者は自身の著作物がいかに利用されているかについて、より正確な情報を得ることが可能になる。

第三に、補償メカニズムの構築である。完全な禁止ではなく、何らかの形での著作権者への補償を通じてバランスを取るアプローチが、今後の主流になる可能性が高い。これは、日本の著作権法第三十条の四における「補償請求権」の検討や、EUのテキスト・データマイニング例外における「適切な報酬」要件と一致する方向性である。補償の仕組みとしては、以下のようなモデルが考えられている：

可能な補償メカニズムのモデル：

直接補償：AI企業が著作権者に直接ライセンス料を支払う方式
集中管理：著作権管理団体（日本の場合は日本音楽著作権協会など）が徴収・配分する方式
基金設立：特定のレベニューシェアをAIクリエーター支援基金に充当する方式
ライセンス推定：一定条件下での利用を合理的ライセンスとして推定し、事後的に補償する方式

第四に、クリエイターへの実務的影響である。今後の法的枠組みの変化に伴い、クリエイターは自身の著作物の利用状況についてより積極的な管理が求められるようになる可能性が高い。具体的には、AI学習データベースからの除外オプション（オプトアウト機能）の提供や、著作物のメタデータに機械可読的な利用条件を付記することが、業界標準として確立されるかもしれない。また、クリエイターの権利保護に関する法的・技術的インフラストラクチャーの充実が、喫緊の課題となる。

第五に、小規模クリエイター保護の枠組みである。大規模な著作権所有企業（新聞社、映画スタジオ、音楽レーベルなど）は、AI企業との交渉力を有しており、個別の許諾交渉を通じた補償を獲得する可能性が相対的に高い。これに対して、個人ブログ執筆者、フリーランスライター、新興アーティストなど、個別的な交渉力を持たないクリエイターの利益保護は、制度的な保護メカニズムによってのみ実現可能である。集中管理団体の機能拡張やクリエイターの権利管理支援体制の整備が、重要な政策課題となる。

第六に、AI生成物と人間創作物の区別の明確化である。今後、著作権登録制度や著作物の流通市場において、「人間による創作」と「AI自動生成」の区別がより明確に認識される必要が生じるだろう。これに対応して、AI生成物に対する明確な表示義務の導入や、AI生成物の知的財産上の扱いについて、新たなカテゴリーを設ける制度的工夫も検討されるべきである。

最後に、継続的な法的評価と制度調整の必要性である。AI技術は急速に発展しており、現在の法的フレームワークが数年後にもなお適切であるかは不確実である。したがって、定期的な法的評価と、技術発展に応じた制度的調整のメカニズムが制度的に組み込まれることが重要である。これは、特に法律によって既に固定化された国よりも、制度的に柔軟性を保つ国の方が、長期的には対応能力において優位に立つ可能性を意味している。

生成AIと著作権の問題は、知識経済の時代における創作インセンティブ、技術発展の自由、および著作権者の権利保護の三者の衡量を求める本質的に複雑な問題である。今後の法的枠組みの構築に際しては、短期的な産業利益よりも、長期的な創作生態系の持続可能性を視野に入れた戦略的思考が必要とされるだろう。