|
海外メディアの報道によると、ChatGPTの開発元であるOpenAIは最近、ChatGPTなどのAIツールの開発に著作権で保護された情報を使用していると述べました。著作権保護がなければ、これらのツールは付加価値を生み出すことは「難しい」でしょう。また、この声明では、OpenAIが英国貴族院の通信・デジタル特別委員会に提出した大規模言語モデルに関する調査に関する文書の中で具体的な意見を表明したことも示唆されています。
ニューヨーク・タイムズは、OpenAI にすべての GPT インスタンスを削除するよう要求する著作権訴訟を起こしました。 ChatGPTや画像生成ツールDALL-EなどのAIモデルは、トレーニングコースから能力を獲得していますが、その一部は著作権者の許可なくパブリックインターネットから膨大な量のコンテンツをスクレイピングすることで提供されています。OpenAIは、トレーニングコンテンツの一部は特定の応用シナリオにおいてライセンス供与されていると主張しています。この自由なスクレイピング手法は、機械学習における標準的な学術的手法として長年用いられてきましたが、近年、ディープラーニングやAIモデルの商用化が進むにつれて、厳しい批判にさらされています。 OpenAIは貴族院への提出書類の中で、「今日の著作権は、ブログ投稿、写真、フォーラム投稿、ソフトウェアコードスニペット、政府文書など、事実上あらゆる人間の表現をカバーしているため、著作権で保護された素材を使用せずに今日の最先端のAIモデルをトレーニングすることは不可能である」と述べている。 さらに、OpenAIは、トレーニングデータを「1世紀以上前に」作成されたパブリックドメインの本や図面に限定すると、「今日の市民のニーズを満たす」人工知能システムは提供されないと述べている。 先月、ニューヨーク・タイムズはOpenAIとその主要投資家であるマイクロソフトに対し、それぞれの製品でニューヨーク・タイムズのコンテンツを違法に使用したとして訴訟を起こしました。OpenAIは月曜日にウェブサイトでこの訴訟に対し回答し、法的根拠がないと述べ、ジャーナリズムへの支持と報道機関とのパートナーシップを改めて表明しました。 OpenAIは、AIモデルの作成は正当かつ合法であり、一定の状況下では著作権で保護されたコンテンツを所有者の許可なく限定的に使用することが法律で認められていると主張している。同社は、著作権法はそのような素材をAIモデルの学習に使用することを禁止していないと主張している。 OpenAIは月曜日のブログ投稿で、「AIモデルの学習にインターネット上で公開されている素材を利用することは、長年にわたり広く受け入れられてきた前例に裏付けられた合理的な利用法です」と述べている。「この原則はクリエイターにとって公平であり、イノベーターにとって必要であり、AIの競争力を高めるために不可欠だと考えています」 OpenAIは著作権訴訟の主張を否定し、ChatGPTの各応答は派生的な著作物であると主張した。 OpenAIがAI学習データのフェアユースを主張したのは今回が初めてではありません。8月にも、コメディアンのサラ・シルバーマンが提起した著作権訴訟に対し、OpenAIが公開資料の使用をフェアユースとして擁護した同様の事例がメディア報道で確認されました。 OpenAIは、訴訟の原告らが「著作権の範囲を誤解しており、人工知能の最前線にある大規模言語モデルなどの革新に適切な余地を残す制限や例外(フェアユースを含む)を考慮に入れなかった」と主張している。 |