弁護士が解説!著作物のAI学習利用に関する海外制度と最新動向
弁護士、AI Practice Group統括
島内 洋人
米国のOpen AI, Inc.(OpenAI)が、2022年9月28日に、自然言語の記述からデジタル画像を生成するDALL-E 2を公開しました。また、OpenAIは、2022年11月30日に、GPT-3.5をベースとし、人間の自然言語の記述をもとに自然言語での回答を生成するChatGPTをリリースしました(2023年3月14日には、GPT-4をベースにしたChatGPTがリリース)。ChatGPTは、2023年4月の段階でユーザーが1億を超え、ユーザーは瞬く間に世界に広がっています。今回は、AIに関する新規ビジネスが沢山立ち上がってほしいという願いを込めつつ、生成AIビジネスを日本で行う場合の法的論点に触れながら、「日本には同分野でのビジネスチャンスがある」と考えられる理由を解説します。なお、法律事務所ZeLoでは、生成AIやAIを用いた新規ビジネスを数多く支援し、研究も深めています。本記事は、当事務所が検討してきた法的論点について解説する連載第一弾です。
法律事務所ZeLo代表弁護士。2009年早稲田大学法学部三年次早期卒業、2011年東京大学法科大学院修了。2012年弁護士登録(第二東京弁護士会所属)。2017年法律事務所ZeLo創業。主な取扱分野はブロックチェーン・暗号資産、FinTech、IT・知的財産権、M&A、労働法、事業再生、スタートアップ支援など。
2017年東京大学法学部卒業、同年司法試験予備試験合格。2018年司法試験合格。2019年弁護士登録(第二東京弁護士会所属)。2020年法律事務所ZeLo参画。クロスボーダー取引を含むM&A、ストック・オプション、スタートアップ・ファイナンスなどコーポレート業務全般を手掛けるほか、訴訟/紛争案件も担当。また、AI、web3、フィンテックなどの先端技術分野への法的アドバイスを強みとする。主な論文に「ステーブルコイン・DeFiとCBDC」(金融・商事判例1611号、2021年)、「スタートアップの株主間契約における実務上の論点と対応指針」(NBL 1242(2023.5.15)号)など。
目次
生成AIとは、画像、文章、音声、プログラムコード、構造化データなどさまざまなコンテンツを生成することのできる人工知能のことを意味します。
これまでも言語を扱う大きなAIモデルを作り、大量のデータと高性能の計算機で学習させて精度を高める研究が続いていたところ、ChatGPTが一般のユーザーに公開され、裾野が広がりました。
ChatGPTには文脈理解などの性能を高めるTransformerという深層学習の手法が使われ、能力が桁違いに向上しました。Transformerは、自然言語処理や画像認識などの機械学習タスクにおいて、広く使用されるニューラルネットワークの一種で、膨大なデータを事前学習(Pre-training)しておくことにより、性能が大幅に上がりました。
また、データセットを使って事前学習した訓練済みモデルの一部または全部を、別のデータセットを使って再トレーニングすることによって、機械学習モデルのパラメーターが微調整(Fine-tuning)され、さらに精度が高まったと言われています。
諸外国では生成AIに関する法規制が様々ありますが、日本は、諸外国に比べて、AIビジネスを推進しやすいように設計されているといえ、AIによるビジネスを国家的に推進している国です。そのため、同分野でのビジネスチャンスがあるといえるでしょう。
生成AIに関するビジネスを行うにあたって、留意すべき一般的な法律を大雑把に掴むとすると、①著作権法と②個人情報保護法になります(別途法的論点に関する記事を掲載していく予定ですので、詳細は次回以降の記事を参照するか個別にお問合せください)。
現状①②のいずれにおいても、日本の法規制はAIによるビジネスを推進する立場にあります。また、③政府がスタートアップを推進する流れがこれを後押ししています。簡単にこれらを見ていきたいと思います。
AIビジネスを行うなら日本だ、という点を基礎付けるのは、著作権法30条の4第2号です。
この条文は大量のデータセットを機械学習で用い、参照しながらアウトプットする際の利用にあたって、非常に重要な条文です。条文は以下のとおりです。なお、平成31年1月1日に、著作権法旧第47条の7がこの第30条の4に整理・統合されています。
著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合
著作権法第30条の4(太字は引用者)
噛み砕いて言うと、「情報解析」のためであれば、必要な範囲で、著作権者の承諾なく著作物の利用ができる、というものです(例外はありますがここでは詳細には触れません)。そして、「情報解析」に機械学習が含まれると考えられていますので、他人の著作物であっても、機械学習のためであれば無許諾で自由に利用できる、ということになります。
営利目的の学習済みモデル生成のためにもこの条文は適用され、この場合にも著作物の利用が可能となっています。
これに対して、諸外国の法規制を見ていきましょう。
まず、米国については、フェアユース(アメリカ著作権法107条)規定によってこの領域が規律されています。フェアユースというのは、明確に規制を定めるのではなく、裁判実務の中でルールを形成していこうというものです。裏を返すと、明確にデータの学習利用を認める規定がなく、現に複数の著作権侵害を主張する訴訟が提起されています(GitHub社の「Github Copilot」、Stability AI社の「Stable Diffusion」、Midjourney社の「Midjourney」に関するクラスアクション等)。
また、EUでは営利目的の場合、著作権者がAI学習利用を禁止しているのにもかかわらず利用すると原則著作権侵害になるとされています。
このように、日本の状況は、機械学習を容易に行えるように許容する規定を明示的に設けるといった意味で、非常に特異であるといえます。これは、AIに関する新規ビジネスに対しては非常にポジティブであり、チャンスに溢れていると捉えられるでしょう。
個人情報保護法の観点から見ても、日本において、生成AIに関するビジネスを行うには優位性があるといえます。
現状の日本では、個人情報取扱事業者は、利用目的を特定し、公表する必要がありますが(個人情報保護法17条1項、21条1項)、裏を返せば、利用目的を適切に公表していれば本人の同意なくして個人情報を収集し学習等に利用することができるということです。
ただし、日本では、要配慮個人情報(個人情報保護法2条3項)については、取得そのものについても、その本人等によって公開されている情報を除いて、原則として本人の同意が必要であるため、配慮が必要になります(個人情報保護法20条2項7号)。
・・・「要配慮個人情報」とは、本人の人種、信条、社会的身分、病歴、犯罪の経歴、犯罪により害を被った事実その他本人に対する不当な差別、偏見その他の不利益が生じないようにその取扱いに特に配慮を要するものとして政令で定める記述等が含まれる個人情報をいう。
個人情報保護法2条3項(太字は引用者)
2 個人情報取扱事業者は、次に掲げる場合を除くほか、あらかじめ本人の同意を得ないで、要配慮個人情報を取得してはならない。
・・・
七 当該要配慮個人情報が、本人、国の機関、地方公共団体、学術研究機関等、第五十七条第一項各号に掲げる者その他個人情報保護委員会規則で定める者により公開されている場合
八 その他前各号に掲げる場合に準ずるものとして政令で定める場合
・・・
個人情報保護法20条2項(太字は引用者)
まとめると、日本においては、要配慮個人情報保護法については、本人等が公開している情報を除いて、そもそも機会学習を行うための取得には慎重にならなければならないものの、利用目的の公表のルールを守れば、ビジネスを進めることができます。
なお、個人情報保護委員会は、2023年6月2日に、OpenAIに対して注意喚起を行っています(個人情報保護委員会「生成 AI サービスの利用に関する注意喚起等について」(2023年6月2日公表)))。これは、上記の要配慮個人情報保護法に関する規制を遵守するように、できるかぎり即時の取組みを行うようにとの要請になりますが、サービスの差し止めを求めるなど、ビジネスへの致命的な注意喚起ではありません。
これに対して、EUでは、General Data Protection Regulation(GDPR:「一般データ保護規則」)のもと、加盟国であるイタリアが、2023年3月、ユーザーやデータ主体に対する情報提供義務違反(GDPR13条)、個人データの収集・処理の法的根拠の不在(GDPR6条)、出力データの正確性原則違反(GDPR5条1項(d))、適切な年齢確認のフローの未整備(GDPR8条)をきっかけにChatGPTの利用を一時停止しました。(GPDP(GARANTE PER LA PROTEZIONE DEI DATI PERSONALI・データ保護機関)「Provvedimento del 30 marzo 2023」(2023年3月30日公表))。GDPR上では日本の個人情報保護法に比べ、このような措置をとれる程の重い規制が存在します。
なお、イタリアについては、2023年5月に、OpenAIの対応により、ユーザーの権利やデータの透明性が確保されたとして、その制限を解除していますが、GDPRの規制は、日本の個人情報保護法に比べ厳格であり、今後も慎重な対応が必要になることが予想されます。
日本政府の直近の動向から見ても、政府としてAIビジネスを推進していきたいと考えていることがうかがえます。
例えば、OpenAI社のCEOであるSamuel H. Altman(サム・アルトマン)氏は、2023年4月10日に来日し、岸田首相に面会しています。確かに、ChatGPTのユーザーは、短期間に一気に増えましたが、一スタートアップのCEOが、このスピード感で、国の首相と面会するといったことは通常はあり得ません。このことからも、政府が、「AIにチャンスを見出している」「本気である」といった姿勢が現れていると感じます。
また、内閣府に設置された2023年5月に設置されたAI戦略会議においても、インターネット革命時に後塵を拝した後悔と、生成AIと日本との親和性から日本には追い風であるとの、強い意思が表明され、政府そのものの強い意思が感じられます。
盛り上がりを⾒せる⽣成AI の技術は、まだ黎明期である。技術的な課題は多くあり、今後、こういった技術的課題が解決されるたびに⼤きな進展となって世の中に波及する。数年間のうちに技術が継続的に進展していくだろう。⻑らく停滞してきた⽇本は、AI の勃興とともに再び成⻑の機運が⾒えている。
この芽を伸ばしていくため、いまこそ⼤胆な戦略が必要なのは間違いない。先⾏する⼆つの変⾰期における⽇本のふるまいを振り返れば、産業⾰命時には内燃機関という新しい技術をすみやかに吸収し、独⾃の改良を加え⾃動⾞産業を興して世界のトップランナーとなった。対してインターネット⾰命時には、戦略と決断の速さ、資本投下の物量で劣り、後塵を拝した。今回のAI 変⾰期はどうか。
⽣成AI と⽇本の親和性を踏まえれば、⼗⼆分に競争できる状況にあるのではないか。ChatGPT の世界的流⾏などによりその利便性・重要性が⽇本の中でも⼀気に知れ渡ったこと、そして、オープンな技術開発も続いてきたために、地域や資本の別なく誰もが参⼊できることは⽇本には追い⾵だ。考えを尽くし策を練れば、果実はついてくるのが現在のタイミングと⾔える。
AI戦略会議「AIに関する暫定的な論点整理」(2023年5月26日)5~6ページ(抜粋)(改行・太字は引用者)
現状の法規制の在り方と、政府の成長戦略を考え合わせると、生成AIを始めとするAIに関するビジネスについては、日本でビジネスを行うにあたって大きなチャンスがあるといえます。また、日本全体でこれを盛り上げていく機運があると考えています。
これからのチャンスを手にできるかは、日本の起業家や企業内で新規ビジネスを行う方々の創意工夫にかかっていると思っていますが、法律事務所ZeLoではこれらの取り組みを全力で応援し、リーガルサービスの提供を通じてサポートしていきます。
最後に、一般的に思いつく、今後発展しそうなビジネスモデルを例に、その法的論点を解説します。
現行の法律の法的解釈によって解決できる・解決すべき領域と、現行の法規制上一定のルールメイキングが必要な領域に分かれることが想定されます。
いずれにしても、このようなビジネスが適切に実施されるように、法律事務所ZeLo全体で規制のあり方を検討していきたいと思いますし、日本全体でそういった議論がおきることを願っています。
プロンプトエンジニアリングを用いて、大規模言語モデルのプロンプトを適切に制御して、コードを生成したり、文章、パワーポイント、エクセル等を容易に生成できるようにするサービスが考えられます。
プロンプトを制御することによって成果物の質を高めるといった方向のサービスであれば、特段大きな法的論点は存在しないものと考えられます。ただし、プロンプトを制御するだけではなく、新しいデータを学習やエンベッティング等を用いて利用する場合には、以下のビジネスと同様の論点が生じ得るため留意が必要です。
プロンプトエンジニアリング:プロンプトとは、人工知能(AI)システムに対して指示や命令を出すことを指します。プロンプトエンジニアリングとは、言語モデル(LMs)を効率的に使用するためのプロンプトを開発および最適化する比較的新しい学問分野です。
バーチャルなキャラクター、音楽を生成できるプラットフォームを運営するビジネスが考えられます。AIアイドルであったり、AIアニメ、AI楽曲であったりと色々な用途があると考えられます。
プラットフォーマーによる学習段階においては、キャラクターや音楽の生成を行うにあたって学習された画像や楽曲の著作権が問題となります。上記のとおり、著作権法30条の4が適用される場合には、著作権侵害は問題となりません。なお、キャラクターの声色も生成AIで作れるようにしてしまうということも考えられますが、現状声色には、そもそも明示的な著作権や知的財産権が存在しないため、声色についてはこういった論点は存在しません。
ただし、これは、学習段階での議論であり、ユーザー等によって生成されたAI創作物が、既存の著作物と同一・類似であった場合には、著作権侵害が成立する可能性はありますので、この点は法的論点になります。一般的に、プラットフォーマーは、ユーザーがプラットフォームを利用した場合、プラットフォーム自身は責任を負わないと利用規約を定めます。しかし、実際にユーザーが著作権侵害等を行ってしまうことを容易にしてしまう場合には、どのように責任を分担するかについては今後の議論となり得ると考えられます。
なお、法的枠組みとは別に、既存のクリエイターを保護する観点で、データが利用されているクリエイターのために、何らかの収益を分配するようなプラットフォームが現れる可能性はあるかもしれません。
AIアイドルなど人間の肖像のようなものを組成したり、死後も自身の人格を後世に残すために自身の考え方を学習させて人格そのものを組成するといった用途も考えられます。
まず、AIアイドル等の肖像の組成については、他人の写真や動画を学習に用いる場合には、肖像権の侵害が問題となります。この点については、大量の肖像のデータセットが用いられて学習されたモデルを用いて肖像を生成した場合には、成果物の利用に他人の名誉権等の権利侵害が想定されるものではなければ、学習段階の肖像権の侵害については原則として問題とならないと考えられます。
自身の人格を残すといったサービスについては、自分自身の同意があれば、特段法的論点はないと考えられますが、同意を取得せずに、特定の人の人格を生成するといったサービスについては、肖像権やパブリシティ権の侵害が問題となります。
なお、法的な枠組みとは別に人間が人間らしく生きるという意味での論点が発生する可能性があり、AI倫理は別途今後の議論となっていくものと考えられます。
大規模言語モデル(LLM)を専門領域で活用するビジネスが想起されます。税理士、公認会計士、弁護士等の士業や、医療領域を補助するようなサービスが考えられます。
例えば、一定の質問であれば自動に回答ができるようになるといった言語モデルを組成することも考えられますが、まずは、税理士法、公認会計士法、弁護士法、医師法等の業法の検討が法的論点になります。
プロンプトエンジニアリングをベースに他人の著作物を利用して、何らかの新しい回答を組成する場合には、プロンプトに対して参考情報として他人の著作物を出力する際の著作権侵害(著作権法30条の4)と、そもそもその回答が著作物を翻案したものなのか否か(著作権法27条)が論点となります。
上記のまとめは、NotionAIで生成してみましたが、概ね外していないように思いました。生成AIビジネスを行うにあたって、AIに関する新規ビジネスが沢山立ち上がってほしいと思いますし、日本にはチャンスがある、熱量をもってビジネスを盛り上げようということで、本稿を締めさせていただければ幸いです。
なお、法律事務所ZeLoでは、AIをはじめとする先端領域に関して、創業時から潜在性に注目して研究・実務を進めてまいりました。その知見と経験をもとに、専門チームを編成し、多数のクライアントへ法的アドバイスを提供しています。ビジネススキームに合わせ、迅速かつ質の高いサービスを提供いたします。「生成AIを活用したビジネスを展開したいが、ビジネススキームについて相談したい」「法的論点について相談したい」など、どんなご相談でも構いませんので、お気軽にお問い合わせください!