BUSINESS
アメリカの映像業界で進む「生成AI活用」の現在地
目次
今、アメリカでは「生成AI革命」と呼ぶべき事態が進行している。それは、業界によって呼び名こそ多少違えど、進行しているメカニズムや現象そのものは同じである。それまでは多くの人間が知恵を絞り手足を動かして行っていた一連の「仕事」や「作業」の一部や全体が、生成AIを筆頭とするAIによって置き換えられ、生産性を劇的に増加させているばかりか、「ニュービジネス」と呼ぶべきものを各所で生み出しつつある。
本記事は、そうしたアメリカの現状を中心に、いずれ日本を含む世界を大きく変えることになるであろう「生成AI革命」について業界ごとにお伝えする。今回は、生成AIの台頭著しいアメリカ・ハリウッドの映像制作の現場をご紹介する。
生成AIで人間の顔を変幻自在に変える「Deep VooDoo」
Deeo VooDooは、人気アニメ「サウスパーク」(South Park)のクリエーターとして有名なトレイ・パーカー(Trey Parker)とマット・ストーン(Matt Stone)の二人が立ち上げた「生成AI映像プロダクションスタジオ」だ。新型コロナウィルスのパンデミックにより人の往来が途絶えたハリウッドで、「人を介さない映像づくり」を行うことを目的に当初立ち上げられ、以後、ハリウッド映画やテレビドラマなどを中心に、生成AIによる「ディープフェイク」(Deep Fake)映像の制作を行っている。
Deep VooDooは、2020年に公開された人気ラッパー、ケンドリック・ラマー(Kendrick Lamar)のプロモーションビデオ(PV)によりその名をハリウッドに知らしめた。あたかもワンテイクで撮影されたかのように見えるそのPVで、ラマーはただひたすらにラップを歌い続ける。そうこうするうちにラマーの顔がOJシンプソン、ニプシー・ハッスル、コービー・ブライアント、カニエ・ウェストの顔に次々と変顔してゆくのだ。
従来のVFX技術を遥に超えた映像の出来栄えにハリウッドは衝撃を受け、Deep VooDooはメジャーを含む複数の映像プロダクションスタジオから仕事のオファーを受け始めるようになった。
Deep VooDooは、映像制作の中でも特に「デ・エイジング(De-aging, 若返り)」や、「リ・フェイシング(Re-facing, 変顔)」と呼ばれる比較的短尺の映像制作を得意としている。彼らの技術は、ルーカスフィルムを買収して独自のスターウォーズビジネスを開始したディズニーに、とりわけ注目されたという。スターウォーズの新エピソードでルーク・スカイウォーカーを従来のVFX技術で若返らせようとして大失敗した経験が背後にあったのは間違いない。
Deep VooDooのテクノロジーを映像づくりにどのように活用するのが法的・倫理的に正しいのかについての一般的な答えは、今のところ出ていない。多くの現場では、法律やこれまでの業界慣習などを睨みつつ、試行錯誤の中でそれぞれの最適解を求めているというのが実態であろう。しかし、そうした課題が残された状態でも、Deep VooDooに対する仕事のオファーが絶えることはない。テクノロジーが先行してビジネスを広げてゆくのは、ハリウッドの伝統と言うべきものなのだろう。
「FlawlessAI」で唇の動きを「現地の言葉」に
FlawlessAIは、ハリウッドで25年以上の経験を持つ映像監督・プロデューサーのスコット・マン(Scott Mann)と、有人のEコマース起業家のニック・ラインズ(Nick Lynes)の二人が立ち上げた会社だ。FlawlessAIは、独自に開発した「シネマティック・リップ・シンシング」(Cinematic Lip Syncing)という技術を活用し、映像に登場する俳優の「唇の動き」を多言語対応化、適正化する機能・サービスを提供している。
ハリウッドで制作される映像作品の多くはアメリカ国内のみならず、全世界に輸出され、各国の視聴者に楽しまれている。多くは輸出先国の言語で「ダビング」(Dubbing、 吹き替え)され、映像内の俳優が現地語を話しているという設定になる。
ところが、現地語にダビングされると通常、俳優の「唇の動き」が「現地の言語」から乖離してしまい、俳優が映像内で浮き上がった存在になってしまうケースが多い。例えば、英語と日本語では文法の違いや、単語の発音、センテンスの言い回しの違いなどから、場合によって日本語の映像ではセリフが全くないにも関わらず、英語のオリジナルの映像内では俳優がしゃべり続けているといったシーンが登場したりする。
そこでFlawlessAIの「シネマティック・リップ・シンシング」を活用することで、映像内の俳優の唇の動きを各国の言語に対応させ、視聴者が抱く違和感を排除することが可能になる。
FlawlessAIの「シネマティック・リップ・シンシング」は、映画の「最適化」にも使われている。ここでいう「最適化」とは、映像を配信先国のレーティング(視聴基準)に適合させるという意味だ。例えばアメリカでは、いわゆる「Fワード」が多用される映画は通常「R(成人向け)指定」となるケースが多い。「シネマティック・リップ・シンシング」では、映像内の「Fワード」をFで始まる当たり障りのない別の単語に置きかえ、演じる俳優の唇の動きをそれに合わせて作り変えることが可能だ。それにより、視聴者数が限定される「R指定」ではなく、より基準の緩い「PG指定」に適合させ、配給収入の増加を狙うことが可能になる。
確実に導入が進む生成AI、課題は?
今年2024年2月、アメリカを代表する世界的人気アーティストのビリー・ジョエルが17年ぶりの新作となる「ターン・ザ・ライツ・バック・オン」(Turn the lights back on)をリリース。アメリカのみならず世界中のファンを歓喜させた。
今年で75歳になったビリー・ジョエルの声は若々しく、往時からの衰えをやや感じさせたものの、独特の透き通った歌声は今も聴く人の心を刺すに十分であった。そして、このビリー・ジョエルの新曲のプロモーションビデオの制作には、上述のDeep Voodooが全面的に関与している。
プロモーションビデオの内容は至ってシンプルで、75歳になったビリー・ジョエルが静かにピアノを演奏し歌い始める。すると映像は彼がデビューしたころと思われる昔へと切り替わり、しばらく若きビリー・ジョエルが歌う姿が映し出される。若きビリー・ジョエルは、その後次第に齢を重ね、最後は歌い始めた時の現在の姿に戻って演奏を終える。長らくビリー・ジョエルのファンをやっている者にとっては思わされるところが多い映像だろう。
ビリー・ジョエル本人が自らの老いた姿を生成AIを用いて「顔変」や「若返り」をさせたり、若き頃の自分にピアノを演奏させたりすることについては、本人の意志や同意がある限り、特に問題はないだろう。しかし、もし本人の同意がない状態で勝手に第三者に本人をベースにしたディープフェイク映像を作られたり、他のアーティストなどとのコラボ映像などを作られたりしたとすれば、タダでは済まない事態に進展することになるのは火を見るよりも明らかだ。
なお、昨今のハリウッドではディープフェイクの問題のみならず、バックグラウンドアクターと呼ばれるエキストラ俳優が全身をボディスキャンされ、プロダクション側に勝手に彼彼女らの「アバター」を作られてしまっている実態が問題視され始めている。生成AIが制作した動画の著作権や肖像権などの取り扱いについては司法の判断を含めて、現在も激しい議論が続けられている。生成AI時代における映像などの著作権の問題については、別の機会に改めて考察させていただければと思う。
参考文献
https://techcrunch.com/2022/12/21/south-park-creators-deepfake-video-startup-deep-voodoo-conjures-20m-in-new-funding/
https:// www.flawlessai.com/people
https://j-seeds.jp/column/post-2400/
前田 健二
経営コンサルタント・ライター
事業再生・アメリカ市場進出のコンサルティングを提供する一方、経済・ビジネス関連のライターとして活動している。特にアメリカのビジネス事情に詳しい。