止まらない生成AIの進化。広がるビジネスシーンへの活用とその可能性

2024/6/19

OpenAIとGoogleが公開した最新生成AI
カーツワイルの「シンギュラリティ」から見た、生成AIの現在地
生成AIはビジネスシーンでどう活用されるのか？

先日、OpenAIとGoogleが、奇しくも相次いで自社の生成AIのアップグレードを発表した。見方によっては人間の能力をはるかに凌駕しているように見える両者の生成AIだが、能力はどこまで高まっているのだろうか。生成AIの進化とは、実際のところシンギュラリティ到来を意味するのだろうか。カーツワイルの予測などに照らし合わせながら、今後ビジネスシーンをどう変えていくか考察する。

OpenAIとGoogleが公開した最新生成AI

先日、OpenAIとGoogleが、相次いで自社の生成AIのアップグレードを発表し、世界中で大きな話題を集めた。OpenAIが発表した最新の生成AI「GPT-4o」（GPTフォーオー）は、「かつてなく高速に、テキスト、映像、そして音声コンテンツを取り扱うことができる」本格的な生成AIだ。人間の問いかけなどの音声によるインプットに対しては最速232ミリセカンドで反応し、通常の人間の対話能力と同程度か、それ以上の能力を確保している。

これまでの同社の生成AIが音声によるインプットをテキストデータに変換して処理し、テキストデータから音声データに再変換してアウトプットしていたのに対し、「GPT-4o」は、テキスト、映像、音声のそれぞれのインプットとアウトプットを同じニューラルネットワークで処理し、情報損失を最小限にとどめ、高速対応を実現している。また、画像生成能力も飛躍的に向上し、生成したキャラクターなどの画像データを維持したまま一貫したストーリー表現をさせることなども可能になった。

Googleの生成AI、Gemini（ジェミニー）はGPT-4oと同様、テキスト、コード、映像、動画、音声といった各種のコンテンツを取り扱うことができるマルチモーダル生成AIだ。GPT4oの直接的な最大のライバルと言っていいかもしれないが、Geminiは特に数学や物理学などにおける複雑な計算処理や、高度で複雑なコンピュータープログラミングなどを得意としているとされる。Googleによると、Geminiはフレキシブルなモデルが最大の特徴のひとつで、モバイルデバイスのような小型端末から、データセンターのような巨大なプラットフォーム上でも稼働させることが可能だ。Geminiは、サイズや機能、あるいは料金体系によってNano、Pro、Ultraの三つが用意されている。

Geminiは、その特徴のひとつであるマルチモーダル機能を最大限に活かし、Googleの各種のサービスにもプラグインされて提供される予定だ。今のところ、Googleサーチ、Gmail、Googleマップ、YouTube、Googleドキュメント・スプレッドシートなどでの活用が予定されている。Googleは、Geminiを自社の生成AIサービスの中核機能と位置づけ、Googleアンブレラを構成する各サービスの質を相互に高めてゆくことを狙っているのであろう。

カーツワイルの「シンギュラリティ」から見た、生成AIの現在地

ところで、「シンギュラリティ」という言葉を世に知らしめた人物のひとりであり、今も現役のGoogleプリンシパル・リサーチャーでもあるレイ・カーツワイル（Ray Kurzweil）は、生成AIの現在地をどのように見ているのだろうか。

カーツワイルは、著書”The Singularity is near”の中で、2029年がAIがいわゆるチューリングテストに合格する年になると予言しているが、その予言は今でも変わっていないのだろうか。なおカーツワイルは、昨年2023年3月5日に、生成AIなどのAIの世界的な開発競争を「減速させよう」と主張する生命の未来研究所（Future of Life Institute）が発表した公開書簡に対して反対する意見表明をしている。

カーツワイルは、意見表明の中で以下のように主張している。

「AIの開発競争を停止させようという意見は、現実的に処理するには基準が曖昧過ぎます。そして、その意見はひとつの深刻な協調問題に直面します。それは、停止を主張する人達は、停止に反対する企業や国家に大きく差を付けられてしまうという問題です。AIの進化は、医療、健康、教育、再生可能エネルギーの開発、およびその他の多くの重要な領域において極めて多くのベネフィットをもたらします。私は生命の未来研究所の公開書簡に署名しませんでしたが、署名した人達の懸念を、AI研究の成果によって払拭することができると信じているからです」

カーツワイルはまた、マサチューセッツ工科大学のAI研究者であるレックス・フリッドマン（Lex Fridman）との対面インタビューで、次のようにも答えている。

「多くの人はAIがひとり立ちして、我々に競争を強いるようになると考えています。AIとは競争になりません。それが結論です。そうではなく、AIを活用して我々の能力をさらに向上させる道を考えるべきです。労働の歴史を見てください。100年前に当たり前に行われていた仕事が現在も残っているでしょうか。（中略）我々は今後、コンピューターと融合してゆきます。コンピューターと融合しながら仕事をする人の数と割合が、今後どんどん増加してゆくことでしょう」

生成AIはビジネスシーンでどう活用されるのか？

「人間とAIの融合」こそ、カーツワイルが描く近未来の姿だ。そして、実際にGPT-4oやGeminiといった人類が生み出した最新の生成AIが、人間と融合するかたちで各所で利用され始めている。特に医療、金融、法律、製造などの領域で生成AIの導入が急ピッチで進んでおり、アメリカの市場調査会社マーケットUSは、2022年時点の全世界の医療用生成AIの市場規模を8億ドル（約1240億円）規模と推定。今後年率37%の高い成長率で成長を続け、2032年までに172億ドル（約2兆6660億円）規模へ拡大すると予測している。医療の領域においてはすでに、患者や医療従事者からの問い合わせや照会に対応するチャットボットや、各種の病気を診断する画像処理や検査などでAIの導入が進んでいるが、膨大なデータを扱う領域においては特に、今後さらにAIの導入と普及が進むだろう。

Googleも、自社のAIテクノロジーの活動領域を広げている。Googleは、昨年から大手ハンバーガーレストランチェーンのウェンディーズと共同で、自社の生成AIを使ったドライブスルーの音声認識オーダリングシステムのパイロットプログラムを開始している。「フレッシュAI」と名付けられたシステムのパフォーマンスは好調で、注文を正しく受け付けて処理するサクセスレートは99%に達しているという。アメリカのファストフードの領域においては、ドライブスルーの注文受付業務は、人間に代わってAIが主導的に行うフェーズへ移行しつつある。

そのほか、広告・マーケティング、小売業・卸売業、教育、不動産、エンターテインメント、農林水産業等々、AIがすでに活用されている産業セクターは数えきれないくらい存在する。否、AIが活用されていない領域を探す方が困難であると言っていいかも知れない。いずれの産業セクターにおいても、AIと人間は見事に協働し、より高い生産性を獲得することに成功しつつある。

カーツワイルは、上述のフリッドマンとの対面インタビューの中で「（AIとの協働により）意思決定のためのパラメーターを増やして現在よりもよりスマートになること。これこそが人間とAIが融合することのカギなのです」と発言し、人間がAIと対立するのではなく、あくまでも協働して自分自身の能力を向上させ、より多くのバリューをクリエイトするようアドバイスしている。現在、AIの導入が世界各地で急速に進んでいるが、その様相を眺めるに、筆者にはカーツワイルの予言が実際に現実のものになっているようにしか見えないのだ。
　

参考文献

https://www.euronews.com/next/2024/05/17/openai-vs-googles-gemini-all-the-major-ai-updates-to-know-about-this-week
https://openai.com/index/hello-gpt-4o/
https://blog.google/technology/ai/google-gemini-ai/#performance
https:// singularityhub.com/2023/05/05/a-note-from-ray-kurzweil-on-the-recent-call-to-pause-work-on-ai-more-powerful-than-gpt-4/
https://www.jdsupra.com/legalnews/ray-kurzweil-google-s-prophet-of-2259595/
https://market.us/report/generative-ai-in-healthcare-market/

WRITING BY