最近のAI関連のトピックは更新が速く、先月、3月半ばのコラムも書いた本人の筆者ですら遠い過去の出来事のように感じます。
[第39回]2024年春、生成AIの新サービスと利用状況
(当コラム 2024年3月19日公開)
「Chap-GPT」で有名な企業、オープンAIが最新の生成AI「GPT-4o(フォーオー)」を、2024年5月13日に発表しました。
この最新のバージョンではヒトと同じ反応速度で会話ができることをウリにしています。
ChatGPTを2倍高速に 米OpenAI、ヒトの反応速度で会話
従来に比べて処理スピードを2倍に高速化した一方、運用コストを半減した。声で話しかけると、ヒトと同じ反応速度で会話ができる。
(日本経済新聞 2024年5月14日)
ところがこの最新AI、なんと一週間もたたずに、肝心の音声機能の一部を利用停止するはめになりました。
ChatGPT、音声機能を一部停止 米俳優に酷似と指摘
米オープンAIは20日、対話型の生成AI(人工知能)「Chat(チャット)GPT」の音声機能の一部を一時的に利用停止すると発表した。音声が米俳優スカーレット・ヨハンソンさんの声に酷似しているとの指摘…。
(日本経済新聞 2024年5月21日)
現実のヒトの声、しかもプロの声に似過ぎてしまう問題は、ポーカロイド発祥の国、日本では古くからよく知られている事象で、最近でもある歌手の歌声合成ソフを開発したところ、本人との合意が取れず(あまりにも似すぎていた?)、発売中止となっています。
花譜の歌声合成ソフト「可不」予約が全てキャンセル決定 発売の見通し立たず
「可不」は、KAMITSUBAKI STUDIO所属のバーチャルシンガー・花譜さんの歌声をベースにした歌声合成ソフトウェア。…同年12月13日にYouTubeにデモ音源として「フォニイ」のカバー動画が公開されると、クオリティの高さが話題になり注目を集めた。
(KAI-YOU 2024年5月14日)
「似ていないとダメだけど似すぎていてもダメ」という自己矛盾に陥るような顛末ですが、クリエイティブの世界ではこの問題はいつの時代でも起こっていて、簡単には解決できない問題でもあります。
会話機能を強化して開発するなら、どんな声にするのかは最初に解決しておく課題ですが、米オープンAIはなぜわざわざ著名な俳優の声に似せてしまったのでしょうか。
他のニュース映像では、昨年のある時期、スカーレット・ヨハンソン氏に声の提供を依頼したが断られたので、別の俳優を起用したと、サム・アルトマンCEOが答えていました。
チャットGPT 米女優似の音声を利用停止
※音声付きの動画が流れます
(ABEMA TIMES 2024年5月22日)
そこにはAI開発が本質的に持つ、クリエーティブへの軽視、なんでも模倣ですます杜撰な体質、ヒト表現者が産み出す成果物の剽窃…。そんな姿がうかがい知れます。
こういう企業体質がまかり通るAI業界に、わたし達の未来を託すことは本当に正しい選択なのでしょうか。(水田享介)