広告・取材掲載

広告・取材掲載

スタビリティーAI、ブランド向けカスタムサウンド生成AIモデル「Stable Audio 2.5」発表

ビジネス 海外

画像生成AI「Stable Diffusion」を手がける英国のスタビリティーAI(Stability AI)は9月10日、企業レベルの音響制作向けに最適化された音声生成モデル「Stable Audio 2.5」を発表。これに伴い、世界最大手の英広告会社WPP傘下のサウンドブランディングエージェンシー「Amp」と提携した。

2秒未満で最大3分間のマルチパート構成(イントロ、展開、アウトロ)のトラックを生成可能。「高揚感」といったプロンプトや、「豊かなシンセサイザー」といった音楽的要素の指定にも、より効果的に応答できるようになった。

テキストまたは音声データを変換できるほか、既存の音声ファイルをアップロードし、追加コンテンツを生成したい箇所を指定すると、AIが文脈を分析してトラックを拡張する「オーディオ・インペインティング」と呼ばれる新機能も備える。

利用規約で著作権保護された素材のアップロードを禁止し、コンテンツ認識システムで順守状況を監視。商用利用において安全で、完全にライセンスされたデータセットで訓練されているという。

市場調査会社イプソスによると、カスタムオーディオがブランドの記憶定着を8倍高め、ブランドエンゲージメントの86%が音声に影響を受けていることが分かっているが、活用しているブランドはごくわずかという。

(文:坂本 泉)

榎本編集長「Stable Diffusionの会社がジングルの制作に強い音楽生成AI「Stable Audio 2.5」を発表。企業や商品のジングルとなると著作権のある学習素材が使用のリスクになるが、完全にライセンスされたデータセット、アップロードに著作権保護のためのコンテンツ認識システムを導入されている。著作権重視のAIは、何でも裏で学習させている生成AIと比べ学習速度が落ちる欠点があるが、現在ではAIで生成した素材を学習に利用する手法も生まれており、このStable Audioのように特化する先を決め打ちすれば、むしろ働き場所を得るメリットがある。ドラマやアニメ、ゲーム、漫画の製作現場でも同様の課題があるので、こうした新世代のAIが今後、コンテンツ産業全般で伸びてくるだろう。Stability AI社はクリエイター重視の経営陣に切り替わって新しい方向に向かいつつあり、Stable Audio2.5はその成果の始まりと言えそうだ。」

ライター:坂本 泉(Izumi Sakamoto)

フリーランスのライター/エディター。立教大学を卒業後、国外(ロンドン/シドニー/トロント)で日系メディアやPR会社に勤務した後、帰国。イベントレポートやインタビューを中心に、カルチャーから経済まで幅広い分野の取材や執筆、編集、撮影などを行う。