「音声の会社」が音楽を始めた日

2026年4月1日、ElevenLabsがiOSアプリ「ElevenMusic」をリリースした。

エイプリルフールのネタではない。テキストプロンプトを入力すると、歌詞付きのフル楽曲が生成される。1日7曲まで無料。音楽生成AI市場の最大手であるSunoに対する、正面からの宣戦布告だった。

ElevenLabsは2022年に創業した音声AI企業だ。テキストを入力すると人間そっくりの音声を生成する「テキスト・トゥ・スピーチ」と、誰かの声を数分のサンプルから複製する「ボイスクローニング」が主力サービスだった。ポッドキャストのナレーション、映画の吹替、ゲームのキャラクターボイス——「声」に関するあらゆるニーズに応えてきた。

その会社が、なぜ音楽に手を出したのか。

$330M ARRの会社が$500Mを調達する意味

ElevenLabsは2025年末時点でARR(年間経常収益)が3億3,000万ドルに達している。TechCrunchによると、2026年2月にはSequoia Capital主導で5億ドルを調達し、企業評価額は110億ドルについた。

音声合成だけでここまで成長した会社が、調達直後に音楽へ参入した。その戦略的な意図は明確だ。

映像制作に必要な「音」は3つある。ナレーション(声)、BGM(音楽)、効果音(SE)。ElevenLabsは声をすでに押さえた。音楽を加えれば、映像制作の音響レイヤーをほぼ丸ごとカバーできる。

つまり、ElevenLabsが目指しているのは「音声AIの会社」ではなく、**「音のOS」**だ。映像を作る人が音に関して必要なものは、すべてElevenLabs1社で揃う——そういう世界を作ろうとしている。

Sunoとの対決は「技術」ではなく「法務」で決まる

音楽生成AIの現時点での最大手はSunoだ。ARRは3億ドル、前年比で404%成長。テキストプロンプトからメロディと歌詞付きのフル楽曲を生成する品質は、正直なところElevenMusicとほぼ互角か、Sunoがやや上と見る向きもある。

しかし、ElevenLabsには Sunoにない武器がある。ライセンス契約だ。

ElevenLabsは世界大手の音楽出版社Kobaltと、インディーズ音楽レーベルの集合団体であるMerlinとライセンス契約を結んでいる。AI音楽生成の学習データについて、権利処理を済ませているということだ。

一方のSunoは、音楽業界からの訴訟リスクを抱えている。「学習データに著作権楽曲を無断使用しているのでは」という疑惑がつきまとっており、これが事業継続のボトルネックになりかねない。

AI音楽市場では、技術力だけでなく法的な安全性が競争優位になりつつある。ElevenLabsがKobalt/Merlin契約を前面に押し出しているのは、まさにその認識の表れだ。

BGMは「完全AI代替」の最前線にいる

ここで誤解してはいけない点がある。AI音楽は「すべての音楽を置き換える」わけではない。

アーティストが表現する楽曲——感情の設計、文化的な文脈の理解、聴く人の記憶に刻まれるメロディ——こうした領域は、まだ人間の領域だ。AIが「それっぽい曲」を作ることはできても、「ヒット曲」を生み出す力は持っていない。

だが、BGMは別の話だ。

YouTubeの動画に添えるBGM、ポッドキャストのイントロ、企業VPの背景音楽。これらは「邪魔にならず、雰囲気を作る」ことが目的であり、独創性よりも適切さが求められる。著作権フリーの素材サイトで「なんとなく合いそうな曲」を探す作業は、まさにAIが得意とする仕事だ。

ElevenMusicの無料枠は1日7曲。月$11のプランに入れば、音声合成とBGM生成の両方が使える。これまでナレーション外注に月数万円、BGM探しに毎回1-2時間をかけていた動画クリエイターにとって、この統合は無視できない。

先行者が倒れた歴史を知っておく

AI音楽の世界には、先行者が倒れた歴史がある。

Amper Musicは2021年にShutterstockに買収された。独立サービスとしては収益化できなかった。Jukedeckは2019年にByteDance(TikTokの親会社)に買収されている。こちらも、単独のサービスとして定着する前に飲み込まれた。2023年には、AIが生成した楽曲がSpotifyから大量に削除される事件もあった。架空のアーティスト名でAI楽曲を量産し、再生回数を稼ぐ手法が問題視されたのだ。

ElevenLabsがこの歴史を覆せるかどうかは、「音声+音楽+効果音」の統合プラットフォームという構想が、単体の音楽生成サービスとは異なる持続性を持てるかにかかっている。

日本では「音の権利処理」が最大のハードル

日本でAI音楽を商用利用しようとすると、著作権とJASRAC登録の問題にぶつかる。AIが生成した楽曲の権利は誰に帰属するのか。JASRAC(日本音楽著作権協会)に登録できるのか。商用利用で法的リスクはないのか——この辺りの整備はまだ進んでいない。

逆に言えば、ここにビジネスチャンスがある。「AI楽曲の権利処理代行」「商用利用可能なAI BGMパッケージ」「日本語歌詞×日本語ボーカルの楽曲制作サービス」——いずれも、まだ日本にはほぼ存在しない。

日本発のAI BGMサービスとしてはSOUNDRAW(月$16.99)が先行しているが、カバーしているのはインストゥルメンタルBGMの領域だ。日本語の歌詞付き楽曲や、ナレーションとBGMの統合ワークフローには、まだ空白がある。

ElevenLabsの「音のOS」戦略は、1つのコア技術(音声合成)から隣接市場(音楽)に横展開し、さらにその先(映像音響全体)を取りに行くという教科書的な拡大戦略だ。技術が拮抗する市場では、法務と統合力が勝敗を分ける——そのことを、この参入劇は鮮やかに示している。

出典: Music Business Worldwide / TechCrunch(ElevenMusic) / TechCrunch(ARR報道) / AImagicx(比較)