活用例

博物館向けAI音声ガイドのナレーション：全言語を99ドルで

Voice Studioは、言語ごとの制作会社費用なしで、お使いのMac上でローカルに10以上の言語の博物館音声ガイドナレーションを制作します。買い切り99ドル、サブスクリプションも文字数制限もありません。

展示音声ガイドの制作は、博物館が手がけるコンテンツ業務のなかでも最も費用のかかるものの一つであり、言語が増えるたびに費用は膨らみます。多言語の博物館ナレーションを専門とする制作会社は、翻訳、ネイティブの声優、スタジオ使用時間、編集を含めて、一つのガイドにつき1言語あたり数千ドルを請求するのが一般的です。40カ所の常設コレクションガイドであれば、英語だけでも小規模な施設にとって3,000〜8,000ドルかかることがあり、言語を追加するごとに同程度の請求が積み重なります。学芸員が絵画の作者特定を見直したり、巡回展が入れ替わったりした瞬間に、再録音と再編集の費用が発生し、納品まで数週間待つことになります。クラウド型のテキスト読み上げのサブスクリプションはこれを削減すると謳いますが、年間264〜1,188ドル以上を請求し、スクリプトを修正するたびに文字数で課金されます。

Voice Studioは買い切り99ドルのデスクトップアプリで、サブスクリプションも文字数制限も言語ごとの制作会社費用もなく、スタジオ品質のAI音声ガイドナレーションをお使いのMac上で完結して制作します。ギャラリーのスクリプトを、英語、スペイン語、フランス語、ドイツ語、日本語、韓国語、中国語を含む10以上の言語の48kHzナレーションに変換し、あらゆる携帯型ガイド機器やツアーアプリにすぐ使えるクリーンなWAVまたはMP3ファイルとして書き出します。すべてのナレーションはオリジナルで商用利用が可能な著作権フリーのため、博物館はライセンスの心配なくプラットフォームをまたいでガイドを展開・収益化・配信できます。99ドルのライセンスにはすべての機能が永続的に含まれており、制作会社なら1言語あたり数千ドルを請求するガイドが、多言語セット全体でわずか99ドルになります。

典型的なワークフローは次のとおりです。各展示や地点のナレーションをVoice Studioに貼り付け、声を選び、クリップを生成します。50カ所のコレクションガイドは一度の作業で50個の個別音声ファイルになり、それぞれが地点番号で命名されるため、音声ガイド機器やモバイルアプリにそのまま取り込めます。修復士が修復を終えたり、壁面解説が更新されたりした場合は、その1行のスクリプトを編集し、その1つのクリップを数秒で再生成して再アップロードするだけで、スタジオ予約も再録音費用も不要です。出力が真の48kHzのWAVとMP3であるため、関連するギャラリー動画、展覧会の予告編、アクセシビリティ向けコンテンツを制作する場合でも、同じファイルをリサンプリングなしでPremiere Pro、DaVinci Resolve、Final Cut、Logicに読み込めます。

多言語対応こそ、博物館向けAI音声ガイドナレーションが真価を発揮する場面です。海外からの来館者は8〜12言語のナレーションを期待しますが、従来の方法では言語ごとに新しい翻訳者、新しい声優、新しい制作会社の請求書が必要になります。Voice Studioなら、すべてを自前で制作できます。スクリプトを翻訳し、各バージョンを貼り付け、対応する言語にわたってネイティブのようなナレーションを1つの99ドルライセンスで生成するだけです。英語、スペイン語、フランス語、ドイツ語、日本語、北京語でガイドを提供する地方の博物館は、言語ごとの6件の制作会社契約を1つのアプリに置き換え、その後7番目の言語を翻訳費以外のコストなしで追加できます。小規模な施設にとって、これは1言語のみの提供か、完全な多言語アクセスの提供かという違いを意味します。

音声クローニングにより、博物館はコレクション全体とすべての特別展を通じて、認識しやすい一人のナレーターを維持できます。選んだ解説員または雇った声優の8〜12秒のサンプルを一度録音してクローン化すれば、その声が一貫したトーンとテンポで全フロアのすべてのギャラリーをナレーションし、何年にわたって地点をいくつ追加しても対応できます。カスタムボイスデザインはさらに進んで、展覧会に独自のキャラクターが必要な場合に対応します。たとえば古代美術の棟には落ち着いた時代ナレーターを、子ども向けの発見ギャラリーには生き生きとした語り手を、といった具合です。バッチキュー処理が物量をさばきます。60カ所のガイド全体、あるいは複数言語の複数ガイドを並べておき、学芸スタッフが他の作業をしている間に、お使いのMacにキュー全体を無人でレンダリングさせられます。

雰囲気は、展示を読み上げただけのものではなく作り込まれたものに感じさせます。Voice Studioは同じアプリ内で、テキストのプロンプトから著作権フリーの背景音楽を生成します。瞑想的な現代美術の部屋には静かなアンビエントパッドを、追悼ギャラリーには抑制された弦楽器を、といったように欲しいものを記述し、ナレーションの下に重ねます。すべてのトラックはオリジナルでローカルに作られるため、ガイド音声がYouTubeや博物館アプリに登場してもContent IDの一致はなく、クリアすべきものもありません。ランニングコストを比較してみましょう。ElevenLabsは月額5〜99ドル、Murfは年間24時間の上限付きで月額19ドルから、WellSaid Labsは月額約49ドル、Suno Proは月額8ドルです。Voice Studioは博物館のナレーションと音楽を、買い切り99ドルにまとめています。

博物館の音声ガイドは特定のチャネルを通じて配信されますが、Voice Studioはそのすべてに適合します。携帯型ガイド機器やレンタルのヘッドセットシステムは、関心地点ごとに標準的なMP3またはWAVを取り込みますが、それはまさにVoice Studioが書き出す形式です。モバイルガイドプラットフォームやQRで起動する展示ページも、同じ放送品質の48kHzファイルを受け入れます。アクセシビリティのため、施設は明瞭で均一なテンポのナレーションに加え、弱視の来館者向けの独立した音声解説トラックや大活字版の付属音声を生成でき、追加のスタジオ予約なしにADAおよびSection 508の期待に応える助けになります。セルフガイドのルートを運営する文化遺産施設やギャラリーは、番号や場所に紐づいた地点ごとのクリーンなクリップを1つずつ手に入れ、既存の再生システムに直接対応させられます。

小規模な施設の採算を考えてみましょう。45カ所の常設ガイドに2つの入れ替え展を加え、4言語で提供する地方の博物館は、200を優に超える個別のナレーションクリップに直面します。言語あたり数千ドルという制作会社の料金では、完全な多言語対応は大半の小規模博物館にとって到底手の届かないものであり、だからこそ多くが英語のみを提供しています。Voice Studioは、それらすべてのクリップの博物館向けAI音声ガイドナレーションを一度の99ドルの支払いでローカルに制作し、その後はあらゆる再認定、入れ替え展、追加言語を限界費用ゼロで吸収します。Apple SiliconのM1〜M4 Mac版と並んでWindowsのベータ版も用意されています。処理は100パーセントオフラインで何もアップロードされないため、公表前の収蔵品の詳細や未発表の展覧会スクリプトが建物の外に出ることは決してありません。

博物館向けAI音声ガイドのナレーション：全言語を99ドルで

関連する活用例

関連記事