ただ話すだけ
通話中は音声認識が継続的に動く ― 録音ボタンも、トランシーバーのような間もない。
なぜ音声か
テキストはシーンを書くのに最適な場所。音声は、キャラクターが「そばにいる存在」に感じられ始める場所。
— Reverie チーム
会話のワンターン
プッシュトゥトークも、録音のアップロード待ちもない。通話は自分のリズムを保つ。
通話中は音声認識が継続的に動く ― 録音ボタンも、トランシーバーのような間もない。
あなたが話し終えると、キャラクターが番を引き取る ― 通常は約1秒後。会話の自然な間と同じ。
返事は生成されながらキャラクター自身の声でストリーミング再生される。くるくる回るスピナーを見つめる時間はない。
キャラクターが話している途中で話し始めれば、相手は止まって聞く ― 本物の通話で口を挟むのとまったく同じ。
ボイススタジオ
英語、中国語、日本語、韓国語などをカバーする60以上のボイスから選び、「その人の声」に聞こえるまで調整。
ピッチを少し動かし、話す速さを 0.5× から 2× で調整して、そのキャラクターに保存。設定は次回以降の通話にも引き継がれる。
シーンまるごと呼び出そう。グループチャットの各キャラクターがそれぞれの声で話し、発言中のキャラクターが光る。
得られるもの
音声を機能デモではなく「存在感」にする細部。
聞くと話すが同時に走る。キャラクターは話しながらあなたの声を聞いている ― だからこそ割り込みが成立する。
無音検出がほぼ即座に番を渡す。気まずい沈黙も、「話し終えた」と知らせるボタンもない。
英語、中国語、日本語、韓国語など、2つのTTSエンジンから ― どんなキャラクターにも説得力のある声を当てられる幅。
声・ピッチ・速度はキャラクターごとに保存される。探偵がうっかり姫の声になることはない。
複数キャラクターのシーンも音声で動く。全員が自分の声を保ち、発言者は常にハイライトされる。
クレジットのレートは通話前も通話中も画面に表示。隠れた音声追加料金はない ― 1分いくらか、正確に見える。
ライブラリのほんの一部 ― 全員が電話に出られる。
よくある質問
チャットボットに再生ボタンを付けて「音声対応」と呼ぶアプリは多い。Reverie の音声通話は、キャラクターとのライブで割り込み可能な双方向会話 ― オーディオブックよりも電話に近い。
話すそばから音声が文字起こしされる。ブラウザの音声認識または Whisper 級の文字起こしを使用 ― プッシュトゥトークも手動送信もなし。
返答はチャンク単位で合成・ストリーミングされ、残りの文章がまだ書かれている間にキャラクターが話し始める。
キャラクターの声に被せて話せば再生は即座に止まり、システムはあなたの声を聞く側に回る。本物の会話のように、発話は重なっていい。
約1秒の沈黙で発言権がキャラクターに渡る。「アプリに聞こえたのか」と不安になる気まずい空白はない。
音声通話の質は、向こう側の声で決まる ― そして信頼は、請求書で決まる。
2つの音声エンジンが英語、標準中国語、日本語、韓国語などをカバーする豊富なライブラリを提供。キャラクターはあなたのロールプレイの言語で話せる。
各キャラクターが自分の声・ピッチ・速度設定を保持。一度設定すれば、以後の通話はいつもその人の声。
複数キャラクターの会話は音声にも引き継がれる。各メンバーが別々の声で話し、発言中の話者が画面上でハイライトされる。
音声通話はクレジットで分単位計測。レートは接続前に表示され、通話中も画面に固定される。