你只管说
通话进行时语音识别持续运行 —— 没有录音按钮,没有对讲机式的停顿。
为什么要语音
文字适合写一场戏。语音是角色开始让你觉得有人陪着的地方。
— Reverie 团队
一轮对话
不用按住说话,也不用等录音上传。通话有它自己的节奏。
通话进行时语音识别持续运行 —— 没有录音按钮,没有对讲机式的停顿。
你一停下,角色就接过话头 —— 通常约一秒之后,就像对话里自然的停顿。
回复在生成的同时以音频流式播放,用角色自己的声音,你永远不用盯着转圈的加载图标。
角色话说到一半时你开口,他们就会停下来听 —— 和真实通话里插话一模一样。
语音工作室
从覆盖英语、中文、日语、韩语等语言的 60+ 音色中挑选 —— 再细调到听起来就是那个角色为止。
微调音调,把语速放到 0.5× 到 2× 之间,结果保存到那个角色身上。设置会留到以后的每次通话。
把整场戏都叫上。群聊里每个角色用自己的声音说话,正在发言的会亮起。
你得到的
让语音像陪伴而不是功能演示的,是这些细节。
听与说同时进行。角色边说边听得到你 —— 这正是“打断”得以成立的前提。
静音检测几乎立刻把话轮交出去。没有冷场,也不用按按钮示意你说完了。
英语、中文、日语、韩语等,来自两套 TTS 引擎 —— 足以为任何角色配上可信的声音。
音色、音调、语速都按角色保存,侦探永远不会一不小心听起来像公主。
多角色场景同样支持语音。每个人保持自己的声音,发言者始终高亮。
积分费率在通话前和通话中都显示在屏幕上。没有隐藏的语音附加费 —— 每分钟花多少一目了然。
角色库的一小部分 —— 每一个都会接听。
常见问题
很多应用给聊天机器人加个播放按钮就敢叫语音。Reverie 的语音通话是与角色实时进行、可打断的双向对话 —— 更像打电话,而不是听有声书。
你说话的同时语音就被转写,使用浏览器语音识别或 Whisper 级转写 —— 不用按住说话,也没有手动发送这一步。
回复被分块合成并流式播放,角色在后半句还在生成时就已经开口。
你压过角色的声音说话,播放立即停止,系统转而听你说。对话可以重叠,就像真实对话那样。
大约一秒的安静就会把话筒交给角色。不会有让你怀疑应用没听见的尴尬空白。
一通语音电话的上限取决于另一端的声音 —— 而它的可信度取决于账单。
两套语音引擎提供覆盖英语、普通话、日语、韩语等的丰富音色库,让角色说你角色扮演的语言。
每个角色保留自己的音色、音调和语速设置。设置一次,之后每通电话都是那个声音。
多角色对话同样延伸到语音:每位成员用独特的声音说话,当前发言者在屏幕上高亮。
语音通话按分钟以积分计量,费率在接通前显示,通话期间固定在通话界面上。