最难搞定的，一直是声音

角色的其它部分，你早就能做对了。文字、背景故事、ta 怎么挑刺、怎么躲问题、那张照片。大家在这些上面花了无数个小时。然后角色一开口，出来的却是另一个人的声音。

这是你一直没法真正掌控的那一块。你从一列预设里挑，挑个最接近的。对很多角色来说，最接近的就够了。但对你最在意的那几个，几乎从来都不够。声音年轻了几岁。口音来自不对的国家。多了一份这个角色没有的温度。都是小小的偏差，可音频一响就立刻露馅，把你从精心搭了那么久的场景里一把拽出来。

我们想给你那个真正的声音，而不是最接近的那个。这件事最后做成了两个工具。现在都在语音工作室里上线了，尝鲜期都免费。

当声音已经存在

有时候你要的声音是真实存在的。它在某段录音里，或者属于某个特定的配音演员，又或者就是你自己的嗓音。这种情况，用克隆。

你给 Reverie 十到三十秒某人说话的音频，它就照着做出一个声音。直接在浏览器里录，或者上传你手头已有的。一分钟左右，它就躺在你的库里，可以装到角色身上了。

这里，录音就是一切。一个人，正常说话，找个安静的地方。底下别垫音乐，别混进第二个人，也别要那种浴室回声。干净的十秒，永远胜过又吵的两分钟。克隆出来不对，几乎都是这个原因。

我们只在动手前要求一件事：这个声音得是你有权使用的。这话我们宁愿直说，也不想藏起来。

当声音只存在于你脑子里

最好的那些角色，大多没被任何人录过音，因为是你编出来的。克隆在这儿帮不上忙。所以第二个工具根本不需要录音。你描述这个声音，Reverie 照着做一个。

需要一点练习的，是去描述声音，而不是描述角色。"一个活了四百年的吸血鬼领主"是个好角色，却是个没用的指令。模型听不见背景故事。"低、慢、有点冷，词尾收得很短"，它才真的有得做。想象你听这个人开口的头几秒：偏高还是偏低，快还是慢，粗还是顺，什么口音。把这个写下来。结果不满意？改几个词，再来一遍。很快，所以值得挑剔。

你能拿它做什么

把一个角色真正的声音，从 ta 来的地方搬过来。给一个原创角色一个别处都不存在、别人的角色永远不会撞上的声音。攒一小批你做好的声音，随用随往不同角色身上装。你做的一切都在"我的声音"里，能回放、能改名、能把没成的删掉。

这些都不取代以前那条用好声音的建议，它依然成立：先拿一句平淡的台词试，再听戏剧化的；注意语速；别调过头。你亲手做的声音，照样可能跟某个场景不搭。但现在，当它对了，是因为你把它做对了，而不是因为它是列表里最不差的那个。

去试试

打开角色的语音设置，点"打开语音工作室"。克隆一个声音，或者描述一个、听听它给你返回什么。两个现在都免费。

最难搞定的，一直是声音

当声音已经存在

当声音只存在于你脑子里

你能拿它做什么

去试试

准备体验动态AI对话了吗？