#声音克隆#音色设计#ai 语音#tts#角色声音#语音工作室

最难搞定的,一直是声音

Reverie Team
Reverie Team

角色的其它部分,你早就能做对了。文字、背景故事、ta 怎么挑刺、怎么躲问题、那张照片。大家在这些上面花了无数个小时。然后角色一开口,出来的却是另一个人的声音。

这是你一直没法真正掌控的那一块。你从一列预设里挑,挑个最接近的。对很多角色来说,最接近的就够了。但对你最在意的那几个,几乎从来都不够。声音年轻了几岁。口音来自不对的国家。多了一份这个角色没有的温度。都是小小的偏差,可音频一响就立刻露馅,把你从精心搭了那么久的场景里一把拽出来。

我们想给你那个真正的声音,而不是最接近的那个。这件事最后做成了两个工具。现在都在语音工作室里上线了,尝鲜期都免费。

当声音已经存在

有时候你要的声音是真实存在的。它在某段录音里,或者属于某个特定的配音演员,又或者就是你自己的嗓音。这种情况,用克隆。

你给 Reverie 十到三十秒某人说话的音频,它就照着做出一个声音。直接在浏览器里录,或者上传你手头已有的。一分钟左右,它就躺在你的库里,可以装到角色身上了。

这里,录音就是一切。一个人,正常说话,找个安静的地方。底下别垫音乐,别混进第二个人,也别要那种浴室回声。干净的十秒,永远胜过又吵的两分钟。克隆出来不对,几乎都是这个原因。

我们只在动手前要求一件事:这个声音得是你有权使用的。这话我们宁愿直说,也不想藏起来。

当声音只存在于你脑子里

最好的那些角色,大多没被任何人录过音,因为是你编出来的。克隆在这儿帮不上忙。所以第二个工具根本不需要录音。你描述这个声音,Reverie 照着做一个。

需要一点练习的,是去描述声音,而不是描述角色。"一个活了四百年的吸血鬼领主"是个好角色,却是个没用的指令。模型听不见背景故事。"低、慢、有点冷,词尾收得很短",它才真的有得做。想象你听这个人开口的头几秒:偏高还是偏低,快还是慢,粗还是顺,什么口音。把这个写下来。结果不满意?改几个词,再来一遍。很快,所以值得挑剔。

你能拿它做什么

把一个角色真正的声音,从 ta 来的地方搬过来。给一个原创角色一个别处都不存在、别人的角色永远不会撞上的声音。攒一小批你做好的声音,随用随往不同角色身上装。你做的一切都在"我的声音"里,能回放、能改名、能把没成的删掉。

这些都不取代以前那条用好声音的建议,它依然成立:先拿一句平淡的台词试,再听戏剧化的;注意语速;别调过头。你亲手做的声音,照样可能跟某个场景不搭。但现在,当它对了,是因为你把它做对了,而不是因为它是列表里最不差的那个。

去试试

打开角色的语音设置,点"打开语音工作室"。克隆一个声音,或者描述一个、听听它给你返回什么。两个现在都免费。

准备体验动态AI对话了吗?

加入成千上万的用户,一起探索无限个性和引人入胜的互动体验。