#voz IA#TTS#voz de personagem#configurações de voz#recursos Reverie

Como escolher uma voz de IA que não te tira da cena

Reverie Team
Reverie Team

Dá pra escrever um card perfeito e perder a cena no segundo em que o personagem fala. TTS não perdoa o que o texto perdoa. Um "senti sua falta" alegre demais e a frase fica impossível de levar a sério. Tom meio passo desafinado e o personagem soa 20 anos mais novo.

O Reverie dá bastante controle sobre como o personagem soa. Este é um guia pra usar bem: qual motor, qual voz, quais botões realmente girar.

Os dois motores: Edge (grátis) e MiniMax (premium)

O Reverie traz dois provedores de TTS:

Microsoft Edge TTS (grátis, padrão). Cavalo de batalha. Mais de 17 idiomas, várias vozes por idioma, defaults por gênero, geração rápida. Limite: é um leitor estável. Lê claro, mas não atua. Ótimo pra maioria; curto pra cena de alta carga emocional.

MiniMax (premium). Mais fidelidade, vários IDs de voz por idioma, e o que importa: suporte a emoção. A síntese carrega registro emocional — ternura, raiva, hesitação — que o Edge não consegue. Mais caro por geração.

Melhor modelo mental: não é "grátis vs. pago". É Edge pra fala cotidiana, MiniMax pra momentos que você quer lembrar.

Arco longo onde o personagem passa a maior parte trocando piada — o Edge segura. Cena em que ele finalmente diz o que vinha segurando — troque. É o equivalente sonoro de "pago o modelo premium numa resposta-chave" — seguro barato pra falas que importam.

Como a voz é decidida

O Reverie escolhe assim:

  1. Preferência do usuário (seu override para este personagem), se estiver setada.
  2. Default do personagem que o criador escolheu.
  3. Fallback por locale + gênero — voz Edge default pra esse par.

Implicações:

  • Se o personagem "soa estranho", seu override sobrescreve o do criador. Não precisa esperar atualização do card.
  • Se você não setou nada, está ouvindo o fallback. Quase certo que não é a melhor voz; é só a mais segura.
  • O fallback existe pra o personagem nunca ficar sem voz. É o piso, não o alvo.

Escolher uma voz que combine

Erro mais comum: escolher por encaixe demográfico (30 anos, mulher → voz de 30). Isso dá voz genérica. Encaixe de caráter dá voz memorável.

Uma médica de combate de 30 não soa como uma instrutora de yoga de 30. Mesma idade, mesmo gênero, vozes totalmente diferentes. O que ouvir:

  • Registro padrão. Tom neutro é quente ou frio, brilhante ou abafado? Combine com o estado de descanso do personagem, não com o dramático.
  • Cadência. Algumas vozes leem rápido até em velocidade padrão. Outras vêm lentas. Uma voz ofegante num personagem estoico não cola, por mais "boa" que seja.
  • Idade implícita. Vozes têm "idade percebida" que pode não bater com a declarada. Personagem de 19 com voz que soa de 35 — desconfortável. Ajuste tom ou troque.

Teste: 15 segundos de uma fala chata ("Tá. Chego. Lá pelas oito.") na voz candidata. Se a fala chata soa errada, as dramáticas não recuperam.

Botões que valem girar

O Reverie expõe um set pequeno. A maioria ignora ou exagera. Para que cada um serve:

Velocidade (Speed)

Default 1.0x. Quase todas melhoram com ajuste pequeno, raramente com grande.

  • 0.9-0.95x personagens pensativos, mais velhos, hesitantes.
  • 1.0-1.05x maioria.
  • 1.1-1.15x nervosos, falantes, alívio cômico.
  • Abaixo de 0.85x ou acima de 1.2x é bandeira vermelha — você está brigando com a voz, troque.

Tom (Pitch)

Com parcimônia. Pequena variação (alguns por cento) envelhece/rejuvenesce de forma crível. Variação grande deixa a voz "processada" — artificial, mesmo com TTS bom. Se sente vontade de empurrar muito o tom, troque de voz.

Emoção (só MiniMax)

A função mais subutilizada. Tag de emoção dá à síntese cor de registro — diferença entre "senti sua falta" dito caloroso e dito vazio. Se você está no MiniMax sem tocar emoção, paga o motor e não usa a vantagem principal.

Usar: beats emocionais, cenas onde texto e tom precisam divergir, momentos onde você esperaria nuance de dublador humano.

Não usar: em toda fala. Emoção em tudo lê como novela. Padrão deveria ser neutro; emoção bate mais forte quando não é constante.

Voz e idioma

O Reverie suporta vozes em 17 idiomas, defaults por gênero no Edge. Notas:

  • Localidade, não só idioma. "Espanhol" não é um sotaque. Personagem argentino com voz castelhana — quem distingue, distingue na hora. Localidade com cuidado.
  • Personagens que trocam de idioma. Se o personagem troca de idioma na conversa, a voz troca de motor/voz pelo idioma do texto. Quase sempre roda; pra algumas vozes não há equivalente em outro idioma e a transição soa esquisita.
  • Idioma nativo não inglês. Voz de inglês americano padrão geralmente tira da cena. Edge tem vozes em inglês com sotaque em alguns idiomas, costuma encaixar melhor.

Erros comuns com voz

  • Escolher a "melhor" em vez da "certa". Prosódia mais natural não é a voz certa se soa de 25 enquanto o personagem tem 50.
  • Velocidade como botão de qualidade. Velocidade é botão de caráter. Mais lento ≠ melhor; é outro personagem.
  • Emoção em toda fala. Sobriedade lê como nível; emoção constante, como teatro escolar.
  • Pular teste de fala chata. Voz passa a maior parte do tempo dizendo "tá", "uhum", "que horas?". Se isso soa mal, as cenas de vitrine também.
  • Esquecer que dá pra sobrescrever. O criador escolheu. Você pode escolher diferente. O override está a um toque.

Como combina com o resto do Reverie

  • Escrita de personagem — as "regras de voz" no card traduzem direto pra escolha de TTS. "Corta a frase quando fica sincero" sugere voz com variabilidade natural de pausa, não leitor estável.
  • Ritmo — voz + velocidade reduzida amplifica cena lenta; voz + velocidade padrão pode acelerar sem você notar.
  • MiniMax pras cenas-chave — mesma lógica que modelo premium pra resposta-chave. Use o motor pago pra fio do gume, não pra papo.

Conclusão

Boa voz é a que você para de notar. Entrega a fala e sai do caminho.

Escolha por personagem, não por demografia. Teste em fala chata. Velocidade e emoção, com leveza. Em cenas que ficam, suba o motor.

Voz não é separada do personagem. Pra quem ouve, voz é o personagem.

Pronto para Experimentar Conversações Dinâmicas com IA?

Junte-se a milhares de utilizadores que já exploram personalidades infinitas e interações envolventes no Reverie.