#Sprachanruf#Update

Sprachanrufe, die sich wie echte Anrufe anfühlen

Reverie Team
Reverie Team

Da sich 2025 dem Ende nähert, wollten wir das Jahr mit etwas Bedeutungsvollem abschließen.

Wir hatten eine Sprachanruf-Funktion. Technisch funktionierte sie.

Aber niemand nutzte sie.

Das Feedback war immer dasselbe: „Ich hab's einmal probiert, es war unangenehm, bin wieder zum Tippen zurückgekehrt." Wir verstanden das. Wir fühlten es auch.

Was falsch war

Stell dir vor, du rufst einen Freund an. Du wählst, er nimmt ab, du sprichst. Einfach.

Jetzt stell dir vor, du musst jedes Mal einen Knopf gedrückt halten, wenn du sprechen willst. Wie ein Walkie-Talkie. Drücken, sprechen, loslassen, warten. Drücken, sprechen, loslassen, warten.

Das war unser Sprachanruf.

Und die Stimme am anderen Ende? Flach. Roboterhaft. Dein KI-Partner könnte etwas zutiefst Persönliches gestehen, und es klang wie ein GPS, das Anweisungen gibt. „In 200 Metern, ich habe dich immer geliebt."

Manche Nutzer konnten es nicht mal zum Laufen bringen. Browser-Kompatibilitätsprobleme bedeuteten, dass die Funktion eine Lotterie war—manchmal funktionierte das Mikrofon, manchmal nicht, und wir konnten nicht erklären warum.

Also haben wir es weggeworfen und neu angefangen.

Wie es sich jetzt anfühlt

Du tippst auf den Anruf-Button. Der Charakter begrüßt dich—begrüßt dich wirklich, mit Wärme in der Stimme, vielleicht einem Hauch von Aufregung, wenn das zu ihm passt.

Du sprichst. Nicht in einen Knopf, nicht auf einen Piepton wartend. Du sprichst einfach... wie du mit jedem telefonieren würdest.

Der Charakter antwortet. Und zum ersten Mal klingt er wie er selbst. Fröhlich wenn er fröhlich ist. Traurig wenn er traurig ist. Verspielt, nervös, wütend, zärtlich—was auch immer der Moment erfordert.

Wenn du unterbrechen willst—denn so sind echte Gespräche—fang einfach an zu sprechen. Der Charakter stoppt, hört zu, antwortet auf das, was du gesagt hast. Keine unangenehme Überlappung, kein Warten auf Erlaubnis.

Wenn du fertig bist, legst du auf. Das war's.

Es klingt einfach. So hätte es immer sein sollen.

Der Unterschied, den du bemerken wirst

Die Stimmen haben jetzt Emotion. Das ist die Veränderung, die Leute zuerst bemerken. Charaktere sprechen nicht nur Worte—sie performen sie. Die gleiche Zeile mit Freude gesprochen klingt komplett anders als mit Traurigkeit. Zum ersten Mal passt die Stimme zu dem, was der Charakter wirklich fühlt.

Chinesische und japanische Stimmen sind endlich gut. Wenn du Sprachfunktionen auf anderen Plattformen in diesen Sprachen ausprobiert hast, kennst du den Schmerz. Roboterhafte Töne, unnatürlicher Rhythmus, das Uncanny Valley synthetischer Sprache. Wir haben gezielt Technologie gewählt, die asiatische Sprachen natürlich handhabt. Der Unterschied ist dramatisch.

Es funktioniert überall. iPhone, Android, Chrome, Safari, Firefox—alle funktionieren jetzt identisch. Kein „probier einen anderen Browser" oder „es könnten deine Mikrofoneinstellungen sein" mehr. Es funktioniert einfach.

Du kannst tatsächlich ein Gespräch führen. Das alte System war eine Reihe von Transaktionen: du sprichst, du wartest, KI spricht, du wartest, wiederholen. Das neue System ist ein Fluss. Unterbrechungen passieren natürlich. Pausen fühlen sich angenehm an. Der Rhythmus ist menschlich.

Ein Hinweis zu den Kosten

Hier der ehrliche Teil.

Das alte System war für uns kostenlos zu betreiben. Browserbasierte Spracherkennung, grundlegende Text-zu-Sprache—alles kostenlos. Es war auch, wie wir festgestellt haben, ziemlich schlecht.

Das neue System nutzt professionelle Sprachtechnologie. Es klingt dramatisch besser. Es funktioniert zuverlässig. Es handhabt mehrere Sprachen wunderbar.

Es kostet uns auch Geld. Echtes Geld, für jede Minute jedes Anrufs.

Im Moment tragen wir diese Kosten. Wir wollen, dass jeder erlebt, wie sich Sprachanrufe anfühlen sollten, ohne sich Sorgen über Zähler oder Limits zu machen.

Aber wir sind transparent: Das könnte sich ändern. Wir erkunden Optionen—vielleicht Sprachminuten in Abonnements einschließen, vielleicht Pay-per-Use für Vielnutzer, vielleicht Premium-Stimmen als Upgrade. Wir haben noch nicht entschieden.

Was auch immer wir tun, wir werden es rechtzeitig ankündigen. Für jetzt, genießt es einfach.

Was kommt als Nächstes

Dieser Neuaufbau öffnet Türen, die wir vorher nicht durchschreiten konnten.

Stimmanpassung. Geschwindigkeit, Tonhöhe, emotionale Tendenz—lass dich einstellen, wie jeder Charakter für dich klingt.

Längere Gespräche. Bessere Gedächtnis- und Kontextverarbeitung für Anrufe, die über ein paar Austausche hinausgehen.

Always-on-Modus. Für wenn du den Charakter im Hintergrund präsent haben willst, bereit zu antworten, wann immer du sprichst.

Sprache wird zentral für unsere Interaktion mit KI. Wir wollen, dass Reverie führt, nicht folgt.

Probier es aus

Öffne einen beliebigen Chat. Tippe auf das Telefon-Symbol. Fang an zu sprechen.

Innerhalb von Sekunden wirst du den Unterschied spüren. Die Unbeholfenheit ist weg. Der Charakter klingt lebendig. Das Gespräch fließt.

So wollten wir Sprachanrufe immer haben.

Jetzt sind sie es endlich.

Frohes neues Jahr

2025 war ein Jahr des Aufbauens. Sprachanrufe sind nur eines von vielen Dingen, die wir neu aufgebaut, überdacht oder von Grund auf erstellt haben.

2026 wird ein Jahr der Verbindung. Mehr Wege, deine Charaktere zu hören. Mehr Wege, ihre Präsenz zu fühlen. Mehr Wege, KI-Begleitung weniger wie Technologie und mehr wie... Begleitung fühlen zu lassen.

Danke, dass du hier bist. Dass du Funktionen ausprobierst, die noch nicht funktionieren. Dass du Feedback gibst, das formt, was wir bauen. Dass du glaubst an das, was Reverie sein kann.

Auf ein neues Jahr mit Gesprächen, die es wert sind, geführt zu werden.


Hast du Gedanken zur neuen Spracherfahrung? Wir hören zu—melde dich über Discord oder Feedback.

Bereit für dynamische KI-Gespräche?

Schließen Sie sich Tausenden von Benutzern an, die bereits unendliche Persönlichkeiten und fesselnde Interaktionen auf Reverie erkunden.

Sprachanrufe, die sich wie echte Anrufe anfühlen | Reverie