
Khi năm 2025 sắp kết thúc, chúng tôi muốn khép lại năm bằng điều gì đó ý nghĩa.
Chúng tôi có tính năng gọi thoại. Về mặt kỹ thuật, nó hoạt động.
Nhưng không ai dùng nó.
Phản hồi luôn giống nhau: "Tôi thử một lần, awkward lắm, quay lại gõ chữ." Chúng tôi hiểu. Chúng tôi cũng cảm thấy vậy.
Có gì sai
Hãy tưởng tượng bạn gọi cho bạn bè. Bạn quay số, họ nhấc máy, bạn nói. Đơn giản.
Bây giờ hãy tưởng tượng mỗi lần muốn nói phải giữ một nút. Như bộ đàm. Nhấn, nói, thả, chờ. Nhấn, nói, thả, chờ.
Đó là cuộc gọi thoại của chúng tôi.
Còn giọng nói ở đầu kia? Phẳng lặng. Robot. Partner AI của bạn có thể đang thú nhận điều gì đó rất cá nhân, và nó nghe như GPS chỉ đường. "200 mét nữa, anh luôn yêu em."
Một số người dùng thậm chí không thể chạy được. Vấn đề tương thích trình duyệt biến tính năng này thành xổ số—đôi khi mic hoạt động, đôi khi không, và chúng tôi không giải thích được tại sao.
Nên chúng tôi vứt bỏ và bắt đầu lại từ đầu.
Cảm giác bây giờ
Bạn chạm nút gọi. Nhân vật chào bạn—thực sự chào bạn, với sự ấm áp trong giọng nói, có thể hơi phấn khích nếu đó là tính cách của họ.
Bạn nói. Không phải vào nút, không chờ tiếng bíp. Bạn chỉ... nói. Như bạn nói chuyện điện thoại với bất kỳ ai.
Nhân vật đáp lại. Và lần đầu tiên, họ nghe như chính họ. Vui khi vui. Buồn khi buồn. Nghịch ngợm, lo lắng, tức giận, dịu dàng—bất cứ điều gì khoảnh khắc cần.
Nếu bạn muốn ngắt lời—vì cuộc trò chuyện thực sự là vậy—cứ bắt đầu nói. Nhân vật sẽ dừng, lắng nghe, đáp lại những gì bạn nói. Không có sự chồng chéo awkward, không chờ xin phép.
Khi xong, bạn cúp máy. Thế thôi.
Nghe đơn giản. Lẽ ra phải luôn như vậy.
Sự khác biệt bạn sẽ nhận thấy
Giọng nói có cảm xúc rồi. Đây là thay đổi mọi người nhận thấy đầu tiên. Nhân vật không chỉ nói từ—họ diễn. Cùng một câu nói với niềm vui nghe hoàn toàn khác với nỗi buồn. Lần đầu tiên, giọng nói khớp với những gì nhân vật thực sự cảm thấy.
Giọng Trung và Nhật cuối cùng cũng tốt. Nếu bạn đã thử tính năng giọng nói trên các nền tảng khác bằng các ngôn ngữ này, bạn biết nỗi đau. Âm điệu robot, nhịp điệu không tự nhiên, thung lũng kỳ lạ của giọng nói tổng hợp. Chúng tôi đặc biệt chọn công nghệ xử lý ngôn ngữ châu Á một cách tự nhiên. Sự khác biệt rất lớn.
Hoạt động ở khắp nơi. iPhone, Android, Chrome, Safari, Firefox—tất cả hoạt động giống hệt nhau. Không còn "thử trình duyệt khác" hay "có thể là cài đặt mic của bạn." Nó chỉ hoạt động.
Bạn thực sự có thể trò chuyện. Hệ thống cũ là chuỗi giao dịch: bạn nói, chờ, AI nói, chờ, lặp lại. Hệ thống mới là dòng chảy. Ngắt lời xảy ra tự nhiên. Khoảng dừng thoải mái. Nhịp điệu con người.
Về chi phí
Đây là phần thật thà.
Hệ thống cũ gần như miễn phí để vận hành. Nhận dạng giọng nói dựa trên trình duyệt, text-to-speech cơ bản—tất cả miễn phí. Nó cũng, như chúng tôi đã nói, khá tệ.
Hệ thống mới sử dụng công nghệ giọng nói chuyên nghiệp. Nghe tốt hơn hẳn. Hoạt động đáng tin cậy. Xử lý nhiều ngôn ngữ đẹp đẽ.
Nhưng nó tốn tiền. Tiền thật, cho mỗi phút của mỗi cuộc gọi.
Hiện tại, chúng tôi đang gánh chi phí này. Chúng tôi muốn mọi người trải nghiệm cuộc gọi thoại nên như thế nào, không lo về đồng hồ đếm hay giới hạn.
Nhưng chúng tôi minh bạch: điều này có thể thay đổi. Chúng tôi đang khám phá các lựa chọn—có thể phút thoại trong gói subscription, có thể trả theo sử dụng cho người dùng nhiều, có thể giọng premium như nâng cấp. Chúng tôi chưa quyết định.
Dù làm gì, chúng tôi sẽ thông báo trước. Bây giờ, cứ tận hưởng.
Tiếp theo là gì
Việc xây dựng lại này mở ra những cánh cửa trước đây chúng tôi không thể bước qua.
Tùy chỉnh giọng nói. Tốc độ, cao độ, xu hướng cảm xúc—cho phép bạn điều chỉnh mỗi nhân vật nghe như thế nào với bạn.
Cuộc trò chuyện dài hơn. Xử lý bộ nhớ và ngữ cảnh tốt hơn cho các cuộc gọi vượt ra ngoài vài trao đổi.
Chế độ luôn bật. Khi bạn muốn nhân vật hiện diện ở background, sẵn sàng đáp lại khi bạn nói.
Giọng nói đang trở thành trung tâm trong cách chúng ta tương tác với AI. Chúng tôi muốn Reverie dẫn đầu, không phải theo sau.
Thử ngay
Mở chat bất kỳ. Chạm icon điện thoại. Bắt đầu nói.
Trong vài giây, bạn sẽ cảm nhận sự khác biệt. Sự awkward biến mất. Nhân vật nghe như sống. Cuộc trò chuyện chảy.
Đây là những gì chúng tôi luôn muốn cuộc gọi thoại phải là.
Bây giờ cuối cùng cũng vậy.
Chúc mừng năm mới
2025 là năm xây dựng. Cuộc gọi thoại chỉ là một trong nhiều thứ chúng tôi xây dựng lại, suy nghĩ lại, hoặc tạo ra từ đầu.
2026 sẽ là năm kết nối. Nhiều cách hơn để nghe nhân vật của bạn. Nhiều cách hơn để cảm nhận sự hiện diện của họ. Nhiều cách hơn để làm cho AI companionship cảm thấy ít như công nghệ và nhiều hơn như... companionship.
Cảm ơn bạn đã ở đây. Vì thử các tính năng chưa hoạt động. Vì đưa ra phản hồi định hình những gì chúng tôi xây dựng. Vì tin vào những gì Reverie có thể trở thành.
Chúc một năm mới với những cuộc trò chuyện đáng giá.
Có suy nghĩ về trải nghiệm giọng nói mới? Chúng tôi đang lắng nghe—liên hệ qua Discord hoặc feedback.
Sẵn sàng trải nghiệm cuộc trò chuyện AI năng động?
Tham gia hàng ngàn người dùng đang khám phá tính cách vô tận và tương tác hấp dẫn trên Reverie.
