比真實還真實的聊天語音
在一件藝術品背後
有愿
想像一下,和AI聊天時,它不僅聽得懂你說什麼,還能用像真人一樣的語調回應,甚至讓你覺得它知道內心想法。這不是科幻電影,而是Sesame公司最新推出的對話語音模型CSM帶來的體驗。這家由Oculus VR聯合創始人Brendan Iribe創辦的公司,最近在AI語音技術上拋出一顆震撼彈,目標是讓AI伴侶的對話自然到不行,還能建立起你的信任感。CSM厲害在哪?簡單來說,它是用變壓器技術打造的多模態模型,靠着約一百萬小時的英語音頻訓練,能根據對話脈絡調整語調和情緒。不管是講外語單詞、抓準語感,還是處理多人對話,它都能應付自如。
實際用過的人怎麼說?有人覺得這語音在語氣、語調已達到誇張級別,比如展示版本Maya和Miles,聽起來就像身邊的朋友。有個家長甚至說,他四歲女兒跟AI聊完後,因為不能再聊而哭了起來,足見這技術有多吸引人。當然,也有人覺得這種“太真實”的感覺有點毛毛的,擔心未來會不會被拿來搞亂七八糟的事。不過專家倒是挺看好,開發者Adil Mania就說:“這比ChatGPT的語音模式還像人,我寧願跟它聊心事也不找心理醫生。”聽起來是不是很有意思?相信很快又有新職業被取替,與其坐着等,不如我們反過來看看又有甚麼新工種將會出現。