36 氪獲悉,6 月 26 日,科大訊飛語音合成技術全新升級,一句話聲音復刻與超擬人合成兩大核心能力實現突破。據介紹,此次一句話聲音復刻技術升級在星火語音大模型底座基礎上,構建了一套層次化語音建模框架,在此框架下進行音色編碼增強和強化學習等關鍵技術突破,使得音色恢復的相似度顯著提升,并精準還原用戶的停頓習慣、情感起伏和呼吸節奏;超擬人合成技術則賦予 AI 聲音以 " 上下文情商 "。據介紹,技術底座已服務全國 5 萬余所學校、600 家醫院及眾多金融機構。
36氪
45分鐘前