声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
- 2025-03-16 00:01:00
- 刘大牛 转自文章
- 517
语音恐怖谷是指在语音合成技术中,当 AI 合成语音接近人类的真实语音,但又存在细微的不自然或不完美之处时,会引发人类的不适感。
Sesame 官方博客中正式写道他们的研究跨越恐怖谷效应,来源:https://www.sesame.com/research/crossing_the_uncanny_valley_of_voice
项目地址:https://github.com/SesameAILabs/csm
huggingface 地址:https://huggingface.co/spaces/sesame/csm-1b
发表评论
文章分类
联系我们
| 联系人: | 透明七彩巨人 |
|---|---|
| Email: | weok168@gmail.com |