目前,Dia仅支撑英文,不外用户也能够正在Hugging Face Spaces线上平台中正在线利用。Nari Labs暗示,后续将推出头具名向通俗消费者的一键摆设办事,进一步降低利用门槛,让更多人无缝体验高质量文本转语音手艺。
IT之家 4 月 24 日动静,由两名韩国研究者组建的 Nari Labs 工做室于前天正在GitHub和Hugging Face开源了具有 16 亿参数的文字转语音AI模子Dia,目前响应模子已正在GitHub上收成了跨越 9300 颗星标,IT之家附项目 GitHub页如下?。
对比测试显示,Dia正在声调天然度?。
响应研究者声称Dia的音质相对于业界的文字转语音模子具有更矫捷的度,同时正在生成的语音天然度方面超越了 ElevenLabs Studio、其支撑对输出音频的音色、还能模仿各类非言语交换(如大笑、咳嗽或清嗓子等)。
上一篇:红毯美到梗塞AI东西让你轻松生成明星动漫照!