谷歌推出 AudioPaLM,一款能说会听的大语言模型

725次阅读
没有评论

品玩6月25日讯,据 huggingface 页面显示,谷歌研究团队近日推出一款大语言模型产品 AudioPaLM,可以实现语音理解和生成功能。

谷歌推出 AudioPaLM,一款能说会听的大语言模型

AudioPaLM 将两个大语言模型 PaLM-2 和 AudioLM 融合到一个统一的多模态架构之中,利用该架构处理和生成文本和语音。 AudioPaLM 还支持语音识别以及语音翻译。

试验表明,AudioPaLM 的表现显著优于现有的语音翻译系统。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy