小米新一代Kaldi中基于GPU的语音识别实

474次阅读
没有评论

AI大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就,语音AI(Speech AI)技术已经广泛应用在数字人,实时翻译,语音搜索、客户服务应答等多个业务场景, NVIDIA 也在不断通过业界领先的技术帮助企业能够快速部署定制化AI智能语音端到端流程。


12月19日和12月21日每晚19:30-21:00DataFun 社区将联合 NVIDIA 举办主题为「大模型时代语音AI模型的训练、优化与应用」的线上直播活动,欢迎感兴趣的小伙伴报名免费观看直播。


本次在线研讨会,来自 NVIDIA 的技术专家,将着重为您介绍如何有针对性地在语音模型的训练、推理、部署等方面进行加速和优化,内容涵盖以下话题:

🔥 如何在 NEMO 框架下快速进行包含 ASR、NLP 和 TTS 全流程语音训任务练;

🔥 如何利用 NVIDIA Riva 这一强大的基于深度学习的 SDK 快速部署企业级中文语音AI服务并进行优化加速;

🔥何利用 TensorRT-LLM 和 TensorRT + Triton 对 ASR 大模型和流式 TTS 进行加速优化

同时,来自小米新一代 Kaldi 项目团队的技术专家,也会分享“新一代 Kaldi 中基于 GPU 的语音识别实践”的经验分享。内容精彩纷呈干货满满,不要错过!
扫码免费报名 会后领取PPT👇

小米新一代Kaldi中基于GPU的语音识别实

*报名即送电子书《模型推理与部署》


PART

01

活动议程

小米新一代Kaldi中基于GPU的语音识别实

PART

02

议题与嘉宾介绍

🔥在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练

时间: 12.19 19:30-20:10

👨‍💻嘉宾: 齐家兴 NVIDIA 解决方案架构

🪧嘉宾介绍

德国亚琛工业大学博士,目前于英伟达企业解决方案部门担任高级架构师,多年来从事自然语言处理和语音识别等方向研究,助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是英伟达 NeMo,Riva 语音识别训练推理平台的中文模型开发者之一。

🍀演讲提纲

NVIDIA NeMo 是一个针对 ASR, NLP, TTS的训练工具框架。它内部集成业界最新的模型结构,高效的 LLM 模型并行训练方法,方便开发者快速开发对话式AI 应用。通过本次演讲,您将收获以下内容:

1、了解 NeMo 中新增加的模型结构

2、了解 NeMo Megatron 对 LLM 的训练优化

3、了解 NeMo 中的 TTS 模型支持


🔥利用 NVIDIA Riva 快速部署企业级中文语音 AI 务并进行优化加速

时间: 12.19 20:10-20:50

👨‍💻嘉宾: 丁文 NVIDIA 解决方案架构师

🪧嘉宾介绍

毕业于上海交通大学,导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门,主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA,负责 Riva 中文 ASR 模型迭代,中文 ASR 模型 GPU 部署方案落地与优化等。

🍀演讲提纲

NVIDIA Riva 提供基于 GPU 的高效流式语音识别和语音合成的部署解决方案。通过本次演讲您将收获以下内容:

1、了解 Riva 中文语音识别新增功能

2、了解 Riva 构建中文语音合成流程

3、学习如何使用 Riva quick start 快速搭建语音服务


🔥利用 NVIDIA 最新推出的 TensorRT-LLM,以及 Triton 推理服务器优化、部署和高效运行语音模型

时间: 12.21 19:30-20:10

👨‍💻嘉宾: 刘川 NVIDIA 解决方案架构经理

🪧嘉宾介绍

毕业于南京大学,目前整体负责云计算行业 GPU 解决方案的构建。NVIDIA 中文语音解决方案主要负责人,对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。

🍀演讲提纲

1、GPU 优化智能语音任务进展概览

2、基于 TensorRT-LLM 加速 ASR 大模型

3、基于 TensorRT + Triton 的流式 TTS 优化方案

🔥新一代 Kaldi 团队的最新进展

时间: 12.21 20:10-20:50

👨‍💻嘉宾: 杨笑宇 小米公司新一代 Kaldi 项目(Daniel Povey 团队)核心开发成员

🪧嘉宾介绍

硕士毕业于剑桥大学,导师为 Phil Woodland 教授,主要研究方向为语音识别。

🍀演讲提纲

1、新一代 Kaldi 项目介绍

2、新一代 Kaldi 项目最新进展

3、新一代 Kaldi 中基于 GPU 的语音识别实践


扫码报名免费参会

领取电子书《模型推理与部署》👇

小米新一代Kaldi中基于GPU的语音识别实

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy