AI大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就,语音AI(Speech AI)技术已经广泛应用在数字人,实时翻译,语音搜索、客户服务应答等多个业务场景, NVIDIA 也在不断通过业界领先的技术帮助企业能够快速部署定制化AI智能语音端到端流程。
12月19日和12月21日,每晚19:30-21:00,DataFun 社区将联合 NVIDIA 举办主题为「大模型时代语音AI模型的训练、优化与应用」的线上直播活动,欢迎感兴趣的小伙伴报名免费观看直播。
本次在线研讨会,来自 NVIDIA 的技术专家,将着重为您介绍如何有针对性地在语音模型的训练、推理、部署等方面进行加速和优化,内容涵盖以下话题:
🔥 如何在 NEMO 框架下快速进行包含 ASR、NLP 和 TTS 全流程语音训任务练;
🔥 如何利用 NVIDIA Riva 这一强大的基于深度学习的 SDK 快速部署企业级中文语音AI服务并进行优化加速;
🔥如何利用 TensorRT-LLM 和 TensorRT + Triton 对 ASR 大模型和流式 TTS 进行加速优化。
同时,来自小米新一代 Kaldi 项目团队的技术专家,也会分享“新一代 Kaldi 中基于 GPU 的语音识别实践”的经验分享。内容精彩纷呈干货满满,不要错过!
扫码免费报名 会后领取PPT👇
*报名即送电子书《模型推理与部署》
PART
01
活动议程
PART
02
议题与嘉宾介绍
🔥在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练
⏰时间: 12.19 19:30-20:10
👨💻嘉宾: 齐家兴 NVIDIA 解决方案架构师
🪧嘉宾介绍:
德国亚琛工业大学博士,目前于英伟达企业解决方案部门担任高级架构师,多年来从事自然语言处理和语音识别等方向研究,助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是英伟达 NeMo,Riva 语音识别训练推理平台的中文模型开发者之一。
🍀演讲提纲:
NVIDIA NeMo 是一个针对 ASR, NLP, TTS的训练工具框架。它内部集成业界最新的模型结构,高效的 LLM 模型并行训练方法,方便开发者快速开发对话式AI 应用。通过本次演讲,您将收获以下内容:
1、了解 NeMo 中新增加的模型结构
2、了解 NeMo Megatron 对 LLM 的训练优化
3、了解 NeMo 中的 TTS 模型支持
🔥利用 NVIDIA Riva 快速部署企业级中文语音 AI 务并进行优化加速
⏰时间: 12.19 20:10-20:50
👨💻嘉宾: 丁文 NVIDIA 解决方案架构师
🪧嘉宾介绍:
毕业于上海交通大学,导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门,主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA,负责 Riva 中文 ASR 模型迭代,中文 ASR 模型 GPU 部署方案落地与优化等。
🍀演讲提纲:
NVIDIA Riva 提供基于 GPU 的高效流式语音识别和语音合成的部署解决方案。通过本次演讲您将收获以下内容:
1、了解 Riva 中文语音识别新增功能
2、了解 Riva 构建中文语音合成流程
3、学习如何使用 Riva quick start 快速搭建语音服务
🔥利用 NVIDIA 最新推出的 TensorRT-LLM,以及 Triton 推理服务器优化、部署和高效运行语音模型
⏰时间: 12.21 19:30-20:10
👨💻嘉宾: 刘川 NVIDIA 解决方案架构经理
🪧嘉宾介绍:
毕业于南京大学,目前整体负责云计算行业 GPU 解决方案的构建。NVIDIA 中文语音解决方案主要负责人,对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。
🍀演讲提纲:
1、GPU 优化智能语音任务进展概览
2、基于 TensorRT-LLM 加速 ASR 大模型
3、基于 TensorRT + Triton 的流式 TTS 优化方案
🔥新一代 Kaldi 团队的最新进展
⏰时间: 12.21 20:10-20:50
👨💻嘉宾: 杨笑宇 小米公司新一代 Kaldi 项目(Daniel Povey 团队)核心开发成员
🪧嘉宾介绍:
硕士毕业于剑桥大学,导师为 Phil Woodland 教授,主要研究方向为语音识别。
🍀演讲提纲:
1、新一代 Kaldi 项目介绍
2、新一代 Kaldi 项目最新进展
3、新一代 Kaldi 中基于 GPU 的语音识别实践
扫码报名免费参会
领取电子书《模型推理与部署》👇