小米新一代Kaldi中基于GPU的语音识别实

AI大模型在语音识别、自然语言处理等领域已经取得了令人瞩目的成就，语音AI（Speech AI）技术已经广泛应用在数字人，实时翻译，语音搜索、客户服务应答等多个业务场景， NVIDIA 也在不断通过业界领先的技术帮助企业能够快速部署定制化AI智能语音端到端流程。

12月19日和12月21日，每晚19:30-21:00，DataFun 社区将联合 NVIDIA 举办主题为「大模型时代语音AI模型的训练、优化与应用」的线上直播活动，欢迎感兴趣的小伙伴报名免费观看直播。

本次在线研讨会，来自 NVIDIA 的技术专家，将着重为您介绍如何有针对性地在语音模型的训练、推理、部署等方面进行加速和优化，内容涵盖以下话题：

🔥 如何在 NEMO 框架下快速进行包含 ASR、NLP 和 TTS 全流程语音训任务练；

🔥 如何利用 NVIDIA Riva 这一强大的基于深度学习的 SDK 快速部署企业级中文语音AI服务并进行优化加速；

🔥如何利用 TensorRT-LLM 和 TensorRT + Triton 对 ASR 大模型和流式 TTS 进行加速优化。

同时，来自小米新一代 Kaldi 项目团队的技术专家，也会分享“新一代 Kaldi 中基于 GPU 的语音识别实践”的经验分享。内容精彩纷呈干货满满，不要错过！
扫码免费报名 会后领取PPT👇

小米新一代Kaldi中基于GPU的语音识别实

*报名即送电子书《模型推理与部署》

PART

活动议程

小米新一代Kaldi中基于GPU的语音识别实

PART

议题与嘉宾介绍

🔥在 NeMo 框架下快速进行包含 ASR、NLP 和 TTS 的全流程语音任务训练

⏰时间: 12.19 19:30-20:10

👨‍💻嘉宾: 齐家兴 NVIDIA 解决方案架构师

🪧嘉宾介绍：

德国亚琛工业大学博士，目前于英伟达企业解决方案部门担任高级架构师，多年来从事自然语言处理和语音识别等方向研究，助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是英伟达 NeMo，Riva 语音识别训练推理平台的中文模型开发者之一。

🍀演讲提纲：

NVIDIA NeMo 是一个针对 ASR, NLP, TTS的训练工具框架。它内部集成业界最新的模型结构，高效的 LLM 模型并行训练方法，方便开发者快速开发对话式AI 应用。通过本次演讲，您将收获以下内容：

1、了解 NeMo 中新增加的模型结构

2、了解 NeMo Megatron 对 LLM 的训练优化

3、了解 NeMo 中的 TTS 模型支持

🔥利用 NVIDIA Riva 快速部署企业级中文语音 AI 务并进行优化加速

⏰时间: 12.19 20:10-20:50

👨‍💻嘉宾: 丁文 NVIDIA 解决方案架构师

🪧嘉宾介绍：

毕业于上海交通大学，导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门，主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA，负责 Riva 中文 ASR 模型迭代，中文 ASR 模型 GPU 部署方案落地与优化等。

🍀演讲提纲：

NVIDIA Riva 提供基于 GPU 的高效流式语音识别和语音合成的部署解决方案。通过本次演讲您将收获以下内容：

1、了解 Riva 中文语音识别新增功能

2、了解 Riva 构建中文语音合成流程

3、学习如何使用 Riva quick start 快速搭建语音服务

🔥利用 NVIDIA 最新推出的 TensorRT-LLM，以及 Triton 推理服务器优化、部署和高效运行语音模型

⏰时间: 12.21 19:30-20:10

👨‍💻嘉宾: 刘川 NVIDIA 解决方案架构经理

🪧嘉宾介绍：

毕业于南京大学，目前整体负责云计算行业 GPU 解决方案的构建。NVIDIA 中文语音解决方案主要负责人，对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。

🍀演讲提纲：

1、GPU 优化智能语音任务进展概览

2、基于 TensorRT-LLM 加速 ASR 大模型

3、基于 TensorRT + Triton 的流式 TTS 优化方案

🔥新一代 Kaldi 团队的最新进展

⏰时间: 12.21 20:10-20:50

👨‍💻嘉宾: 杨笑宇小米公司新一代 Kaldi 项目（Daniel Povey 团队）核心开发成员

🪧嘉宾介绍：

硕士毕业于剑桥大学，导师为 Phil Woodland 教授，主要研究方向为语音识别。

🍀演讲提纲：

1、新一代 Kaldi 项目介绍

2、新一代 Kaldi 项目最新进展

3、新一代 Kaldi 中基于 GPU 的语音识别实践

扫码报名免费参会

领取电子书《模型推理与部署》👇

小米新一代Kaldi中基于GPU的语音识别实

2023 年 12 月
一	二	三	四	五	六	日
	1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

小米新一代Kaldi中基于GPU的语音识别实

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

文心AIGC

手把手教你用AI 10分钟生成一个APP！零基础也能搞定

手把手教你用AI 10分钟生成一个APP！零基础也能搞定