每周编辑精选|7×24h 的 AI 直播间来啦!一键使用 GPT-SoVITS 声音克隆教程上新

685次阅读
没有评论

📢📢 好消息!好消息!📺「超神经电视台」在 bilibili 上线啦~

 

「超神经电视台」会「7×24h」不间断直播 AI 领域的实用课程与行业大会等,每周我们会在文章结尾发布下周的节目预告哦!

点开看看:http://live.bilibili.com/26483094

 

悄悄说,前段时间从 OpenAI 离职的技术大神 Karpathy 发布的 AI 大课——「让我们构建 GPT Tokenizer(分词器)」将会在下周五(3 月 15 日)晚上 8 点在直播间播放。为了让大家更方便地体验该项目,项目相关资源 minbpe 也已上线至 hyper.ai 官网,快来观看学习吧~

 

此外,本周 hyper.ai 官网还上线了多个文本类情感分析数据集供大家下载使用哦!

 

3 月 4 日-3 月 8 日,hyper.ai 官网更新速览:

 

* 优质公共数据集:10 个

* 社区文章精选:4 篇

* 热门百科词条:10 条

 

访问官网:hyper.ai

 

公开数据集精选

 

1. minbpe 存储库

 

该存储库为 Karpathy 的 minbpe 项目存储库,包含了基于类的 Tokenizer 实现,如 BaseTokenizer 和 BasicTokenizer 等。这些类的设计旨在提供训练、编码和解码的基本功能,以及保存和加载等实用功能。

 

直接使用:

https://reurl.cc/97A8QY

 

2. D4 面向抑郁症诊断聊天的中文对话数据集

 

D4 是一个抑郁症诊断聊天中文对话数据集。它是一种被称为任务型聊天的全新对话类型。该数据集由 1,339 个多轮对话组成,包含对话摘要和诊断结果。

 

直接使用:

https://reurl.cc/krbAk3

 

3. dmsc_v2 电影评论数据集

 

该数据集包含超 70 万用户对 28 部电影的超 200 万条评分或评论数据。适用于推荐系统、情感/观点/评论等倾向性分析的任务。

 

直接使用:

https://reurl.cc/prbEOl

 

4. Amazon 亚马逊用户评价数据集

 

该数据集包含 142 万用户对亚马逊上 1,100 多个类目 52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。

 

直接使用:

https://reurl.cc/97A8AV

 

5. Dianping 大众点评数据集

 

该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。

 

直接使用:

https://reurl.cc/eLbYrR

 

6. Weibo_senti_100k 新浪情感类微博数据集

 

该数据集包含 10 万多条带情感标注的新浪微博,其中正负向评论各约 5 万条。

 

直接使用:

https://reurl.cc/N487a6

 

7. Online_shopping_10_cats 10 个种类的线上购物评论数据集

 

该数据集包含 10 个类别(书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服计算机、酒店)的线上购物评论,共 6 万多条的评论数据,正、负向评论各约 3 万条。可用于情感/观点/评论等倾向性分析任务。

 

直接使用:

https://reurl.cc/qrbl8g

 

8. ChnSentiCorp 携程酒店评价数据集

 

该数据集包含来自携程网的 7,000 多条酒店评论数据,5,000 多条正向评论和 2,000 多条负向评论。

 

直接使用:

https://reurl.cc/QelvjM

 

9. Waimai_10k 外卖平台用户评价数据集

 

该数据集来自某外卖平台收集的用户评价,包含正向评价约 4,000 条,负向评价约 8,000 条。可用于情感/观点/评论的倾向性分析。

 

直接使用:

https://reurl.cc/K4zaQq

 

10. Four-shapes 四种形状数据集

 

该数据集包含 16,000 张 4 种形状的图像:正方形、星形、圆形和三角形。每个图像为 200×200 像素。数据是使用 Garmin Virb 1080p 运动相机收集的。

 

直接使用:

https://reurl.cc/E4N9Zm

 

更多本周更新数据集,请访问

https://hyper.ai/datasets

 

社区文章精选

 

1. 准确率达 91.74%!东南大学提出光伏电池缺陷检测模型,首次引入神经结构搜索

 

为了同时满足工业领域对缺陷检测的精度和速度要求,来自东南大学自动化学院的张金霞教授团队,基于神经结构搜索和知识蒸馏,提出了一种光伏电池电致发光图像缺陷自动检测模型,准确率达 91.74%。目前,该研究成果已发布在 arXiv 上。

 

查看完整报道:

https://reurl.cc/97AK7x

 

2. 内含教程丨音色克隆模型 GPT-SoVITS,5 秒语音就能克隆出相似度 95% 的声音

 

RVC (Retrieval based Voice Conversion) 创始人(GitHub 账号:RVC-Boss)开源了一款音色克隆项目 GPT-SoVITS,上线后便获得极高热度。仅需提供 5 秒语音样本,便可收获相似度达到 80%~95% 的克隆语音。目前,该模型部署教程已上线 HyperAI超神经官网。

 

点击开始克隆:

https://reurl.cc/97AKj8

 

3. 两会进行时丨科技大佬点名 AI4S/人才培养/算力/大模型/行业通用数据集……

 

又是一年「两会」时!政府工作报告中明确提出要开展「人工智能+」行动,来自社会各界的人大代表与政协委员也纷纷围绕 AI 建言献策。本文梳理了部分科技圈大佬的提案建议。

 

查看完整报道:

https://reurl.cc/lgbxGE

 

4. HyperAI 超神经 x DT 新材料丨 AI 技术在化学与材料科学科研中应用研讨会开启报名

 

「AI 技术在化学与材料科学科研中应用研讨会」将于 4 月 23 日—25 日在河南郑州开幕,多位行业专家将围绕 AI 应用于材料化学领域的挑战、前景与机遇等方面带来深度分享。

 

感兴趣的开发者们可以点击下方链接报名。

 

报名链接:

https://reurl.cc/QelMdb

热门百科词条精选

 

1. 拉普拉斯算子 Laplacian

2. 世界模型 World Modeling

3. 每秒帧数 Frames Per Second (FPS)

4. 扩散模型 Diffusion Model

5. 人机回圈 Human-in-the-loop (HITL)

 

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

 

超神经 B 站直播预告

 

日期

时间

内容

3 月 11 日
星期一

10:00

英伟达历年发布会

3 月 12 日

星期二

10:00

18:00

机器学习编译课程

特斯拉 AI 日

3 月 13 日

星期三

10:00

谷歌历年 I-O 发布会

3 月 14 日

星期四

10:00

斯坦福HAI 研讨会

3 月 15 日

星期五

 

10:00

20:00

 

MIT 深度学习课程

Let‘s build GPT Tokenizer

3 月 16 日

星期六

10:00

哈佛 CS50 课程

(2023)

3 月 17 日

星期日

10:00

哈佛 CS50 课程

(2022)

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

 

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

 

下周再见!

 

关于 HyperAI超神经 (hyper.ai)

 

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区,致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

 

* 为 1200+ 公开数据集提供国内加速下载节点

* 收录 300+ 经典及流行在线教程

* 解读 100+ AI4Science 论文案例

* 支持 500+ 相关词条查询

* 托管国内首个完整的 Apache TVM 中文文档

 

访问官网开启学习之旅:

https://hyper.ai/

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy