❤️【专栏:数据集整理】❤️ 之【有效拒绝假数据】
👋 Follow me 👋,一起 Get 更多有趣 AI、冲冲冲 🚀 🚀
语音数据集下载地址汇总
📔 Acoustic-Phonetic Continuous Speech Corpus【英文】
🔴 数据集链接
🔵 数据集简介
📕 commonvoice [ 中文]
🟧 下载链接
🟨 该链接下载界面如下
🟦 该链接下还可以关注的数据集如下
📗 中文语音数据 - THCHS-30 : A Free Chinese Speech Corpus
📘 一个免费的汉语说话人识别语料库【A Free Chinese Speaker Recognition Corpus】
🔴 数据集介绍
🔵 下载地址
🟣 下载主页
📙 致谢
📔 Acoustic-Phonetic Continuous Speech Corpus【英文】
🔴 数据集链接
TIMIT Acoustic-Phonetic Continuous Speech Corpus GitHub 地址
TIMIT 语料库 kaggle 下载地址,登录Kaggle账号即可下载
🔵 数据集简介
📕 commonvoice [ 中文]
🟧 下载链接
Mozilla 公司的 Common Voice(输入邮箱即可下载): Mozilla 公司的 Common Voice
🟨 该链接下载界面如下
🟦 该链接下还可以关注的数据集如下
📗 中文语音数据 - THCHS-30 : A Free Chinese Speech Corpus
请直接参考该博文即可:中文语音数据 - THCHS-30
国内主流语音数据库主页:https://openslr.org/resources.php
📘 一个免费的汉语说话人识别语料库【A Free Chinese Speaker Recognition Corpus】
🔴 数据集介绍
这是一个“户外”收集的大规模说话人识别数据集
数据集由两个子集 CN-Celeb1 和 CN-Celeb2 组成。
所有音频文件都被编码为单声道,并以 16kHz 的频率采样,精度为 16 位。
对于 CN-Celeb1,它包含来自 1,000 位中国名人的 130,000 多条话语,并涵盖了现实世界中的 11 种不同类型。
对于 CN-Celeb2,它包含来自 2,000 位中国名人的 520,000 多条话语,涵盖了现实世界中的 11 种不同类型。
数据收集过程由清华大学语音与语言技术中心组织。
数据集详细信息
语种:中文
内容:自由文本
音频参数:16 kHz,16 bits,单通道
数据类型:说话人识别语料库
录音环境:
娱乐、访谈、唱歌、戏剧、电影、视频博客、直播、演讲、电视剧、朗诵和广告
🔵 下载地址
http://cslt.riit.tsinghua.edu.cn/~data/CN-Celeb/
http://www.openslr.org/82/
🟣 下载主页
这里下载了 CN-Celeb1 的 cn-celeb_v2.tar.gz [22G] 数据压缩包,解压查看内容,分析如下
flac 格式音频
查看数据集文件目录
# tree 查看 两个层级
tree -L 2
.
├── 1911.01799.pdf
├── data
│ ├── id00000
│ ├── id00001
│ ├── id00002
│ ├── id00003
│ ├── id00004
│ ├── id00005
│ ├── id00006
...
...
│ ├── id00996
│ ├── id00997
│ ├── id00998
│ └── id00999
├── dev
│ └── dev.lst
├── eval
│ ├── enroll
│ ├── lists
│ ├── README.TXT
│ └── test
└── README.TXT
1003 directories, 4 files
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
📙 致谢
文章来源: positive.blog.csdn.net,作者:墨理学AI,版权归原作者所有,如需转载,请联系作者。
原文链接:positive.blog.csdn.net/article/details/105522398