CCMusic数据库搜集了流行音乐、民族音乐及数百种民族乐器的音响素材,并进行全面的标注,构成1个供MIR研究者使用的多用途的音乐数据库。本数据库由音乐学院专门录制,录制者具有较高的音乐素养,录制环境及技术专业,录音质量高,无商品版权问题,录制的音频免费公开,并方便大规模推广。本数据库对录音环境、录音设备以及录音人员、流程等方面进行专业的限定,力求避免各种噪声的干扰,获得高质量的音频素材。此外将音频的旋律声部与伴奏声部分两轨独立录制,对音乐信息检索的研究有重要的意义。未来,我们将会搜集更多的音乐素材进行录制和详细的标注。
本数据库包含 10 个子数据集,列表如下:
关于本数据库更详细的描述请查看以下论文:
本数据集收录了中国音乐学院琴房7种型号钢琴(KAWAI立式钢琴、KAWAI三角钢琴、英昌立式钢琴、星海立式钢琴、大剧院施坦威钢琴、施坦威三角钢琴、珠江立式钢琴)的全音域音频文件12个(.wav/.mp3/.m4a格式),以及拆分后的单音音频文件1320个(.wav/.mp3/.m4a格式),共计1332个文件。此外还有《钢琴音质主观评价问卷调查》1个(.xls格式),包括29人参与钢琴音质主观评价的打分情况。
以KAWAI三角钢琴为例,列表如下:
序号 | 文件名称 | 演奏内容 | 文件大小 | 时长(min) | 文件格式 | demo试听 |
---|---|---|---|---|---|---|
1 | KAWAI-Grand.wav | KAWAI三角钢琴大字一组C-大字组C半音阶音频 | 20.9 MB (21,965,182 字节) | 19:20 | .wav(RIFF) | |
2 | 7100.wav | KAWAI三角钢琴大字一组C单音音频 | 994 KB (1,017,928 字节) | 00:05 | .wav(RIFF) | |
3 | 7101.wav | KAWAI三角钢琴大字一组#C单音音频 | 1.15 MB (1,211,800 字节) | 00:06 | .wav(RIFF) | |
4 | 7102.wav | KAWAI三角钢琴大字一组D单音音频 | 1.13 MB (1,195,640 字节) | 00:06 | .wav(RIFF) | |
5 | 7103.wav | KAWAI三角钢琴大字一组#D单音音频 | 1.17 MB (1,227,960 字节) | 00:06 | .wav(RIFF) | |
6 | 7104.wav | KAWAI三角钢琴大字一组E单音音频 | 1.06 MB (1,114,864 字节) | 00:06 | .wav(RIFF) | |
7 | 7105.wav | KAWAI三角钢琴大字一组F单音音频 | 1.12 MB (1,179,488 字节) | 00:06 | .wav(RIFF) | |
8 | 7106.wav | KAWAI三角钢琴大字一组#F单音音频 | 1.20 MB (1,260,264 字节) | 00:07 | .wav(RIFF) | |
9 | 7107.wav | KAWAI三角钢琴大字一组G单音音频 | 1.00 MB (1,050,244 字节) | 00:05 | .wav(RIFF) | |
10 | 7108.wav | KAWAI三角钢琴大字一组#G单音音频 | 1.09 MB (1,147,180 字节) | 00:06 | .wav(RIFF) | |
11 | 7109.wav | KAWAI三角钢琴大字一组A单音音频 | 899 KB (920,996 字节) | 00:05 | .wav(RIFF) | |
12 | 7110.wav | KAWAI三角钢琴大字一组#A单音音频 | 1.06 MB (1,114,868 字节) | 00:06 | .wav(RIFF) | |
13 | 7111.wav | KAWAI三角钢琴大字一组B单音音频 | 946 KB (969,468 字节) | 00:05 | .wav(RIFF) | |
14 | 7200.wav | KAWAI三角钢琴大字组C单音音频 | 946 KB (969,464 字节) | 00:05 | .wav(RIFF) |
本数据集包含由22位歌手翻唱的6首普通话歌曲,共132段(.wav格式),每段翻唱均由一段主歌及一段副歌组成。由4位专业评委从音准、节奏、音域、音色、发音、颤音、音量变化、气息控制、整体表现等九个方面进行评价打分,满分10分制。打分情况记录在《调查问卷评分结果》中。
从六首歌曲中分别选出一位歌手的演唱,列表如下:
序号 | 文件名称 | 歌手 | 演唱内容 | 文件大小 | 时长(min) | 文件格式 | demo试听 |
---|---|---|---|---|---|---|---|
1 | HY_至少还有你demo.wav | HY | 歌曲《至少还有你》 | 16.8 MB (17,683,338 字节) | 00:30 | .wav(RIFF) | |
2 | LJQ_但愿人长久demo.wav | LJQ | 歌曲《但愿人长久》 | 12.3 MB (12,960,102 字节) | 00:22 | .wav(RIFF) | |
3 | SCX_我只在乎你demo.wav | SCX | 歌曲《我只在乎你》 | 7.47 MB (7,833,702 字节) | 00:13 | .wav(RIFF) | |
4 | WHL_如果没有你demo.wav | WHL | 歌曲《如果没有你》 | 16.7 MB (17,568,102 字节) | 00:30 | .wav(RIFF) | |
5 | WZB_月亮代表我的心demo.wav | WZB | 歌曲《月亮代表我的心》 | 16.7 MB (17,568,102 字节) | 00:24 | .wav(RIFF) | |
6 | YHA_甜蜜蜜demo.wav | YHA | 歌曲《甜蜜蜜》 | 16.7 MB (17,568,102 字节) | 00:19 | .wav(RIFF) |
本数据集包含1280个用真声/假声演唱的单音音频文件(.wav格式),真声被标记为_chest,假声被标记为_falsetto。此外还收录了每段音频的标注标签、mel spectrogram、MFCC、频谱特征,共计5120个.csv文件。
例子如下:
本数据集是用于对37种民族乐器的音色主观评价实验,包含用作音色主观评价实验的汇总音频素材1个(.wav格式),以及14人参与的37种乐器在16个音色评价词上的音色主观评价实验(1~10分)打分表(.xlsx格式)。此外还有对10种乐器的频谱分析报告10个(.docx格式),乐器音频来自 中国传统乐器音响数据库(CTIS) 。
部分文件列表如下:
本数据集包含至少1700首不同流派音乐的音频(.mp3格式,来自网易云),每段音频时长约270~300秒。数据库共分为17个流派,每个流派对应一个标注文件,标注信息为流派分类标签,用于流派分类任务。主要的流派标签:古典(symphony, opera, solo, chamber)、非古典(pop, dance&house, indie, soul/r&b, rock)。
标注信息的格式: file_name, duration, singer, fst_level_label, sec_level_label,
thr_level_label
以非古典non-classical流派(标注标签为2)的摇滚rock流派(标注标签为11)的Adult Alternative
Rock流派(标注标签为19)为例,部分列表如下:
序号 | file_name | duration | singer | fst_level_label | sec_level_label | thr_level_label |
---|---|---|---|---|---|---|
1 | A Fine Frenzy - Elements | 203s | A Fine Frenzy | 2 | 11 | 19 |
2 | Daniel Powter - Not Coming Back | 241s | Daniel Powter | 2 | 11 | 19 |
3 | Hit Crew Masters - A Place For My Head | 186s | Hit Crew Masters | 2 | 11 | 19 |
4 | R.E.M. - Everybody Hurts | 320s | R.E.M. | 2 | 11 | 19 |
5 | Black Strobe - Boogie in zero Gravity | 209s | Black Strobe | 2 | 11 | 19 |
6 | Hit Crew Masters - Futures | 237s | Hit Crew Masters | 2 | 11 | 19 |
本数据集包含音色和音域2个子数据库。
1.音色数据集包含录制的9名歌手的干声演唱音频,以及经过剪切、重新拼接后的音频片段,共计775段(.wav格式)。
2.音域数据集包括若干人声演唱的上、下行半音阶音频,以及剪切后的单音音频素材。此外还有音频波形文件若干。
音色数据集以singer 2 的演唱为例,列表如下:
序号 | 文件名称 | 内容 | 文件大小 | 时长 | 文件格式 | demo试听 |
---|---|---|---|---|---|---|
1 | singer2.wav | singer2演唱干声片段(6s) | 1.05 MB (1,109,742 字节) | 6s | .wav(RIFF) | |
2 | singer2-1.wav | singer2演唱干声剪切拼贴后片段 | 2.06 MB (2,162,706 字节) | 24s | .wav(RIFF) | |
3 | singer2-1-1.wav | singer2演唱干声片段剪切为10段之1 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
4 | singer2-1-2.wav | singer2演唱干声片段剪切为10段之2 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
5 | singer2-1-3.wav | singer2演唱干声片段剪切为10段之3 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
6 | singer2-1-4.wav | singer2演唱干声片段剪切为10段之4 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
7 | singer2-1-5.wav | singer2演唱干声片段剪切为10段之5 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
8 | singer2-1-6.wav | singer2演唱干声片段剪切为10段之6 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
9 | singer2-1-7.wav | singer2演唱干声片段剪切为10段之7 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
10 | singer2-1-8.wav | singer2演唱干声片段剪切为10段之8 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
11 | singer2-1-9.wav | singer2演唱干声片段剪切为10段之9 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) | |
12 | singer2-1-10.wav | singer2演唱干声片段剪切为10段之10 | 2.52 MB (2,646,042 字节) | 29s | .wav(RIFF) |
音域数据集以singer 19 的演唱为例,列表如下:
本数据集包含300首流行歌曲(.mp3格式,来自网易云),以及每首歌曲的结构性标注文件(.txt格式)。歌曲结构:intro, chorus, verse,pre-chorus, post-chorus, bridge, ending。
以“Britney Spears - Toxic (Bloodshy & Avant's Intoxicated Remix)”和“Backstreet Boys - Darlin'”为例,标注信息列表如下:
序号 | 开始时间(0.01s) | 结束时间(0.01s) | 结构标注 | demo | 序号 | 开始时间(0.01s) | 结束时间(0.01s) | 结构标注 | demo | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 0000 | 4241 | "Intro" | Britney
Spears - Toxic |
1 | 0000 | 2486 | "Intro" | Backstreet
Boys - Darlin' |
||||||||||
2 | 4241 | 6924 | "Verse A" | 2 | 2486 | 4054 | "Verse A" | ||||||||||||
3 | 6924 | 8606 | "Pre-chorus A" | 3 | 4054 | 5628 | "Verse B" | ||||||||||||
4 | 8606 | 11289 | "Chorus A" | 4 | 5628 | 8778 | "Chorus A" | ||||||||||||
5 | 11289 | 12631 | "Re-intro A" | 5 | 8778 | 10350 | "Verse C" | ||||||||||||
6 | 12631 | 13977 | "Verse B" | 6 | 10350 | 11920 | "Verse D" | ||||||||||||
7 | 13977 | 15655 | "Pre-chorus B" | 7 | 11920 | 15072 | "Chorus B" | ||||||||||||
8 | 15655 | 19681 | "Chorus B" | 8 | 15072 | 18607 | "Bridge" | ||||||||||||
9 | 19681 | 24043 | "Re-intro B" | 9 | 18607 | 21763 | "Chorus C" | ||||||||||||
10 | 24043 | 26730 | "Chorus C" | 10 | 21763 | 23334 | "Re-intro" | ||||||||||||
11 | 26730 | 28072 | "Bridge A" | 11 | 23334 | 26861 | "Chorus D" | ||||||||||||
12 | 28072 | 29417 | "Re-intro C" | 12 | 26861 | 30015 | "Chorus E" | ||||||||||||
13 | 29417 | 33443 | "Chorus D" | 13 | 30015 | 32758 | "Chorus F" |
本数据集包含1500个二胡音频片段(.wav格式),所有音频均由专业二胡演奏家演奏。根据二胡不同的演奏技法,将它们分为11类(分弓、垫弓、泛音、连弓&滑音&大滑音、击弓、拨弦、抛弓、顿弓、颤弓、颤音、揉弦)。每种演奏技法都有对应的若干个音频。音频来自: 中国传统乐器音响数据库(CTIS) 。
每种技法对应的部分音频列表如下:
序号 | 文件名称 | 演奏技法 | 文件大小 | 文件格式 | demo试听 |
---|---|---|---|---|---|
1 | detache_01.wav | 分弓 | 256 KB (262,372 字节) | .wav | |
2 | diangong_01.wav | 垫弓 | 114 KB (116,940 字节) | .wav | |
3 | harmonic_natural_05.wav | 泛音-自然泛音 | 215 KB (220,874 字节) | .wav | |
4 | harmonic_artificial_02.wav | 泛音-人工泛音 | 153 KB (157,008 字节) | .wav | |
5 | glissando_down_05.wav | 大滑音-下行 | 44.0 KB (45,064 字节) | .wav | |
6 | glissando_up_03.wav | 大滑音-上行 | 39.5 KB (40,464 字节) | .wav | |
7 | huihuayin_long_04.wav | 滑音-后回滑音 | 178 KB (183,248 字节) | .wav | |
8 | legato&slide_up_01.wav | 连弓-向上连弓 包含滑音 | 183 KB (188,206 字节) | .wav | |
9 | slide_dianzhi_03.wav | 滑音-垫指滑音 | 78.7 KB (80,626 字节) | .wav | |
10 | dajigong_05.wav | 击弓-大击弓 | 188 KB (192,646 字节) | .wav | |
11 | horse_03.wav | 击弓-马嘶 | 168 KB (172,920 字节) | .wav | |
12 | pizzicato_07.wav | 拨弦 | 25.1 KB (25,704 字节) | .wav | |
13 | ricochet_11.wav | 抛弓 | 64.6 KB (66,246 字节) | .wav | |
14 | staccato_07.wav | 顿弓 | 31.0 KB (31,812 字节) | .wav | |
15 | tremolo_03.wav | 颤弓 | 124 KB (127,082 字节) | .wav | |
16 | trill_long_01.wav | 颤音-长颤音 | 205 KB (210,490 字节) | .wav | |
17 | vibrato_late_01.wav | 揉弦 | 236 KB (242,574 字节) | .wav |
本数据集专门用于区分美声、民族唱法,所有音频均由专业歌唱家演唱。
部分音频列表如下:
序号 | 文件名称 | 性别 | 唱法 | 文件大小 | 文件格式 | demo试听 |
---|---|---|---|---|---|---|
1 | 干牛山 女 民族.wav | 女 | 民族唱法 | 1.23 MB (1,291,292 字节) | .wav | |
2 | 草原牧歌 男 民族.wav | 男 | 民族唱法 | 9.63 MB (10,105,288 字节) | .wav | |
3 | 美丽乡村 女 美声.wav | 女 | 美声唱法 | 10.7 MB (11,325,040 字节) | .wav | |
4 | 黄河颂 男 美声.wav | 男 | 美声唱法 | 3.27 MB (3,433,670 字节) | .wav |
本数据集包含2824个古筝单技法音频片段(.wav格式)。其中2328个片段是从虚拟音源中收集得到,496个片段是由专业古筝演奏家弹奏并录制的。这些片段几乎涵盖了古筝音域范围内的音调以及最常用的技法。根据古筝不同的演奏技法,将它们分为8类:颤音、上滑音、下滑音、回滑音、刮奏(刮奏、花指)、摇指、泛音、拨弦(勾、打、抹、托……)。每种演奏技法都有若干个对应的音频。