MIDI 文件格式解析举例_c# mid文件解析-程序员宅基地

技术标签: CS61B  摘要性笔记  

变长动态字节

    首先学习 MIDI 一个编码约定,MIDI 使用字节流(1bytes)来传输数据,对于小于 127 的数据就用一个字节存储。大于127的数据把字节的高位用来标识长数据,这样方便程序解析(一般情况高位为0认为一个byte是一个数据,如果出现高位为1(most significant bit)就读取多个字节再解析 int或者long),具体解析过程是最后一个字节前都用高位置1声明这是一个长整数的一部分。

    示例图:


文件组成块

    MIDI 是这样组织的:

MThd <length of header data>

<header data>

MTrk <length of track data>

<track data>

MTrk <length of track data>

<track data>

. . .


文件头解析

    先看文件头

<Header Chunk> = <chunk type><length><format><ntrks><division>

<chunk type, 32bits>

 is the four ASCII characters 'MThd';

<length, 32bits>

is a 32-bit representation of the number 6 (后面的6bytes)(high byte first).

 <format, 16bits>

 specifies the overall organisation of the file (16bit word).

0

single multi-channel track

1

one or more simultaneous tracks (or MIDI outputs) of a sequence

2

one or more sequentially independent single-track patterns

<ntrks, 16bits>

the number (16bits) of track chunks in the file. It will always be 1 for a format 0 file. 

 <division, 16bits>

bit15 = 0

每个四分音符的 ticks

bit15 = 1

这个涉及一些复杂的指定,今天时间关系就暂时不分析这个

    当然这里 16bit word 是前面说的 most significant bit first 的,如果扩展也是可以的(这样的话 length 就要更新了)。

    然后趁热打铁看一个实例 midi 文件吧。

    可以看到,文件开始是 4bytes 的 MThd,然后接着是一个 4bytes 的 6 指明了头部这里是 6 bytes 长度,接下来就是 3 个 2bytes 的分别是 format 多轨同步格式,8个轨(经过搜索 MTrk 的确只有 8个),以及指定一个 4分音符 是 480 个 ticks. 我们之后解析文件的时候要用到这些数据。

    接下来看每个轨是怎么搞同步轨的,怎么记录音频的信息的。


轨道块解析

<Track Chunk>  直接看下面横向表格

<chunk type>

32bits

<length>

32bits

<MTrk event> 变长

<delta-time>

<event>

<MIDI event>

<sysex event>

<meta-event>

MTrk event ++ …

    这里 delta-time 主要是记录这个事件发生的时间点(用到上述变长字节数据),要实现同步播放同一个音符,我们只需要让两个音符的 delta time 是同一个tick计数就行了。

    然后我们来看怎么做这些 event 的数据格式(主要看会用到的)

    首先看 meta-event 的格式,解析 MIDI 的时候根据程序需求,不需要实现全部的 meta 支持,我们看主要的几个,首先 meta 要用 FF 来标识这是一个 meta event,我们看一些常见的 meta event

FF 05 len text  

A lyric to be sung. Generally, each syllable will be a separate lyric event which begins at the event's time.

FF 2F 00

End of Track. This event is not optional. It is included so that an exact ending point may be specified for the track, so that

an exact length is defined, which is necessary for tracks which are looped or concatenated。

FF 51 03 tttttt

Set Tempo (in microseconds per MIDI quarter-note)

FF 58 04 nn dd cc bb

Time Signature nn 是分子,dd是2的幂分母,cc 是一拍 tick 长,bb 是 一个midi 4分音符有多少个32分音符记谱

FF 03 len text

Sequence/Track Name,实际我分析的 midi 文件第二个 Track 第一条就是 Guitar 的字符串

    所以每个 MTrk event 都是以一个 变长字节数据 + 一个带 flag 的特别命令组成的。我们可以编写函数一次读取一个 MTrk event 把 delta-time 和 even 都解析出来。而且由于 FF 的存在以及 most significant bit 存在,我们不需要编写判断各种指令的变长命令读入,而是通过 FF 来辨析各个 event 段。FF 倒回来一个变长字节数据(delta-time)就是一个 MTrk event 的开始。

    趁热打铁2,我们再来看实际的文件

 4D 54 72 6B  

 00 00 00 17

 00 FF 51 03

 07 0A E2 00

 FF 03 00 00

 FF 58 04 04

 02 07 0A 00

 FF 2F 00

 M T  r k

 ◦ ◦ ◦ ◦

 ◦ ◦ Q ◦

 ◦ ◦ ◦ ◦

 ◦ ◦ ◦ ◦

 ◦ X ◦ ◦

 ◦ ◦ ◦ ◦

 ◦ / ◦

    一个 MTrk 块,lengh 是 23 个 bytes,数一下的确是  23.

    然后依次读取每个 MTrk event

    第一个是 00 FF 51 03 07 0A E2 ,设置 tempo 为一个四分音符为 07 0A E2 毫秒。

    第二个是 00 FF 58 04 04 02 07 0A, 设置 4/4 时值,7 tick 一拍,一个midi 4分音符记谱为一个10个32分音符。

    第三个是 00 FF 2F 00 声明这一个 track 结束。 可以发现这里的全是 meta-event 就单独用一个全部 delta-time 都是 0 的 Track Chunk 来存放了。

    下面就是说明音乐数据的 MIDI event 的格式了:

    前面讲到的都是 Track 下的,我们实际弹奏是需要一个乐器同时弹奏多个音的,把这个叫 Channel 好了。以下X就代表对特定的  Channel 进行设置。

状态字节

功能描述

数据字节描述

8X

松开音符

1字节:音符号(00~7F) / 2字节:力度(00~7F)

9X

按下音符

1字节:音符号(00~7F) / 2字节:力度(00~7F)

AX

触后音符

1字节:音符号(00~7F) / 2字节:力度(00~7F)

BX

控制器变化

1字节:控制器号码(00~79) / 2字节:控制器参数(00~7F),如钢琴踏板

CX

改变乐器

1字节:乐器号码(00~7F)

DX

通道触动压力

1字节:压力(00~7F)

EX

弯音轮变换

1字节:弯音轮变换值的低字节 / 2字节:弯音轮变换值的高字节

   阅读 midi 可以发现 guitar1 音轨下有一堆 00 BX 系列的控制器设置字段,以及一些弯音轮变换。然后转入这个乐器 event,

    00 C1 1D 00 C0 1D

    这一句就是 设置 Channel 1 和 Channel  0 为乐器 1D,乐器 1D 就是 29 失真吉他。好了为了读懂这里的 HW 的需要掌握的MIDI spec 都马克完了,接下来我们就可以读取MIDI实现鼓和不同的特效吉他的效果播放了。我们现在掌握的音频合成有鼓和不太像钢弦吉他的两种合成声,论文还提到竖琴的不过一般midi谱没有用竖琴的吧。为了播放我手头这个midi,可能需要探究一下贝斯的声音合成就够了。

补充打鼓是算在默认 channel 下的:

In GM standard MIDI files, channel 10 is reserved for percussion instruments only.

 所以打鼓另外还有一套音色控制编码,由于他没有音高。

  使用 Java 自带的midi库可以去下载 Oracle 提供的 Audio Demo。

   

附录

先是音高编号,即上面 8X 9X 后面跟着的音符号 00 ~ 7F

下面附上常见的乐器编号:

 钢琴

1 Acoustic Grand Piano大钢琴

2 Bright Acoustic Piano 亮音大钢琴

3 Electric Grand Piano 电钢琴

打击乐器

13 Marimba 马林巴

14 Xylophone 木琴

吉他

25 Acoustic Guitar (nylon)尼龙弦吉他

26 Acoustic Guitar(steel) 钢弦吉他

27 Electric Guitar (jazz) 爵士乐 电吉他

28 Electric Guitar (clean) 清音电吉他

29 Electric Guitar (muted) 弱音电吉他

30 Overdriven Guitar 驱动 音效吉他

31 Distortion Guitar 失真音效吉他

32 Guitar Harmonics 吉他泛音

贝司

33 Acoustic Bass 原声贝司

34 Electric Bass(finger) 指拨电贝司

35 Electric Bass(pick) 拨片拨电贝司

36 Fretless Bass 无品贝司

37 Slap Bass 1 击弦贝司1

38 Slap Bass 2 击弦贝司2

39 Synth Bass 1 合成贝司1

40 Synth Bass 2 合成贝司2

各种鼓

112-120

弦乐独奏

41 Violin 小提琴

42 Viola中提琴

43 Cello 大提琴

44 Contrabass 低音提琴

47 Orchestral Harp 竖琴

铜管乐器组

57 Trumpet 小号

58 Trombone 长号

59 Tuba 大号

61 French Horn 圆号

62 Brass Section 铜管  

鼓的音色(代替音高)

18 voice two 人声“two
19 voice three 人声“three”

27 high q 激光枪声
28 slap 拍击声
29 scratch push 特效处理推音
30 scratch pull 特效处理拉音
31 sticks 鼓槌对敲
32 square click 敲方板
33 metronome click 节拍器
34 metronome bell 节拍器重音
35 acoustic bass drum 低音大鼓
36 bass drum 1 高音大鼓
37 side stick 鼓边
38 acoustic snare 小鼓
39 hand clap 拍手声
40 electric snare 电子小鼓
41 low floor tom 低音落地嗵鼓
42 closed hi-hat 合音踩镲
43 high floor tom 高音落地嗵鼓
44 pedal hi-hat 踏音踩镲
45 low tom 低音嗵鼓
46 open hi-hat 开音踩镲
47 low-mid tom 中低音嗵鼓
48 hi-mid tom 中高音嗵鼓
49 crash cymbal 1 低砸音镲
50 high tom 高音嗵鼓
51 ride cymbal 1 低浮音镲
52 chinese cymbal 中国镲
53 ride bell 浮音镲碗
54 tambourine 铃鼓
55 splash cymbal 溅音镲
56 cowbell 牛铃
57 crash cymbal 2 高砸音镲
58 vibraslap 颤音叉
59 ride cymbal 2 高浮音镲
60 hi bongo 高音邦戈
61 low bongo 低音邦戈
62 mute hi conga 弱音康加
63 open hi conga 高音康加
64 low conga 低音康加
65 high timbale 高音铜鼓
66 low timbale 低音铜鼓
67 high agogo 高音拉丁打铃
68 low agogo 低音拉丁打铃
69 cabasa 沙锤
70 maracas 响葫芦
71 short whistle 短哨
72 long whistle 长哨
73 short guiro 短锯琴
74 long guiro 长锯琴
75 claves 击杆
76 hi wood block 高音木块
77 low wood block 低音木块
78 mute cuica 弱音吉加
79 open cuica 开音吉加
80 mute triangle 弱音三角铁
81 open triangle 开音三角铁
82 shaker 沙锤(比69沙锤高)
83 jingle bell 铃铛
84 bell tree 铃树
85 castanets 响板
86 mute surdo 弱音瑟多
87 open surdo 开音瑟多
88 applause2 欢呼2(roland sc-88pro)
当选用48号orchestra音色的时候,变体音色为:
27 closed hi-hat 敲击闭合踩镲
28 pedal hi-hat 脚踏踩镲
29 open hi-hat 敲击张开踩镲
30 ride cymbal 点镲
35 concert bd 2 管弦乐队大鼓2(声音清晰)
36 concert bd 1 管弦乐队大鼓1(此有巨大响声)
38 concert sd 管弦乐队小军鼓
39 castanets 响板
40 concert sd 管弦乐队小军鼓
41 timpani f f3阶定音鼓
42 timpani f# f#3阶定音鼓
43 timpani g g3阶定音鼓
44 timpani g# g#3阶定音鼓
45 timpani a a3阶定音鼓
46 timpani a# a#3阶定音鼓
47 timpani b b3阶定音鼓
48 timpani c c4阶定音鼓
49 timpani c# c#4阶定音鼓
50 timpani d d4阶定音鼓
51 timpani d# d#4阶定音鼓
52 timpani e e4阶定音鼓
53 timpani f f4阶定音鼓
57 concert cymbal 2 管弦乐队镲2(浊音)
59 concert cymbal 1 管弦乐队镲1(清音)
88 applause 欢呼声(根据时值决定长度)  22 mc-505 beep 1 mc-505信号音1
23 mc-505 beep 2 mc-505信号音2
24 concert sd 大乐队小军鼓
25 snare roll 小军鼓滚奏
26 finger snap 2 响指2
(以上roland sc-88 pro)
27 high q 激光枪声
28 slap 拍击声
29 scratch push 特效处理推音
30 scratch pull 特效处理拉音
31 sticks 鼓槌对敲
32 square click 敲方板
33 metronome click 节拍器
34 metronome bell 节拍器重音
35 acoustic bass drum 低音大鼓
36 bass drum 1 高音大鼓
37 side stick 鼓边
38 acoustic snare 小鼓
39 hand clap 拍手声
40 electric snare 电子小鼓
41 low floor tom 低音落地嗵鼓
42 closed hi-hat 合音踩镲
43 high floor tom 高音落地嗵鼓
44 pedal hi-hat 踏音踩镲
45 low tom 低音嗵鼓
46 open hi-hat 开音踩镲
47 low-mid tom 中低音嗵鼓
48 hi-mid tom 中高音嗵鼓
49 crash cymbal 1 低砸音镲
50 high tom 高音嗵鼓
51 ride cymbal 1 低浮音镲
52 chinese cymbal 中国镲
53 ride bell 浮音镲碗
54 tambourine 铃鼓
55 splash cymbal 溅音镲
56 cowbell 牛铃
57 crash cymbal 2 高砸音镲
58 vibraslap 颤音叉
59 ride cymbal 2 高浮音镲
60 hi bongo 高音邦戈
61 low bongo 低音邦戈
62 mute hi conga 弱音康加
63 open hi conga 高音康加
64 low conga 低音康加
65 high timbale 高音铜鼓
66 low timbale 低音铜鼓
67 high agogo 高音拉丁打铃
68 low agogo 低音拉丁打铃
69 cabasa 沙锤
70 maracas 响葫芦
71 short whistle 短哨
72 long whistle 长哨
73 short guiro 短锯琴
74 long guiro 长锯琴
75 claves 击杆
76 hi wood block 高音木块
77 low wood block 低音木块
78 mute cuica 弱音吉加
79 open cuica 开音吉加
80 mute triangle 弱音三角铁
81 open triangle 开音三角铁
82 shaker 沙锤(比69沙锤高)
83 jingle bell 铃铛
84 bell tree 铃树
85 castanets 响板
86 mute surdo 弱音瑟多
87 open surdo 开音瑟多
88 applause2 欢呼2(roland sc-88pro)
当选用48号orchestra音色的时候,变体音色为:
27 closed hi-hat 敲击闭合踩镲
28 pedal hi-hat 脚踏踩镲
29 open hi-hat 敲击张开踩镲
30 ride cymbal 点镲
35 concert bd 2 管弦乐队大鼓2(声音清晰)
36 concert bd 1 管弦乐队大鼓1(此有巨大响声)
38 concert sd 管弦乐队小军鼓
39 castanets 响板
40 concert sd 管弦乐队小军鼓
41 timpani f f3阶定音鼓
42 timpani f# f#3阶定音鼓
43 timpani g g3阶定音鼓
44 timpani g# g#3阶定音鼓
45 timpani a a3阶定音鼓
46 timpani a# a#3阶定音鼓
47 timpani b b3阶定音鼓
48 timpani c c4阶定音鼓
49 timpani c# c#4阶定音鼓
50 timpani d d4阶定音鼓
51 timpani d# d#4阶定音鼓
52 timpani e e4阶定音鼓
53 timpani f f4阶定音鼓
57 concert cymbal 2 管弦乐队镲2(浊音)
59 concert cymbal 1 管弦乐队镲1(清音)
88 applause 欢呼声(根据时值决定长度)

主要的参考资料是 MIDI 的 Spec  和网络搜索的一些表格

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/u010180372/article/details/118697564

智能推荐

攻防世界_难度8_happy_puzzle_攻防世界困难模式攻略图文-程序员宅基地

文章浏览阅读645次。这个肯定是末尾的IDAT了,因为IDAT必须要满了才会开始一下个IDAT,这个明显就是末尾的IDAT了。,对应下面的create_head()代码。,对应下面的create_tail()代码。不要考虑爆破,我已经试了一下,太多情况了。题目来源:UNCTF。_攻防世界困难模式攻略图文

达梦数据库的导出(备份)、导入_达梦数据库导入导出-程序员宅基地

文章浏览阅读2.9k次,点赞3次,收藏10次。偶尔会用到,记录、分享。1. 数据库导出1.1 切换到dmdba用户su - dmdba1.2 进入达梦数据库安装路径的bin目录,执行导库操作  导出语句:./dexp cwy_init/[email protected]:5236 file=cwy_init.dmp log=cwy_init_exp.log 注释:   cwy_init/init_123..._达梦数据库导入导出

js引入kindeditor富文本编辑器的使用_kindeditor.js-程序员宅基地

文章浏览阅读1.9k次。1. 在官网上下载KindEditor文件,可以删掉不需要要到的jsp,asp,asp.net和php文件夹。接着把文件夹放到项目文件目录下。2. 修改html文件,在页面引入js文件:<script type="text/javascript" src="./kindeditor/kindeditor-all.js"></script><script type="text/javascript" src="./kindeditor/lang/zh-CN.js"_kindeditor.js

STM32学习过程记录11——基于STM32G431CBU6硬件SPI+DMA的高效WS2812B控制方法-程序员宅基地

文章浏览阅读2.3k次,点赞6次,收藏14次。SPI的详情简介不必赘述。假设我们通过SPI发送0xAA,我们的数据线就会变为10101010,通过修改不同的内容,即可修改SPI中0和1的持续时间。比如0xF0即为前半周期为高电平,后半周期为低电平的状态。在SPI的通信模式中,CPHA配置会影响该实验,下图展示了不同采样位置的SPI时序图[1]。CPOL = 0,CPHA = 1:CLK空闲状态 = 低电平,数据在下降沿采样,并在上升沿移出CPOL = 0,CPHA = 0:CLK空闲状态 = 低电平,数据在上升沿采样,并在下降沿移出。_stm32g431cbu6

计算机网络-数据链路层_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输-程序员宅基地

文章浏览阅读1.2k次,点赞2次,收藏8次。数据链路层习题自测问题1.数据链路(即逻辑链路)与链路(即物理链路)有何区别?“电路接通了”与”数据链路接通了”的区别何在?2.数据链路层中的链路控制包括哪些功能?试讨论数据链路层做成可靠的链路层有哪些优点和缺点。3.网络适配器的作用是什么?网络适配器工作在哪一层?4.数据链路层的三个基本问题(帧定界、透明传输和差错检测)为什么都必须加以解决?5.如果在数据链路层不进行帧定界,会发生什么问题?6.PPP协议的主要特点是什么?为什么PPP不使用帧的编号?PPP适用于什么情况?为什么PPP协议不_接收方收到链路层数据后,使用crc检验后,余数为0,说明链路层的传输时可靠传输

软件测试工程师移民加拿大_无证移民,未受过软件工程师的教育(第1部分)-程序员宅基地

文章浏览阅读587次。软件测试工程师移民加拿大 无证移民,未受过软件工程师的教育(第1部分) (Undocumented Immigrant With No Education to Software Engineer(Part 1))Before I start, I want you to please bear with me on the way I write, I have very little gen...

随便推点

Thinkpad X250 secure boot failed 启动失败问题解决_安装完系统提示secureboot failure-程序员宅基地

文章浏览阅读304次。Thinkpad X250笔记本电脑,装的是FreeBSD,进入BIOS修改虚拟化配置(其后可能是误设置了安全开机),保存退出后系统无法启动,显示:secure boot failed ,把自己惊出一身冷汗,因为这台笔记本刚好还没开始做备份.....根据错误提示,到bios里面去找相关配置,在Security里面找到了Secure Boot选项,发现果然被设置为Enabled,将其修改为Disabled ,再开机,终于正常启动了。_安装完系统提示secureboot failure

C++如何做字符串分割(5种方法)_c++ 字符串分割-程序员宅基地

文章浏览阅读10w+次,点赞93次,收藏352次。1、用strtok函数进行字符串分割原型: char *strtok(char *str, const char *delim);功能:分解字符串为一组字符串。参数说明:str为要分解的字符串,delim为分隔符字符串。返回值:从str开头开始的一个个被分割的串。当没有被分割的串时则返回NULL。其它:strtok函数线程不安全,可以使用strtok_r替代。示例://借助strtok实现split#include <string.h>#include <stdio.h&_c++ 字符串分割

2013第四届蓝桥杯 C/C++本科A组 真题答案解析_2013年第四届c a组蓝桥杯省赛真题解答-程序员宅基地

文章浏览阅读2.3k次。1 .高斯日记 大数学家高斯有个好习惯:无论如何都要记日记。他的日记有个与众不同的地方,他从不注明年月日,而是用一个整数代替,比如:4210后来人们知道,那个整数就是日期,它表示那一天是高斯出生后的第几天。这或许也是个好习惯,它时时刻刻提醒着主人:日子又过去一天,还有多少时光可以用于浪费呢?高斯出生于:1777年4月30日。在高斯发现的一个重要定理的日记_2013年第四届c a组蓝桥杯省赛真题解答

基于供需算法优化的核极限学习机(KELM)分类算法-程序员宅基地

文章浏览阅读851次,点赞17次,收藏22次。摘要:本文利用供需算法对核极限学习机(KELM)进行优化,并用于分类。

metasploitable2渗透测试_metasploitable2怎么进入-程序员宅基地

文章浏览阅读1.1k次。一、系统弱密码登录1、在kali上执行命令行telnet 192.168.26.1292、Login和password都输入msfadmin3、登录成功,进入系统4、测试如下:二、MySQL弱密码登录:1、在kali上执行mysql –h 192.168.26.129 –u root2、登录成功,进入MySQL系统3、测试效果:三、PostgreSQL弱密码登录1、在Kali上执行psql -h 192.168.26.129 –U post..._metasploitable2怎么进入

Python学习之路:从入门到精通的指南_python人工智能开发从入门到精通pdf-程序员宅基地

文章浏览阅读257次。本文将为初学者提供Python学习的详细指南,从Python的历史、基础语法和数据类型到面向对象编程、模块和库的使用。通过本文,您将能够掌握Python编程的核心概念,为今后的编程学习和实践打下坚实基础。_python人工智能开发从入门到精通pdf

推荐文章

热门文章

相关标签