多音轨MIDI音乐主旋律提取方法探析

2021-11-23 01:28谢林玲
科技创新导报 2021年19期

摘  要:MIDI技术具有灵活的演奏形式与超强的编辑能力,自20世纪80年代诞生以来,计算机音乐因为有了这个统一的接入标准以及在音乐制作上的便利性而得到了极大的发展。MIDI的主要特点在于其是一种数字文件,而非音频文件,是一种描述性的数据“音乐语言”,仅仅是记录了演奏乐曲的信息,因而占用的存储空间极小且便于编辑、修改。MIDI音乐主旋的提取除了在技术上的实践应用,更重要的是有利于音乐数据库的构建,对于多音轨MIDI音乐主旋律提取方法的探析有着一定的实践意义。

关键词:多音轨  MIDI技术  主旋律提取  数字文件

中图分类号:TP391.42 文献标识码:A 文章编号:1674-098X(2021)07(a)-0072-03

On the Method of Extracting the Main Melody of

Multi Track MIDI Music

XIE Linling

(Jinggangshan University, Ji'an, Jiangxi Province, 343009  China)

Abstract: MIDI technology has flexible performance forms and super editing ability. Since its birth in the 1980s, computer music has been greatly developed because of this unified access standard and the convenience in music production. The main feature of MIDI is that it is a digital file, not an audio file. It is a descriptive data "music language", which only records the information of playing music, so it occupies very little storage space and is easy to edit and modify. In addition to the practical application in technology, the extraction of MIDI music theme is more important for the construction of music database. It has a certain practical significance for the analysis of multi track MIDI music theme extraction methods.

Key Words: Multi track; MIDI technology; Theme melody extraction; Digital file

MIDI音乐的出现,激发了电子音乐最为强大的潜能,浩瀚、丰富的音色资源与计算机的超级编辑功能结合在一起,可以任意剪辑拼贴、更换乐器、调整速度、音调,极大地提升了音乐创作、制作、剪辑的工作效率。带动了计算机音乐制作技术的进步,降低了专业音乐制作的门槛,促进了个人音乐工作室的诞生。随着科技的发展,个人计算机以及相关的MIDI设施的购买成本越来越低,因此,只要有想法,有能力,加上可以获得的相关软、硬件设施就能实现自己的音乐梦想。MIDI技术有着比其他任何传统乐器都更为丰富的演奏手段和难以想象的编辑能力。MIDI技术的发展,让音乐制作得到了普及,造福了一大批“网络音乐人”与“自由音乐人”。在MIDI研究过程中,对MIDI音乐的特点以及发展过程,让多音轨MIDI的各个轨道各自工作起来,从多音轨中提取主旋律进而构建数据库的方法等都是值得探討与分析的。

1  MIDI音乐的特点及其发展

MIDI的主要特点在于其是一种数字文件,而非音频文件,是一种描述性的数据“音乐语言”,仅仅是记录了演奏乐曲的信息,因而占用的存储空间极小且便于编辑、修改[1]。正因MIDI的这一特点,使其得到了飞速的发展与普及。对于国人而言,早期从事计算机音乐的人几乎都是从MIDI开始的,MIDI甚至是计算机音乐的代名词。MIDI到底是什么?简而言之,MIDI(Musical Instrument Digital Interface)即音乐数字设备接口,是一种数字化通信语言,一种使相关设备之间相互兼容并实现技术交流的技术标准。通过MIDI技术,音乐家可以像指挥家一样对自己作品的声音进行全面的控制和实时操控,无论是在制作室还是演出现场,MIDI技术都可以改变电子乐器、录音设备以及信号处理器等设备的参数,可以根据需求进行实时的操控,以呈现出最好的声音效果。

20世纪80年代,电子科技的发展与计算机数字化技术的采用,推动了电子乐器的大发展,但是不同生产厂家之间的设备要进行同步是一件非常困难的事,因为每个厂家所生产设备的标准不一。为了解决设备之间的相互兼容性,MIDI标准被提上日程。1982年,国际乐器制造商协会通过了大卫·史密斯提出的“通用合成器接口”的方案,命名为“音乐设备数字接口”,即“MIDI”接口,1983年,MIDI协议1.0正式确定。从此,所有电子乐器背后都有了一个五孔MIDI插座,为乐器之间的相互兼容架起了一座桥梁,不同的乐器之间有了统一的连接规范,可以使用统一的“音乐语言”。自20世纪80年代MIDI诞生以来,计算机音乐因其有了统一的接入标准以及在音乐制作上的便利性而得到了巨大的发展,同时也为音乐界带来了一场重大的革命[2]。近年来,MIDI技术的重大变化在于采样音源的介入,采样音源是对传统乐器以及现实音效进行采录后而制作编辑的,其最大的特点在于其具有更加真实的效果和越来越大的容量。比如当下使用最为广泛的Kontakt采样器及所支持的音源,就Kontakt自带的原厂音源就有23GB,支持其格式的爱丽丝钢琴就占用了6GB(只是一种单独的纯钢琴音色)。另外,大众所熟知的好莱坞管弦乐,仅弦乐部分就有326GB,还有BFD鼓音源已经超过了100GB,足见当下采样音色所占用的存储容量,这也表明了在音乐制作领域无论是软件还是硬件都在飞速的发展。早期的MIDI音乐制作都是建立在GM音色表基础上的,虽然音色相对当下的采样音色差一点,但是其优势在于在任何音序软件中打开同一个MIDI文件都可以正常播放而基本不会出现乱码的情况。而随着音序软件及音源的不断发展,音序软件开始支持VST、DX、AU等多种格式,同时众多的音序软件生成的文件已然不是单纯的MIDI文件,而是有着自己的“工程文件”扩展名。如Cubase就以“cpr”作为扩展名,SONAR则是“cwp”为扩展名等。这些发展变迁都表明着当下的音序软件、MIDI音乐技术都朝着个性化和丰富性的方向延展,体现了MIDI音乐制作技术的实质性变化,使其逐步走向音源容量更大,效果更加精致,可调控性更强以及更加智能化。当下,几乎所有的音乐类型都脱离不了计算机音乐的相关技术,随着科技的不断发展,计算机音乐也在飞速的普及[3]。在今天,电子音乐已成为一种广为人知的艺术形式,并在高校中建立起了相对完整的学科体系[4]。音乐行业已然与MIDI技术不可分离,MIDI音乐主旋律的提取不仅在于技术上的应用,同时对于音乐数据库的构建有着极为重要的意义。

2  多音轨MIDI音乐主旋律的提取方法

随着AI技术的不断变化更新,音乐创作的形式化技术也在其中得到了进一步的发展[5]。MIDI是音乐设备的数字接口,其电缆本身不带有音频数据信息,通过计算机向其他合成器等电子设备发出的MIDI信息是一些表演数据,以这种手段方式向其他乐器发出指令,进而控制其他操作系统。MIDI信息有许多不同的类型,大的方面来说,其包括了通道信息和系统信息。通道信息一般应用在MIDI的具体通道之中,而系统信息指的是整个系统的信息。当MIDI轨被编码为一个单独的统一体,这个统一体包括音乐音符和其他与演奏相关的事件信息。轨道内所包含的信息是可以通过创造性的方式分离出来,成为一个独立的音轨,用于诸如转调、重新分配乐器、数据库构建等。在当下的研究与实践应用中,MIDI主旋律的提取主要采用分层聚类算法、音轨特征量的方法。

2.1 分层聚类算法的多音轨MIDI音乐主旋律提取方法

随着计算机科学和音乐科技的发展,算法在计算机作曲领域已有广泛的研究和应用[6]。选择所有包含旋律音轨的方法來提取主旋律,被称为分层聚类算法。分层聚类算法是基于音轨之间的距离而建立起来的一个音轨的聚集。此方法可以从保存基本信息(音高信息和距离特征)的MIDI轨道中获得一个可选择的最佳音轨,进而从这个最佳音轨中提取主旋律。为了在提取主旋律时这一算法得以实现,需要经过以下6个步骤。第一,是对所要提取音乐中的所有音轨进行轮廓算法,而所谓的轮廓算法主要是应用在复调音乐中提取主旋律的一种方法,复调音乐是一种多旋律的音乐类型,一般来说,多条旋律都是主旋律,同等重要。因而,所谓的提取主旋律只是将所有音符聚集到一个音轨上,最好选择最高音的音符,得出具有一定特征的音高柱状图的音符集合。第二,是计算出每一音轨的平均信息,在这些平均信息中,得出最为突出的音符集,将其视为主旋律。第三,是将每一个音符分成十二平均律,以十二平均律的形式来描述每一个音符,进而计算出音高的柱状图。第四,是以音程的构建形成音符的聚集,实现音符的集合。音程是旋律运动的基本动力,通过音与音之间形成不同的距离(即音程度数),最终实现变幻莫测,丰富多彩的旋律组合。因而要提取旋律就需要对音程进行计算与分析,最终获得主旋律。第五,在以上四步完成后,基本得出旋律音轨,此时选择所获得的旋律音轨,然后再去除其余的聚集音轨。第六,再次运用轮廓算法对旋律音轨进行计算,获得最高的音高线条,得出音乐的主旋律。

分层聚类算法是应用数学模型来计算聚集的旋律音轨之间的距离,在提取MIDI主旋律时关照到了不同乐器轨以及弱音高的音轨,极大地减少了主旋律提取时的误差,所提取的主旋律更为精细与准确。

2.2 音轨特征量的多音轨MIDI音乐主旋律提取方法

音乐制作者在运用MIDI创作音乐时,一般都会给每一个MIDI轨道命名,虽然并没有说一定要给MIDI轨道命名,但是通常为了便于修改与操作,基本都会给予MIDI轨道名称。名称明确就为主旋律的抽取提供了巨大的参考信息,同时也可以作为旋律音轨的特征向量来予以使用。一般的主旋律的音轨名称可能是Melodies(旋律)、Vocal(人声)、Solo(独奏)等。而其他的伴奏声部则有可能是吉他(Guitar)、贝斯(Bass)、Piano(钢琴)等。当然,也有名称模糊的时候,当音轨名称模糊时,也可以通过MIDI的通道号、左右声道的平衡度、MIDI音符的平均力度、音轨主音量的大小以及MIDI音符的发音时间、发音面积来推算主旋律音轨。

无论是MIDI设备还是设备中的某个音源或者程序,只要被设定为响应某一乐器音色或者人声的通道号,即会响应这一通道上所传输的信息,比如人声、钢琴或者小提琴等。但是在16通道的MIDI音轨中,一般情况第10通道都是留给打击乐器的,所以根据这一固有特征,在进行主旋律轨选择时就可以排除第10通道。

一般来说,所有的MIDI轨道都会作一个声像的平衡调节,以达到人耳在聆听音乐时的舒适度。对于主旋律音轨来说,通常情况下都会处于左右平衡的状态,即处于中间的位置。而其他乐器轨道在左右声像上多少都会有所偏差。这也可以作为一个特征向量来参考。除此之外,作为主旋律的MIDI轨中的音符的平均力度一般来说都会高于其他声部。为了突出主旋律的明确性,其主音量也会大于其他音轨的音量值。另外,主旋律的发音时间及发音面积(音长和音高)相比其他声部都会更容易被人们感知。

在抓取与确定主旋律音轨的过程中,通过合理分析与选取各音轨的向量特征,建立分析模型,结合特征向量确定主旋律音轨。

3  结语

纵观电子音乐的发展历程,无论是合成技术还是后来的采样技术,其最终的目的无非是朝着两个方向发展,一方面是更为准确地再现自然声学的音响效果,即与MIDI技术紧密相连的部分,借助数字编辑的灵活度与强大功能,不断拓展音色范畴与真实性,可以模仿任何一件传统乐器的声音,如小提琴等。另一方面则是开拓新的“声音”,更为强调声音的新颖性与实验性。MIDI已经在音乐制作的各个领域内进行应用,MIDI技术在其灵活度与自由的编辑能力上高于任何传统乐器。在不断的发展中,MIDI技术越来越丰富,越来越体现出了自己的东西,逐渐走上了一条渐进式的创作之路。多音轨MIDI音乐主旋律的提取,对于在音乐数据库的构建上具有极大的意义,因此,对于其提取方法的探讨也有着一定的实践价值。

参考文献

[1] 黄枕宇.西方电子与计算机音乐史——电子、数据科技影响下的西方音乐[M].北京:中央音乐学院出版社,2020.

[2] 谢林玲,李文韫.虚拟乐器人性化演奏效果的可实现性[J].科技资讯,2021(1):29-31.

[3] 梁威.基于Kontakt采样器中虚拟乐器人性化效果的实现[J].科技创新导报,2020(29):87-90.

[4] 赵晓雨.艺术理念与技术创新驱动下的中国电子音乐发展[J].中央音乐学院学报,2019(4):83-90,114.

[5] 马丹,吴跃.基于生成对抗网络的智能音乐综述[J].计算机应用研究,2021,38(3):641-646.

[6] 景宇阳.基于乐谱识别的深度学习算法作曲系统[D].南京:南京艺术学院,2020.