基于神经网络的声乐演奏评价系统研究及其在钢
0 引言
随着我国经济的发展,居民生活水平日益提高,在物质生活得到大幅度改善的同时,人们的精神生活也在不断充实[1]。钢琴演奏作为陶冶情操的一种重要手段受到众多人追捧,学员人数众多,而现阶段,我国钢琴演奏的教学者人数却极为稀少,加之钢琴教学需采用一对一的教学方式,加之钢琴教学对环境、时间要求等因素,使得钢琴普及率并不高[2-5]。因此针对钢琴学习开发一款声乐演奏评价系统并利用计算机的自动识别技术,自动记录学员的演奏信息,并利用系统内已存乐曲信息对比,对学员的钢琴演奏效果进行点评,找到演奏中的不足显得尤为重要。该系统不仅在一定程度代替老师的教学工作,同时该系统还可对相关专业人员进行音乐创作有一定的辅助作用。
1 神经网络技术研究
计算机神经网络技术是根据人体的神经网络原理产生的信息处理系统。BP(Back Propagation)网络是目前最流行的神经网络技术,它能够学习并存储输入—输出关系型映射[6-8]。按照功能和作用机理的不同,该网络技术的学习模型包括输入层、隐层和输出层三个层级[9],其结构示意如图1所示。
图1 BP神经网络结构
假设输入层节点个数为n,隐层节点个数为q,输出层节点个数为m,输入层至隐层间权值为vki,转换关系用f1表示,隐层至输出层间权值为wjk,转换关系用f2表示,则由输入层至隐层的转换可用式(1)表示,由隐层至输出层的转换如式(1)。
式中:zk为输入层转换至隐层后的值,xi为输入层值,i为1到n的整数如式(2)。
式中:yj为隐层转换至输出层后的值,k为1到m的整数。
网络结构中的误差可用式(3)计算,如式(3)。
式中:e为计算误差,为隐含层平均值。
根据以上转换规则,得到了计算机中BP神经网络算法流程,如图2所示。
图2 BP神经网络算法流程
2 声乐特征提取技术
2.1 音乐特征提取
音乐特征提取是评价系统中最为重要的内容。音乐特征提取的准确性和科学性决定了系统信号识别的准确性和评价结果客观与否,因此必须对声乐特征提取进行系统分析。
音乐特征识别是一个将音乐素材转变成电子信号的过程[10]。识别的基础是音乐特征的采集,本文选取了4架钢琴并分为不同制式,采用不同的演奏方法和弹奏力度,并包含了各个音区,将采集到的音乐信息通过傅里叶变化得到不用音的时域波形和频域波形,傅里叶变换公式如式(4),图3为提取后的波形图。
a 时域波形
b 频域波形图3 提取后波形
式中:v0为弦的初始运动速度,a为振动加速度,t为振动时间,l为弦长,δ为击打的半宽度。
2.2 提取后处理
分析图3的波形图可以发现,提取后的音乐特征与实际值之间存在一定差距,电子音乐与实际音频之间关系不能完全对应,因此有必要对提取后的波形处理使其与真实值更为接近。根据相关研究[10-14],钢琴的音高取决于基频的大小,钢琴的音色取决于倍频的大小,钢琴的音色受提取的频谱中前五个峰值范围内的波形及五个峰值间的相互相对大小影响。因此必须对提取公式重新修正,从波形影响因素出发,构建了式(5)所示的修正公式,根据修正公式对提取波形进行修改,并依据公式(5)对图3做出修改,修改后图像如图4所示。
a 频域波形
b 局部波形图4 处理后波形
式中:S(ω)为修改后的振动纵坐标值,α1为调节波形峰值附近波形曲线的参数值,A为振幅,ωt为指定音频或倍频。
3 系统设计与应用
3.1 评价系统构件
声乐演奏评价系统是利用计算机的识别技术判断演奏者的演奏效果,并按照严谨的计算机逻辑和预先制定的演奏标准对于演奏表演打分。系统会根据不同乐曲,事先将乐曲转化成电子信息,演奏者在系统内演奏的乐谱经滤波处理后被提取音乐特征,经过电子乐谱与演奏者乐谱信息比较,最后输出比较结果并打分,其结构框架如图5所示。
图5 系统框架
根据系统框架结构,从系统内部数据的处理顺序出发,按照系统的工作原理和工作顺序,绘制了系统流程如图6所示。
图6 系统流程
系统会将乐谱预处理并以电子信息形式存储,演奏者乐谱信息经过音乐特征提取并整理后与存储的乐谱信息比较,最后依据比较结果评分并输出评分结果。
文章来源:《电站系统工程》 网址: http://www.dzxtgczz.cn/qikandaodu/2021/0728/564.html