|
计算机应用 2018
结合多尺度时频调制与多线性主成分分析的乐器识别DOI: 10.11772/j.issn.1001-9081.2017092175 Keywords: 多尺度时频调制,多线性主成分分析,听觉谱图,支持向量机,乐器识别 Abstract: 摘要 针对目前时域频域特征、倒谱特征、稀疏特征、概率特征对同族乐器错分率高且对打击乐器识别不佳的问题,提出一种提取时频信息且低冗余度的模型用于乐器识别。首先利用耳蜗模型对乐音进行谐波分解,生成接近人耳感知且包含时频信息的听觉谱图(AS);随后利用多尺度滤波器对听觉谱图多尺度时频调制(MTFM)以观测时频的变化;最后利用多线性主成分分析(MPCA)对调制输出在保留数据内在相关的前提下降维,并使用支持向量机(SVM)分类。仿真实验表明,该方法在IOWA数据库上取得92.74%的正确率,对打击乐器与同族乐器的错分率分别为3%与9.12%,均优于上述特征。相比主成分分析(PCA)降维,MPCA提高识别准确率6.43%。因此,该模型适用于对同族乐器与打击乐器的识别
|