%0 Journal Article %T 基于张量神经网络的音频多语义分类方法 %A 邢玲 %A 贺梅 %A 马强 %A 朱敏 %J 计算机应用 %D 2012 %X ?音频特征向量已广泛应用于音频分类的研究,该表示形式虽能有效体现音频的固有特性,但无法表示音频信息多语义特性及各语义间的相关性。提出了基于张量统一内容定位(tucl)的音频语义表征方式,将音频语义描述表示为三阶张量,并构建多语义张量空间。在此空间中,张量语义离散度(tsd)能有效聚集具有相同语义的音频资源,通过计算各音频资源的tsd来完成对音频资源的分类,并构建了rbf张量神经网络(rbftnn)来自适应学习分类模型。实验结果表明,在多语义分类的情况下,tsd算法的分类性能明显优于当前典型的高斯混合模型(gmm)算法;通过与支持向量机(svm)学习模型相比可知,基于tsd的rbftnn模型分类学习的准确率明显优于基于tsd的svm模型。 %K 语义离散度 %K 多语义分类 %K 语义表征 %K 张量语义空间 %K 神经网络 %U http://www.joca.cn/CN/abstract/abstract15875.shtml