%0 Journal Article %T News video semantic extraction framework based on multimodal information
一种基于多模态特征的新闻视频语义提取框架 %A YAN Jian-peng %A FENG Hua-min %A LIU Jia-qi %A
闫建鹏 %A 封化民 %A 刘嘉琦 %J 计算机应用研究 %D 2012 %I %X 为提高视频语义信息提取准确率, 提出了一种基于多模态特征的新闻视频语义提取框架。在视频中提取主题字幕信息, 对音频进行分类和语音识别, 根据主题字幕信息借助搜索引擎得到与新闻视频相关的网页; 最后利用网页文本对语音识别的结果进行纠错, 从而通过视频字幕信息和语音脚本的跨模态融合提高视频语义提取的准确率。在中等规模的新闻视频含新闻网页库测试表明了该方法的有效性, 经纠错后的语音识别准确率达到了65%左右。 %K multimodel feature %K semantic analysis %K video retrieval
多模态特征 %K 语义分析 %K 视频检索 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=A9D9BE08CDC44144BE8B5685705D3AED&aid=31780116840884783EA576EE8CD48957&yid=99E9153A83D4CB11&vid=771469D9D58C34FF&iid=DF92D298D3FF1E6E&sid=37670E198ADCA666&eid=DA18F418694A6B14&journal_id=1001-3695&journal_name=计算机应用研究&referenced_num=0&reference_num=12