%0 Journal Article
%T Logistic视频字幕增强模型
%A 李钦瑞
%A 吕学强
%A 李卓
%A 刘坤
%J 中国图象图形学报
%D 2014
%R 10.11834/jig.20140505
%X 目的为提高复杂背景下的视频字幕在光学字符识别（OCR）中的识别率，需要对提取的视频字幕进行有效地字幕增强。首次将Logistic模型应用到视频字幕增强中，提出了基于Logistic模型的融合多帧信息的视频字幕增强方法。方法对字幕进行检测与跟踪，将出现在连续多帧中的同一字幕片段进行对齐；通过分析字幕片段在多帧中信息，提出字幕背景在时域上的变化特征、背景和字幕文本的固有特征，并将3个特征进行量化与融合，构建适用于字幕增强的Logistic模型，实现对视频字幕的增强。结果对含阴影或描边效果的特殊复杂背景字幕、普通复杂背景字幕、单一背景字幕分别进行实验，增强后的字幕在OCR软件中的识别正确率分别为81.76%、97.13%、98.19%，与对比方法比较均有一定的提高。结论实验结果表明，本文方法既可以降低字幕背景的复杂度，又可以提高字幕背景与文本的对比度，从而可以对复杂背景和单一背景下的视频字幕进行有效地增强。
%K 复杂背景
%K 字幕增强
%K Logistic模型
%K 字幕检测与跟踪
%K 时域特征
%U http://www.cjig.cn/jig/ch/reader/view_abstract.aspx?file_no=20140505&flag=1