|
- 2007
基于多元判别分析的文本分割模型Keywords: 文本分割 多元判别分析 分割单元内距离 分割单元间距离 分割单元长度 遗传算法 Abstract: 提出了一种独立于具体领域的文本线性分割统计模型,其中采用多元判别分析方法定义了4种全局评价函数,实现对文本分割模式的全局评价,寻找满足分割单元内距离最小化和分割单元间距离最大化条件的最好分割方式.该模型采用遗传算法来解决新模型的高计算复杂度问题.比较性实验结果显示,新模型比TextTiling和Dotplotting算法取得了更高的Pμ评价性能
|