%0 Journal Article %T Automatic Chinese-English Paragraph Segmentation and Alignment
汉英双语库自动分段对齐研究 %A WANG Bin %A LIU Qun %A ZHANG Xiang %A
王斌 %A 刘群 %A 张祥 %J 软件学报 %D 2000 %I %X 双语库对齐是自然语言处理研究的重 要课题之一.其中,双语库段落对齐是指找出源文和译文中对应的翻译段落的对齐过程.它上 承篇章对齐,下接句子对齐,在整个双语库的对齐中起着承上启下的重要作用.但由于种种原 因,双语库段落对齐在当今研究中没有受到应有的重视.直接进行通用的段落自动对齐具有相 当的难度,也不必要,鉴于此,提出将段落对齐转化成分段对齐进行实现.通过汉英词汇对之 间的特征比较,首先找到可以用于汉英双语库分段的锚点词汇对,在此基础上,通过锚点词所 在句子的匹配获得锚点句子对来进行分段.实验结果表明,该方法具有良好的使用价值,可以 用于其他语言对的对齐. %K NLP (natural language processing) %K bili ngual corpora %K alignment %K paragraph segmentation %K anchor
自然语言处理 %K 双语库 %K 对齐 %K 分段 %K 锚点 %U http://www.alljournals.cn/get_abstract_url.aspx?pcid=5B3AB970F71A803DEACDC0559115BFCF0A068CD97DD29835&cid=8240383F08CE46C8B05036380D75B607&jid=7735F413D429542E610B3D6AC0D5EC59&aid=A40F2C447E973FA3&yid=9806D0D4EAA9BED3&vid=708DD6B15D2464E8&iid=708DD6B15D2464E8&sid=D9E4B4338A9AF29A&eid=C3BE0738C75042AD&journal_id=1000-9825&journal_name=软件学报&referenced_num=8&reference_num=12