汉字部件信息数据库的建立──部件和部件组合频率的统计分析
Keywords: 部件,部件组合,组字次数,频率,数据库,汉字
Abstract:
用FoxBASE语言统计了6763个基本汉字集合中的部件和部件组合的频度信息,建立了“部件数据库”和“部件组合数据库”。前者包含567个部件;后者包含汉字中实际存在的7583个两部件组合。统计结果表明部件和部件组合均呈偏态分布,绝大多数的频率很低。这两个数据库不仅可应用于研究汉字认知中整体和局部的关系、汉字的学习和记忆,而且也可供汉字学的定量研究、中文信息的计算机处理研究参考。
Full-Text