基于词图的最大概率中文分词方法
分词方法分类中文分词大致分为三类:
基于字符串匹配:最大正向匹配法、逆向最大匹配法、最少切分法、双向匹配法等
基于统计:基于词频度统计的分词方法
基于规则:基于知识理解,利用神经网络等分词方法
语言模型基于词图的最大概率分词方法源于概率统计语言模型。从统计思想的角度来看,分词问题的输入是一个字串C=C1,C2,……,Cn,输出是一个词串S=W1,W2,……,Wm,其中...
阅读全文…