中文分词是中文文本处理的基础技术,核心是将连续的汉字序列切分为具有语义或语法意义的词语单元,如将“我爱北京天安门”切分为…
libmmseg 中文分词库使用非常广泛,目前本站的搜索部分就是用的他,结合 Sphinx 和 Coreseek 做全文搜索。 Coreseek 官网已关闭…