Sphinx-coreseek匹配结果的问题

Sphinx-coreseek匹配结果的问题

归属感 发布于 2017-01-09 字数 486 浏览 1094 回复 1

遇到一个现象:

要匹配的记录为:“天天都是a12的日子”

搜索:a12 可以匹配到结果,但搜索a1 或 a2 或 12 都无法得到结果,

注:(在建索引时 a12、a1、 a2 、 12 都没有加入字典)

有谁知道怎么解决吗?


以下由@熊欲轻飞 补充:
我遇到一样的问题,中文搜索无误,字母或数字搜索不准确。
@fengming 提到配置mmseg.ini的方法,我之前已试过,奇怪的是不行。

比如“代号H123456”,默认分词是

代号/x H123456/x 

如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

扫码加入群聊

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

晚风撩人 2017-04-20 1 楼

coreseek在调用mmseg分词时,调用字典把a12分解成一个整词。
分词结果:

Array ( [0] => 天天 [1] => 都是 [2] => a12 [3] => 日子 )

有种解决方法,但是比较麻烦,需要手动建立一个字形表。
即:

a1 > a12
a2 > a12
12 > a12

你可以在手册中搜索wordforms 关键字,有很详细的解释。

顺便说下,如果方便的话把csft.conf关键部分贴出了。