词库文件(自定义 SCWS 词库)
作者:哪吒游戏网
词库文件(自定义 SCWS 词库),哪吒游戏网给大家带来详细的词库文件(自定义 SCWS 词库)介绍,大家可以阅读一下,希望这篇词库文件(自定义 SCWS 词库)可以给你带来参考价值。
自定义 SCWS 词库
如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统,内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。
1. 全局自定义词库
这是针对同一个 xunsearch 安装实例来讲,该服务端下的所有项目都将共用这个自定义词库。严格来讲,这是 SCWS 本身就提供的功能,xunsearch 只是做了整合和规范。涉及的相关文件如下(假设 $prefix 是您的安装目录)
$prefix/etc/dict_user.txt
打开上述文件词库文件,文件开头已经有了相关注释和说明。这个文件就是自定义词库文件,如果您同一台机器上装有多个 xunsearch 服务端,那么每个服务端独自使用自己的自定义词典文件。
添加删除修改自定义词库只要编辑该文件即可,以下为相关规范:
Note: 该功能自 1.2.0 版本起方可使用,源自网友建议。
2. 项目自定义词库
某些情况下,不同的项目需要不同的特殊词库。每个搜索项目的自定义词库文件如下:
$prefix/data/项目名称/dict_user.txt
文件内容及格式与是一致的,在此不再赘述。此外词库文件,这个文件还可以通过相关的SDK API 读取和修改。
Note: 该功能自 1.3.4 版本起方可使用。
$Id$
总结:以上内容就是针对词库文件(自定义 SCWS 词库)详细阐释,如果您觉得有更好的建议可以提供给哪吒游戏网小编,词库文件(自定义 SCWS 词库)部分内容转载自互联网,有帮助可以收藏一下。
