Jieba 分词插件是云搜索服务实例的默认插件,不能卸载。您可以在本地词典文件中配置分词和停用词,通过上传词典文件的方式配置 Jieba 分词和停用词。
您在上传 Jieba 分词文件、冷热更新文件、使用 Jieba 分词能力前,请先了解以下基础信息:
系统默认提供一个分词词典文件(SYSTEM_MAIN.dic)和一个停用词词典文件(SYSTEM_STOPWORD.dic);通过可视化配置的分词词条完成一键生效后,生成的分词词典文件为SYSTEM_DICTIONARY_MAIN.dic
,停用词词典文件为SYSTEM_DICTIONARY_STOPWORD.dic
,支持下载词典文件到本地查看文件内容。
您在上传 Jieba 词典文件时,应注意以下内容:
utf-8
编码的 .dic
文件。-_.
)组成。词典文件更新操作(添加、编辑和删除)完成后,将对使用 Jieba 词典的存量、新增索引生效,文件更新后约两分钟才可实际生效。其中存量索引仅对新增数据生效,如果您希望对存量索引的存量数据生效,可使用数据刷新功能刷新索引数据。相关文档,请参见执行数据刷新。
每个节点获取词典文件的时间可能不同,请耐心等待词典生效,大概两分钟后再使用更新之后的词典。
生效方式 | 描述 | 字典文件类型 | 是否重启实例 |
---|---|---|---|
启用 | 首次上传的自定义词典文件,需要启用才可生效。 | 自定义词典文件 | 否 |
热更新 | 当您需要更新已启用的词典文件内容时,您可以下载已启用的词典文件,在本地更新文件内容后,然后进行热更新操作。 | 自定义词典文件 | 否 |
冷更新 | 系统提供的默认分词和停用词词典文件不支持热更新,仅支持冷更新。 | 系统词典文件 | 是 |
analysis-jieba
插件,然后单击对应操作栏的分词词库/停用词词库。首次上传的自定义词典文件需要启用后才可生效。
analysis-jieba
插件,然后单击对应操作栏的分词词库/停用词词库。待启用
状态的词典文件,然后单击启用。当您需要更新已启用的自定义词典文件内容时,您可以下载已启用的词典文件,在本地更新文件内容后,然后进行热启用操作。热更新词典文件不会触发实例重启,而是在运行过程中加载分词词库。
说明
analysis-jieba
插件,然后单击对应操作栏的分词词库/停用词词库。系统默认提供的分词和停用词词典文件不支持热更新,仅支持冷更新。如果需要更新默认词典库,您可以选择上传同名文件,然后冷更新词典文件,这样便能更新默认词典库内容。
说明
analysis-jieba
插件,然后单击对应操作栏的分词词库/停用词词库。支持下载分词词典/停用词词典文件,可以用来查看词条详情,也可以用来更新词典文件中的词条内容。
analysis-jieba
插件,然后单击对应操作栏的分词词库/停用词词库。说明
删除词典文件,请先了解以下事项:
analysis-jieba
插件,然后单击对应操作栏的分词词库/停用词词库。