受支持版本: 当前版本 (18) / 17 / 16 / 15 / 14
开发版本: devel

F.12. dict_int — 用于整数的示例全文搜索词典 #

dict_int是一个全文搜索附加词典模板的示例。 引入这个示例词典是为了控制整数(有符号和无符号)的索引, 使这类数字能够被索引,同时又避免唯一词的数量过度增长, 因为那会严重影响搜索性能。

这个模块被认为是受信任的,也就是说,它可以由在当前数据库上具有CREATE权限的非超级用户安装。

F.12.1. 配置 #

该词典接受三个选项:

  • maxlen参数指定整数词中允许的最大数字位数。 默认值为 6。

  • rejectlong参数指定超长整数应被截断还是忽略。 如果rejectlongfalse(默认值), 词典将返回该整数的前maxlen位数字。 如果rejectlongtrue,词典会将超长整数视为停用词, 因此不会为其建立索引。注意,这也意味着无法搜索这类整数。

  • absval参数指定是否要移除整数词前导的+-符号。 默认值为false。当其为true时,会先移除符号,再应用maxlen

F.12.2. 用法 #

安装dict_int扩展后,会创建一个文本搜索模板 intdict_template以及一个基于该模板、使用默认参数的词典 intdict。你可以修改这些参数,例如:

mydb# ALTER TEXT SEARCH DICTIONARY intdict (MAXLEN = 4, REJECTLONG = true);
ALTER TEXT SEARCH DICTIONARY

或者基于该模板创建新的词典。

要测试该词典,可以尝试:

mydb# select ts_lexize('intdict', '12345678');
 ts_lexize
-----------
 {123456}

但在实际使用中,通常需要像Chapter 12所述那样, 将它包含到某个文本搜索配置中。可能类似如下:

ALTER TEXT SEARCH CONFIGURATION english
    ALTER MAPPING FOR int, uint WITH intdict;

提交更正

如果您发现文档中有不正确的内容、与您使用特定功能的经验不符或需要进一步说明,请使用此表单来报告文档问题。