-
Notifications
You must be signed in to change notification settings - Fork 302
离线配置
xuxijie edited this page Nov 3, 2022
·
11 revisions
离线配置用于索引构建,在离线配置中可以设置索引表结构、数据处理方式、索引构建参数、分析器插件等。离线配置的目录必须是一个数字,在构建索引时,我们需要制定到配置目录的上一层目录,程序会自动使用目录下的最大配置版本进行索引构建。下面是一个离线配置目录的例子,也可以参考offline_config。
schemas是一个必须的目录,里面存储一个或多个表的索引结构配置。索引结构配置文件是一个json格式的文件,文件名由索引表名称和后缀”_schema.json“组成。索引结构配置文件的具体格式请参考schema配置。
data_tables是一个必须的目录,里面存储一个或多个表数据处理配置,用于指导引擎在索引构建时如何对原始数据进行处理。数据处理配置文件是一个json格式的文件,文件名由索引表名称和后缀“_table.json”组成。数据处理配置文件的具体格式请参考data_table配置。
clusters是一个必选的目录,里面存储一个和多个索引表构建时的具体参数。配置文件是一个json格式的文件,文件名由索引表名称和后缀“_cluster.json“组成。索引构建配置的具体格式请参考cluster配置。
plugins是一个可选目录,里面存储索引构建时使用的自定义插件。
analyzer.json是一个分析器配置文件,配置文件中指定了引擎所有可以使用的分析器,具体格式请参考分词器配置。