时间:2024-11-28 10:00:25
elasticsearch倒排索引原理
Elasticsearch倒排索引原理是基于文档中所有不重复词的列表构成,对于其中每个词,有一个包含它的文档列表。倒排索引建立的分词(Term)和文档(Document)之间的映射关系,在倒排索引中,数据是面向词(Term)而不是面向文档的。倒排索引主要由单词词典(Term Dictionary)和倒排列表(Posting List)及倒排文件(Inverted File)组成。
倒排索引的工作原理是通过标记位匹配,找到相关度最高的词进行评分后输出。同样场景下对文本进行搜索,正排索引的时间复杂度为O(n),而倒排索引的时间复杂度为O(1),意味着扫描一次就可以找到文档在哪里。
科技之家 广州小漏斗信息技术有限公司 版权所有 提供支持 粤ICP备20006251号