倒排索引(Inverted Index)是一種數據結構,主要用於加快根據關鍵字查找相關文檔的速度。
倒排索引的基本原理是,將文檔中的關鍵字作為索引,將包含該關鍵字的文檔ID作為記錄的內容。在倒排索引中,每個關鍵字都對應一個列表,這個列表記錄了所有包含該關鍵字的文檔的ID、關鍵字在文檔中出現的次數和位置。當需要查找某個關鍵字時,可以直接根據關鍵字查找對應的列表,從而快速獲取包含該關鍵字的所有文檔的信息。
倒排索引與正排索引(文檔到單詞的索引)相對,正排索引是根據文檔的唯一ID來查找文檔內容中的關鍵字,而倒排索引則是根據關鍵字來查找包含該關鍵字的文檔。