命名實體識別(Named Entity Recognition,簡稱NER)是自然語言處理(NLP)中的一項重要任務,旨在從文本中識別出具有特定意義的實體。
這些實體通常包括人名、地名、機構名、專有名詞等,此外,根據不同的業務需求,還可以包括其他類型的實體,如產品名稱、型號、價格等。命名實體識別的核心在於確定這些實體的範圍和類別,其是實現信息提取、問答系統、句法分析、機器翻譯等NLP任務的基礎。命名實體識別的準確度對下游任務的效果有重要影響,因此它是NLP中非常關鍵的基礎問題。實現命名實體識別的方法包括基於規則的方法和有監督學習方法,其中規則方法依賴於人工制定的規則,而監督學習方法則是從有標籤的數據中學習來進行識別。