語料庫是一種用於語言學研究的重要資源,通常包含經過科學取樣和加工的大規模電子文本。
語料庫收集了語言在實際使用中真實出現的材料,可以用於多種目的,如詞典編纂、語言教學、傳統語言研究和自然語言處理中的統計或實例研究等。語料庫可以根據語料採集的原則和方式分爲異質、同質、系統和專用等多種類型,還可以根據語料的語種分爲單語、雙語和多語等類型;按照是否標註,語料庫可以分爲生語料庫和熟語料庫。
語料庫是一種用於語言學研究的重要資源,通常包含經過科學取樣和加工的大規模電子文本。
語料庫收集了語言在實際使用中真實出現的材料,可以用於多種目的,如詞典編纂、語言教學、傳統語言研究和自然語言處理中的統計或實例研究等。語料庫可以根據語料採集的原則和方式分爲異質、同質、系統和專用等多種類型,還可以根據語料的語種分爲單語、雙語和多語等類型;按照是否標註,語料庫可以分爲生語料庫和熟語料庫。