特徵工程是一個關鍵的數據預處理步驟,主要包括數據清洗、特徵構造、特徵選擇、特徵提取和特徵變換。具體如下:
數據清洗。包括去除異常值、處理缺失數據、數據類型轉換等。
特徵構造。根據業務領域或數據背景,人工構造新的特徵。
特徵選擇。從提取出的特徵中選擇對機器學習模型有用的特徵,去除冗餘特徵,提高模型效果。
特徵提取。從原始數據中提取出適合用於機器學習的特徵,如文本中的詞袋模型、圖像中的邊緣檢測等。
特徵變換。將原始特徵進行變換,如歸一化、離散化、平滑等,使得模型更容易學到數據的規律。
特徵工程是一個關鍵的數據預處理步驟,主要包括數據清洗、特徵構造、特徵選擇、特徵提取和特徵變換。具體如下:
數據清洗。包括去除異常值、處理缺失數據、數據類型轉換等。
特徵構造。根據業務領域或數據背景,人工構造新的特徵。
特徵選擇。從提取出的特徵中選擇對機器學習模型有用的特徵,去除冗餘特徵,提高模型效果。
特徵提取。從原始數據中提取出適合用於機器學習的特徵,如文本中的詞袋模型、圖像中的邊緣檢測等。
特徵變換。將原始特徵進行變換,如歸一化、離散化、平滑等,使得模型更容易學到數據的規律。