開啟glass.arff檔案
(1) 原始長條圖
Discretize分兩種等寬和等頻兩種
weka.filters.unsupervised.attribute.Discretize
1. 滑鼠點選空白處, 跳出weka.gui.GenericEditor對話框, 設定完成關閉該對話框後
2. 點擊<Apply>按鈕
weka.gui.GenericEditor對話框設定如下
設定離散化條件: attributeIndices(指定要套用的屬性索引)
(2)RI屬性離散化(等寬)後長條圖
模擬第二種離散方法, 先按下<Undo>將資料再次恢復至未修改前
這次將useEqualFrequency Enable
(3)RI屬性離散化(等頻)後長條圖
Ba,Fe進行等頻離散化後仍然差異很大, 因為原始長條圖就嚴重偏向一端
如果資料平均分布, 等頻離散化應該長條圖大致一樣高
------------------------------------------------------------------------------------------------------------------------------------
開啟iris.arff檔案
套用監督的離散化濾波器: weka.filters.supervised.attribute.Discretize
下圖可以發現petallength和petalwidth兩個屬性最為代表性, 可以有效分類
以petalwidth為例, 雖然有些分類錯誤:紅色類別夾帶部份藍色類別, 藍色類別夾帶部份紅色類別
留言列表