假設某機構擬針對其一萬筆文件分成10 個主題類別(假設每篇文件僅能屬於某一主
題類別),以提供瀏覽或是讓使用者依類別訂閱文件(爾後有該類新文件,會自動派
送給使用者)。受限於人力時間,僅有4000 篇被人工分類,各類別的篇數如下表第
二列所示。該機構擬採購文件自動分類系統,評估了X 與Y 兩套系統,其中X 系統
可正確分類的類別與篇數分布如下表第三列,而Y 系統可正確分類的類別與篇數分
布如下表第四列。請問:
X 與Y 系統分類4000 篇文件的正確率,各是多少?(5 分)
X 與Y 系統在各類別上的平均分類正確率,各是多少?(5 分)
若要選一個系統,讓使用者依類別訂閱文件,應該選那一個比較好,為什麼?(7 分)
若要選一個系統,把剩下的6000 篇文件自動分類完,應該選那一個比較好,為什麼?
(8 分)
類別
1
2