以下是一個簡易的資訊檢索系統內部的文件與索引詞彙的關係矩陣圖,共計有4 篇
文件(Doc1, Doc2, Doc3, Doc4)以及5 個索引詞彙(Term1, Term2, Term3, Term4,
Term5),Doc1 與Term1 相交的格子中的數字2,代表詞彙Term1 在Doc1 文件出
現2 次,依此類推其他格子中數字的意義。請依向量內積的方法計算兩兩文件的相
似性。(25 分)
Term1
Term2
Term3
Term4
Term5
Doc1
2
0
4
1
0
Doc2
0
1
5
2
4
Doc3
1