将待比较的两个事物表示为多维向量
文档被表示为项空间中的向量,查询也被表示为向量,向量间的距离作为文档排序的依据
为项赋予权重:二元权重,项的频度,TF-IDF,TF-IDF正规化
向量空间模型余弦相似度计算示例
非对称性、非传递性、相似和差别的非镜像性
对比并不仅仅对特征进行匹配而且还要决定对象的各个组成部分进行对齐
将相似定义为将源串转换为目标串所需要的转换步骤函数