第三章 相似
几何模型
多维标度模型
将待比较的两个事物表示为多维向量
向量空间模型
文档被表示为项空间中的向量,查询也被表示为向量,向量间的距离作为文档排序的依据
为项赋予权重:二元权重,项的频度,TF-IDF,TF-IDF正规化
向量空间模型余弦相似度计算示例
特征(对比)模型
非对称性、非传递性、相似和差别的非镜像性
基于对齐的模型
对比并不仅仅对特征进行匹配而且还要决定对象的各个组成部分进行对齐
基于转换的模型
将相似定义为将源串转换为目标串所需要的转换步骤函数