0%

LSH算法浅谈

传统的协同过滤算法,不管是基于用户还是基于物品的,其中最关键的一个问题便是:计算两个用户(或物品)之间的相似度。相似度的计算有多种方式:欧氏距离、余弦相似度或者Jaccard相似度,不管以何种计算方式,在数据维度较小时,都可以用naive的方式直接遍历每一个pair去计算。但当数据维度增大到一定程度时,计算复杂度就开始飙升了,主要体现在两个方面