我们知道,只要是能够被序列数据表示的物品,都可以通过 Item2vec 方法训练出 Embedding。但是,互联网的数据可不仅仅是序列数据那么简单,越来越多的数据被我们以图的形式展现出来。这个时候,基于序列数据的 Embedding 方法就显得“不够用”了。但在推荐系统中放弃图结构数据是非常可惜的,因为图数据中包含了大量非常有价值的结构信息。
不了解Item2vec 方法和Embedding看看下面文章:
Embedding 技术的神奇之处
经典的 Embedding 方法——Word2vec
Word2vec 模型上篇:CBOW 和 Skip-gram
Word2vec 模型下篇:CBOW 和 Skip-gram
Item2Vec: Word2vec方法的推广
互联网中,基于图结构数据有哪些?互联网中非常典型的图结构数据,主要有社交网络、知识图谱和二部图。
社交网络,从社交网络中,我们可以发现社区,再根据这些“社交”特性进行社交化的推荐,如果我们可以对社交网络中的节点进行 Embedding编码,社交化推荐的过程将会非常方便。
社交网络图
知识图谱:主要由三元组(RDF,实体-关系-实体)组成,知识图谱中包含了不同类型的知识主体(如人物、地点等),附着在知识主体上的属性(如人物描述,物品特点),以及主体和主体之间、主体和属性之间的关系。如果我们能够对知识图谱中的主体进行 Embedding 化,就可以发现主体之间的潜在关系,这对于基于内容和知识的推荐系统是非常有帮助的。
知识图谱
行为关系类图数据。这类数据几乎存在于所有互联网应用中,它事实上是由用户和物品组成的“二部图”(也称二分图,如图 )。用户和物品之间的相互行为生成了行为关系图。借助这样的关系图,我们自然能够利用 Embedding 技术发掘出物品和物品之间、用户和用户之间,以及用户和物品之间的关系,从而应用于推荐系统的进一步推荐。
行为关系类图
,