现有如下场景: mongo 中有大量记录,现在需要计算两两之间的相似度,用 spark 合适么,我觉得不是典型的 map reduce ,不知道是不是不适合用 spark 计算。希望大家给点思路。
1
lsnl8480 2016-05-10 13:17:38 +08:00 1
1 ,合适
2 , spark 实现了一些协同推荐的算法 3 , spark 读取 mongo 数据: https://databricks.com/blog/2015/03/20/using-mongodb-with-spark.html |