这是一个创建于 2450 天前的主题,其中的信息可能已经有所发展或是发生改变。
现有 dataDF 结构如下:
root
|-- asin: string (nullable = true)
|-- topic: array (nullable = true)
| |-- element: double (containsNull = true)
| t1 | t2 | t3 |
a1 | d11 | d12 | d13 |
a2 | d21 | d22 | d23 |
a3 | d31 | d32 | d33 |
请问怎么用 Statistics.corr 方法来计算两两的相似度,从而得到如下结构的 DF:
case class Corr(asin1: String, asin2: String, corr: Double)