请教一个 spark dataframe 问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 980 天前的主题，其中的信息可能已经有所发展或是发生改变。

代码：

val dfArr = df.map(row => {
  ...
  ...
  val DF = spark.createDataFrame(rdd, schema)
  DF // 返回 dataframe
})

报错：

error: Unable to find encoder for type org.apache.spark.sql.DataFrame. An implicit Encoder[org.apache.spark.sql.DataFrame] is needed to store org.apache.spark.sql.DataFrame instances in a Dataset. Primitive types (Int, String, etc) and Product types (case classes) are supported by importing spark.implicits._  Support for serializing other types will be added in future releases.

将 df.take(n)到 driver 不会报错，不 take 的话报错，原因应该是序列化的时候没找合适的 encoder ，奇怪的是我在创建 df 的时候已经给了 schema.

目前尚无回复

dataframe Spark Apache encoder