V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ylxw
V2EX  ›  问与答

分块读取 hdfs 数据,一条数据分为多条

  •  
  •   ylxw · 2018-06-01 09:28:27 +08:00 · 920 次点击
    这是一个创建于 2352 天前的主题,其中的信息可能已经有所发展或是发生改变。
    请问在读取 hdfs 文件的时候,采用分块 chunksize 读取数据,但怎么会把一条数据拆分成多条呢?
    with client.read(full_path,encoding='utf-8',chunk_size=10000) as reader:
    for piece in reader:
    piece=piece.split('\n')
    for line in piece:
    print(line)

    本来数据是 2018-05-01|weorjerjsfj|worjwelfjs|
    结果读出来的数据是 2018-05-01|weo
    rjerjsfj|worjwelfjs|分别显示了两条记录
    1 条回复    2019-04-19 11:06:21 +08:00
    RmanzzZ
        1
    RmanzzZ  
       2019-04-19 11:06:21 +08:00
    老哥问题解决了吗 遇到同样问题了 不知道怎么处理
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5385 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 07:14 · PVG 15:14 · LAX 23:14 · JFK 02:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.