V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
aragakiiyui
V2EX  ›  Python

乱码的♂哲学♀教育

  •  
  •   aragakiiyui · 2015-08-27 14:47:04 +08:00 · 2710 次点击
    这是一个创建于 3375 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我不知道岁月给我们的爱为什么是那样的苍白,它停在了今天,让我真的无奈。。。
    这是一个令人忧伤的 bug ,为什么我的爬虫爬京东的时候,同一个关键词,大部分时间都是正常运作的,但是有时候结果却是乱码,不知道是不是我代码的问题。
    我是用 XPath+requests 来解析网页的,大家写爬虫有碰到过这种情况么?!求建议!
    6 条回复    2015-08-30 12:25:45 +08:00
    kurtrossel
        1
    kurtrossel  
       2015-08-27 15:17:52 +08:00   ❤️ 4
    有点乱,别人可能看不到重点,整理一下

    没有什么能阻挡那滔天的巨浪,它铺面而来,席卷了一切。。。
    那是一个慵懒倦怠的午后,忧伤的程序员突然发现了他的宿命,他与京东的纠缠。隐形的巨兽匍匐在他面前,蓄势待发,他被巨兽的鼻息笼罩,却无力挣脱
    他是一个直男,他用 XPath+requests 写爬虫解析网页,同一个关键词,有时返回的结果正常,有时却是乱码,大家是否也遇到过相同情况?有何解决办法?
    kasp
        2
    kasp  
       2015-08-27 15:48:31 +08:00
    LS 整理的真好。
    wuling
        3
    wuling  
       2015-08-27 15:54:30 +08:00
    奶茶东嘛,每爬那么 30 多次里总有个几次乱码,你懂的
    aragakiiyui
        4
    aragakiiyui  
    OP
       2015-08-27 16:53:59 +08:00
    @kurtrossel 我从未见过如此与我一般才华横溢之人(一 一+正义的眼神)。
    aragakiiyui
        5
    aragakiiyui  
    OP
       2015-08-27 16:54:21 +08:00
    @wuling 你也出现过这种情况么?!
    RadishWind
        6
    RadishWind  
       2015-08-30 12:25:45 +08:00
    换正则试试
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2776 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 11:48 · PVG 19:48 · LAX 03:48 · JFK 06:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.