V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
zjhui
V2EX  ›  Linux

使用wget模拟登录时碰到验证码

  •  
  •   zjhui ·
    zjhui · 2012-08-27 16:40:07 +08:00 · 5169 次点击
    这是一个创建于 4471 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我想用shell写个下载豆瓣fm上面歌曲的脚本,可是豆瓣在登录的时候用图片进行验证,貌似wget就不行了,是不是有chrome的插件能获得登录时的cookie,wget就可以直接使用这个cookie进行登录?或者还有其他什么办法?
    7 条回复    1970-01-01 08:00:00 +08:00
    egen
        1
    egen  
       2012-08-27 17:51:11 +08:00
    wget 可以保存和重新读入cookie,不过你下载到验证码之后怎么办?
    zjhui
        2
    zjhui  
    OP
       2012-08-27 19:36:24 +08:00
    @egen 额..要不只能是先浏览器登录,然后拿登录以后的cookie给wget用?
    gavingeng
        3
    gavingeng  
       2012-08-28 00:18:22 +08:00
    @zjhui
    用python脚本来保存cookie,然后在抓取你想要的歌曲!
    用过curl 的post来做过登陆抓取,但不是captcha
    egen
        4
    egen  
       2012-08-28 00:32:46 +08:00
    @zjhui 浏览器登录的cookie也能用,就是麻烦点,可以参考这篇文章
    cabinw
        5
    cabinw  
       2012-08-28 00:53:41 +08:00
    @egen 文章没贴上来啊
    egen
        6
    egen  
       2012-08-28 12:01:56 +08:00   ❤️ 1
    @cabinw 哈哈,sorry,不知道为什么没贴上来,这里:http://yp.oss.org.cn/software/show_resource.php?resource_id=962
    YUCOAT
        7
    YUCOAT  
       2012-08-28 15:28:58 +08:00
    用Python的urllib2来替代wget吧,它好像可以设置Cookie
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2650 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 02:47 · PVG 10:47 · LAX 18:47 · JFK 21:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.