V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
zhcq163
V2EX  ›  Python

Python 新手寻求帮助-如何在 Python 中使用 beautifulsoup 获取 onclick 的信息?

  •  
  •   zhcq163 · 2018-07-27 00:53:54 +08:00 · 2819 次点击
    这是一个创建于 2312 天前的主题,其中的信息可能已经有所发展或是发生改变。

    大神们好,我已经将某页面进行格式化处理,将所需要的内容格式化成<a href="javascript:void(0)" onclick="showInfo('XXXXXXXXXXXXXXX'),但是我想获取到 onclick 内的所有 XXXXXXXXXXXX 的字符串信息,这个应该怎么操作,谢谢

    6 条回复    2018-07-27 16:11:01 +08:00
    Sylv
        1
    Sylv  
       2018-07-27 01:02:53 +08:00 via iPhone
    KeatingSmith
        2
    KeatingSmith  
       2018-07-27 08:36:38 +08:00 via iPhone
    re.findall(r ’<a.*?onclick=“ showInfo\(\’(.*?)\’\).*?>’, text)
    yanzixuan
        3
    yanzixuan  
       2018-07-27 11:00:52 +08:00
    soup.find('a').attrs.get("onclick", "")
    ddzzhen
        4
    ddzzhen  
       2018-07-27 12:45:48 +08:00 via Android
    正则即可
    zhcq163
        5
    zhcq163  
    OP
       2018-07-27 13:43:16 +08:00
    @ddzzhen 正则应该怎么写
    glaucus
        6
    glaucus  
       2018-07-27 16:11:01 +08:00
    @zhcq163 二楼就是给你写的正则呀,而且这个用 substring 也可以
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2894 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 12:22 · PVG 20:22 · LAX 04:22 · JFK 07:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.