V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Dora112233
V2EX  ›  程序员

有无爬虫大佬

  •  
  •   Dora112233 · 33 天前 · 2061 次点击
    这是一个创建于 33 天前的主题,其中的信息可能已经有所发展或是发生改变。
    • 最近要做一个需求,输入 某 88 店铺地址 需要拿到店铺内所有商品详细信息
    • 现在使用的 playwright+camoufox 一直弹滑动验证还一直失败,虽然有时候能成功但效率非常低
    • 有无做过的大佬处理过这些吗
    26 条回复    2025-03-07 08:09:37 +08:00
    youngce
        1
    youngce  
       33 天前
    输入 某 88 店铺地址 需要拿到店铺内所有商品详细信息

    这个需求的数据,已经国内头部难度了
    freewind
        2
    freewind  
       33 天前
    能做成的估计在吃公家饭
    Dora112233
        3
    Dora112233  
    OP
       33 天前
    @freewind 不会啊,好多第三方服务商 只不过太贵,不想花钱
    Dora112233
        4
    Dora112233  
    OP
       33 天前
    @youngce 据说 pdd 和某团才是最难的
    uibobo
        5
    uibobo  
       33 天前
    哪些第三方我想知道
    wangzi1993
        6
    wangzi1993  
       33 天前
    用 RPA 抓会不会好点
    daodao
        7
    daodao  
       33 天前
    某 88 网页 DOM 命名 经常会变化策略,如果只是满足一时需求还算容易,你出价 帮你实现。
    mumbler
        8
    mumbler  
       33 天前
    大模型时代,只要能显示出来,就抓得到,效率的问题
    Dora112233
        10
    Dora112233  
    OP
       33 天前
    @daodao 老板不想出钱😮‍💨
    danbai
        11
    danbai  
       33 天前
    又不愿意花钱 又不愿意花时间 怎么搞
    eluotao
        12
    eluotao  
       32 天前
    能拿电商数据,这个价格不贵。让你老板花钱吧。
    gam2046
        13
    gam2046  
       32 天前
    不想出钱,讨论就结束了。

    总不会想着有爬虫大佬给你白嫖吧。

    而且你找到的大佬,报价,大概率会比这些服务商更贵,定制,需要额外的成本。

    这些服务商依靠销量已经摊平了很多研发成本。
    l4ever
        14
    l4ever  
       32 天前
    你不会想白嫖大佬吧?
    hubaq
        15
    hubaq  
       32 天前
    @mumbler 笑死,大模型做不了爬虫。
    hubaq
        16
    hubaq  
       32 天前
    输入 某 88 店铺地址 需要拿到店铺内所有商品详细信息

    未登录情况下一天拿到 1W 条数据阿里给奖金 2W
    单账号登录情况下一天拿到 3000 条数据阿里给奖金 3000
    YILSLIN
        17
    YILSLIN  
       32 天前 via Android
    @Dora112233 某团确实严格,我拿 BurpSuite 内嵌浏览器登了一下账号,直接给我封号了。。。
    manhere
        18
    manhere  
       32 天前
    怀念 V587 的提示。。。这事的难度在于没法一劳永逸,永远需要和反制斗智斗勇

    爬虫大舞台,号多你就来
    dbow
        19
    dbow  
       32 天前
    做大了淘宝会起诉你,现在没有肉身在国内的商家敢这么干
    zeusho871
        20
    zeusho871  
       32 天前
    不要用 playwright ,官方版本的 playwright 会被检测,用 Drissonpage 或者 undetected-playwright
    249239432
        21
    249239432  
       32 天前
    做这个全网采集店铺数据的一年几千万收入,会告诉你方法么?
    lasuar
        22
    lasuar  
       32 天前
    你这个问题前段有时间有人问过,后来找帖子,404 了,连账号都 404 了。小伙纸,不要随时想着白嫖。
    feiniu
        23
    feiniu  
       32 天前
    好多公司就靠这数据活下来,这是能随便告诉别人的么
    himly1
        24
    himly1  
       32 天前 via Android
    试试 bright data
    CC11001100
        25
    CC11001100  
       31 天前
    @Dora112233 #10 6
    pureGirl
        26
    pureGirl  
       31 天前 via iPhone
    不就是靠风控吗,胆子大多搞几个帐号
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3420 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 11:01 · PVG 19:01 · LAX 04:01 · JFK 07:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.