V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  coderhxl  ›  全部回复第 1 页 / 共 4 页
回复总数  75
1  2  3  4  
199 天前
回复了 findu 创建的主题 健康 我中邪了,一直想求助但不知道怎么描述好。
找有名的大师瞧瞧
233 天前
回复了 magic3584 创建的主题 互联网 准备换邮箱了
outlook 还不错
236 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@charslee013 很 OK
236 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@hpan 可以调用 crawlFile API 爬文件,https://coder-hxl.github.io/x-crawl/cn/guide/crawl-file
个人不应该将公司的未发布代码作为个人开源项目使用
想开发漂亮的网站应该考虑 UI 框架吧
@ttentau1 厉害啊,有机会也可以试试 x-crawl 获取数据,https://github.com/coder-hxl/x-crawl
得先打好基础,html css js 得牢固,不然在学 Vue 过程中还要去补基础,这样效率很低的
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@MapleEve OK ,Dify 还没了解过,有机会可以瞧瞧,搞开源还是蛮消耗精力的
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@gongquanlin 基本的设备指纹也够用
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@teenthsch gpt4 跟 gpt3 对比还是很听话的
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@changz 现在用 AI 成本高但以后不一定
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@charslee013 这个得试了才能知道,如果有好的建议也会采纳的
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@jianyang 并且这种方式貌似不适用于通用型爬虫,适用于特定网站。
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@jianyang AI 主要是能够更好地应对网站更新后类名或结构改变的问题,并且 AI 还能根据要求筛选数据等操作。
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@topang 可以自己封装一个方法,需要的时候调用就行了
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@tinyzilan123 就看使用者怎么用了
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@tinyzilan123 对的,所以有另一种解决方案,二者结合,第一次爬取的时候缓存路径,后面让传统爬虫用缓存路径的,如果错误就调用 AI 重新获取路径再缓存。这样既不用担心网站更新导致爬虫工作失败,也避免浪费 token
239 天前
回复了 coderhxl 创建的主题 推广 传统爬虫 还是 AI 辅助爬虫?该怎么选?
@bubble21 当时我也考虑到加上这个,用 puppeteer 获取页面截图,上传截图给 AI 提取内容。
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3550 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 25ms · UTC 04:31 · PVG 12:31 · LAX 20:31 · JFK 23:31
Developed with CodeLauncher
♥ Do have faith in what you're doing.