V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  coderhxl  ›  全部回复第 4 页 / 共 4 页
回复总数  75
1  2  3  4  
@yzding AI 的处理时间跟传入的数据量有关
即使网站后续的更新导致类名或结构发生改变也能正常爬到数据,因为我们不再依赖于固定的类名或结构来定位并提取所需信息,而是让 AI 理解并解析网页的语义信息,从而更高效、智能和便捷提取所需数据。
目前新版 x-crawl 的 AI 辅助功能是依靠 OpenAI ,后续还可能加入其他 AI 。
@mightybruce 感谢您
了解 AI 和 x-crawl 爬虫结合示例的
- AI 需要处理的 HTML
- AI 按照我们的指令解析 HTML 后返回的 srcResult ( img url )

因为 HTML 片段太多了不方便查看就放下面链接的底部,想了解的可以去看看。

https://coder-hxl.github.io/x-crawl/cn/guide/#%E7%A4%BA%E4%BE%8B
随着 AI 技术的不断进步和应用场景的不断拓展,这种结合将会发挥出更大的潜力。
小米摄像头
272 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
272 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
@stimw crawlPage API 是用的 puppeteer ,puppeteer 使用者更多些。两者用法上很相似,后续也可以写个新的 API 加上 playwright 。
272 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
crawlPage API 是用的 puppeteer ,puppeteer 使用者更多些。两者用法上很相似,后续也可以写个新的 API 加上 playwright 。
272 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
@aikilan 感谢您的支持❤️,使用过程中遇到的问题都可以在 GitHub Issues 中提 Issues ,我会尽快解决。
272 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
@laoona 感谢您的支持❤️
272 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
@Motorola3 感谢您的支持
272 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
可以做自动化操作
273 天前
回复了 coderhxl 创建的主题 Node.js 一个灵活的 Node.js 多功能爬虫库 —— x-crawl
快来体验一下吧
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3456 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 05:00 · PVG 13:00 · LAX 21:00 · JFK 00:00
Developed with CodeLauncher
♥ Do have faith in what you're doing.