有几个藏品美的不行,想下载原图看。 抓包看了下,特么的切成尺寸 200 多的方块碎片,7_5.jpg ,4_10.jpg 等等等等
其实要爬也容易,找规律批量 down 碎片下来拼。
可是我并不想爬啊,下载几张高清晰藏品图欣赏欣赏就行了,费这老牛鼻子的功夫。。。。 恼火。
都是公版古董了,还搞得七零八落,难不成公版还怕人山寨。
要下的藏品是这个
www。dpm。org。cn/collection/jewelry/231382.html
1
yamedie 2019-07-23 16:19:25 +08:00
https://img.dpm.org.cn/Uploads/Picture/dc/21091[1024].jpg 没有切割啊
|
2
Kirscheis 2019-07-23 16:19:28 +08:00 via Android
虚拟屏幕截图大法可破
|
5
Mavious OP 我以为只是为了节省流量才切碎的
结果看到这个藏品不让唤起 F12,就知道是故意这么搞的了 digicol。dpm。org。cn/cultural/detail?id=ce90d95c05aa41bc83477df2e07a3fd6 当然要强制唤起也容易,先 F12 再开链接嘛。。。。要么上 fiddler 当然这个藏品也是切碎的了。 然后找了个现成轮子,但是作者什么注释都没有,看得一头雾水。。 github。com/EternalZZX/dpm-download/blob/master/download.py |
6
Mavious OP @nolo 你抓包看一下就明白了,水印是一张单独的透明底 png,直接用 ublock 毙掉就行了。
但是大图是不成的了,只有人工拼了。要么暴力截图。我屏幕 19 寸,暴力截图效果也不好。而且我想要原图。。。。 |
7
dodo2012 2019-07-23 16:31:42 +08:00
这切图的切的,是为了加载么?
|
8
yamedie 2019-07-23 16:33:00 +08:00 2
打开控制台
var c = document.querySelector('canvas'); c.toDataURL(); 得到图片的 base64 串 但有一个问题是: 超出屏幕可见区域的部分画面不显示, 谁再想想办法, 感觉是用不着拼接的 |
9
Mavious OP 更新一下,看到一个教程了,按图索骥,原图尺寸
<Size Width="4707" Height="3713" /> 教程采用的方法是暴力下载全部碎片,再拼接。。。 zhuanlan。zhihu。com/p/4412 [不是 QQ 号你干嘛不让我发呢] 1393 感谢 8 楼,我还在搜索方案。 故宫这么有名,说不定也有人遇到了和我一样的困难。。。 |
10
silencefent 2019-07-23 16:59:49 +08:00 2
|
11
NotNil1 2019-07-23 17:25:15 +08:00 1
@silencefent 我从网上看,这个轮子是可以不放原图的,原图切好后放到这个网站目录下就可以使用,所以可能,下载不到原图。一个简单的例子 https://www.cnblogs.com/yingjiehit/p/4362377.html。
|
12
bibizhang 2019-07-23 17:30:13 +08:00
10 楼说的对,高清的大图都得这么搞。
|
13
NotNil1 2019-07-23 17:36:31 +08:00 1
@Mavious 我试了 4 楼的 py 脚本,可以下载,命令就是
python download.py https://en.dpm.org.cn/dyx.html?path=/tilegenerator/dest/files/image/8831/2011/3479/img0007.xml 会有一个缩略图,和一个文件夹,文件夹中是切割好的图片,按照矩阵拼接起来就好了 |
14
learnshare 2019-07-23 17:40:19 +08:00 1
瓦片图,地图也都是这么处理的,因为没法一次加载所有数据
|
15
Mavious OP @ljtletters 谢谢,我是 py3.6,运行了一下发现没有 pil 模块,回去装上模块再试
|
16
NotNil1 2019-07-23 17:47:40 +08:00 1
|
17
LZSZ 2019-07-23 17:52:22 +08:00
这些文物要是能 360 度看就好了
|
18
Mavious OP @ljtletters
折腾了一下,模块装好了,SSL 证书报错,摆渡了一下,加了个 verify=False 跳过了。然后就跑起来了。 很不错,如你所说,有碎片也有( 285 个碎片,1.28MB ),合成图也有( 1MB )。 xml 文件里说是 4707x3713,合成之后是 4743x3741,基本一致,在找不到原图的情况下……已经非常好了。 so goooooooooood 圆满解决。开心了卷走了七八个藏品图。 谢谢你。 -------------- 那个轮子……我技术很差,基本没看懂原图搁哪儿了=_= |
19
xmoiduts 2019-07-23 21:56:27 +08:00 via Android
想起了我爬 overviewer minecraft 地图瓦片的那段日子,要拼接 /比对差异,竟然用 pillow 一个库就撸出来了。
|
20
php01 2019-07-24 09:32:54 +08:00
谷歌文化学院的图片也是瓦片图,弄了很久,放弃了
|
21
Threeinchtime 2019-07-24 13:51:13 +08:00
selenium 一把唆
|
22
Apol1oBelvedere 2019-11-01 12:18:15 +08:00
下载图片容易,就是少一个智能拼合图片的工具
|