通用图片下载 - kanmh看漫画下载器

通用图片下载是kanmh看漫画下载器的一个子功能,用户可自行添加规则来让网站成为看漫画下载器的支持站点从而批量下载其网站图片.不会添加规则的也可以在官网下载已做好的站点规则.不局限于漫画网站,各种图片网站制作好规则都可以进行批量下载.

使用方法:在kanmh看漫画下载器的工作文件夹下,新建<通用图片下载>文件夹,将下列已做好的.txt规则放入其中即可支持对应站点的下载。最多支持80条,如果打包全部下载多余80条,请删除至80条内。详细帮助请往下翻。

通用规则下载

按作者喜好前后排列。 下载请右键另存为,点击可查看主域名网址。提交规则给作者,邮箱77099329@qq.com。
目前发布的通用规则少于100条前都将有一个提交规则送额外p活动,按网站规则质量分3档25000,20000,15000额外p赠送。不会制作规则也可以提交优秀网站给我,一经采用也有10000额外p赠送。规则和网站提交一次性最多5个,不局限于漫画网站,各类网站都可以。

漫画喵绅士[本子] hentaiera[本子] 禁漫天堂_要设置cookie等教程[本子] 漫画库[绅士漫画] 漫畫狗[漫画] 小浣熊[韩漫] 漫画啦[国韩漫] 漫画芯[国韩漫]

acgkona[图站] konaR18[R18图站] yande[R18图站] 叽哩叽哩[acg图库] 萌娘资源[acg图库]

美女宅福利[无圣光套图] 宅福利搜[搜索] 抓美网[无圣光套图] 很美网[无圣光图集] 美女导航[图集] 美女集[图集] 女神图[图集] 亿图库[图集]

图库天堂图片[壁纸素材] zol壁纸[壁纸素材] 天极图片[壁纸素材] 唯一图库[壁纸素材] Visual[照片素材]


使用帮助

此帮助分两部分,前半是使用相关,后半是要编辑或自行新增通用规则的详细帮助。

首先,请在看漫画下载器的工作文件夹内创建<通用图片下载>的文件夹,再把通用规则放入其中。比如看漫画下载器的路径是“D:\tools\kanmh\kanmh看漫画下载器v1.32.exe”,那么通用规则如k站kona的路径就应该是“D:\tools\kanmh\通用图片下载\kona.txt”,这样才能正确加载使用规则

通用图片下载

目前通用图片下载功能是在站点标签内,点<管理编辑通用图片下载>击进入。

通用图片下载

如图红框1.处,已经成功加载了这些规则,对应站点会在看漫画下载器内支持分析下载。使用时无需每次打开这个<通用图片下载>窗口,只要<通用图片下载>文件夹内有规则就会正确识别加载使用。

接下来是批量加入队列功能的使用介绍。如图红框2.处,这里能把测试列表页地址替换为始尾地址再加入队列。拿亿图库举例,红框3.处测试列表页地址为“https://www.yeitu.com/meinv/xinggan/2.html”,多列表队列替换为“/(2).html”,此处括号内/(2).html与前面/2.html对应,后面的始尾分别填上“2”,“5”,再点击后面的<批量加入队列>,会将https://www.yeitu.com/meinv/xinggan/2.html-https://www.yeitu.com/meinv/xinggan/5.html加入到队列,id为ALL代表分析下载时全选章节。需要注意的是这是性感美女栏目的地址,如果要批量加入其他栏目的地址,比如动漫分类的COSPLAY需要修改测试列表页地址为“https://www.yeitu.com/dongman/cosplay/2.html”,再填入始尾,点击<批量加入队列>即可。要注意的是第一页地址是https://www.yeitu.com/dongman/cosplay/index.html,而不是https://www.yeitu.com/dongman/cosplay/1.html,这个可以把他单独下载,或单独分析后加入队列。

站点名右侧的模式只对图片命名有影响,在漫画选项下会以主标题(为空则是站点名)空格副标题空格编号命名,在图片选项下会以副标题空格编号命名。

所有规则可以修改站点名来修改文件名,但规则内的站点名必须与文件名一致。如我们常用kona可以在通用图片管理功能窗口点击kona加载,然后修改站点名红框4.处,为01.kona再点击保存,然后到<通用图片下载>文件夹内把原kona.txt删除掉。这样的话01.korna会出现在所有规则的最前面。或直接修改kona.txt为01.kona.txt,再打开规则把修改为,总之一致就行了。有规则文件变动请重启下软件,或加载任意规则后保存下,来刷新所有规则。已分析的列表也需要重新分析一次。

至此,如果您对添加编辑规则无兴趣,只用现有已完成的通用规则,以上基本已经够用。除上红框外,还有<分目录存>,<自动章节编号>,<编号反序>也属可操作范围,其他的话请勿修改。

编辑规则帮助

下面开始添加编辑通用规则的详解,了解熟练后,5分钟内就可以对一个网站做出通用规则,让看漫画下载器支持分析下载,还能使用队列功能批量下载图片,轻松实现挂机搬运网站全部图片。视频教程

通用图片下载

<站点名>,可以任意取命,规则保存时会保存为<通用图片下载>文件夹下站点名.txt。
<模式>,影响图片的命名,如为漫画,保存名为主标题(为空则是站点名) 副标题 序号.jpg;如为图片则为副标题 序号.jpg。
<站点主域名>,是所有网站访问的返回值,如果下载一图测试的返回值为空,也是用这个做返回值;一般来说填域名就可以了。
<编码>,网站访问的编码,如果不对会出现乱码;目前暂不支持big5。
< user-agent >,网站访问客户端的系统版本,比如默认的“Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36”代表pc平台使用chrome内核的360安全浏览器;再比如“Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.76 Mobile Safari/537.36”代表手机端安卓6;一般使用上述两条就可以了。
< cookie >,网站访问的用户信息,比如一些需要登陆的网站,填上后,获取的是已登陆页面的源码;cookie的获取,请查看视频帮助。

通用图片下载

这部分是做列表测试,也就是分析后出现在表格中的内容,需要获取到内容页的名字和内容页的地址就可以了。下面提到的正则表达式在本功能中其实不难,只需要知道两点即可。一.*?可以代表任意多个字符,二()括号代表需要匹配的内容,(.*?)代表需要匹配的任意多个字符。不理解的话还是推荐查看视频帮助。
<测试列表页地址>,图片站的话应该是列表页,漫画站的话应该是漫画目录页
<模拟前端源码>,可以获取到经过js渲染返回后的源码,比如说一些漫画网站内容页直接查看源代码无法在其中找到显示的漫画图片,而使用模拟前端源码是真的通过内置浏览器 访问一次网站,再获取页面内容,就能看到其中漫画图片地址了。但由于无法使用线程,占用资源多,访问速度慢,效率低,不应主用。
<列表源码删除>,删除部分列表源码,可使用正则表达式。
<区间截取匹配>,先截取需要使用的部分源码。
<区间替换>,将一些多余代码替换掉,可使用正则表达式。比如一些列表页除了文字链接还有图片链接,这样就重复了,使用<区间替换>或<列表源码删除>都能把其中一种链接删除掉。
<匹配列表页匹配>,匹配内容页的超链接地址。这里是在区间截取源码里重复匹配符合这个匹配规则的所有。
<补齐相对地址>,将相对地址补齐成绝对地址。
<匹配副标题匹配>,匹配内容页的名字。这里是在区间截取源码里重复匹配符合这个匹配规则的所有。
<匹配副标题匹配>,匹配内容页对应的栏目或上级目录名。比如这里是漫画的话可以匹配漫画名,图片的话可以匹配栏目名,如果为空则使用站点名。

通用图片下载

这里是做内容测试,也就是获取内容页中的需要下载的图片地址,以及如果有分页,获取分页内的图片地址。
<测试内容页地址>,包含需要下载图片的内容页地址。
<内容源码删除>,删除部分内容源码,可使用正则表达式。
<区间内截取>,先截取需要使用的部分源码。
<区间替换>,同列表测试区间替换。
<解码>,这里是将截取区间的源码做js执行,可以将一些加密的图片地址解码成正确明显的图片地址,或自行编辑执行js,弥补软件功能的不足。比如在zol壁纸里,需要用到两次区间替换,但软件功能只有一次,于是可以用这个执行js来进行第二次的替换。
<匹配内容页匹配>,匹配需下载图片的超链接地址。这里是在区间截取源码里重复匹配符合这个匹配规则的所有。
<补齐地址+匹配>,将相对地址补齐成绝对地址,还可以加一次匹配。
<分页源区间匹配>,在内容页源码中区间截取需要的一段源码,一般来说是包含所有分页超链接的部分。
<分页模式>,包含三种,全部列出,下一页,总页。软件会自动删除重复分页地址。如果没有分页一定要下行勾选无分页。
<全部列出>,分页是全部显示的,可以使用此模式。注意多测试,有些是网站是小于10页全部显示,多余10页才显示下一页的。
<下一页>,没有办法使用全部列出,总页模式后才使用这个模式,效率较低。有内置估算分页功能。
<总页>,内容页源码里有共多少页,有选择框选页,或有直接到最后一分页链接时适用。
<分页源匹配匹配>,在全部列出时重复匹配所有分页超链接,在下一页时匹配下一页的超链接,在总页时匹配总页数字。
<分页补齐>,两种,<手动><网址匹配>。后面的<无分页>其实应该属于分页模式的一种,总之不使用分页,一定要勾选,相当于分页开关。
<分页的手动补齐>,勾选分页补齐手动后适用,但一般网站的上级目录都是不固定的,所以一般用后面的网址提取。
<网址提取前多少个/内容>,勾选分页补齐网址提取后适用,用于补齐分页的相对地址,输入数字,在网址提取测试多试下就出来了。
<删除末/>,是网址提取功能相关,删除最后一个/。
<总页1开始>,是分页模式总页功能相关,分页从1开始序号,不勾选是2开始。
<总页逆匹配>,是分页模式总页功能相关,如1.2.3.4.5.....末页18这种,想直接匹配18但代码与前面相同不好做匹配时使用,能重复匹配然后选用最后一个匹配内容,仍然是要匹配数字,如上,匹配18这个数字即可。
<分页的总页替换>,<替换>,在匹配出总页数字后,将测试内容页地址替换为分页地址,从2开始直到等于总页地址。除此之外测试内容页地址也会包含其中。

通用图片下载

<下载一图测试>,<返回>,前面填写测试图片的地址,后面填写返回值,一般填写网站主域名就可以了,为空则使用主域名为返回值。
<正确码>,<错误码>,正确码可以填写分页里都有的固定代码,比如正确码默认的“charset=”,获得的分页源码如果没有正确码那视为读取源码失败,会稍等后循环重试知道源码包含正确码,错误码同理,可以填写测试错误码后的提示不同代码。一般来说填写正确码即可。
<多列表队列替换>,<始尾>,这个在使用时已经说过了,是将测试列表地址替换后批量加入队列的功能。
(.*?) .*? 常用的匹配字符,点击后会复制,直接粘贴会比较快的打出字符;
保存此规则,这个很重要,不保存关闭窗口就没了。保存是按站点名.txt存放在看漫画下载器文件夹下通用图片下载文件夹内。
<分页优化>,快速获取分页;<分页预读>,在获取分页的同时下载,分页预读只能在一分页一图的站点使用,否则会程序错误;<分目录存>,把下载的图片按章节或者说内容页创建文件夹单独存放;<自动章节编号>,<编号反序>,如果章节需要标注一个阅读顺序可以勾选,一般用于漫画站。这几个设置是看漫画下载器的基础设置,这里对通用图片下载的站点单独对应设置,不用再去频繁修改总设置。
<分析测试>,把测试列表地址直接分析,点击后把通用图片下载窗口移开就可以看到了,分析后下载,可以测试规则编写的正确性。记得先保存规则生效。

至此帮助结束,还有不清楚的可以观看通用图片下载视频帮助,直观的展示如何快速制作一个站点规则,还有些获取源码操作,匹配细则都会更加详细的解说。

返回主页