技术宅

当前位置:首页 > 下载中心 > 工具软件

工具软件

杰奇cms3.0专用采集器 关关采集器V5.4版

时间:01-12 作者:
杰奇cms3.0专用采集器 关关采集器V5.4版

此版只支持杰奇3.0!此版只支持杰奇3.0!此版只支持杰奇3.0

本版本需要最低.NET4.6且只支持X64系统!

这里高能,看仔
杰奇cms3.0专用采集器 关关采集器V5.4版

此版只支持杰奇3.0!此版只支持杰奇3.0!此版只支持杰奇3.0
      
      本版本需要最低.NET4.6且只支持X64系统!

      这里高能,看仔细:一旦发现任何方式外流PHP程序及采集器,一刀全切,大家都玩完!一旦发现任何方式外流PHP程序及采集器,一刀全切,大家都玩完!一旦发现任何方式外流PHP程序及采集器,一刀全切,大家都玩完!

      /cms/configs/article/sort.php请严格按如下格式编写,且必须和采集器分类一一对应!
      $jieqiSort['article'][1] 中的1为大类ID,不能为空,不能为负数
      code为分类拼音,不能为空
      caption为大类名,不能为空
      group为男女频道ID:1男生,2女生,不能为空,不能为负数
      types大类下面的小类数组,一个数对应一个小类,不能为负数,不能为空
      以上必须和采集器100%对应!必须和采集器100%对应!必须和采集器100%对应!
      SORT.PHP具体格式如下:(举例一条)
      $jieqiSort['article'][1] = array('code' => 'xuanhuan', 'caption' => '玄幻小说','group' => '1','types' => array('113'=>'异能修真','114'=>'仙侠情缘','115'=>'妖精鬼怪','116'=>'西方魔幻','117'=>'随身空间','118'=>'未来幻想','119'=>'玄幻奇幻','142' =>'东方玄幻','143' =>'魔法校园','144' =>'王朝争霸','145' =>'西方奇幻','146' =>'异世大陆','147' =>'远古神话'));

    2019年11月26日 v5.4
     1.增加章节表字段“summary”一键置空功能(不是清空章节表,只是将“jieqi_article_chapter”的预览字段“summary”置空,仅杰奇1.8及以上版本有此字段,1.7及以下请不要执行),具体在 ”设置“->”系统设置“->”生成设置“->”清空章节预览字段“ 点击执行!
     2.修正V5.3一个严重BUG,可能会造成章节表数据错乱!
    2019年11月26日 v5.3
     1.本版本开始需要最低.NET4.6且只支持X64系统!
     2.手动模式增加列出目标站的章节ID,以及本站的章节ID和字数,以便快速查看该章节是不是空章节,以及对方站对应的章节,快速修正!
    2019年11月25日 v5.2
     1.因杰奇1.8及以上版本默认将入库章节内容预览的TXT,会增加章节表的体积增长,现在可以在 ”设置“->”系统设置“->”生成设置“->”是否入库章节预览内容“ 自定义开关,开启后将入库章节的预览内容,章节表字段“summary”将增加TXT文本前100-150个汉字,会增加章节表的体积,仅对杰奇1.8及以上版本有用,默认开启入库,杰奇1.7请取消选择
    2019年11月11日 v5.1
     1.修复因单引号 ‘ 引起的严重错误"SQL logic error or missing database......",会中断采集,并跳出错误窗口,强烈建议更新,这个问题从采集器发布开始就有,一直未能找到原因,今天终于解恨干掉了!可恶之及
     2.空章节出现“请求失败”而中断采集的修复,现按采集设定是“入库章节名”还是“跳过本章"或者“停止本书更新”,自行设置
     3.修复因V5.0.0.6版本的一个小BUG引起的无法采集封面

    2019年10月31日 v5.0.0.5
     配置必须更改,否则产生错误请自行解决!切记!切记!切记!
      1.配置生成路径:设置-->系统设置-->生成设置
        目录和内容路径:
          这里写章节目录及章节内容静态文件存放的硬盘文件夹
          如:D:\www.jieqi.com\files\article\html
          注意:如果使用程序/configs/article/configs.php中的配置这里请留空
          不留空生成的内容就在这里,切记!切记!切记!
        目录和内容地址:
          这里写章节目录及章节内容访问的静态根URL地址
          如:https://www.jieqi.com/files/article/html
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空调用的URL就是这里的,切记!切记!切记!
        全文阅读路径:
          这里写全文阅读静态文件存放的硬盘文件夹
          如:D:\www.jieqi.com\files\article\fullhtml
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空生成的内容就在这里,切记!切记!切记!
        全文阅读地址:
          这里写全文阅读访问的静态根URL地址
          如:https://www.jieqi.com/files/article/fullhtml
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空调用的URL就是这里的,切记!切记!切记!
        OPF和TXT路径:
          这里写OPF及TXT文件存放的硬盘文件夹
          如:D:\www.jieqi.com\files\article\txt
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空生成的内容就在这里,切记!切记!切记!
        OPF和TXT地址:
          这里请写OPF及TXT访问的根URL地址
          如:https://www.jieqi.com/files/article/txt
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空调用的URL就是这里的,切记!切记!切记!
        图片章节路径:
          这里写图片章节附件文件存放的硬盘文件夹
          如:D:\www.jieqi.com\files\article\attachment
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空生成的内容就在这里,切记!切记!切记!
        图片章节地址:
          这里写图片章节附件访问的根URL地址
          如:https://www.jieqi.com/files/article/attachment
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空调用的URL就是这里的,切记!切记!切记!
        封面路径:
          这里写封面文件存放的硬盘文件夹
          如:D:\www.jieqi.com\files\article\cover
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空生成的内容就在这里,切记!切记!切记!
        封面地址:
          这里写访问封面的根URL地址
          如:https://www.jieqi.com/files/article/cover
          注意:如果用程序/configs/article/configs.php中的配置这里请留空
          不留空调用的URL就是这里的,切记!切记!切记!
==================以上部分请认真更改!或者清空后保存==============================
     2.增加规则的多编码功能,以便采集一站多编码的变态行为!
        规则-->采集规则管理器-->载入规则测试后保存,旧规则必须载入重新保存一下!
         GetSiteCharset:全站默认编码(必填,不可留空)
         NovelCharset:  简介页编码编码(可以留空,留空调用全站默认编码)
         IndexCharset:  章节目录列表编码(可以留空,留空调用全站默认编码)
         ContenCharset: 内容页编码(可以留空,留空调用全站默认编码)
         TextCharset:   真实内容页编码编码(可以留空,留空调用全站默认编码)
     3.优化章节名对比部分,以提高对比精准度


    2019年10月25日23:00
     1、修复日志记录格式,如果要用到超级修复功能必须更新,否则会出现SQL logic error or missing database no such column: ERROROK错误,虽然不影响,但是很讨厌
    2019年10月20日
     1、开放超级修复功能,按日志循环修复,测试后确定功能牛逼的不要不要的,可以彻底解放双手,坐等流量来,其他时间爱干啥干啥!比如:3P去、双飞、大宝剑等
     2、规则测试中加入源码和入库时的效果对比,可以看到是不是心目中的入库效果!

    2019年10月19日
     1、采集时对Unicode解码,直接转换为明文!
     2、修正采集时因无男女频道及分类造成的参数错误而不采集!现在无视,强制对应到默认分类中!

    2019年10月7日
     1、国庆假最后一天修正杰奇2.4生成HTML的一处BUG
     2、杰奇2.4目录页生成时的字数调用标签的增加
     3、手动模式下删除本地章节的一处细节调整

=======================以上开始只是BUG的修正,功能无增加=======================

    2019年10月4日
     里程碑的更新,支持章节目录的分页采集,从此可以告别外挂的痛苦,SO,版本号定格V5.0,以后专注研究PHP周边及大健康
     1、PubIndexUrlPagekey:获取小说目录页的分页编码的正则
     2、PubIndexUrlPage:分页目录组合URL
     3、开启目录分页采集会减低生产效率,不想降低生产效率该如何解决?简单,以上两个规则空着,自己外挂即可!
     4、采集器写到这里,该有的不该有的都写了,那么就此定格版,够用就好!

          青山不改,绿水长流,有缘江湖再见或者再也不见!
          最后祝大家流量一天十翻,10天过百万,100天收购李彦宏!

    2019/10/03
     1、更改自动采集模式下索引的对比方式,不管是全本还是连载均会对比!
     2、更改10月2日的规则“PubChapter_GetSkip”跳过章节开头几个章节数的判断方式,可以留空表示不跳过,如需要跳过请按实际填写对应数字,如:9
    2019/10/02
     1、增加规则中加入跳过前几章不采,不跳过请写0,不能为空,切记切记!(此判断已经于2019年10月3日更新判断,可以留空)
    2019/10/01
     1、首先祝大家节日快乐,祖国繁荣昌盛!
     2、修正分页采集,采集多页更快乐!具体格式:
           PubContentPageUrl为分页URL,如:hrrps://www.abcd.com/book/{NovelKey/1000}/{NovelKey}/{NovelPubKey}_{Page}.html
           PubContentPageKey分页结束的标识,如:下一章、或者 >下一章<
    2019/09/28
     1、注意请安装.NET4.5以上!
     2、支持3.0的原生TXT、封面、图片章节等附件路径,当然也可以自定义!
     3、3.0读取的的sort.php及config.php文件在"/cms/configs/article/"文件夹里,sort.php写法同2.4一样,只是统一顺序问题,内容是一样,注意:CODE的值不能为空!
     4、3.0在"系统设置=>本地网站目录”时,请指向同public和CMS文件夹同级目录即可!
     5、3.0的TXT文件默认放在 "storage/data"下属的子目录中,封面、HTML静态文件、章节附件默认放在“storage/files"下属的子目录中!
    2019/09/27
     1、去掉关闭时可选最下化到右下角功能!
     2、修正配置文件引起的“索引超出了数组界限”的BUG,这是一个很讨厌的BUG,真的很讨厌!
     3、修正1.8入库时因个别字段没有不能采集的BUG!
    2019/09/25
     1、修正几处BUG!
    2019/09/24
     1、重新启用"清理无用html页面"和”清理无用txt文本文件“,在标准模式->高级修复里开启或关闭!
     2、修正多处读取和写入TXT及HTML时因编码不正确导致的乱码BUG!
    2019/09/23
     1、无聊弄了个最小化到右下角的功能,点关闭按钮会提示是最小化到右下角还是退出采集器,一是为了避免误点关闭,二是为可以节省任务栏,点右下角图标会自动还原窗口,就像QQ一样的可爱,可直接在状态栏双击书本图标快速打开和最小化窗口!
    2019/09/21
     1、自动采集索引对比优化,开启自动修复后,连载状态的内容改变任意章节均会自动修正,不再全部索引遍历,只要章节大于1的任意位置,对比不上就直接开始替换!
    2019/09/16
     1、修正手动模式下时间显示不正确的BUG!
     2、调整部分页面布局,适应自动缩放!
    2019/09/08
     1、修正杰奇1.7版只能入库新书不能更新已有小说的BUG!
     2、修正替换章节文本编码不正确的BUG!
    2019/09/07
     1、修正杰奇1.7版入库时字数不正确BUG!
     2、杰奇1.7自动采集生成OPF时进行格式化处理,更易读!
    2019/09/05
     1、修正杰奇1.7版保存TXT和OPF时依旧为UTF-8编码问题
     2、修正杰奇1.7书名拼音问题,采用同1.8以上版本相同的拼音字段articlecode,请在设置里生成拼音化,否则将不能采集
    2019/09/01
     1、说好的不更新了,手贱更新一下
     2、增加网站编码定义,可通吃GBK及UTF8
     3、更改章节自动修复的索引对比方式,理论上是更友好,更高效
     4、去掉部分无用功能
     5、若干小BUG修正
     6、增加生成HTML的内链功能
    2019/08/06
     1、.net必须为V4.0以上,不是4.0请自行安装X64,不支持WINDOWS2008以下版本
     2、修复若干小BUG,当然还是有BUG
     3、支持jieqiv1.X-3.X版本,当然是UTF8(UTF8,UTF8,UTF8,说三遍)包括TXT及OPF均已生成为UTF8,已抛弃GBK,系统只测试了V2.3及2.4
     4、MYSQL组件的更新,是为了支持MYSQL编码集utf8mb4
     5、原生杰奇标签更友好
     6、此版为终版,不再更新不再修复BUG,至于功能也不增加了
     7、JieQiv2.4开始字数标签为{?$words?},及相关的有多处改动标签,自行查手册
     8、工具只限个别内部流通
     9、建议配合开源杰奇2.4UTF8版使用,配上PHP7.3+OPCache+MemCache,感觉人生从此达到了巅峰
     ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
     由于1.8以后版本的目录页判断比较多没有一一判断所以用的时候把代码按以下格式来写(仅供参考,自行测试)
        {?section name=i loop=$chapterrows?}{?if $chapterrows[i].chaptertype > 0?}{?if $i['order'] > 1?}
        </UL>
        </DIV>{?/if?}
        <DIV class=dirtitone><H2>{?$chapterrows[i].chaptername?}</H2></div>{?if $i['order'] < $i['count']?}
        <DIV class="clearfix dirconone">
        <UL>{?/if?}{?else?}{?if $i['order'] == 1?}
        <DIV class="clearfix dirconone">
        <UL>{?/if?}
        <li class="chapter"><a href="{?$chapterrows[i].url_chapter?}" title="{?$chapterrows[i].lastupdate|date:'Y-m-d H:i'?}更新,共{?$chapterrows[i].size_c?}字">{?$chapterrows[i].chaptername?}</a></li>{?if $i['order'] == $i['count']?}
        </UL>
        </DIV>{?/if?}{?/if?}
        {?/section?} 


软件界面

测试规则

可以直接看发布后样式