u采 采集(给出采集软件的任务地址库文件?保存任务库)
优采云 发布时间: 2021-10-07 23:00u采 采集(给出采集软件的任务地址库文件?保存任务库)
所以这里有一个临时解决方案:我使用的是 优采云采集器2010sp2 *敏*感*词*。
采集之后的商业版用户的URL存放在PageUrl目录中。一个task对应一个db3. 可以从最上面的task算到第一个,对应的就是Site_*。db3. 这样就可以先做备份,然后清空。到时候可以直接恢复用户名。如果您害怕犯错,请将其全部保存并稍后恢复。
如图:
如果要仔细看,这个db3其实是sqlite数据库格式的文件,可以使用db3数据库编辑器查看和修改。根据jobid,有朋友问我是不是不知道jobid怎么办。呵呵,大家可以去Data目录查看3-新浪国内新闻。新浪国内新闻背后的新浪国内新闻是您自定义的网站栏目名称。这对应于jobid。
如图:
最后,你备份完数据库后就可以了(需要备份PageUrl和Data目录下你的任务名对应的文件夹。最好都是以防万一,采集后覆盖即可.)
后来我也看到了网站下面的文件,和我的文章很相似。你可以参考一下。
优采云是一款不错的采集软件,“盗版也有办法”,就看你怎么用了。
Linker曾经偶尔研究过优采云采集软件,但从未购买过商业版。想想看,现在的版本和之前的1.x 和2.x 版本相差甚远。容易。
一哥昨晚给他讲了他的优采云采集软件(企业版,有钱人!),老是提示任务地址库重复。研究了一下,还是比较简单的,并告诉了他处理的方法,另外经过搜索,发现优采云的3.0 sp1版本有这个bug,任务地址库无法清除,但是管理员在sp2版本中已经解决了这个问题。
后来这位朋友问优采云采集软件的任务地址库是哪个文件?如何保存任务地址库?如何手动清理任务地址库文件?据Linker所知,编辑任务地址库需要商业版。如果要手动处理,可以发现手动地址库文件在优采云根目录下的pageurl目录下,每个task对应一个地址。库文件,mdb格式,打开就可以找到,具体地址是加密的。优采云 有些太商业了,嘿嘿!
既然知道了任务地址库的位置和文件,那么手动清理任务地址库自然就简单了。删除重复优采云(删除后编辑任务再保存),或者直接删除库中的记录。如果你想保存它用于其他任务,只需将其重新排序为其他任务的 id。
简单测试通过。脚本屋原创文章。