采集的文章内容不能直接发布(发布失败常见问题汇总(二):发内容--WEB发布错误 )
优采云 发布时间: 2022-01-13 19:35采集的文章内容不能直接发布(发布失败常见问题汇总(二):发内容--WEB发布错误
)
发布失败常见问题汇总
1.在发布配置中,列表无法刷新,老是提示“格式不匹配”?
答:有很多原因。请依次确认。登录成功后,请开启查看返回码功能。比如你刷新列表的页面,登录后才能访问,必须先登录网站。检查登录cookie是否正确;二、你可能选错了模块,网站系统的不同版本或模块一般不通用,请使用对应版本的模块;第三可能是你的 网站 和默认的模块刷新列表页面有区别。例如,模块以默认样式制作,而您已更改为另一种样式。修改请参考模块开发相关手册,或使用‘使用自定义分类参数’;4.
2.发布内容--WEB发布错误,请查看返回码,采集内容重复发布,说明发布成功未知?
答:出现类似这样的错误:Content--WEB发布错误,请查看返回码:File:///E:\Documents and Settings\Administrator\Desktop\2008 Standard Edition\Data\1-admin5-seo\网络错误。日志。请记住打开此日志文件。看看里面返回了什么代码。
如果返回代码为空,则它可能发布得太快,以至于您的服务器无法响应并且没有返回任何字符。这时候可能发布成功,也可能发布失败。详情请查看网站。如何处理?请修改发布速度(问题3)。不要太短,主要以发布成功为前提。
如果返回码不为空,并且显示表示已经成功,那么请在网站上查看是否成功:如果成功,则说明模块中的成功返回值与是你的系统返回的,那么请修改模块中的成功标志为你系统的成功返回值。如果显示成功但实际上并不成功,可能是你提交的数据格式错误,你的程序没有报错,但是进入数据库失败。导致发布失败,那么需要仔细检查发布的代码是否有问题。;如果返回码显示不成功,请注意是什么问题,比如标题太长,没有关键字,或者其他问题。在这种情况下,
采集 的内容已经多次发表。一种可能是您选择了多种发布方法。请在“编辑任务”的“文件保存和高级设置”中设置“在哪里定义成功发布为成功”。还有一个原因是上次发布成功,但当时显示为未知。如果不再需要发布,可以将数据库中的所有记录更改为发布。
3.Discuz出现“您的请求不正确或验证字符串不匹配无法提交”:
答:这是discuz在发布的时候会发送一个formhash,这个值是在发布页面获取的。发生这种情况是因为获得的 formhash 不正确。请使用优采云内置浏览器登录查看源码,查找“formhash=”,然后修改在线发布模块,将其值替换为原发布中的【登录随机值1】模块(当然也可能是登录随机值X的值,与模块作者的使用有关)也可以自己修改模块,让程序正确获取formhash。
4.发在网站上,发现所有内容挤在一起,查了源码,发现空格少了?
答:有两种可能:一种是你制定规则时过滤了空格造成的;另一个是你的系统会过滤。在这种情况下,请在“内容发布设置”中选择“发布数据时的 UrlEncode 处理”。Wind新闻属于某些类别。
5.图片总是贴相对地址,不是远程地址?
A:请在标签编辑器中选择“完整的相对地址到绝对地址”。选择默认下载图片后,无需勾选此项。
6.发布测试成功,但实际发布显示成功却没有文章?
答:还有很多可能。一是你的模块的成功识别码不是唯一的,即发布成功和失败的识别码相同;必须先到网站的审核地址;第三,也可能是优采云的连续发帖数据被你的防火墙或者你服务器的防火墙屏蔽了,请关闭防火墙试试。另一个是登录信息无效。比如你的网站一段时间不操作会自动下线,距离实际发布还有相当长的时间。因此,获取的原创登录信息无效。
7.贴在我的论坛上,显示代码?
A:请在发布配置中选择UBB发布。一般discuz、phpwind等论坛都必须选择ubb发布。如需html发帖,请在后台开启相关海报的html发帖权限。
8.如何继续我上一个未完成的帖子?
A: 只需勾选任务栏中的“发布内容”复选框,程序就会发布来自采集的未发布数据。
9.文章 发布后发现有[tag: author] 和[tag: source] 之类的,怎么回事?
答:这是模块中的标签没有被替换。你做任务规则的时候没有做相应的标签,所以发布是这样的。您可以将模块中的相应文本修改为固定值或删除[tag:source]。你不需要标签。比如source=[tag:source],改成固定值如source=优采云采集器,直接删除delete source=[tag:source]。
10.找不到可发布的内容。
答:这是程序在本地数据库中找不到未标记为未发出的记录。在这种情况下,您已经发布了所有数据,或者您没有选择任务栏中的内容。
11.测试或发布时,“只能一个账号同时在线,或者你的账号已经被禁用”
A:这是因为网站系统不允许一个账号同时在线,比如英制。在这种情况下,建议您使用 采集 发布的专用帐户。请勿使用它登录 网站。
12.有时候明明已经正确获取了web cookie,但是测试还是没有登录?
答:一个是cookie过期的问题,另一个可能是我们的程序获取不正确(抱歉,目前程序无法正确获取所有cookie)。在这种情况下,建议您使用专业的抓包软件,比如WSockExpert,来抓取cookies,然后将抓取到的cookies填入程序保存cookies的地方。
13.如何设置发布速度?
A:请在“编辑任务”的“文件保存和高级设置”中设置采集和发布速度,时间单位为毫秒。
14.采集地址重复。
A:程序会保存采集页面的地址,如果已经采集,默认不去采集。如果需要重新采集,可以删除所有原任务地址库和本地采集的数据。如果您要采集的网页内容不断变化,可以选择不检测重复选项
15.论坛怎么改用户发帖,一个用户太假了?
答:如果您使用网络上在线发布的方式,那么程序发布就相当于手动发布。您不能同时登录多个帐户,因此该程序不能。要实现多账号发帖,需要修改原有的论坛程序,让他可以使用多个用户名发帖。discuz的随机发布界面是一个修改后的程序,使用不同的用户发布到自己的论坛。
14.测试URL采集是正常的,但是当真正的采集时漏掉很多。
A:程序默认会过滤掉重复的URL。如果一个 URL 已经在同一个站点下被获取,它不会转到 采集。
1 7.采集的数据入库后,显示很多问号?
答:这一般是入库时没有选对码造成的,请注意选码;