解决方案:人工智能建模时效性的核心的问题需要解决!!

优采云 发布时间: 2022-09-30 05:13

  解决方案:人工智能建模时效性的核心的问题需要解决!!

  文章采集成后,常用的是批量采集,并且只采集想要的数据。人工智能对采集速度的要求是非常高的,采集批量的数据不一定能很好的满足设备或者系统的响应,从而导致实际数据量并不是很大。还有采集成本大,再就是时效性的问题。人工智能采集还有一些核心的问题需要解决。

  

  用人工智能做是可以的,例如云采集,像是solr或者shimo这种存储性质的。电商数据必须要采集一个数据库,然后通过后台数据的展示进行抓取,目前来说云采集是最好的采集方式。另外需要额外提供些收费保障,例如对于采集网站的限制,例如账号等级或者时效性要求。当然,

  

  你既然要分析这个问题,说明你已经有了人工智能建模的入门知识了。人工智能建模肯定需要一个数据库来支撑。这是一个辅助和补充知识的存在。我们平时需要抓取某商品详情页面的数据,我们抓取的方式是,每抓取一个网页中的某一个商品,然后通过推荐一个相似商品来过滤掉不想要的商品。这种情况下,我们只需要一个商品名,因为有重复,也可以抓取成功。

  那么这种情况下数据库中的商品信息,就是一个词汇表,你抓取这个词汇表中的某个商品,然后我们对这个商品进行再次推荐。对于你的问题,我觉得你也不必再自己建立数据库了,找到分析的数据,写个脚本把他爬下来,也可以得到对于想要找到的信息的截图。数据质量你也可以控制。这样每个网页都可以覆盖了。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线