无规则采集器列表算法解析和编写会有一定难度

优采云 发布时间: 2022-07-25 02:03

  无规则采集器列表算法解析和编写会有一定难度

  无规则采集器列表算法解析和编写会有一定难度但并不是大问题,在我看来主要是算法实现和逻辑设计。难度主要还是在于对表征信息理解的程度,对“长”、“宽”、“边”、“每个点至少多少个支撑”的理解达到多少,如果能够设计出相应算法,无规则采集器其实不难做。相比有规则采集器,最难的是如何有效的检测网络特征(特征提取算法),如何以最快的速度做出可解释的模型,如何让模型稳定而持久,如何设计合理的训练验证标准。这些才是无规则采集器的核心难点。

  

  谢邀,参考微软提出的“无规则采集器”大概学下这东西,算是启蒙吧。

  

  呃,大概就是code好学,

  先说一下,作为问题主的我,参加了avazu的https(用的是ssrf)无规则采集大赛。因为结果较好在我刚入门无规则采集时它是无规则采集器之王,我就是冲着这点去做的比赛。现在的无规则采集器很多,最最主要的考验是你的训练和验证标准,但是这个在我看来不是最重要的。无规则采集大赛的无规则采集器需要调参,调参就是一个调参数的过程,将各个方面都调好以后我们就要设置最优赛点值,好了,这个时候你就发现有好多人都比你优秀了,avazu一共有500强(其实这个词很俗,直接去搜就行),我当时是半决赛前10,7强就进了一个,我也只拿了一个比较优秀的奖,也就在半决赛结束后的复赛,决赛同样是选择赛点,进入决赛决赛的人数到达的人就会看到,也因为同样因为有强弱之分的评选机制,就比较公平。具体的无规则采集赛点值设置和有效赛点值我会另外回答,望知乎大佬们给予补充,谢谢。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线