输入关键字 抓取所有网页(关键字技巧1.精确匹配("、《》、加减号(+、-)、通配符)

优采云 发布时间: 2021-11-02 00:07

  输入关键字 抓取所有网页(关键字技巧1.精确匹配("、《》、加减号(+、-)、通配符)

  关键词技巧

  1.完全匹配(“”、“”)、加减号(+、-)、通配符(*、?)

  双引号:如果要搜索完全收录几个单词的内容,加双引号""

  书名号:您要搜索的内容是一个完整的作品,如书籍、电影、音乐等,添加书名号以获得更准确的结果""

  加号:使用关键词前面的加号,相当于告诉搜索引擎该词必须出现在搜索结果页面上

  减号:在关键词前使用减号,表示关键词不能出现在查询结果中。比如debug.exe-csdn可以排除搜索下载资源时需要积分的csdn。

  通配符包括星号 (*) 和问号 (?)。前者意味着匹配的数量不受限制,而后者可以匹配的字符数量是有限的。它们主要用于英文搜索引擎。比如输入“computer*”,可以找到“computer,computers,computerised,computerized”这样的词,输入“comp?ter”,只能找到“computer, compater,competer”这样的词

  2.空格的使用,如果您需要搜索两个或多个关键内容,只需在关键词之间输入一个空格

  搜索引擎说明:

  1.文件类型搜索,计算机中的任何文件都收录名称、点和扩展名。此扩展名代表文件类型。一般图片格式为jpg、png等,记事本为txt,word文档为doc,pdf格式为pdf。这通常用于搜索在线论文。关键字文件类型:doc

  2.·inurl:限制搜索范围为url链接,在指定URL的网页上搜索;当它与站点不同时,inurl 可以是站点的一部分,更详细

  例如 inurl:gov 扬州

  3.intitle:搜索标题中收录关键词的页面(非网页内容);可以与双引号“”(英文)一起使用,表示标题是指定标题的网页,不能拆分。

  4.intext:要搜索文本中收录的内容,可以使用一组关键字。

  5.在网站中搜索有关关键词的信息。关键字站点:网站,将搜索范围限制在特定站点

  例如杀死一个 robin 站点:

  inurl(URL)、intitle(标题)、intext(内容,一组关键字)一起使用,可以找到大部分的东西。

  谷歌搜索引擎

  1. num 参数:num 的取值范围为 1 到 100,Google 搜索页面默认显示 10 个搜索结果。通过设置 URL 参数来调整显示的结果。末尾的 &num=100 表示一个页面上只显示 100 个搜索结果。

  2. lr 参数:指的是语言限制(语言限制),它限制了对某种语言的网页的搜索。如果 lr 参数为空,则搜索所有网页。例如,lr=lang_zh-CN|lang_zh-TW 搜索所有中文网页。语言代码可以在谷歌提供的语言文档中找到。

  3.cr 参数:表示国家限制,国家后两个字符需要大写。具体国家代码请查看GOOGLE提供的国家代码文档。

  4. hl 参数:表示宿主语言(界面语言),谷歌一般会根据你的地理位置帮你确定界面语言。例如,如果您使用日语代理服务器,Google 将显示日语。如果看不懂日文,希望如果改成英文或者中文,可以添加HL参数/search?q=vimperator&lr=lang_ja&cr=countryJP&hl=zh-CN,谷歌提供的hl参数语言代码文档。

  5. as_qdr 参数:as 表示高级搜索,qdr 表示查询日期范围,您可以在谷歌搜索中提供时间限制功能,例如“过去1周”,甚至自定义日期。

  例如as_qdr=m2表示过去两个月,as_qdr=y2表示过去两年,as_qdr=d2表示过去两天,w表示一周,s表示秒,n表示分钟,h表示小时。

  信息:域名

  可以获得网站的一些信息

  链接:网站网址

  通过这个,你可以看到网页做了哪些外部链接,更可以看到谁转载了你的文章和谁采集

  有关的:

  根据外部链接和页面标题查找

  缓存:

  谷歌将返回有关查询网页的所有抓取的快照信息。

  快速使用百度法

  1.设置浏览器中url地址栏的搜索引擎为百度

  

  2.alt+D 或 Ctrl+L 快速定位地址栏,输入你要百度的内容

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线