搜索引擎进行信息检索的优化策略方法(信息和信息检索的概念,检索的策略以及常用的技巧)

优采云 发布时间: 2021-10-26 19:29

  搜索引擎进行信息检索的优化策略方法(信息和信息检索的概念,检索的策略以及常用的技巧)

  原创:勤学好学,勤学思行

  在我的工作中,同事经常提到我擅长检索信息,尤其是与专业相关的信息。我没有很多高级检索技巧,但我认为一些基本方法可能对您有所帮助。本文将分享,重点介绍信息和信息检索的概念、检索策略和常用技巧。

  1 什么是信息?

  克劳德·艾尔伍德·香农(Claude Elwood Shannon),信息论的创始人,他对信息的定义是:

  “信息是不确定性的解决方案。” 直译,它的意思是“信息被用来消除不确定性”。

  还是很难理解,什么是不确定性?它指的是具有这种可能性以及另一种可能性的事物。当信息很少时,你不知道各种可能性的比例。例如,让你猜测一个你完全不熟悉的城市的天气。没有历史数据和天气预报。估计只能学了。如果你告诉你这个城市过去10年的天气,你可以增加一些猜测的概率。, 并且如果您有更准确的天气预报,则可以增加您对猜测的信心。

  因此,另一方面,“信息用于增加确定性”。比如在一个产品开发中,如果你根本不了解底层原理,也没有任何经验,那么你可能会不断地经历各种尝试和错误。可能的解决方案,最后也可能找到解决方案,但是成本太高,不然下次就不行了,如果你知道过去的设计经验,那么你可以很快排除明显不合理的解决方案,如果你了解其背后的原理,甚至优化设计,可以进一步消除设计中的不确定性,从而增加成功的概率。

  你可能会说光有信息是不够的,知识是必要的。这就是语言的歧义。我理解在香农的定义中,信息是比较宽泛的,甚至可能没有具体的含义。同时,我们在日常生活中也经常会遇到类似的概念,比如数据、知识、智慧等等,它们之间有什么关系?我看到的一个更好的模型是 David MacCandless 在 2010 年提出的,它在组织和意义的递进关系中显示数据、信息、知识和智慧如下:

  

  在这个结构中,描述如下

  数据:分散的元素,如单词、数字、代码等;

  信息:产生某些联系的元素,如句子、方程、想法等;

  知识:有组织的信息,如概念结构、复杂的故事等;

  智慧:知识的应用,例如完成一个项目。

  从定义的角度来看,信息可以消除不确定性,那么它有什么目的,或者我们为什么要理解和应用它,我至少理解以下三个原因:

  ①信息和能源是理解人类科技和文明发展的两条主线。关于这个观点,推荐阅读吴军写的《全球科技史》,里面有详细的介绍。为什么没有“物质”?因为最新的物理学研究发现物质在自然界中也是能量,我目前无法解释清楚。

  ②信息是公司创造和传递价值的关键。这更容易理解。切屑的主要原料是沙子,但由于材料排列的不同,其价值发生了较大的变化。一辆全新的布加迪威龙跑车,新车非常昂贵,但经过强烈撞击,构成它的材料并没有太大变化,而且它的排列也发生了变化,导致价值大幅下降。

  ③信息处理是知识工作者的核心能力。我们在工作场所中的许多人实际上并不需要进行高强度的身心洞察力。我们的大部分工作本质上是对信息进行处理,将接收到的信息加工成成品或半成品,并在载体中进行传输。走出去构成了一定的价值创造环节,我们的信息处理能力很大程度上决定了我们这个环节能够创造的价值。

  2 为什么要掌握信息检索?

  在我看来,我们需要掌握信息检索方法的原因有以下三个。

  首先,随着时间的发展,我们这个星球上的信息量越来越大,无论是书籍、论文、网页,甚至是视频内容,都呈指数级增长,无法穷尽;其次,我们在中国遇到的99%的工作和生活问题都是人们遇到过的,甚至是总结出来的。它们对我们很有价值。最后,如何从海量信息中找到对我们有帮助的工具和方法。

  基于以上考虑,我们只需要掌握初步的搜索方法(我在本文中介绍的)就可以解决大部分问题。而生活中有些人认为,即使遇到问题也很难解决,或者直接问别人答案,却不知道身边总有一位学识渊博的老师。这就像坐在一个装满黄金的盒子上乞讨。

  3 如何搜索?

  检索的基本方法是什么?我总结为下图。通过设计一个收录关键词和运算符两部分的搜索公式,我们可以从大量的信息(信息源)中过滤出我们想要的信息。当然,通过对结果的评估,我们可能需要不断修改我们搜索的数据库和我们的搜索公式。

  3.1选择信息源

  搜索源决定了我们可以获得我们想要的信息的基本概率。比如你想找一些权威的研究论文,那你可能不会去微信找,而如果你想知道附近哪个地方更好吃,你可能就得不到所谓的专利网站,对吧?虽然这是一个极端的例子,但我想说的是,我们必须在正确的地方找到东西。根据信息来源的类型,我将其分为以下几类:

  

  ①研究,如专业期刊、专利网站等,每个行业都有自己的专业期刊,期刊有专门的论文检索方法;

  ②通用类,谷歌、必应、百度等搜索工具背后的信息量很大,并且自带一些不错的搜索方式。后面我要介绍的搜索方式主要是基于这三个搜索引擎。

  ③生活方式,比如各种生活类APP等~

  3.2 构建搜索查询-关键词

  我选择了正确的来源并成功了 1/3。下一步就是用什么样的关键词来搜索,所谓的关键词和你要检索的内容很相关,有实质意义不建议用句子搜索. 虽然现在智能算法经常能识别出你的意思,但很容易带来很多噪音。如何确定关键词以保证结果尽可能准确和全面?有几个原则:

  ①关键词通常具有较高的“专一性”和“指向性”,这意味着它与普通词的区分度很高。对于一些你比较陌生的领域,你不知道该用哪个词。您可以先找到相关内容,然后从其标题和摘要中提取。

  ②注意关键词的类似表达。例如,对于我的专业 - 声学,我可能会使用 Sound、Acoustic、Sonic、Audio...,

  ③关键词不限于文字,还有图片和声音。

  3.3 构建搜索查询运算符

  确定了关键词(可能是几个),第三步就是通过算子把这些关键词组合起来,提高检索的准确率和效果。有很多运营商。下面我就给大家介绍5个常用的,发现有效的。

  ①布尔运算-AND/OR/NOT

  这是最常用的功能,也是所有搜索引擎和检索系统都会有的功能。其含义如下表所示。

  

  ②完全收录——“”

  如果你想让某个段落在搜索结果中“完全重现”,就加双引号。请注意,在大多数情况下,英文需要双引号。

  ③文档类型-文件类型

  如果要直接查找相关文档,这个非常有效。它也是我查找专业文档最常用的工具。我经常使用文件类型:pdf,所以我找到的都是PDF。

  ④标题收录-intitle:

  如果您想在标题中收录您的 关键词,您可以使用 intitle 找到与您的 关键词 更接近的主题。

  ⑤网站-站点:

  如果你想在特定的网站中搜索,你可以使用网站,比如新浪新闻

  

  这些只是我经常使用的一些,如果你想了解更多的搜索方法,提高你的搜索技巧,可以在搜索中输入如何搜索。这种获取更多搜索技巧的方式也是一种实现

  “教人钓鱼不如教人钓鱼。” 对于特定的检索,例如专利和论文,还有更多系列的检索技术。有兴趣的可以具体学习。

  总结

  以上就是今天想和大家分享的一些基本的检索方法。我希望它会对你有所帮助。如果想掌握更深入的方法,可以自行搜索。同时,在检索中还有以下提示:

  1 其实你遇到的99%的问题都是人遇到过的,而且很多都很好的解决了,身边也一直有这样一位知识渊博的老师,你可以多咨询他;

  2 在这个时代,你很幸运。如果你想知道什么,你总是可以通过搜索引擎找到相关信息;

  3、能用搜索引擎解决的问题,尽量少问别人;

  4 检索结果只是开始。检索的目的是答疑解惑。这是我们的最终目标;

  5 也可以创建信息,让别人检索,给别人提供价值,比如我现在写的文章。如果对你有点帮助,那就值得了。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线