搜索引擎进行信息检索的优化策略方法(网络信息检索过程中的常用方法及技巧如下)
优采云 发布时间: 2021-10-05 14:09搜索引擎进行信息检索的优化策略方法(网络信息检索过程中的常用方法及技巧如下)
互联网上蕴藏着丰富的医疗信息资源,而且信息资源随时都在变化和更新。如何找出所需的医学信息并将其应用于临床、教学和科研,是21世纪每一位医务人员急需了解和掌握的课题。为减少或避免新手在信息检索过程中走弯路,加快获取信息的步伐,本文将网络信息检索过程中常用的方法和技术介绍如下:
一、 如何进行网络信息检索
1、选择特定主题并确认关键词
1.1 以陈述句或疑问句的形式写下您要搜索的主题,并确定关键词或短语。例如:美国的营养食品标签要求是什么?
1.2 将您认为最重要的概念设置为搜索关键词。注意搜索词的同义词、单复数、拼写变化、词尾差异等。例如:(食品标签或食品标签或食品标签)(必需或要求或要求或规则或法规或指南或指南)(营养或营养)
1.3 确定收录搜索主题的广泛类别,这对于应用分类方法搜索信息很有用。例如:商业--公司--食品或科学营养
1.4 选择可能收录搜索主题的组织或机构。应用搜索引擎获取该地址,然后浏览或检索该网站。示例:FDA(美国食品和药物管理局)
2、选择合适的搜索引擎
搜索引擎按搜索方式可分为全文搜索引擎和多搜索引擎三类(见表一)。搜索界面是否允许应用布尔符号、截词、自然语言或仅单词搜索?搜索结果只有标题和网址?是否包括整个网页、部分网页和/或新闻讨论组地址?这些都是影响搜索引擎选择、大小、速度、帮助性能的重要因素以及搜索结果的显示方式也会影响你的选择(见表二)。另外,可以根据查询信息的类型选择对应的站点类型,比如查询URL的HotBot,以及WhoWhere ? 用于查询名称(见表 三))。
3、选择合适的搜索方式
确定搜索引擎后,下一步就是使用哪种方法来实现搜索过程。下面推荐几种不错的检索方法,以便成功检索到您需要的文档。
3.1 多引擎搜索:是信息检索的首选。它同时搜索多个独立引擎并将结果显示在同一页面上。检索过程通过关键词和一些常用的操作符完成。多引擎的应用加快了整个检索过程,返回的无关站点相对较少是其优点。缺点是有时在进行复杂搜索时无法有效执行,可能会产生一些奇怪的结果。代表性站点是 Inference Find 和 Metacrawler
3.2 关键词 检索:当您要查找特定信息或引擎数据库较大时,可以使用关键词 查询数据库以获得更满意的结果。由于此类搜索引擎使用机器人(即计算机程序)随时在互联网上巡逻,检索符合条件的网页并将其存储在其数据库中,因此数据库更新快,搜索结果是新的。缺点是对数据库中内容的索引有时不准确,这往往会给查找所需信息带来困难。
3.3 分类搜索:适用于搜索分类清晰的信息。它是一个分层的主题目录,可以进行搜索和查询。它将不同学科、专业、行业和地区的信息以分类或主题的方式通过超文本链接进行组织。这些主题目录一般分为大类下的几个子类。将类别按层次系统排列,然后手动连接采集的网页。用户逐层点击主题目录,直到找到他们需要的信息。由于人工筛选和系统组织,搜索结果质量高且有条理。缺点是采集信息的速度远远落后于网络资源的增长。数据库通常很小,检索的文档数量有限。代表站点是 Yahoo! 和信息搜索。
3.4个类别目录加关键词联合搜索:当你在犹豫是用类别搜索好还是关键词搜索好时,应用类别目录加关键词联合搜索你最好选择。一般先找到所需信息的窄类别,然后在目录中应用关键词搜索。例如,要在 Yahoo! 上搜索有关儿科肿瘤的信息,您可以单击 Yahoo! 中的 Health。首页逐层直到小儿科,然后在该页面的查询框中输入关键词oncology 查找相关信息。这种方法的优点是搜索范围更窄,结果更准确有效。但是,对于较难的检索,选择合适的关键词并不容易,这是它的缺点。
4. 如何对待搜索结果
有时搜索结果并不令人满意,要么太多,要么太少,或者找不到相关信息。如果遇到这些问题,可以尝试以下对策。
4.1 您只能阅读搜索结果中的前几条信息。因为大多数搜索引擎会首先列出最符合要求的网页,虽然返回了数千个搜索结果,但需要的网页网址往往是第一页。
4.2 缩小搜索范围。当返回的网页过多,而您需要的网页不在前几页时,您可以通过更改关键词,更改搜索范围,使用逻辑AND和引号来缩小搜索范围。
4.3 网页的对策无法找到。首先检查拼写错误,然后查看搜索关键词是否有任何矛盾。如果还是不能搜索成功,可以换一个搜索引擎,可能会得到你想要的结果。虽然每个搜索工具的功能大致相同,但检索方法和信息拥有的侧重点不同。
4.4 如果使用上述策略仍然找不到您需要的网页,请不要太失望。您可以链接到类似的网页,您也许可以找到一个指向您理想目的地的链接,或者您可以直接向搜索到的主页管理员写电子邮件寻求帮助。
二、搜索技巧
大多数情况下,如果你有一个好的搜索策略,正确应用布尔逻辑符号,熟悉各个搜索引擎的特点,你就能得到一个好的搜索结果。此外,在某些情况下,可以使用其他技术来改进搜索结果。这些技术适用于表 2 中的大多数引擎。
2.1 Ctrl-F:用搜索引擎检索到需要的文档并连接到相关网页后,有时会发现当前视野中没有出现想要的文档。这可能是因为文件存储在当前页面的底部。一种快速的方法是按 Ctrl-F 在当前页面上查找文件。
2.2 标记您的搜索结果:如果将来可以重复当前搜索,请标记您的结果。
2.3 右切网址:通常一个搜索过程会返回很多文档网址,例如:搜索“Okanagan University College Library”时,不仅返回OUC图书馆主页(),还返回短语“Okanagan University”“College Library”很多网页(如)。与其一一点击每个网址去寻找你需要的文件,不如在预测文件可能出现的地方截掉网址,直接在浏览器的地址栏中输入。同样,当你得到一个很长的 URL 无法连接时,尝试正确的剪切方法,依次删除前对角 URL 的最后一部分,直到连接成功。连接成功后,查看当前页面,发现您要查找的文件名和路径可能会发生变化。
2.4 猜测站点的网址:要猜测某个站点的网址,首先要了解网址的基本组成。通过我们对URL知识的积累和对某些平台的票证状态的了解,我们通常可以“创建”这样一个主页URL。例如,假设您不知道 CCTV 的 URL。根据URL命名的常识,猜测可能是或。结果,两者都成功连接。
当然,我这里列出的信息检索方法只是冰山一角,还有很多甚至更好的方法需要探索。但是方法还不够,更重要的是实际上网查资料。相信在不久的将来,还会有更多的网络信息检索高手出现。
表1 按搜索方式分类的常用搜索工具