搜索引擎优化毕业论文(化工物性数据网上查询系统和Web信息获取技术的差别)
优采云 发布时间: 2022-01-13 05:12搜索引擎优化毕业论文(化工物性数据网上查询系统和Web信息获取技术的差别)
【摘要】 随着化工专业数据库多年的建设,互联网上已经有很多化工行业从业人员和研究人员可以查询的数据网站。但是这些网站一般不能提供全面的化学数据,格式也相差很大。现有的搜索引擎技术是面向链接分析的网络爬取和全文分析系统,不能很好地找到网页背后的数据库中的信息。面向专业的基于主题的搜索引擎已经开始研究如何更好地获取这些数据。本文介绍了搜索引擎技术的历史、工作原理、新技术、专业领域的数据库搜索引擎及其面临的挑战,提出页面分析与数据提取技术和主动Web信息获取技术。利用Java和Oracle 9i数据库构建化学物理数据的数据采集和发布系统,利用搜索引擎技术中的蜘蛛技术和页面分析技术获取数据,利用XML的通用性进行转换和组织数据的存储。到本地数据库。针对页面分析和数据抽取过程中数据定位不准确的问题,提出一种基于站点内页面对比分析的Web数据抽取方法。页面数据块是在页面构建和块的基础上通过对比分析得到的,然后通过同结构多页比较和格式判断提取数据,最后将数据存入数据库。该系统实现了对互联网化学物理数据的高效准确数据提取。本系统通过J2EE技术和AXIS框架,建立了化学物性数据在线查询系统和Web Service系统,开发了化学物性发布系统。