c 抓取网页数据(保定师范专科学校学报.4第17卷第4期)

优采云 发布时间: 2022-03-16 17:12

  c 抓取网页数据(保定师范专科学校学报.4第17卷第4期)

<p>2004年10月保定师范学院学报0ct。20040FBAODINGTEACHERSVol17No. 4 第17卷第4期 JOURNALCOLLEGE文章 No.: 1008.4584 (2004)04-0015-03 使用MSHTML组件从网页中提取数据 卢书金 (河北保定师范学院教育信息技术系)保定071051)摘录关键词:HTML语言;MSHTML对象模型;网页分类号:TP311.1 文档识别码:A 1 问题提出随着互联网的发展,数据和存在有信息的人越来越多,通常只需要在浏览的网页上保存或记录部分数据即可,其他情况下,为了更好地分析研究数据,就需要用编程的方法把网页上的网页。例如,科学家需要从发布天气预报的网站获取气象数据以供研究;金融和经济工作者需要跟踪和记录股票和汇率的变化;需要根据关键词搜索网页,分析链接等。所有这些应用都涉及到网页数据的分析和提取。2 网页结构 要分析网页上的内容和数据,首先要了解网页的结构。互联网由无数相互链接的网页组成。这些页面也称为Web文档,由HTML(HyperMarkup也收录要显示的图形、声音等元素,以及指向其他文档的超链接)组成。控制语句是由一些标签(Tag)组成,用于描述显示内容的形式,负责客户端和服务器之间的信息交换。标签用◇括起来,经常成对出*敏*感*词*(1967一),男,河北省唐县人,实验员·16·保定杂志社师范学院,2004年第4期(2)超链接:使用、定义、指定超链接的目标uRL;(

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线