vb抓取网页内容( (宁贵银)的基本操作建议)
优采云 发布时间: 2021-09-22 23:29vb抓取网页内容(
(宁贵银)的基本操作建议)
VB获取所述网页的所有元素
2008-12-11 22:20
VB获取所述网页的所有元素
用于获取网页所有的元素都是简单:
DIM thehtml作为新HTMLDocument的
组thehtml = wb.document
“WB =的ActiveX web浏览器
“thehtml.all就是它!
...,所以得到的所有链接,很容易! :
DIM COLLLINK AS IHTMLELEMENT采集
获取所有链接
组colllicink = thehtml.all.tags( “a”)的
对于i = 0至CollLink.Length - 1
debug.print “链接” &安培; CSTR第(i + 1)&安培; “:” &安培; colllick(I)及vbnewline
下
我相信所有的HTML元素将被征服!
----------------------------------------------- ---------------------------- ---------------------- ---------------------------- -----
privateSub webbrowser1_documentcomplete(BYVAL PDISP AsoBject,URL AS VARIANT
的foreach sform在web浏览器1. Document.Links
列表1.的AddItem sform
下
端子
----------------------------------------------- ---------------------------- ---------------------- ----------------------------
私有子webbrowser1_documentcomplete(BYVAL PDISP AS对象,URL AS VARIANT
DIM X只要
对于x = 0到web浏览器1. Document.Links.LENGTH - 1
debug.print web浏览器1. Document.Links.Item(x)的
下一个x
“长度属性,则返回元件的数量浓缩元件
debug.print “再次” &安培;网页浏览器1. Document.Links.LENGTH& “链接”。
端子
----------------------------------------------- ---------------------------- ---------------------- ---------------------
Dimdtashtmldocument
SETD = web浏览器1.文献
me.caption = dt.getlementsBytagname( “标题”)(0) .innertext“显示文本信息
[CBM666捕获“网页手柄标题和URL]
具体:
私有子的Form_Load()
INET 1.执行 “你的URL”
端子
私有子inet1_statechanged(BYVAL国家作为整数
昏暗STMP作为字符串,SHTML AS STRING
如果状态= 12然后
做
的DoEvents
STMP = INET 1.的GetChunk(102 4)
如果LEN(STMP)= 0 THEN EXIT DO
SHTML = SHTML + STMP
环
文本1.文本= SHTML
结束时,如果
端子
此实现那么快。
如何让网页标题
用VB
几乎所有使用它来完成采集任务!贡献,非常简单的降
FunctionsTrcut(strContent,strstart,strend)asstring“通用截距功能
DimstrHTML,S1,S2ASSTRING
Dimstrstart,Strendastring
strHTML中= strcontent
OnenderResuMenext
S1 = INSTR(strHTML中,strStart + LEN(strStart)
S2 = InStr函数(S1,strHTML中,StrEnd)
strcut = MID(strHTML中,S1,S2-S 1)
endfunction可写
privateSubform_load()
Dimhunzi1,Hunzi2Asstring
hunzi1 = “thisistry”
hunzi2 = strcut(hunzi1, “”“)
msgboxhunzi2
endsub