ASP采集-ASP采集程序原理

2009-05-12 15:24:08来源:未知 阅读 ()

新老客户大回馈,云服务器低至5折

采集程序的主要步骤如下:

一、获取被采集的页面的内容

二、从获取代码中提取所有用的数据

一、获取被采集的页面的内容

我目前所掌握的ASP常用获取被采集的页面的内容方法:

1、用serverXMLHTTP组件获取数据

以下内容为程序代码:

以下为引用的内容:
Function GetBody(weburl) 
    '创建对象
    Dim ObjXMLHTTP
    Set ObjXMLHTTP=Server.CreateObject("MSXML2.serverXMLHTTP")
    '请求文件,以异步形式
    ObjXMLHTTP.Open "GET",weburl,False
    ObjXMLHTTP.send
    While ObjXMLHTTP.readyState <> 4
        ObjXMLHTTP.waitForResponse 1000
    Wend
    '得到结果
     GetBody=ObjXMLHTTP.responseBody
    '释放对象
     Set ObjXMLHTTP=Nothing
End Function

调用方法:
GetBody(文件的URLf地址)


2、或XMLHTTP组件获取数据

以下内容为程序代码:

以下为引用的内容:

Function GetBody(weburl)  
    '创建对象
    Set Retrieval = CreateObject("Microsoft.XMLHTTP")
    With Retrieval
     .Open "Get", weburl, False, "", ""
     .Send
     GetBody = .ResponseBody
     End With
    '释放对象
    Set Retrieval = Nothing
End Function


调用方法:
GetBody(文件的URLf地址)


这样获取的数据内容还需要进行编码转换才可以使用

以下内容为程序代码:

以下为引用的内容:
Function BytesToBstr(body,Cset)
        dim objstream
        set objstream = Server.CreateObject("adodb.stream")
        objstream.Type = 1
        objstream.Mode =3
        objstream.Open
        objstream.Write body
        objstream.Position = 0
        objstream.Type = 2
        objstream.Charset = Cset
        BytesToBstr = objstream.ReadText
        objstream.Close
        set objstream = nothing
End Function

标签:

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有

上一篇:判断远程图片是否存在的asp技巧

下一篇:好用的asp防SQL注入代码