摘要:隨著Web技術的發(fā)展,越來越多的信息需要通過異步Web傳輸來獲取,提出一種基于Msxml2的異步信息搜索方法,通過采集Web偵聽頁,分析XML信息結構,達到信息傳送的目的。
關鍵詞:Msxml2;request;ActiveXObject;偵聽頁
1 引言
XmlHttp2.0提供客戶端同http服務器異步通訊協(xié)議,客戶端可通過Msxml2對象向Web服務器發(fā)送請求并使用文檔對象模型DOM處理同應,且所有通訊都可在后臺進行,擴展了Web的信息處理能力。
2 Msxml2對象特色技術
Msxml2(或XmlHttp)對象屬于ActiveX,使用Msxml2.XmlHttp方式創(chuàng)建,可注冊一個函數(shù)給XmlHttp對象的on-readystatechange方法,該對象的open方法可發(fā)出Http請求,對象的Send方法可自動調用所注冊的函數(shù)。
2.1 使用XmlHttp抓取目標地址的Web頁面
頁面分析的GetBody函數(shù)通過XmlHttp組件可后臺獲取目標地址Web頁的內容,這種方式獲得的Web頁面結構可被應用系統(tǒng)后臺分析。
2.2 字符轉換
后臺獲取的Web數(shù)據(jù)往往有亂碼現(xiàn)象,可以使用Adodb.Stream對其進行二進制處理,SaveToFile(FileName)方法可將數(shù)據(jù)存入文件;Object.LoadFromFile(FileName)方法可以從文件中讀取數(shù)據(jù);Object.Write(Data,[Options])將指定的文本數(shù)據(jù)裝入對象中;Object.ReadText(NumChars)讀取指定長度的文本及參數(shù)說明:NumChars指定要讀取的字符串長度,未指定則讀取全部數(shù)據(jù)。
2.3 后臺頁面保存
后臺網(wǎng)頁的內容可以作為Msxml2.XmlHttp對象的Re-sponse屬性返回,意味著可以使用FileSystem對象將頁面的內容保存到文件中,例如:
保存后文檔的格式可能與網(wǎng)頁的格式不同,這取決于所使用樣式表的格式。多數(shù)情況下,即使格式有點缺漏,頁面也可按文本方式讀取。
2.4 跨域訪問
跨域訪問就是A網(wǎng)站的JavaScript代碼試圖訪問B網(wǎng)站,包括提交內容和獲取內容。由于安全原因,直接跨域訪問是被瀏覽器所禁止的,可以使用StreamReader對象后臺獲取。
3 XML信息控制
IE客戶端可通過JavaSeript命令將XML命令控制文件通過后臺發(fā)送給Web偵聽頁,并獲得信息反饋。邏輯過程是:(JS)應用->偵聽頁->ActiveX控件,ActiveX控件->偵聽頁->客戶端(JS)接收,如圖1所示。
IE客戶端發(fā)出“XML命令”的JavaScript命令典型過程:
在IE客戶端,可以不用XML格式命令而使用普通文件構造指令,但使用XML格式容易解析指令及其參數(shù),例如“Open”函數(shù)的“Xml_receive.a(chǎn)sp”網(wǎng)頁被稱為偵聽頁;第3個參數(shù)決定是否異步執(zhí)行;還可以再加上用戶名和口令兩個參數(shù),此時要求進行同步查詢,即IE窗口在完成查詢前只進行等待。
3.1 偵聽頁基本功能
IE客戶頁面提交查詢時,通過“偵聽頁”發(fā)出XML格式指令。由XmlHttp向WWW服務器請求交互,Web服務器即解釋該命令,并調用相應ActiveX控件,以XML字符串形式將查詢結果返回給IE端用戶。偵聽頁執(zhí)行的基本過程:[!--empirenews.page--]
(1)將查詢請求加載到XML DOM,并對指令及其參數(shù)進行解析。支持Java,Script的所有瀏覽器都支持文檔對象模型(DOM)。DOM涉及W3C標準文檔的對象模型,以樹形結構表示HTML和XML文檔,可以定義遍歷、檢查和修改樹節(jié)點的方法和屬性,如圖2所示。使用DOM技術可以解析XML文件中的查詢指令和參數(shù)(parameter),可以有多個參數(shù)。
(2)根據(jù)客戶要求,調用Active X控件的處理方法,執(zhí)行結果用XML字符串表示。創(chuàng)建Active X對象并調用預定的GetTitlesXML()方法,返回Pubs數(shù)據(jù)庫的查詢結果,結果用XML字符串方式返回。
(3)將返回結果加載到XML DOM并用Response對象返回給IE用戶。Response對象可將結果反饋給IE用戶。具體方法是使用XML DOM的Save方法返回結果。例如,下面的程序片段中,反饋信息為XML串:resuhsXML,它通過Response對象設置輸出流格式。
3.2 XML信息接收
IE客戶端一旦接收到返回結果,就將其加載到XMLDOM,并使用XML解析方式分析信息,以獲得相應的信息。先將XmlHttp的ResponseXML信息加載到XML DOM對象中。如果出錯,可以分析“偵聽頁”返回的出錯信息;如果正確,DOM里就有查詢結果,并可通過分析該XML文檔求得信息結果。另外XmlHttp還有responseText方法用于加載普通文件,但推薦使用XML文件格式。
3.3 XML_SQL查詢
對于預定的性能函數(shù)GetTitlesXML(),可以結合SQL命令加強功能,進行數(shù)據(jù)庫操作。例如,根據(jù)書籍的類型、價格和銷售日期等信息,由Form表單的信息組成SQL條件字句,在IE客戶端查詢書籍的代碼如下:
4 結語
總結了使用Msxml構件在客戶端和后臺Web服務器之間建立通訊聯(lián)系的基本環(huán)節(jié)的實現(xiàn)方法,給出用戶需要的ActiveX控件的部分方法和屬性。Msxml提高得整個Web應用系統(tǒng)的自制性能,這為進一步實現(xiàn)胖B/S應用奠定了技術基礎。
北京2022年10月18日 /美通社/ -- 10月14日,國際數(shù)據(jù)公司(IDC)發(fā)布《2022Q2中國軟件定義存儲及超融合市場研究報告》,報告顯示:2022年上半年浪潮超融合銷售額同比增長59.4%,近5倍于...
關鍵字: IDC BSP 數(shù)字化 數(shù)據(jù)中心要問機器人公司哪家強,波士頓動力絕對是其中的佼佼者。近來年該公司在機器人研發(fā)方面獲得的一些成果令人印象深刻,比如其開發(fā)的機器人會后空翻,自主爬樓梯等。這不,波士頓動力又發(fā)布了其機器人組團跳男團舞的新視頻,表演的機器人包括...
關鍵字: 機器人 BSP 工業(yè)機器人 現(xiàn)代汽車