日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > > 充電吧
[導(dǎo)讀]記者消息,7 月 1 日,Google 在其博客上發(fā)布了一個(gè)重要消息,它宣布,Google 開(kāi)源了存儲(chǔ) robots.text 解析器的 C++ 庫(kù),以便推動(dòng) REP(Robots Exclusion



記者消息,7 月 1 日,Google 在其博客上發(fā)布了一個(gè)重要消息,它宣布,Google 開(kāi)源了存儲(chǔ) robots.text 解析器的 C++ 庫(kù),以便推動(dòng) REP(Robots Exclusion Protocol,也稱爬蟲(chóng)協(xié)議、機(jī)器人協(xié)議)成為互聯(lián)網(wǎng)標(biāo)準(zhǔn)。

1994 年,荷蘭軟件工程師 Martijin Koster 提出了 REP 的概念,通過(guò) robots.txt 文件來(lái)隱藏一些信息不被搜索引擎抓取,比如,只抓取應(yīng)該被抓取的頁(yè)面;屏蔽一些網(wǎng)站中較大的文件;屏蔽一些無(wú)效鏈接;保密敏感信息等。

記者注:搜索引擎的爬取方式(圖片來(lái)自百度百科)

我們可以這么來(lái)理解,網(wǎng)站就好比一個(gè)房間,robots.txt 文件就是主人在房門(mén)上懸掛的“請(qǐng)勿打擾”的提示牌,可以讓人止步于一些存放貴重物品的房間,但它終究不是守門(mén)人,無(wú)法阻擋懷有惡意的竊賊。

聯(lián)合多方力量上交提案

25 年過(guò)去了,業(yè)內(nèi)對(duì) REP 表示了充分的認(rèn)可,但現(xiàn)在它更像是一個(gè)道德規(guī)范,而不是非官方的互聯(lián)網(wǎng)標(biāo)準(zhǔn)。

不過(guò),Google 正致力于改變這一現(xiàn)狀。Google 在博客中說(shuō)道,

我們希望幫助網(wǎng)站所有者和開(kāi)發(fā)者在互聯(lián)網(wǎng)上創(chuàng)造令人驚嘆的體驗(yàn),而不是擔(dān)心如何控制抓取工具。Google 和協(xié)議的發(fā)起人,以及其他網(wǎng)絡(luò)管理員和搜索引擎共同起草了一份關(guān)于如何在現(xiàn)代網(wǎng)絡(luò)上適用 REP的提案,目前已經(jīng)上交給了 IETF(記者按:Internet Engineering Task Force,非盈利互聯(lián)網(wǎng)開(kāi)放標(biāo)準(zhǔn)組織,負(fù)責(zé)開(kāi)發(fā)和推廣自愿互聯(lián)網(wǎng)標(biāo)準(zhǔn))。

Google 的提案反映了 20 多年來(lái) Googlebot 和一些主要網(wǎng)絡(luò)爬蟲(chóng),以及大約 5 億依賴 REP 的網(wǎng)站應(yīng)用 robots.txt 的實(shí)際經(jīng)驗(yàn),并且在現(xiàn)代網(wǎng)絡(luò)層面做了擴(kuò)展,定義了 robots.txt 解析和匹配的所有之前未定義場(chǎng)景:

任何基于 URI 的傳輸協(xié)議都可以使用 robots.txt;它不再局限于 HTTP,也可用于 FTP 或 CoAP。

開(kāi)發(fā)人員必須至少解析 robots.txt 的前 500 KB 內(nèi)容。定義文件的最大值,以確保打開(kāi)連接不需要花太長(zhǎng)時(shí)間,從而減輕服務(wù)器上不必要的壓力。

新的最長(zhǎng)緩存時(shí)間為 24 小時(shí)或可用的緩存指令值,賦予網(wǎng)站所有者靈活性隨時(shí)更新 robots.txt,而爬蟲(chóng)程序不會(huì)因此使網(wǎng)站過(guò)載。

當(dāng)前可以訪問(wèn)的 robots.txt 文件由于服務(wù)器故障而變得不可訪問(wèn)時(shí),這些無(wú)法訪問(wèn)的頁(yè)面將在很長(zhǎng)一段時(shí)間內(nèi)不被檢索。

開(kāi)源 robots.txt 解析器

除了聯(lián)合多方力量向 IETF 上交提案,Google 還作出了其它努力,開(kāi)源了自己 robots.txt 文件庫(kù)旨在創(chuàng)建標(biāo)準(zhǔn)化語(yǔ)法來(lái)創(chuàng)建和解析文件,消除所有混淆。

Google 在博客中這樣說(shuō)道:

REP 是網(wǎng)絡(luò)中最基本,最關(guān)鍵的組成部分之一,但它只是約定俗成的標(biāo)準(zhǔn),這難免讓人感到沮喪;這給網(wǎng)絡(luò)管理員和爬蟲(chóng)工具開(kāi)發(fā)者帶了困擾......推動(dòng) REP 成為行業(yè)標(biāo)準(zhǔn)這件事十分重要,因?yàn)樗厦總€(gè)人的利益。不過(guò),對(duì)于解析 robots.txt 文件的開(kāi)發(fā)人員來(lái)說(shuō),這種標(biāo)準(zhǔn)化需要付出更大的努力,所以,我們開(kāi)源了含有 robots.txt 解析器的 C++ 庫(kù)。

據(jù)稱,這個(gè) C++ 庫(kù)已經(jīng)存在了 20 年之久,里面包含了自 90 年代起就編寫(xiě)的代碼片段。在這 20 年里,該庫(kù)經(jīng)歷了不斷的發(fā)展,也覆蓋了許多在編寫(xiě) robots.txt 文件方面非常實(shí)用的案例,這對(duì)想要構(gòu)建自己的解析器的開(kāi)發(fā)人員來(lái)說(shuō)很有助益。

除此之外,Google 還在開(kāi)源軟件包中添加了一個(gè)測(cè)試工具,可以幫助編寫(xiě)人員測(cè)試 robots.txt 的效果。

外界的態(tài)度

在 Google 開(kāi)源 robots.txt 后,這個(gè)話題引起了廣泛的關(guān)注,甚至登頂 Hacker News。

Constellation 研究公司(記者(公眾號(hào):記者)按: 專門(mén)從事數(shù)字化轉(zhuǎn)型和顛覆性技術(shù)方面的技術(shù)研究與咨詢)的分析師 Holger Mueller 告訴 SiliconANGLE,標(biāo)準(zhǔn)化對(duì)于互聯(lián)網(wǎng)正常工作至關(guān)重要,很高興看到 Google ?在 REP 這樣基本的東西上取得領(lǐng)先。

Holger Mueller 還補(bǔ)充道,

與任何開(kāi)源倡議和標(biāo)準(zhǔn)化嘗試一樣,我們還需要靜待,看看此舉到底會(huì)不會(huì)成功,我們又能在此之中學(xué)到什么。這是一個(gè)值得密切關(guān)注的領(lǐng)域。

在國(guó)內(nèi),網(wǎng)友們也紛紛高呼“谷人?!保ㄓ浾甙矗骸肮雀瑁祟?lèi)的希望”)來(lái)表示對(duì)該事件的贊賞。


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢(shì)抑制與過(guò)流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問(wèn)題卻十分常見(jiàn),不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問(wèn)題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(chē)(EV)作為新能源汽車(chē)的重要代表,正逐漸成為全球汽車(chē)產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車(chē)的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車(chē)的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車(chē) 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車(chē)場(chǎng)照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢(shì)逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問(wèn)題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對(duì)周?chē)娮釉O(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來(lái)解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開(kāi)關(guān)電源具有效率高的特性,而且開(kāi)關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開(kāi)關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉