日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁(yè) > 物聯(lián)網(wǎng) > 《物聯(lián)網(wǎng)技術(shù)》雜志
[導(dǎo)讀]摘 要 :當(dāng)今時(shí)代,信息量呈爆炸式增長(zhǎng),推薦系統(tǒng)是處理海量信息的一種有效方式,也是一種無(wú)需用戶提出明確需求就可幫助用戶快速發(fā)現(xiàn)有用信息的工具。在推薦系統(tǒng)中,協(xié)同過(guò)濾算法有著重要應(yīng)用。傳統(tǒng)協(xié)同過(guò)濾算法通常使用余弦相似度公式進(jìn)行興趣相似度計(jì)算,但是很多情況下熱門物品會(huì)影響到推薦結(jié)果,并不能較好地反映用戶需求。文中對(duì)傳統(tǒng)協(xié)同過(guò)濾算法余弦相似度計(jì)算公式提出改進(jìn)方案,給出一個(gè)帶有懲罰因子的余弦相似度修正公式,可以較好地抑制熱門物品對(duì)用戶實(shí)際相似度的影響,改善用戶近鄰集合的劃分,從而實(shí)現(xiàn)更好的推薦效果。經(jīng)實(shí)驗(yàn)測(cè)試,推薦系統(tǒng)的性能指標(biāo)得到了一定的改善。


引 言


隨著信息量的提升,推薦系統(tǒng)開始發(fā)揮越來(lái)越重要的作用。目前,推薦系統(tǒng)在新聞行業(yè)、娛樂(lè)媒體行業(yè)以及電子商務(wù)領(lǐng)域都有著重要的應(yīng)用。推薦系統(tǒng)領(lǐng)域出現(xiàn)了多種算法, 這些算法都有著明確的應(yīng)用場(chǎng)景,同時(shí)也各有優(yōu)缺點(diǎn)。常用的推薦算法包括基于內(nèi)容的推薦、基于關(guān)聯(lián)規(guī)則的推薦和協(xié)同過(guò)濾算法 [1] 等,其中,協(xié)同過(guò)濾算法是推薦系統(tǒng)中的經(jīng)典算法之一,在眾多場(chǎng)合都有非常廣泛的應(yīng)用。該算法目標(biāo)明確、易于理解,同時(shí)實(shí)用性很強(qiáng),無(wú)需具備專業(yè)領(lǐng)域的知識(shí)即可完成推薦。隨著時(shí)間的推移,推薦系統(tǒng)的性能會(huì)一直得到增強(qiáng),因此該算法的自動(dòng)化程度較高,同時(shí)也可較為方便地處理復(fù)雜的對(duì)象信息和非結(jié)構(gòu)化數(shù)據(jù) [2]。但是協(xié)同過(guò)濾算法存在冷啟動(dòng)、數(shù)據(jù)稀疏、可拓展性差等缺點(diǎn) [3],這些缺點(diǎn)在實(shí)際應(yīng)用中會(huì)影響到推薦系統(tǒng)的性能。本文從實(shí)際入手,針對(duì)協(xié)同過(guò)濾算法傳統(tǒng)的相似度公式無(wú)法抑制熱門物品的問(wèn)題,提出懲罰因子的概念,給出修正后的余弦相似度計(jì)算公式,并進(jìn)行實(shí)驗(yàn)論證。


1 協(xié)同過(guò)濾算法

1.1 傳統(tǒng)協(xié)同過(guò)濾算法

協(xié)同過(guò)濾算法在 1992 年被提出 [5-6],該算法的第一個(gè)應(yīng)用項(xiàng)目是 Tapestry[7]。協(xié)同過(guò)濾算法是在獲取到用戶信息后,尋找目標(biāo)用戶的近鄰集合,選擇近鄰集合中感興趣的對(duì)象推薦給目標(biāo)用戶,其具體步驟如下 :


(1)收集用戶行為,產(chǎn)生用戶評(píng)分矩陣

用戶的行為數(shù)據(jù)可以多種形式展現(xiàn)給后臺(tái),因此需要進(jìn)行預(yù)處理。預(yù)處理是將自然語(yǔ)言描述的用戶歷史行為轉(zhuǎn)換為數(shù)字化信息 [8]。預(yù)處理之后,將用戶對(duì)物品的行為信息描述為一個(gè) m×n 的矩陣 R(m,n),這個(gè)矩陣被稱為用戶 - 評(píng)分矩陣。矩陣 R 中每一行代表用戶,每一列代表物品對(duì)象,Rij 表示用戶 i 對(duì)物品對(duì)象 j 的評(píng)分。同時(shí),采取 0 和 1 兩種數(shù)值的方式表征用戶行為,數(shù)字 1 代表用戶喜歡該物品,反之為不喜歡。用戶評(píng)分矩陣 R 為 :

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究

(2) 建立用戶近鄰集合,找出用戶鄰居

用戶近鄰集合是將目標(biāo)用戶與其他用戶進(jìn)行相似度計(jì)算后生成用戶的近鄰集合。用戶之間的相似度通過(guò)相似度公式計(jì)算得出。興趣相似度計(jì)算公式較多,如 Jaccard 公式、余弦相似度公式等。其中,余弦相似度公式使用較多。

(3) 產(chǎn)生推薦結(jié)果

計(jì)算用戶 u 對(duì)物品 i 的興趣度公式為 :

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究

式中:S(u,K)表示用戶 u的近鄰集合, 包含與 u最接 近的 K個(gè)用戶;N(i)表示對(duì)物品 i產(chǎn)生行為的用戶集合;

Wuv 表示用戶 u,v 的興趣相似度;rvi 表示用戶 v 對(duì)物品 i 的興趣。


1.2 相似度公式

本文使用余弦相似度公式計(jì)算興趣相似度。給定用戶 u 與用戶 v,令 N(u)與 N(v)分別表示用戶 u 與用戶 v 曾經(jīng)有過(guò)正反饋的物品集合,余弦興趣相似度公式如下 :

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究

通過(guò)式(3)可計(jì)算出目標(biāo)用戶與其他用戶之間的相似度值,從而確定用戶的近鄰集合,以便下一步使用。

1.3 算法流程


整個(gè)系統(tǒng)算法流程包括收集用戶歷史信息、建立用戶評(píng)分矩陣、計(jì)算用戶相似度、生成近鄰集合,進(jìn)而產(chǎn)生推薦。協(xié)同過(guò)濾算法流程如圖 1 所示。

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究



2 基于懲罰因子的協(xié)同過(guò)濾改進(jìn)算法

2.1 懲罰因子

若熱門物品出現(xiàn)次數(shù)較多,則會(huì)使實(shí)際相似度計(jì)算結(jié)果受到影響,導(dǎo)致推薦的物品都是熱門物品,無(wú)法挖掘用戶的實(shí)際需求。為了避免這種影響,考慮加入一個(gè)懲罰因子作為加權(quán)系數(shù),從而抑制熱門物品的影響,因此本文對(duì)余弦相似度計(jì)算公式進(jìn)行修正,將物品出現(xiàn)次數(shù)的倒數(shù)作為懲罰因子。物品出現(xiàn)次數(shù)越多,即該商品越熱門,同時(shí),該商品對(duì)于用戶興趣相似度的貢獻(xiàn)越少。修正后的公式可衰減熱門物品造成的影響,帶有懲罰因子的修正公式為 :

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究



式中:N(i)表示商品 i 出現(xiàn)的次數(shù);i 表示用戶 u 與用戶 v共同產(chǎn)生行為的商品。通過(guò)物品出現(xiàn)的次數(shù)來(lái)懲罰熱門物品。

2.2 其他改進(jìn)參數(shù)

冷啟動(dòng)是推薦系統(tǒng)設(shè)計(jì)過(guò)程中必須經(jīng)歷的一個(gè)過(guò)程。由于系統(tǒng)剛剛創(chuàng)建,新注冊(cè)的用戶尚未對(duì)項(xiàng)目產(chǎn)生有效的行為信息,此時(shí)可利用的行為信息極少,這種情況下難以給用戶做出合理的推薦 [9],因此必須考慮從別的渠道獲取更多的用戶信息作為參考。通過(guò)用戶的注冊(cè)信息挖掘用戶愛(ài)好是一種有效的方式,在用戶注冊(cè)時(shí)加以引導(dǎo),使用戶提供一些信息,通過(guò)這些信息最大限度地挖掘出用戶感興趣的信息。用戶注冊(cè)信息完畢后初次登錄時(shí),后臺(tái)系統(tǒng)可根據(jù)用戶提交的個(gè)人信息進(jìn)行分析與挖掘,從而做出有針對(duì)性的推薦。

2.3 改進(jìn)后的算法流程

本文在原有的推薦流程中加入懲罰因子的參數(shù),該參數(shù)作為衰減因子可削弱熱門造成的影響,使用用戶對(duì)該物品發(fā)生正反饋的次數(shù)衡量物品的熱門程度。物品越熱門,懲罰力度越高,熱門物品對(duì)計(jì)算興趣相似度帶來(lái)的影響越小,因此可較好地解決熱門物品對(duì)于推薦效果的影響。改進(jìn)后的算法流程如圖 2 所示。

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究



3 實(shí)驗(yàn)結(jié)果

本文使用目前推薦系統(tǒng)經(jīng)典的數(shù)據(jù)集 MovieLens(m1-1M)進(jìn)行驗(yàn)證。MovieLens數(shù)據(jù)集是目前公認(rèn)的數(shù)據(jù)集之一[10],共有用戶表(Users)、電影表(Movies)及評(píng)分記錄表三張表。本文使用準(zhǔn)確率與召回率作為實(shí)驗(yàn)數(shù)據(jù)進(jìn)行評(píng)測(cè) [11]。準(zhǔn)確率與召回率計(jì)算公式為 :

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究



式中:R(u)表示對(duì)用戶 u 推薦的 N 個(gè)物品;T(u)表示測(cè)試集中用戶 u 喜歡的物品的集合。

首先使用經(jīng)典的余弦相似度算法進(jìn)行計(jì)算。將推薦數(shù)量選定為 25,目標(biāo)用戶的鄰居個(gè)數(shù)分別為 2,3,4,5,6,7,8,9,10,20,40。由上述數(shù)據(jù)得到的準(zhǔn)確率與召回率(計(jì)算結(jié)果保留小數(shù)點(diǎn)后四位)見(jiàn)表 1 所列。

基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究



由上述實(shí)驗(yàn)數(shù)據(jù)可知,當(dāng)目標(biāo)用戶的鄰居個(gè)數(shù)為 3 時(shí),準(zhǔn)確率與召回率有較好的效果,因此在對(duì)修正后的公式驗(yàn)證時(shí)可選定鄰居個(gè)數(shù) 3 進(jìn)行準(zhǔn)確率與召回率的對(duì)比。余弦相似度公式與修正后的相似度公式對(duì)比見(jiàn)表 2 所列。


基于懲罰因子的協(xié)同過(guò)濾算法的改進(jìn)與研究


由表 2 可知,使用余弦相似度公式的準(zhǔn)確率為 0.133 8,召回率為 0.154 4,使用帶有懲罰因子的修正公式的準(zhǔn)確率為0.144 6,召回率為 0.204 0。實(shí)驗(yàn)結(jié)果表明,帶有懲罰因子的修正公式可以較好地抑制熱門物品的影響,提升系統(tǒng)的準(zhǔn)確率與召回率。


4 結(jié) 語(yǔ)

由于使用傳統(tǒng)的余弦相似度公式時(shí),熱門物品會(huì)影響推薦結(jié)果,導(dǎo)致推薦的物品幾乎都是熱門物品,因此本文提出帶有懲罰因子的余弦相似度計(jì)算公式,使用熱門物品出現(xiàn)次數(shù)的倒數(shù)作為懲罰因子,物品越熱門懲罰力度越大。通過(guò)實(shí)驗(yàn)驗(yàn)證,該算法可使準(zhǔn)確率與召回率得到一定的提升,從而提高推薦效率。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

在接下來(lái)的5G時(shí)代當(dāng)中,華為也將會(huì)憑借著自身的優(yōu)勢(shì),從而處于遙遙領(lǐng)先的地位,但其實(shí)厲害的又不僅僅是華為企業(yè),如今,作為國(guó)際巨頭的三星開始了在6G當(dāng)中的研發(fā),6G接下來(lái)的網(wǎng)速,將會(huì)是5G的50倍,對(duì)于三星的這一個(gè)大動(dòng)作,華...

關(guān)鍵字: 5G 6G 三星

隨著人工智能概念的爆發(fā),越來(lái)越多的企業(yè)開始關(guān)注并布局智能家居領(lǐng)域。有研究機(jī)構(gòu)預(yù)測(cè)預(yù)測(cè),2022年中國(guó)智能家居的整體產(chǎn)值將突破萬(wàn)億元,前景一片向榮。

關(guān)鍵字: 全屋智能 智慧生活 小愛(ài)同學(xué)

博鰲亞洲論壇國(guó)際科技與創(chuàng)新論壇第二屆大會(huì)在廣州舉行。期間舉行的5G科技應(yīng)用與6G展望分論壇備受矚目。六位通信領(lǐng)域的頭部企業(yè)、高校和科研院所的專家通過(guò)線上線下聯(lián)動(dòng)方式,共同研討5G軟硬件關(guān)鍵技術(shù)研發(fā)現(xiàn)狀與未來(lái)6G發(fā)展前景展...

關(guān)鍵字: 5G 6G 通信算法

智能家居作為住宅家居現(xiàn)代生活場(chǎng)景方式,當(dāng)下已經(jīng)不再只是一個(gè)概念,而是基于家居家裝軟硬件產(chǎn)品為載體的生活方式實(shí)景呈現(xiàn),越來(lái)越多的人在家裝時(shí)選擇智能家居。需求助推行業(yè)持續(xù)火熱,大小資本都以狂風(fēng)席卷之勢(shì)進(jìn)駐這個(gè)行業(yè),根據(jù)企查查...

關(guān)鍵字: 全屋智能 智能家居 智能門鎖

5G領(lǐng)先讓我們信心大增,但是這不能成為我們高枕無(wú)憂的理由。隨著我們認(rèn)識(shí)到通訊技術(shù)在科技領(lǐng)域的重要性之后,競(jìng)爭(zhēng)必然會(huì)更加激烈起來(lái)。在5G還未成熟的年代,通訊商們就已經(jīng)開始將目光瞄準(zhǔn)了6G,并開始相關(guān)的研發(fā)和布局。

關(guān)鍵字: 5G 6G 虛擬數(shù)字世界

小米智能家居現(xiàn)在已經(jīng)能實(shí)現(xiàn)聯(lián)動(dòng)和自動(dòng)化了,比如指紋鎖進(jìn)屋就打開窗簾電視,播放天氣預(yù)報(bào),根據(jù)設(shè)定溫度決定是否打開空調(diào),根據(jù)空氣質(zhì)量檢測(cè)儀決定是否打開新風(fēng)機(jī)~結(jié)合人體移動(dòng)和光線傳感器開燈就更是不用說(shuō)了~最近也在搞全屋智能化,...

關(guān)鍵字: 全屋智能 溫度感應(yīng) 小米

根據(jù)5G設(shè)備市場(chǎng)的調(diào)研數(shù)據(jù)當(dāng)中來(lái)看,三星所拿下的5G設(shè)備市場(chǎng)份額就達(dá)到了10.4%,也就是說(shuō),排在了第四名的位置。

關(guān)鍵字: 6G 三星 華為

擁有 5G、人工智能、物聯(lián)網(wǎng)等新技術(shù)的支撐,智能家居行業(yè)逐漸從單品智能邁入全屋智能階段 。其由于全屋智能產(chǎn)品特殊性,落地安裝涉及到方案場(chǎng)景設(shè)計(jì)、布線,安裝,施工、后期維護(hù)更新等多個(gè)環(huán)節(jié),整體最好的實(shí)施路徑是通過(guò)房屋整體裝...

關(guān)鍵字: 全屋智能 5G 物聯(lián)網(wǎng)

5G時(shí)代,我們實(shí)現(xiàn)了彎道超車,一躍超越高通,愛(ài)立信,領(lǐng)先于世界?,F(xiàn)如今,5G正在全世界加速普及和應(yīng)用。通訊和實(shí)業(yè)的結(jié)合,已助力生產(chǎn)效率進(jìn)一步提高,讓我們的生活變得更加美好。

關(guān)鍵字: 5G 6G 中國(guó)移動(dòng)

自從2020年作為建設(shè)主體納入大灣區(qū)綜合性國(guó)家科學(xué)中心先行啟動(dòng)區(qū),躋身科創(chuàng)國(guó)家隊(duì)以來(lái),松山湖科學(xué)城圍繞科研創(chuàng)新人才的需求,全面提升城市服務(wù)能級(jí)和城市品質(zhì),讓松山湖成為近悅遠(yuǎn)來(lái)、宜居宜業(yè)宜研宜創(chuàng)的科學(xué)家園。

關(guān)鍵字: 智慧城市 科學(xué)家園 人工智能

《物聯(lián)網(wǎng)技術(shù)》雜志

2511 篇文章

關(guān)注

發(fā)布文章

編輯精選

技術(shù)子站

關(guān)閉