摘要:海量文本快速索引是云檢索系統(tǒng)的一個(gè)難點(diǎn),而分布式索引程序的開發(fā)難度較大。文中提出了一種基于MapReduce的分布式索引方法,通過(guò)在Map函數(shù)中執(zhí)行文檔的解析及索引,以及在Reduce函數(shù)中合并索引數(shù)據(jù),以減少文檔排序的工作量,提高索引效率。實(shí)驗(yàn)結(jié)果表明,該方法適用于海量數(shù)據(jù)的并行處理。
ADI數(shù)據(jù)中心白皮書搶先看,測(cè)試領(lǐng)紅包
野火F429開發(fā)板-挑戰(zhàn)者教學(xué)視頻(提高篇)
vim從入門到精通第02季:使用插件定制自己的IDE開發(fā)環(huán)境
吳恩達(dá)coursera機(jī)器學(xué)習(xí)(中文字幕)
開關(guān)電源培訓(xùn)
內(nèi)容不相關(guān) 內(nèi)容錯(cuò)誤 其它
本站介紹 | 申請(qǐng)友情鏈接 | 歡迎投稿 | 隱私聲明 | 廣告業(yè)務(wù) | 網(wǎng)站地圖 | 聯(lián)系我們 | 誠(chéng)聘英才
ICP許可證號(hào):京ICP證070360號(hào) 21ic電子網(wǎng) 2000- 版權(quán)所有 用戶舉報(bào)窗口( 郵箱:macysun@21ic.com )
京公網(wǎng)安備 11010802024343號(hào)