Facebook 新功能:讓盲人也能“看見(jiàn)”照片內(nèi)容
在 Facebook、Instagram、Facebook Messenger 與 WhatsApp 等平臺(tái)上,用戶們上傳的照片每天超過(guò) 20 億張,但對(duì)盲人或視障人士來(lái)說(shuō),F(xiàn)acebook 等平臺(tái)上所出現(xiàn)的照片,只能是屏幕閱讀器讀出的“照片”二字,影像內(nèi)容從來(lái)不得而知。而現(xiàn)在,F(xiàn)acebook 透過(guò)人工智能技術(shù),要將圖像內(nèi)容以語(yǔ)音敘述方式,“說(shuō)”給盲人或視障人士聽(tīng)。
Facebook 所推出的這項(xiàng)新功能名為“自動(dòng)文字替代(automaTIc alternaTIve text)”,利用機(jī)器學(xué)習(xí)技術(shù),建立演算法來(lái)幫助人工智能學(xué)習(xí)識(shí)別圖像內(nèi)容,喂養(yǎng)數(shù)百萬(wàn)個(gè)范例,在正確度達(dá) 80% 的情況下,才會(huì)對(duì)圖像進(jìn)行標(biāo)示,讓人工智能系統(tǒng)能辨識(shí)平臺(tái)上圖像中的內(nèi)容,并透過(guò)語(yǔ)音詮釋圖片。自動(dòng)文字替代功能辨識(shí)圖像內(nèi)容后,接著利用 iPhone 的 VoiceOver 功能,以語(yǔ)音敘述方式,向用戶讀出照片內(nèi)容。
雖然目前這項(xiàng)功能還在發(fā)展初期,但已能辨識(shí)包括交通工具(車、船、飛機(jī))、自然現(xiàn)象(日落、下雪、海洋)、運(yùn)動(dòng)(籃球場(chǎng))、食物等類型的圖像,也能針對(duì)人臉特征進(jìn)行敘述。就如 Facebook 所舉例,假如影像中出現(xiàn)“一對(duì)情侶戴著太陽(yáng)眼鏡站在海邊微笑著”(首圖左),那么,F(xiàn)acebook 的自動(dòng)替代文本功能所讀出的會(huì)是“兩個(gè)人、微笑、太陽(yáng)眼鏡、戶外、水”,至于首圖右,所讀出的則會(huì)是“披薩、食物”。
對(duì)于如種族等較為敏感、可能引起爭(zhēng)議的內(nèi)容,F(xiàn)acebook 表示,將會(huì)特別小心處理,若不具高度把握的話,并不會(huì)對(duì)這類圖像進(jìn)行標(biāo)示,避免引起紛爭(zhēng)。
目前自動(dòng)文字替代功能僅在 iOS 平臺(tái)上推出,且語(yǔ)言的部分僅支持英文語(yǔ)音,但 Facebook 表示將會(huì)盡快在其他平臺(tái)上推出并提供更多語(yǔ)言。雖然這項(xiàng)功能還在發(fā)展初期,但對(duì)盲人或視障人士來(lái)說(shuō),無(wú)疑為他們使用社交平臺(tái)又多開(kāi)啟了一扇窗。





