中文名確定!Token正式被譯名為“詞元”:我國(guó)日均調(diào)用量突破140萬(wàn)億
3月24日消息,國(guó)家數(shù)據(jù)局在官方公告中首次使用“詞元”作為Token的標(biāo)準(zhǔn)譯名,標(biāo)志著這一術(shù)語(yǔ)在中文人工智能領(lǐng)域的正式確立。
國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏24日在國(guó)新辦舉行的新聞發(fā)布會(huì)上表示,到今年3月,我國(guó)日均詞元(Token)調(diào)用量已超過(guò)140萬(wàn)億,相比2024年初的1000億增長(zhǎng)了1000多倍,相比2025年底的100萬(wàn)億,三個(gè)月時(shí)間又增長(zhǎng)了40%多。
“日均詞元調(diào)用量的大量增加,充分表明中國(guó)的人工智能發(fā)展進(jìn)入了快速增長(zhǎng)階段。”劉烈宏表示,人工智能應(yīng)用場(chǎng)景在不斷深化,從能對(duì)話到能決策執(zhí)行的智能體,中國(guó)人工智能產(chǎn)業(yè)的競(jìng)爭(zhēng)力在顯著增強(qiáng),現(xiàn)在備受關(guān)注的Token出海,就是產(chǎn)業(yè)競(jìng)爭(zhēng)力增強(qiáng)的一個(gè)標(biāo)志。
《人民日?qǐng)?bào)》在2026年1月發(fā)布《漫談詞元》科普文章,將Token定義為“處理文本的最小數(shù)據(jù)單元”,蘋果中國(guó)官網(wǎng)、央視新聞、中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)等技術(shù)文檔也統(tǒng)一使用“詞元”。
怎么理解詞元?簡(jiǎn)單來(lái)說(shuō),詞元是人工智能大模型為了高效處理數(shù)據(jù),把數(shù)據(jù)進(jìn)行拆分后的“最小信息載體”,可以理解為“字/詞片段/符號(hào)”等。
比如“我愛(ài)中國(guó)!”,可拆分成“我”“愛(ài)”“中國(guó)”“!”4個(gè)詞元。
如果說(shuō)互聯(lián)網(wǎng)時(shí)代信息傳輸?shù)暮诵亩攘渴橇髁?,那么人工智能時(shí)代,這一關(guān)鍵指標(biāo)正變?yōu)樵~元。用戶輸入的每一個(gè)字,模型生成的每一段話、識(shí)別的每一幅圖像,都在消耗詞元。





