重磅!DeepSeek最快下周發(fā)布大模型V4
3月1日消息,據(jù)國(guó)外媒體最新報(bào)道,DeepSeek計(jì)劃于下周正式發(fā)布全新的多模態(tài)大語(yǔ)言模型V4版本。
這款備受期待的新模型將原生支持圖片、視頻以及文本的生成功能。這也是DeepSeek自今年1月推出R1推理模型以來的首次重大版本迭代,有望進(jìn)一步填補(bǔ)國(guó)內(nèi)低成本開源模型的需求。
然而,比技術(shù)升級(jí)更引人注目的是DeepSeek在這一版本測(cè)試階段采取的特殊舉措。據(jù)知情人士透露,DeepSeek已經(jīng)向包括華為在內(nèi)的國(guó)內(nèi)硬件供應(yīng)商提供了V4模型的測(cè)試權(quán)限。
令人意外的是,DeepSeek此次打破了行業(yè)慣例,并未向英偉達(dá)和AMD這兩家全球領(lǐng)先的芯片供應(yīng)商提供預(yù)發(fā)布版本的訪問權(quán)限,這一策略在業(yè)內(nèi)引發(fā)了廣泛討論。
在人工智能開發(fā)領(lǐng)域,開發(fā)者通常會(huì)與領(lǐng)先的芯片制造商共享模型預(yù)發(fā)布版,以確保軟件能在主流硬件上高效運(yùn)行。DeepSeek此前也曾與英偉達(dá)技術(shù)團(tuán)隊(duì)保持過緊密合作。
此次DeepSeek選擇優(yōu)先支持國(guó)產(chǎn)硬件,卻將英偉達(dá)和AMD拒之門外,背后的策略考量非常耐人尋味。
通過這種差異化的授權(quán)方式,以華為為代表的中國(guó)芯片制造商能夠獲得寶貴的領(lǐng)先時(shí)間。他們可以提前數(shù)周針對(duì)自家處理器進(jìn)行軟件層面的深度優(yōu)化,從而在模型適配與運(yùn)行效率上占據(jù)先機(jī)





