阿里達(dá)摩院在機(jī)器視覺(jué)問(wèn)答VQA榜單中首次超越人類-行業(yè)資訊電商資訊
2023-01-19 | 13:57 | 發(fā)布在分類/淘寶知識(shí) | 閱讀:43
2023-01-19 | 13:57 | 發(fā)布在分類/淘寶知識(shí) | 閱讀:43
本文主題電商行業(yè)觀察,阿里達(dá)摩院超越人類,AI,VQALeaderboard,阿里達(dá)摩院,阿里,行業(yè)資訊。
8月12日消息,在國(guó)際權(quán)威機(jī)器視覺(jué)問(wèn)答榜單VQALeaderboard上,阿里巴巴達(dá)摩院以81.26%的準(zhǔn)確率創(chuàng)造了新紀(jì)錄,讓AI在“讀圖會(huì)意”上首次超越人類基準(zhǔn)。
今年6月,阿里達(dá)摩院在VQA2021Challenge的55支提交隊(duì)伍中奪冠,成績(jī)領(lǐng)先第二名約1個(gè)百分點(diǎn)、去年冠軍3.4個(gè)百分點(diǎn)。此次達(dá)摩院再次以81.26%的準(zhǔn)確率創(chuàng)造VQALeaderboard全球紀(jì)錄,首次超越人類基準(zhǔn)線80.83%。
據(jù)了解,VQA是AI領(lǐng)域難度最高的挑戰(zhàn)之一。在測(cè)試中,AI需根據(jù)給定圖片及自然語(yǔ)言問(wèn)題生成正確的自然語(yǔ)言回答。這意味著單個(gè)AI模型需融合復(fù)雜的計(jì)算機(jī)視覺(jué)及自然語(yǔ)言技術(shù):首先對(duì)所有圖像信息進(jìn)行掃描,再結(jié)合對(duì)文本問(wèn)題的理解,利用多模態(tài)技術(shù)學(xué)習(xí)圖文的關(guān)聯(lián)性、精準(zhǔn)定位相關(guān)圖像信息,最后根據(jù)常識(shí)及推理回答問(wèn)題。
值得一提的是,這不是阿里達(dá)摩院第一次在AI關(guān)鍵領(lǐng)域超越人類基準(zhǔn)。2023年,達(dá)摩院曾在斯坦福SQuAD挑戰(zhàn)賽中歷史性地讓機(jī)器閱讀理解首次超越人類,引發(fā)海外媒體關(guān)注。
今年以來(lái),達(dá)摩院在AI底層技術(shù)領(lǐng)域動(dòng)作頻頻,先后發(fā)布了中國(guó)科技公司中首個(gè)超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6及首個(gè)超大規(guī)模中文語(yǔ)言模型PLUG,并開(kāi)源了歷經(jīng)3年打造的深度語(yǔ)言模型體系A(chǔ)liceMind,其曾登頂GLUE等六大國(guó)際權(quán)威NLP榜單。
幕思城為您更新最近最有用的電商資訊、電商規(guī)則電商行業(yè)觀察,阿里達(dá)摩院超越人類,AI,VQALeaderboard,阿里達(dá)摩院,阿里行業(yè)資訊。了解更多電商資訊、行業(yè)動(dòng)向,記得關(guān)注幕思城!
這個(gè)問(wèn)題還有疑問(wèn)的話,可以加幕.思.城火星老師免費(fèi)咨詢,微.信號(hào)是為: msc496。