幕思城>電商百科>通用知識(shí)>淘寶知識(shí)>阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類-行業(yè)資訊電商資訊

    阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類-行業(yè)資訊電商資訊

    2023-01-19| 13:57|發(fā)布在分類/淘寶知識(shí)|閱讀:43

    本文主題電商行業(yè)觀察,阿里達(dá)摩院超越人類,AI,VQALeaderboard,阿里達(dá)摩院,阿里,行業(yè)資訊。

    阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類

    8月12日消息,在國際權(quán)威機(jī)器視覺問答榜單VQALeaderboard上,阿里巴巴達(dá)摩院以81.26%的準(zhǔn)確率創(chuàng)造了新紀(jì)錄,讓AI在“讀圖會(huì)意”上首次超越人類基準(zhǔn)。

    阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類

    今年6月,阿里達(dá)摩院在VQA2021Challenge的55支提交隊(duì)伍中奪冠,成績領(lǐng)先第二名約1個(gè)百分點(diǎn)、去年冠軍3.4個(gè)百分點(diǎn)。此次達(dá)摩院再次以81.26%的準(zhǔn)確率創(chuàng)造VQALeaderboard全球紀(jì)錄,首次超越人類基準(zhǔn)線80.83%。

    據(jù)了解,VQA是AI領(lǐng)域難度最高的挑戰(zhàn)之一。在測(cè)試中,AI需根據(jù)給定圖片及自然語言問題生成正確的自然語言回答。這意味著單個(gè)AI模型需融合復(fù)雜的計(jì)算機(jī)視覺及自然語言技術(shù):首先對(duì)所有圖像信息進(jìn)行掃描,再結(jié)合對(duì)文本問題的理解,利用多模態(tài)技術(shù)學(xué)習(xí)圖文的關(guān)聯(lián)性、精準(zhǔn)定位相關(guān)圖像信息,最后根據(jù)常識(shí)及推理回答問題。

    阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類

    阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類

    值得一提的是,這不是阿里達(dá)摩院第一次在AI關(guān)鍵領(lǐng)域超越人類基準(zhǔn)。2023年,達(dá)摩院曾在斯坦福SQuAD挑戰(zhàn)賽中歷史性地讓機(jī)器閱讀理解首次超越人類,引發(fā)海外媒體關(guān)注。

    今年以來,達(dá)摩院在AI底層技術(shù)領(lǐng)域動(dòng)作頻頻,先后發(fā)布了中國科技公司中首個(gè)超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6及首個(gè)超大規(guī)模中文語言模型PLUG,并開源了歷經(jīng)3年打造的深度語言模型體系A(chǔ)liceMind,其曾登頂GLUE等六大國際權(quán)威NLP榜單。

    阿里達(dá)摩院在機(jī)器視覺問答VQA榜單中首次超越人類

    幕思城為您更新最近最有用的電商資訊、電商規(guī)則電商行業(yè)觀察,阿里達(dá)摩院超越人類,AI,VQALeaderboard,阿里達(dá)摩院,阿里行業(yè)資訊。了解更多電商資訊、行業(yè)動(dòng)向,記得關(guān)注幕思城!

    這個(gè)問題還有疑問的話,可以加幕.思.城火星老師免費(fèi)咨詢,微.信號(hào)是為: msc496。

    難題沒解決?加我微信給你講!【僅限淘寶賣家交流運(yùn)營知識(shí),非賣家不要加我哈】
    >