如何讓AI用最少的樣本來理解自然語言是個難題

來源：快科技時間：2021-09-14 13:42:01

AI人工智能是現(xiàn)在的熱門，很多服務(wù)都上了AI客服，如何讓AI用最少的樣本來理解自然語言是個難題，國內(nèi)還有中文語言理解的需要。在日前的中文語言理解權(quán)威評測基準(zhǔn)CLUE評測中，阿里的AI模型就拿到了雙料冠軍。

日前，中文語言理解權(quán)威評測基準(zhǔn)CLUE公布了小樣本學(xué)習(xí)評測榜單FewCLUE的最新結(jié)果，阿里巴巴在大模型和無參數(shù)限制模型兩項(xiàng)賽事中雙雙刷新榜單最好紀(jì)錄，僅次于“人類”，并在極少(一個類別僅十余個)樣本條件下，超過了新聞文本分類上的人類識別精確度。

這證明了AI小樣本學(xué)習(xí)在NLP任務(wù)上具備超越人類的能力。

FewCLUE是CLUE最新推出的一項(xiàng)中文小樣本學(xué)習(xí)評測榜單，包括大模型和無參數(shù)限制模型雙賽道，用來評估預(yù)訓(xùn)練模型是否能夠通過小樣本學(xué)習(xí)來掌握特定的自然語言處理任務(wù)?；谶@項(xiàng)評估，科研人員可以更精準(zhǔn)的衡量預(yù)訓(xùn)練模型的泛化性和準(zhǔn)確率。

眾所周知，預(yù)訓(xùn)練模型在特定自然語言處理任務(wù)上要取得高精度的成本非常高，科研人員進(jìn)而轉(zhuǎn)向攻關(guān)小樣本學(xué)習(xí)技術(shù)，希望用較低的成本實(shí)現(xiàn)可觀的識別精確度。

據(jù)悉，阿里云機(jī)器學(xué)習(xí)平臺PAI和和達(dá)摩院共同提出了一種大模型+小樣本的聯(lián)合方案，在大規(guī)模通用預(yù)訓(xùn)練基礎(chǔ)之上，將億級知識圖譜融入預(yù)訓(xùn)練模型，打造了強(qiáng)大的底座KGBert，結(jié)合Fuzzy-PET少樣本學(xué)習(xí)，在多個任務(wù)上比預(yù)訓(xùn)練微調(diào)技術(shù)提升近25%了準(zhǔn)確率，甚至在一個小樣本學(xué)習(xí)任務(wù)上的精準(zhǔn)度超過了人類。

例如，在智能客服場景下的用戶需求識別，僅需人工標(biāo)注幾十條樣本，就能讓需求識別的準(zhǔn)確率達(dá)到90%。

值得一提的是，這項(xiàng)小樣本學(xué)習(xí)技術(shù)已在阿里巴巴的實(shí)際場景落地且有很好的業(yè)務(wù)表現(xiàn)，目前阿里云智能客服云小蜜僅用20條樣本就可以做到快速冷啟動，實(shí)現(xiàn)精準(zhǔn)問答，準(zhǔn)確率超過80%，并在政務(wù)、金融、通用線多個業(yè)務(wù)場景落地。開發(fā)者可基于PAI直接調(diào)用行業(yè)解決方案，也可以二次開發(fā)打造自己的模型。

阿里云PAI是國際領(lǐng)先的機(jī)器學(xué)習(xí)平臺，過去幾年陸續(xù)打破多項(xiàng)國內(nèi)外AI記錄：2019年10月，英文多輪閱讀榜單QuAC取得第一;2020年3月，中文CLUE分類榜單取得第一;2020年8月，英文SuperGLUE取得國內(nèi)第一，世界第二。

“我們希望通過算法與工程的協(xié)同設(shè)計構(gòu)建端到端的大規(guī)模AI工程能力，用云上AI平臺PAI服務(wù)各行各業(yè)。”阿里巴巴副總裁、阿里云計算平臺負(fù)責(zé)人賈揚(yáng)清表示：“目前，PAI支持從數(shù)據(jù)標(biāo)注、模型設(shè)計、分布式訓(xùn)練、模型管理和模型服務(wù)等AI資產(chǎn)管理的各方面需求，全面提升AI落地企業(yè)應(yīng)用的效率。”

責(zé)任編輯：FD31

上一篇：飛行汽車何時才能到來

下一篇：幾周便能編寫新固件？特斯拉換備用芯片