本文中指的是斯坦福大學發起的SQuAD(Stanford Question Answering Dataset)挑戰賽,是在文本認識領域中最複雜的測試之一。
SQuAD是基於500多篇“維基百科”的文章的10萬多個問答對。幾天前,公司的程序通過了測試,獲得82.44分,這個分值超過人類參與者的最高分——82.30分。
該公司的代表稱這個結果是“歷史性的里程碑”。
SQuAD是基於500多篇“維基百科”的文章的10萬多個問答對。幾天前,公司的程序通過了測試,獲得82.44分,這個分值超過人類參與者的最高分——82.30分。
該公司的代表稱這個結果是“歷史性的里程碑”。