第一階段拍攝了6個小時的視頻,視頻中錄下了有10個專業演員的(在此過程他們都有脈搏器)情緒:高興,驚訝,凶惡,憂鬱、恐懼和厭惡。
然後注釋者們研究所得到的視頻,他們指出被觀察者在某些具體時間的情緒。
接下來是選出160個小時的視頻,在視頻中記錄下各種場景中的在互相交流的人們。收集到的數據成為訓練神經網絡識別人類表情的方法。
這些方法注意到了聲音(音高、音色、音量、言語的停頓)、情緒基調、語義、面部表情、肢體運動的速度和方向、部分肢體的位置、在皮膚顏色變化時的心率,胸部運動時的呼吸,人的性別和年齡及其臉上的眼鏡、八字胡和絡腮胡。
已準備使用的新研發可能對商業、廣告、安全和醫療以及其它重要的正確理解人類行為及其情緒的領域有所幫助。