眾多科學研究表明,書面文字必然反映作者特點,包括性、心理特徵、教育程度等。言語是大公司人事部門和安全機構專家所使用的重要心理診斷工具。
分析一個人的言語可以判斷其是否存在某些疾病(痴呆、抑鬱症等),是否有自殺傾向。
專家團隊分析了利用神經網絡分析文本的各種機器學習技術的效果。
俄羅斯國立核能研究大學莫斯科工程物理學院副教授亞歷山大·斯博耶夫表示:"得益於先進的神經網絡模型,在文本作者不刻意隱藏自己性別的情況下,我們在確定文本作者性別方面取得了很好的結果。"
例如,從交友網站上選取的文本,神經網絡輕易就能判斷誰故意使用了異性名字,準確率為百分之百。
研究結果表明,使用卷積神經網絡和深入學習法來判斷文本作者性別,以此為基礎的方法最為有效。
目前專家團隊正在研究如何判斷年齡。