https://big5.sputniknews.cn/20251021/1068001557.html
俄研究人員找到消除在線翻譯錯誤的方法
俄研究人員找到消除在線翻譯錯誤的方法
俄羅斯衛星通訊社
蘇爾古特國立大學的科學家們開發出一款能夠分析機器翻譯程序錯誤的工具,該工具有助於提升該領域的研發質量。據該校新聞處消息,研究人員已獲得專利。 2025年10月21日, 俄羅斯衛星通訊社
2025-10-21T23:34+0800
2025-10-21T23:34+0800
2025-10-21T23:34+0800
俄羅斯
語言
科學
https://cdn.sputniknews.cn/img/07e5/01/1a/1032964455_0:0:1201:676_1920x0_80_0_0_54835fc62d7098f927876a47232a9a41.jpg
如今,在線翻譯已成為常用工具,但其翻譯質量仍不穩定。蘇爾古特國立大學指出,目前業界使用各種特殊指標來分析和改進這類程序的翻譯錯誤。該校的科學家們開發了一個程序,他們稱,該程序能提供比標準方法更深入、更多維的分析。她表示,該程序不僅能評估詞彙匹配度(選詞準確度),還能評估語義準確度(意義傳遞是否正確)和句法結構正確性(句子構建是否規範)。與同類工具相比,其關鍵優勢在於將多種評估方法整合到一個自動化工具中。研究過程中,團隊對主流在線翻譯服務和商用神經網絡的譯文進行了分析。針對每份譯文都生成了詳細報告,任何指標得分較低的句子都會自動標亮以供進一步分析。蘇爾古特國立大學的研究人員表示,部分翻譯工具在詞彙匹配度(選詞精確性)方面表現良好。然而,所有測試系統在翻譯複雜的語法結構時都遇到了困難。蘇爾古特國立大學的科學家們研究成果的核心是基於Python語言開發的程序,運用了自然語言處理專用工具庫nltk,使計算機能夠"理解"並將文本分割成獨立句子和詞彙。同時採用了Stanza庫進行語法分析,識別每個詞語在句子中的語法功能。
https://big5.sputniknews.cn/20251016/1067928293.html
俄羅斯衛星通訊社
feedback.cn@sputniknews.com
+74956456601
MIA „Rossiya Segodnya“
2025
俄羅斯衛星通訊社
feedback.cn@sputniknews.com
+74956456601
MIA „Rossiya Segodnya“
News
cn_CN
俄羅斯衛星通訊社
feedback.cn@sputniknews.com
+74956456601
MIA „Rossiya Segodnya“
https://cdn.sputniknews.cn/img/07e5/01/1a/1032964455_33:0:1140:830_1920x0_80_0_0_f4efe40ec1b2777bb66780ba9e8ab55c.jpg俄羅斯衛星通訊社
feedback.cn@sputniknews.com
+74956456601
MIA „Rossiya Segodnya“
俄羅斯, 語言, 科學
俄研究人員找到消除在線翻譯錯誤的方法
蘇爾古特國立大學的科學家們開發出一款能夠分析機器翻譯程序錯誤的工具,該工具有助於提升該領域的研發質量。據該校新聞處消息,研究人員已獲得專利。
如今,在線翻譯已成為常用工具,但其翻譯質量仍不穩定。蘇爾古特國立大學指出,目前業界使用各種特殊指標來分析和改進這類程序的翻譯錯誤。
該校的科學家們開發了一個程序,他們稱,該程序能提供比標準方法更深入、更多維的分析。
蘇爾古特國立大學語言學專業碩士研究生亞羅斯拉娃·巴庫緬科說道:“許多評估指標,尤其是BLEU(雙語評估替換),這種最常見的通過統計短語字面匹配度進行評價的系統,可能會呈現片面的結果。我們的發明解決了這個問題,它能進行綜合分析,在句法和語義傳達層面揭示翻譯的薄弱環節。”
她表示,該程序不僅能評估詞彙匹配度(選詞準確度),還能評估語義準確度(意義傳遞是否正確)和句法結構正確性(句子構建是否規範)。與同類工具相比,其關鍵優勢在於將多種評估方法整合到一個自動化工具中。
研究過程中,團隊對主流在線翻譯服務和商用神經網絡的譯文進行了分析。針對每份譯文都生成了詳細報告,任何指標得分較低的句子都會自動標亮以供進一步分析。
蘇爾古特國立大學的研究人員表示,部分翻譯工具在詞彙匹配度(選詞精確性)方面表現良好。然而,所有測試系統在翻譯複雜的語法結構時都遇到了困難。
該校語言學與翻譯學系副教授阿克薩娜·塔吉博娃指出:“我們成功開發的工具不僅能提供整體評估,更能精確識別錯誤類型——無論是詞彙、語法還是語義錯誤。這使分析過程更加高效,有助於明確機器翻譯系統的改進方向。”
蘇爾古特國立大學的科學家們研究成果的核心是基於Python語言開發的程序,運用了自然語言處理專用工具庫nltk,使計算機能夠"理解"並將文本分割成獨立句子和詞彙。同時採用了Stanza庫進行語法分析,識別每個詞語在句子中的語法功能。