Дослідники з Тель-Авівського та Аріельського університетів в Ізраїлі розробили модель штучного інтелекту, яка може автоматично перекладати клинописний аккадський текст на англійську мову. Це ще один важливий крок до збереження та поширення культурної спадщини Стародавньої Месопотамії, зазначають вчені.
Про це розповідає просвітницький проект Біблійна археологія з посиланням на The Jerusalem Post.
Фахівці з ассиріології, які спеціалізуються на археологічних, історичних, культурних та лінгвістичних дослідженнях Ассирії та решти Стародавньої Месопотамії, витрачають багато років, намагаючись зрозуміти аккадські тексти, написані клинописом, однією з найдавніших відомих форм письма. Клинопис перекладається як «клиноподібний», тому що в давнину люди писали ним за допомогою очеретяного стилуса, роблячи клиноподібні знаки на глиняній табличці.
Але тепер дослідники з Тель-Авівського та Аріельського університетів розробили модель штучного інтелекту, яка заощадить усі ці зусилля. Ця модель може автоматично перекладати аккадський текст, написаний клинописом, англійською мовою.
Ассирія, названа на честь бога Ашшура (найвищого в пантеоні ассирійських богів), була розташована на Месопотамській рівнині. У 721 р. до н. е. ассирійська армія прийшла з півночі, захопила Північне Ізраїльське царство та забрала десять племен Ізраїля у полон, після чого вони були втрачені для історії.
Археологи знайшли сотні тисяч глиняних табличок на території Стародавньої Месопотамії, написаних клинописом і датованих 3400 роком до нашої ери. Однак табличок знайдено набагато більше, ніж може легко перекласти обмежена кількість експертів, здатних їх прочитати.
Доктор Шай Ґордін з Аріельського університету, доктор Ґай Гутерц та інші з Тель-Авівського університету, та їхні колеги 2 травня опублікували свої висновки в журналі PNAS Nexus під назвою «Переклад з аккадської на англійську за допомогою нейронного машинного перекладу» (Translating Akkadian to English with neural machine translation. Gai Gutherz, Shai Gordin, Luis Sáenz, Omer Levy, Jonathan Berant. PNAS Nexus, Volume 2, Issue 5, May 2023, pgad096).
Під час розробки нової моделі машинного навчання вчені підготували дві версії автоматичного перекладу з аккадської мови: одна перекладає з транслітерованих латиницею написів, а інша — з клинописних елементів юнікоду безпосередньо на англійську.
Перша версія, що використовує латинську транслітерацію, дала більш задовільні результати в цьому дослідженні, досягнувши оцінки 37,47 у Best Bilingual Evaluation Understudy 4 (BLEU4), що є тестом рівня відповідності між машинним і людським перекладом того самого тексту.
Програма найбільш ефективна при перекладі речень довжиною 118 символів або менше. У деяких реченнях вона створювала «галюцинації» — синтаксично правильний, але не точний результат англійською.
Доктор Ґордін зазначив, що в більшості випадків переклад можна буде використовувати як первинну обробку тексту. Автори припускають, що машинний переклад може бути використаний як частина співпраці людей та машини, під час якої люди-вчені виправляють і вдосконалюють результати моделей.
Сотні тисяч глиняних табличок, написаних клинописом, документують політичну, соціальну, економічну та наукову історію Стародавньої Месопотамії, пишуть автори статті, «проте більшість цих документів залишаються неперекладеними та недоступними через їх величезну кількість і обмежену кількість експертів, які можуть їх прочитати».
Вчені підсумовують, що переклад є фундаментальною діяльністю людини, яка має довгу наукову історію від моменту виникнення писемності. «Це може бути складним процесом, оскільки зазвичай вимагає не лише експертного знання двох різних мов, а й різних культурних середовищ. Цифрові інструменти, які можуть допомогти з перекладом, з кожним роком стають все більш поширеними, пов’язаними з досягненнями в таких галузях, як оптичне розпізнавання символів і машинний переклад. Однак стародавні мови все ще становлять серйозну проблему в цьому відношенні. Для їх прочитання і розуміння потрібні знання про давно померлу мовну спільноту, до того ж самі тексти теж можуть бути дуже фрагментарними».