Закрыть

Нейросеть впервые перевела книгу с удмуртского языка на русский

14:40, 19 марта, 2024
Нейросеть впервые перевела книгу с удмуртского языка на русский
14:40, 19 марта, 2024
1165
0
Источник фото: Вера Штыкова
1165
0

Сборник рассказов «Перепеч» Багай Аркаша вышел в свет в 1927 году.

Ижевск. Удмуртия. Нейросеть впервые перевела книгу с удмуртского языка на русский. Об этом «Сусанину» рассказала главред литературного журнала «Кенеш» Анастасия Шумилова.

«В начале марта айтишник и культуртрегер удмуртского языка Егор Лебедев отправил мне образцы того, как нейросеть переводит удмуртские тексты из соцсетей на русский. Мы решили проверить, как она переведёт художественные тексты. Оказалось, очень даже неплохо. Подумали, что было бы здорово перевести какую-нибудь удмуртскую книгу. Я тогда перечитывала «Перепеч» Багай Аркаша, так что выбрали её», — рассказала Анастасия Шумилова.

В результате Егор перевёл тексты с помощью нейросети, Анастасия их отредактировала, дизайнер Вера Штыкова всё сверстала и оформила.

«Для осуществления перевода сборника использовалась одна из самых передовых языковых моделей на данный момент — Claude 3 Opus от компании Anthropic. Модель может принимать на вход большой кусок текста, однако выдавать в качестве ответа может лишь небольшую часть, поэтому необходимо давать предложения порционно, примерно по 5-6 параграфов на один запрос. Кроме того, иногда могут теряться знаки препинания, например, кавычки, тире, переносы строк, поэтому нужно дополнительно следить за этим», — отметил в свою очередь Егор Лебедев.

Он также отметил, что в последние годы произошёл значительный прогресс в области автоматического перевода текста благодаря развитию больших языковых моделей (large language models, LLM). Эти модели, обученные на огромных объёмах текстовых данных, способны генерировать высококачественные переводы, приближающиеся по качеству к работе профессиональных переводчиков. Обучаясь на таких объёмах данных, модели улавливают глубокие закономерности и связи как внутри языков, так и между ними. А это позволяет им не просто переводить текст «слово в слово», а учитывать контекст, семантику, грамматику и стилистические особенности. 

Анастасия Шумилова рассказала, что предлагаемый на суд читателей текст — не художественный перевод, и многие достоинства удмуртского текста не дошли до русскоязычного читателя. Тем не менее опыт показал, что нейросети могут стать отличным инструментом для знакомства с непереведёнными на русский удмуртскими текстами — коих множество.

Несколько слов об авторе оригинального текста. Аркадий Николаевич Клабуков (1904–1984), также известный как Багай Аркаш, — удмуртский писатель, переводчик, фольклорист. Получил образование в Ижевском педагогическом техникуме и МГУ имени М. В. Ломоносова. После учёбы вернулся в Ижевск, работал в книжном издательстве «Удмуртия» и в Удмуртском научно-исследовательском институте. Его произведения, написанные для детей, до сих пор пользуются популярностью, и не одно поколение выросло на его поэме «Тютю Макси» (1936). Автор писал и юмористические произведения. Например, в 1926 году в газете «Гудыри» (сейчас это газета «Удмурт дунне») печатались его рассказы из цикла «Локан Петырлэн верамъёсыз» («Рассказы Локан Петыра / Петра Лоханкина»). В 1927 году четыре рассказа этого цикла были опубликованы отдельной книгой «Перепеч».

Прочитать книгу на двух языках можно по ссылке.

Возрастное ограничение: 18+

1165
0