Почему кыргызский Google Переводчик предлагает «странные» переводы?

Опубликовано
Айжамал Идирис

При тестировании кыргызской версии Google Переводчика пользователи обнаружили «странные» переводы слов. Кыргызстанский программист объяснил, почему «дурак» переводится сервисом как «акмак аял» — «дурная женщина».

Cервис языковых переводов официально обновился в ночь на 18 февраля. Наряду с дюжиной новых языков, в него был добавлен и кыргызский.

Кыргызстанские пользователи социальных сетей начали тестировать переводчик и обнаружили переводы слов, которые показались им смешными или оскорбительными.

Программист Даниил Вартанов в интервью Kloop.kg пояснил, что Google в своих переводах опирается на то, как те или иные фразы или слова пишут пользователи интернета в своих текстах.

«Навряд ли волонтёры загружали тексты такого характера, чтобы там были слова типа “акмак аял” [“дурная женщина” – прим.ред]. Очевидно, это слово Google Переводчик почерпнул в интернете, в тех редких крупицах, когда кыргызский текст был представлен где-то ещё», — прокомментировал Вартанов.

По словам Вартанова, подобные случаи уже неоднократно встречались: например, с английского Google переводил фразу «Government decided» (Государство решило) как «Назарбаев решил», а с украинского — «Росiйська Федерацiя» (Российская Федерация) как «Мордор» [страна, где находятся главные силы Тьмы и Зла в мирах британского писателя Дж. Р. Р. Толкина].

Корпорация Google после этого случая объяснила российскому изданию РБК, что их переводчик является автоматическим и в своей работе использует определённые алгоритмы.

«Когда Google Переводчик создает автоматический перевод, он использует образцы из сотен миллионов документов, чтобы определить, какой вариант может быть наиболее правильным. Но автоматический перевод — это очень сложная система, поскольку значение слов зависит от контекста, в котором они используются», — сообщил тогда представитель компании.

Вартанов считает, что возмущаться некорректными переводами Google с кыргызского — «это всё равно что на зеркало пенять».

«Пенять надо на общество, которое так говорит. А ещё лучше — на себя, за то, что не нажали кнопку “Предложить лучший перевод” и не работали с волонтёрами над двуязычными текстами. Так что винить Google — всё равно, что винить Википедию в отсутствии интересующей вас статьи», — сказал он.

По словам директора фонда «Биздин мурас» Чоробека Сааданбекова, который непосредственно работал над тем, чтобы добавить кыргызский в переводчик Google, на сегодняшний день волонтеры загрузили в базу около миллиона фраз и порядка четырех миллионов слов.

Сервис языковых переводов постоянно пополняется, и у пользователей есть возможность предлагать свой вариант перевода, нажав на кнопку «Предложить исправление».

Опубликовано
Айжамал Идирис