Почему кыргызский Google Переводчик предлагает «странные» переводы?

При тестировании кыргызской версии Google Переводчика пользователи обнаружили «странные» переводы слов. Кыргызстанский программист объяснил, почему «дурак» переводится сервисом как «акмак аял» — «дурная женщина».

Cервис языковых переводов официально обновился в ночь на 18 февраля. Наряду с дюжиной новых языков, в него был добавлен и кыргызский.

Кыргызстанские пользователи социальных сетей начали тестировать переводчик и обнаружили переводы слов, которые показались им смешными или оскорбительными.

12755415_1045675105475559_2124342716_o

Программист Даниил Вартанов в интервью Kloop.kg пояснил, что Google в своих переводах опирается на то, как те или иные фразы или слова пишут пользователи интернета в своих текстах.

«Навряд ли волонтёры загружали тексты такого характера, чтобы там были слова типа “акмак аял” [“дурная женщина” – прим.ред]. Очевидно, это слово Google Переводчик почерпнул в интернете, в тех редких крупицах, когда кыргызский текст был представлен где-то ещё», — прокомментировал Вартанов.

12499134_1045675575475512_628903484_o

По словам Вартанова, подобные случаи уже неоднократно встречались: например, с английского Google переводил фразу «Government decided» (Государство решило) как «Назарбаев решил», а с украинского — «Росiйська Федерацiя» (Российская Федерация) как «Мордор» [страна, где находятся главные силы Тьмы и Зла в мирах британского писателя Дж. Р. Р. Толкина].

12499123_1045675738808829_830200161_o

Корпорация Google после этого случая объяснила российскому изданию РБК, что их переводчик является автоматическим и в своей работе использует определённые алгоритмы.

«Когда Google Переводчик создает автоматический перевод, он использует образцы из сотен миллионов документов, чтобы определить, какой вариант может быть наиболее правильным. Но автоматический перевод — это очень сложная система, поскольку значение слов зависит от контекста, в котором они используются», — сообщил тогда представитель компании.

12752248_1045675682142168_1330637439_o

Вартанов считает, что возмущаться некорректными переводами Google с кыргызского — «это всё равно что на зеркало пенять».

«Пенять надо на общество, которое так говорит. А ещё лучше — на себя, за то, что не нажали кнопку “Предложить лучший перевод” и не работали с волонтёрами над двуязычными текстами. Так что винить Google — всё равно, что винить Википедию в отсутствии интересующей вас статьи», — сказал он.

По словам директора фонда «Биздин мурас» Чоробека Сааданбекова, который непосредственно работал над тем, чтобы добавить кыргызский в переводчик Google, на сегодняшний день волонтеры загрузили в базу около миллиона фраз и порядка четырех миллионов слов.

Сервис языковых переводов постоянно пополняется, и у пользователей есть возможность предлагать свой вариант перевода, нажав на кнопку «Предложить исправление».