Об истории и перспективах систем перевода

УДК 621.311.04

ОБ ИСТОРИИ И ПЕРСПЕКТИВАХ СИСТЕМ ПЕРЕВОДА

Коженин Н.А., КГЭУ, г. Казань

Кандидат филологических наук, доцент - Муллахметова Г. Р.

 

Начиная с 1947 года американские учёные, а за ними русские, японские и французские учёные начали разработку систем перевода в военных целях. Первые опыты проводились уже в 1954, однако низкое качество перевода поставило «крест» на этой идеи. Но с приходом семидесятых годов, эта сфера получила новую жизнь, однако уже в коммерческих целях.

До сих пор, все системы работали на дословном переводе текста и подстановки правил в него (фразобазируемый перевод), однако совсем недавно лидирующие компании, (Google 27 сентября 2016 и Яндекс 14 сентября 2017) перешли на нейросетевую модель, что почти сразу показало свои результаты. По статистике Google, с появлением новой технологии количество ошибок уменьшилось на 60%.

Главной отличительной особенностью этой системы является самообучаемость на сравнении языковых пар. Смысл такой техники заключается в сравнении системой одинаковых текстов, написанных на разных языках. Примером «пищи» могут являться двуязычные парламентские отчёты, издаваемые в Канаде (английский и французский). Или документы стран ЕЭС, которые выходят на 11 языках.

Было проведено сравнение сервисов Google и Яндекс, переводом однотипных фраз в разных временных формах с русского на английский и нахождение аналогичные фразеологизмы в двух языках. Основной проблемой, которой обладали оба был неправильный перевод временной формы. Более того, Яндекс часто опускал слова в предложении либо заменял их несоответствующими контексту. В тесте на фразеологизмы оба переводчика провалились. Стоит заметить, что тест проводился на паре русский – английский, языках, состоящих в разных семьях. Отличный результат может быть в других, более близких парах.

Именно благодаря глубинному обучению можно сказать, что развитие технологий машинного перевода стоять на месте не будет. Хоть и сейчас он сможет связать двух людей, непонимающих друг другу, однако достичь результата чистой речи будет очень сложно.