Почему переводчикам не нужно бояться нейросетей гугла

      Комментарии к записи Почему переводчикам не нужно бояться нейросетей гугла отключены

Почему переводчикам не нужно бояться нейросетей гугла

Эта заметка — громадной комментарий к новости про Гугл Translate подключил русский язык к переводу с глубинным обучением. На первый взгляд, звучит и выглядит всё весьма сильно. Но поясню, из-за чего не следует спешить с выводами про «переводчики больше не необходимы».

Трюк в том, что на сегодня разработка способна заменить… да никого она не может заменить.

Переводчик — это не тот, кто знает зарубежный язык, так же как фотограф — это не тот, кто приобрел громадную тёмную зеркалку. Это нужное условие, но далеко не достаточное.

Переводчик — это тот, кто превосходно знает собственный язык, прекрасно осознаёт чужой и может совершенно верно передать оттенки смысла.

Все три условия ответственные.

До тех пор пока мы не видим кроме того первую часть (в плане «знает собственный язык»). Ну, как минимум для русского, пока всё весьма и весьма не хорошо. Вот уж что-то, а расстановка запятых превосходно алгоритмизуется (Word справился году так в 1994, лицензировав метод у местных), да и для нейросети имеющегося корпуса текстов ООН легко выше крыши.

Кто не в курсе, все официальные документы ООН выпускаются на пяти языках постоянных участников Совета безопасности, включая русский, и это самая большая база весьма качественных переводов одних и тех же текстов для данных пяти языков. В отличие от переводов художественных произведений, где «переводчика Остапа может понести», база ООН отличается правильнейшей передачей узких оттенков смысла и совершенным соответствием литературным нормам.Данный факт, плюс полная бесплатность, делает её совершенным комплектом текстов (корпусом) для тренировок неестественных переводчиков, не смотря на то, что она и покрывает лишь сугубо официально-бюрократическое подмножество языков.

Возвратимся к нашим баранам переводчикам. По закону Парето, 80% опытных переводчиков — нехорошие. Это люди, каковые закончили курсы иностранного языка либо, в лучшем случае, какой-нибудь региональный педагогический институт по профессии «преподаватель зарубежного языка младших классов для сельской местности».

И никаких вторых знаний у них нет. В противном случае не сидели бы на одной из самых низкооплачиваемых работ.

Понимаете, на чём они получают? Нет, не на переводах. В большинстве случаев, клиенты этих переводов знают текст на зарубежном языке лучше переводчика.

Они сидят на требованиях законодательства и/либо местных обычаев.

Ну вот у нас положено, дабы инструкция к товару была на русском. Исходя из этого импортёр находит человека, что немножечко знает «импортный» язык, и тот эту инструкцию переводит. Данный человек не знает товара, не имеет никаких знаний в данной области, у него было «три с минусом» по русскому, но — переводит.

Итог всем известен.

Ещё хуже, если он переводит «в обратную сторону», т.е. на чужой язык (привет китайцам). Тогда его труд вполне возможно попадает в «баннизмы» Экслера либо их местный аналог.

Либо вот вам более тяжелый случай. При обращении в гос. органы с зарубежными документами необходимо представить перевод этих документов. Причём перевод должен быть не от дяди Васи, а от юридически глубокоуважаемой конторы, с «мокрыми» печатями и т.д.

Ну вот сообщите, как сложно «перевести» водительское удостоверение либо в том месте свидетельство о рождении? Все поля стандартизированны и пронумерованы. «Переводчику» необходимо, в нехорошем случае, имена личные с одного алфавита на другой. Но нет, «дядя Вася» отдыхает, причём, значительно чаще, благодаря кроме того не закону, а просто внутренним руководствам местных чиновных начальничков.

Обратите внимание, 80% переводческих контор живут при нотариусах. Предугадайте с трёх раз, из-за чего?

Как на этих переводчиков повлияет появление хорошего машинного перевода? Да никак. Ну т.е. имеется надежда, что уровень качества их переводов всё-таки улучшится в каких-то небольших качествах, где имеется что переводить. Ну и всё. Рабочее время тут значительно не уменьшится, по причине того, что они и по сей день солидную часть времени копируют текст из графы в графу. «В этом сыре столько-то белков, столько-то углеводов…» Национальные формы в различных государствах различные, исходя из этого работы им меньше не станет.

Особенно если не прилагать упрочнений.

Промежуточный вывод: для нижних 80% не изменится ничего. Они и без того получают не по причине того, что переводчики, а по причине того, что бюрократы самого нижнего уровня.

Сейчас взглянуть на противоположную часть спектра, ну пускай это будут верхние 3%.

Самый важный, не смотря на то, что и не самый технически сложный 1%: синхронный перевод крайне важных переговоров. В большинстве случаев между большими корпорациями, но в пределе — в ООН либо похожих верхах. Одна неточность переводчика при передаче кроме того не смысла — чувств, может привести, в самом нехорошем случае, к ядерной войне.

Наряду с этим, как вы осознаёте, эмоциональный окрас кроме того совпадающих практически фраз в различных языках может весьма различаться. Т.е. переводчик обязан идеально знать оба культурных контекста собственных рабочих языков. Очевидные примеры — слова «инвалид» и «негр».

Они практически нейтральны в русском и ярко эмоционально окрашены, впредь до обсценности, в современном британском.

Такие переводчики смогут не опасаться ИИ: никто ни при каких обстоятельствах не доверит такую ответственность машине.

Следующий 1% — это художественные переводчики. Ну вот у меня, к примеру, целая полка выделена под шепетильно собираемые уникальные английские издания Конана Дойля, Льюиса Кэролла, Хью Лори — в оригинале, без всяких в том месте адаптаций и отечественных местных перепечаток. Чтение этих книг превосходно развивает словарный запас, понимаете ли, ну кроме огромного эстетического наслаждения.

Я, дипломированный переводчик, могу пересказать весьма близко к тексту любое предложение из этих книг. Но взяться за перевод? Увы, нет.

Я кроме того не заикаюсь о переводах поэзии.

Наконец, самый технически сложный (для нейросети — по большому счету неосуществимый) 1% это научно-технический перевод. В большинстве случаев, в случае если какая-то команда в какой-то стране вырвалась вперёд в собственной области, они именуют изобретения и свои открытия на своём языке. Может так появляться, что в второй стране вторая команда независимо изобрела/открыла то же самое.

Так появились, к примеру, законы Бойля-Мариотта, Менделеева-Пуассона и споры на тему Попов / Маркони, Можайский / братья Райт / Сантос-Дюмон.

Но в случае если зарубежная команда «совсем ускакала» вперёд, у «догоняющих» учёных имеется два варианта в лингвистическом смысле: калькировать либо переводить.

Калькировать заглавия новых разработок, само собой разумеется, несложнее. Как раз так в русском показались алгебра, компьютер и медицина, во французском — bistro, datcha и vodka; в британском — sputnik, tokamak и perestroika.

Но время от времени всё-таки переводят. Голос гуманитария в моей голове дико прётся от термина тачсота для обозначения довода преобразования Фурье от преобразования Фурье, как перевод для querquency. Шутки в сторону, таких терминов нет в гугле — но у меня имеется бумажный учебник по цифровой обработке сигналов, одобренный и освящённый минобром, в котором эти термины имеется.

И да, анализ тачсоты — это единственный (узнаваемый мне) метод отличить мужской голос от женского. Варианты?

Я к чему клоню: этим людям нечего опасаться, по причине того, что они сами формируют язык, вводят в него термины и новые слова. Нейросети всего лишь обучаются на их ответах. Ну, не забывая тот факт, что инженеры и эти учёные не на переводах получают.

Ну и, наконец, «средний класс», хорошие опытные переводчики, но не топы. С одной стороны, они ещё защищены бюрократией — переводят, к примеру, инструкции, но уже не к травяным бадам, а, допустим, к обычным лекарствам либо в том месте станкам. Иначе — это уже сейчас современные работники с высокой автоматизацией труда.

Их работа уже на данный момент начинается с составления «словарика» терминов, дабы перевод был единообразен, а дальше, по сути, пребывает в редактировании текста в специальном софте типа trados. Нейросети уменьшат количество нужных правок и увеличат производительность труда, но принципиально ничего не поменяют.

Итого, слухи о скорой смерти профессии простого переводчика мало преувеличены. На всех уровнях мало ускорится работа и мало увеличится борьба, но — ничего необыкновенного.

А вот кому дастся — так это переводчикам-журналистам. Ещё 10 лет назад они имели возможность нормально сослаться на английскую статью, из которой ничего не осознали, и написать полный абсурд. Сейчас также пробуют, но опытные британский читатели их раз за разом макают в… ну вы осознали.

В-неспециализированном, их время прошло. С универсальным машинным переводчиком среднего уровня, пускай и мало корявым, «журналисты» типа alizar либо ragequit становятся легко безработными.

Нейросети: Люди уже не самые умные существа на планете Земля


Интересные записи на сайте:

Подобранные по важим запросам, статьи по теме: