Автоматический (машинный) перевод

Машинный перевод

Пока переводческий компьютер
не может полностью заменить переводчика-человека

Современные суперкомпьютеры оставляют мало шансов шахматисту-человеку, даже если он чемпион мира по шахматам. А вот современные лингвистические процессоры пока не могут составить достойную конкуренцию переводчику-человеку, несмотря на все успехи последних десятилетий в моделировании искусственного интеллекта и постоянное наращивание мощности процессоров.

Системы автоматизированного перевода пока играют лишь вспомогательную роль и в состоянии удовлетворительно декодировать и перевести лишь несложные синтаксические и лексические конструкции. Им пока не под силу разобраться в многозначности, всевозможных аллюзиях и недомолвках, присущих большинству неадаптированных текстов.

Существующие словарные и терминологические базы тоже не могут им помочь, так как описывают лишь малую толику словарного запаса современных живых языков.

Если вы хотите поймать кайф от «автоматизированного перевода», сходите, например, на страницу: querywords.ru/english/Finder%27s+Fee
Понять, о чем идет речь, конечно можно. Но в принципе это пока набор слов. И уж никак не годится для справочных нужд.

Если Вам нужно понять приблизительную тему сообщения на китайском или каком-то другом языке, которого Вы совершенно не знаете, то широко предлагаемая сегодня в Интернете функция онлайн-перевода посещаемых страниц может действительно пригодиться.

Но предлагать эти инструменты для профессионального использования в переводческой деятельности без последующей основательной доработки и переделки полученных сырых результатов, мягко говоря, несерьезно.

Правда, некоторые переводчики тем не менее умудряются использовать подобные машинные заготовки, чтобы, как они говорят, «не набивать текст вручную и не выискивать термины». Лично для меня такая «технология» работы только лишняя трата времени и неоправданный риск профессиональным имиджем, заработанным долгими годами упорного труда.

Юрий Новиков, 2009

«В последние несколько лет повсеместное распространение технологий машинного перевода (MT) вызвало рост скорости перевода. В среднем по отрасли это повышение производительности невелико, но оно повлекло за собой значительное усиление ценового давления на переводческие компании во всех сферах, в том числе тех, где машинный перевод не используется либо не играет существенной роли.

В результате цены снизились везде, зачастую весьма заметно, и это повлияло на многих ключевых игроков в отрасли. Теперь компания может выполнить больше работы, но ее доход будет таким же, как и раньше, или даже немного ниже.»

Леонид Глазычев, кандидат физико-математических наук, генеральный директор компании Логрус. Оценка размеров переводческих компаний: научный метод сопоставления несопоставимого

Что такое машинный перевод и чем он отличается от автоматизированного перевода

Википедия о машинном переводе
Машинный перевод — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой с помощью специальной компьютерной программы. Так же называется направление научных исследований, связанных с построением подобных систем. Не следует путать с термином «Автоматизированный перевод».

Автоматизированный перевод (АП, англ. Computer-Aided Translation) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.

Что пишут в Интернете о средствах автоматизации процесса перевода

Машинный перевод — автоматизированный перевод — системы Translation Memory

Юрий Василенко. О применимости термина «Система автоматизированного перевода» к так называемым «CAT-системам» (trengtor.com/translation-notes/)
Если мы попробуем абстрагироваться от круга общения профессиональных переводчиков, то увидим следующее: слово «автоматизированный» ассоциируется у людей (безотносительно к занимаемым должностям и образовательному цензу) со словом «автоматический» и с «большой зеленой кнопкой». Т.е. такая система, в их понимании, работает автоматически, а переводчик только вводит в нее все новые и новые листы исходного текста. Т.е. это уже и не переводчик вовсе, а всего лишь «оператор системы автоматизированного перевода». Отсюда остается всего один маленький шаг до полного смешения понятий и синонимизации таких терминов, как «система автоматизированного перевода», «система автоматического перевода» и «система машинного перевода». Что, собственно, и происходит очень часто на практике — достаточно заглянуть в любой околопереводческий форум. А словари и вовсе просты: computer-aided translation (CAT) — компьютерный перевод, машинный перевод.

AET.su — Обзор программ и онлайн-сервисов для перевода текстов

ПО для перевода текстов: Trados Обсуждение в форуме (forum.perevodby.ru)
Посмотрите в сторону WordFast (www.wordfast.net/index.php?lang=ru01). По функциональности практически ничем не уступает раскрученному в России Традосу, но значительно стабильнее и лицензия стоит дешевле. Кроме того, вы можете скачать с сайта абсолютно функциональную версию, в которой копилка переводов ограничена 500 блоками. Поверьте, это достаточно много, около 20 условно-печатных страниц.

Я пользуюсь двумя пакетами программами в основном — Trados и Deja Vu.

Традос состоит из трех основных программ:

  • Trados WorkBench — собственно говоря сам модуль накопления текстов.
  • Trados TagEditor — интерфейс для работы с форматированными текстами, а также с различными форматами текстов — Excel, PowerPoint, Word и т.д.
  • Trados WinAlign — программа для сопоставления сегментов в файлах оригинала и перевода, и последующего формирования Translation Memory (TM).

Есть также простейший инструмент для работы в MS Word — однако — именно этот инструмент вызывает наиболее количество негативных эмоций, этот инструмент довольно часто вешает Ворд при работе с большими файлами.

Дежавю очень болезненно прожевывает очень крупные файлы — например, у меня при попытке конвертировать в проект файл размеров в 50 мегабайт — дежавю попросту останавливается не начав процесс. Т.е. не зависает, но и не конвертирует. Кроме того, Дежавю проблематично работает с файлами, где много картинок или много элементов форматирования.

Дни переводчиков-синхронистов сочтены (www.langu.rubr)> В университете Карнеги-Меллона в Питтсбурге, США прошла первая открытая демонстрация возможностей систем автоматического перевода живой речи на другие языки в реальном масштабе времени.

Научные публикации по машинному переводу на английском и русском языке — cl.iitp.ru
электронные тексты для чтения и скачивания (Лаборатория компьютерной лингвистики Института проблем передачи информации РАН)

Л.Л. Иомдин, 2004. Уроки машинного перевода для детей и взрослых — cl.iitp.ru
[Лингвистика для всех. Зимняя лингвистическая школа–2004. Москва, НИИРО. С. 56–68] Файл pdf. «Что такое машинный, он же автоматический, он же компьютерный, перевод? Сейчас, когда для перевода текстов с одного языка на другой компьютер используется самыми разными способами – от двуязычных и многоязычных электронных словарей до систем типа translation memory («память», или «архив» переводов), этот вопрос оказывается не таким уж простым. Мы будем понимать машинный перевод как процесс, при котором компьютер по заданному тексту на одном языке производит новый текст на другом языке, которого раньше в этом компьютере не было: понятно, что ни словари, ни архивы переводов таким свойством не обладают.»

Мария Якушина. Машинный и профессиональный перевод. — norma-tm.ru
Определенные категории текста электронный переводчик способен более или менее адекватно передать на другом языке. Прежде всего, это относится к документам, где в большом количестве используются устойчивые лексические обороты (особенно к юридическим документам). К сожалению, даже в этом случае не удается избежать ошибок.

Системы автоматизированного перевода и Translation Memory (TM) — gigatran.ru
Память переводов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац).

Срочный перевод на английский онлайн переводчиками — le-mon.ru
Перед началом дискуссии о разнообразном множестве уже на текущий момент доступных систем автоматического перевода (программ-переводчиков) следует прежде всего ответить на главный вопрос, поднимаемый в контексте систем машинного перевода.

Срочные переводы с английского на русский и наоборот характеризуются достаточно низким качеством на текущий момент, в этой связи появляется закономерный вопрос: неужели профессиональный перевод с английского на русский, реализованный на уровне специальных программ-переводчиков, до сих пор остается делом будущего?

Структура и функции автоматического многоязычного переводного словаря -dialog-21.ru (2004)
Автоматический многоязычный переводной словарь (АМПС) разрабатывается как часть интегрированной лексикографической базы Украинского языково-информационного фонда Национальной академии наук Украины (УЯИФ НАНУ)

Машинный перевод: взаимодействие переводчика и ЭВМ, качество перевода

Машинный (компьютерный, автоматический) перевод

Машинный перевод противопоставляется переводу, сделанному человеком без использования информационных технологий – «ручному» переводу.

Первые алгоритмы машинного перевода использовали перекодирование текста исходного языка ( ИЯ ) на текст языка перевода ( ПЯ ). В специальной литературе преобразование исходного текста в конечный стало называться трансфер [1].

В 1947 г. в США, после появления первых ЭВМ, была высказана идея использовать их для перевода. В 1954 г. прошла первая демонстрация возможностей машинного перевода. Несмотря на несовершенство использовавшейся системы (около 250 слов в словаре, 6 правил грамматики), эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и в СССР [2].

Формы организации взаимодействия человека и ЭВМ при машинном переводе

1. С постредактированием : исходный текст перерабатывается машиной, а человек-редактор исправляет результат. Автоматический перевод с постредактированием: включает работу с «грубым» переводом предварительно нередактированного текста, сделанным машиной, с целью привести его в соответствие с нормами языка перевода;

2. С предредактированием : человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.

Преобразование текста перед его вводом в систему перевода осуществляется таким образом, чтобы отредактированный текст на лексико-семантическом и грамматическом уровнях приближался к языку перевода или к конструкциям языка-источника, правила преобразования которых формализованы и известны используемой системе;

3. С интерредактированием : человек вмешивается в работу системы перевода, разрешая трудные случаи. Подразумевает взаимодействие человека и машины в процессе самого перевода; человек при этом разрешает трудные случаи «онлайн» (например, при переводе лексически неоднозначных единиц определяет, какую именно единицу следует употребить в каждом случае).

Смешанные системы (например, одновременно с пред- и постредактированием) [2, 3].

Автоматизированный перевод

Вместо « машинный » иногда употребляется слово « автоматический », что не влияет на смысл. Однако термин « автоматизированный перевод » имеет совсем другое значение — при нём программа просто помогает человеку переводить тексты.

Автоматизированный перевод предполагает такие формы взаимодействия:

1. Частично автоматизированный перевод : например, использование переводчиком-человеком компьютерных словарей.

2. Системы с разделением труда : компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё, не уложившееся в схему, отдаёт человеку.

В англоязычной терминологии также различаются термины machine translation , MT (полностью автоматический перевод) и machine-aided или machine-assisted translation ( MAT ) (автоматизированный); если же надо обозначить и то, и другое, пишут M(A)T .

Существуют два принципиально разных подхода к построению алгоритмов машинного перевода: основанный на правилах ( rule-based ) и статистический , или основанный на статистике ( statistical (phrase-based) ). Первый подход является традиционным и используется большинством разработчиков систем машинного перевода (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии и др.). Ко второму типу относится популярные переводные сервисы от Яндекс и Google [2].

Качество перевода

После первоначальной эйфории в истории машинного перевода было осознано, что перевод связан с объектом чрезвычайной сложности — с естественным языком, что с первоначально поставленной задачей разработки полноценного перевода при помощи машины справиться не так легко. К тому же перевод — это творческая деятельность, и уже хотя бы поэтому он не может быть в полной мере заменен машиной. В результате начальную эйфорию сменили более уравновешенные взгляды на возможности машинного перевода. Стало ясно, что он, хотя и не заменил собой переводчика-человека, все же может быть ему полезен [1].

Современные компьютерные программы перевода достаточно совершенны, но они до сих пор не могут разрешить самую сложную задачу процесса перевода: выбор контекстуально-необходимого варианта, который в каждом тексте обусловлен многими причинами. В результате начальную эйфорию сменили более уравновешенные взгляды на возможности машинного перевода. В настоящее время результат этого вида перевода может быть использован как черновой вариант будущего текста, который будет редактировать переводчик , а также как средство, чтобы в крайней ситуации отсутствия переводчика получить общее представление о теме и содержании текста [1].

Качество перевода зависит от тематики и стиля исходного текста, а также грамматической, синтаксической и лексической родственности языков, между которыми производится перевод.

Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее, для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке.

Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных шуток [2].

Ошибки обусловлены тем, что компьютер не может думать образами и не имеет возможности оперировать реалиями разных культур и эпох так, как это способен делать человеческих мозг [4].

Лексические анализы переведенных текстов показали, что по большей части электронные переводчики адекватно переводят простые части речи, но допускают ошибки в переводе падежей, принадлежности прилагательных, речевых оборотов, построения предложения.

Недостатком некоторых переводчиков является неточность перевода слов, имеющих несколько значений. Для более адекватного перевода в перспективе можно предложить более глубокий эвристический анализ грамматического построения предложения, с улучшением качества перевода различных частей речи и их грамматических характеристик, а так же исключить конфликт словарей при переводе специализированных текстов.

Грамматический анализ текстов показывает, что электронный переводчик справляется с переводом слов во множественном и единственном числе, но имеется определенная трудность в переводе падежей и постановки глаголов в нужное число. Это объясняется различной интерпретацией падежей в русском и английском языках: в русском – через окончание, в английском – через предлоги [5].

Наряду с установленными правилами построения предложения в каждом языке существуют и свои неписаные законы, которые иногда называются красотами языка. Например, предложение на английском языке «This is my book» дословно переводится «Это есть моя книга», и формально это будет правильным, но по-русски так не говорят. В данном случае можно сказать, что предложение «написано так, будто его составил иностранец». Конечно, приведенный пример является простейшим, и возможность исключения слова «is» очень просто отражается в программе машинного перевода. Но на практике получившийся перевод похож на текст, написанный иностранцем.

Текст также может содержать слова, которые нужно понимать в контексте образа жизни людей в конкретной стране. Например, под словом «демократ» в США подразумеваются политики, выступающие за большее вмешательство государства в экономику, а в России те, кто выступает за большую свободу рынка. Это разные понятия [6].

В настоящее время сфера использования машинного перевода сводится к промышленному переводу. Он может помочь в рутинной переводческой работе, когда быстрота выполнения перевода важнее его качества. Например, он может оказаться кстати для специалиста, не владеющего тем или иным иностранным языком, на котором ему нужно прочитать интересующий его текст. Хотя машинный перевод, как правило, оказывается полным ошибок и неувязок, человек вполне может получить общее представление о содержании текста, что поможет ему решить, стоит ли заказывать более качественный перевод или попытаться отредактировать полученный. Таким образом, машинный перевод позволяет получить то, что И. С. Алексеева условно назвала « сигнальным переводом » [1].

С 1976 г. машинный перевод используется для перевода прогнозов погоды с английского языка на французский в Канаде. Система работает со скоростью 1000 слов в минуту. Каждый день машины переводят до 30000 слов, работая при этом всего полчаса в день. Успех программы объясняется тем, что в текстах метеорологических сводок используется ограниченная по тематике лексика, а также стандартные синтаксические конструкции [1].

Таким образом, результаты машинного перевода почти всегда требуют редактирования. А то, насколько адекватными можно считать результаты перевода на компьютере, определяется не только качеством системы машинного перевода, но и качеством последующего редактирования [6].

МАШИННЫЙ ПЕРЕВОД

МАШИННЫЙ ПЕРЕВОД, выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия. Современный машинный, или автоматический перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков L1 – L2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.

Наиболее распространенной является следующая последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкретной грамматической форме, например дательного падежа множественного числа) во входном словаре (словаре языка, с которого производится перевод) с сопутствующим морфологическим анализом, в ходе которого устанавливается принадлежность данной словоформы к определенной лексеме (слову как единице словаря). В процессе анализа из формы слова могут быть получены также сведения, относящиеся к другим уровням организации языковой системы.

2. Следующий этап включает в себя перевод идиоматических словосочетаний, фразеологических единств или штампов данной предметной области (например, при англо-русском переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамматического анализа); определение основных грамматических (морфологических, синтаксических, семантических и лексических) характеристик элементов входного текста (например, числа существительных, времени глагола, синтаксических функций словоформ в данном тексте и пр.), производимое в рамках входного языка; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round может быть существительным, прилагательным, наречием, глаголом или же предлогом); лексический анализ и перевод лексем. Обычно на этом этапе однозначные слова отделяются от многозначных (имеющих более одного переводного эквивалента в выходном языке), после чего однозначные слова переводятся по спискам эквивалентов, а для перевода многозначных слов используются так называемые контекстологические словари, словарные статьи которых представляют собой алгоритмы запроса к контексту на наличие/отсутствие контекстных определителей значения.

3. Окончательный грамматический анализ, в ходе которого доопределяется необходимая грамматическая информация с учетом данных выходного языка (например, при русских существительных типа сани, ножницы глагол должен стоять в форме множественного числа, при том что в оригинале может быть и единственное число).

4. Синтез выходных словоформ и предложения в целом на выходном языке.

В зависимости от особенностей морфологии, синтаксиса и семантики конкретной языковой пары, а также направления перевода общий алгоритм перевода может включать и другие этапы, а также модификации названных этапов или порядка их следования, но вариации такого рода в современных системах, как правило, незначительны. Анализ и синтез могут производиться как пофразно, так и для всего текста, введенного в память компьютера; в последнем случае алгоритм перевода предусматривает определение так называемых анафорических связей (такова, например, связь местоимения с замещаемым им существительным – скажем, местоимения им со словом местоимения в самом этом пояснении в скобках).

Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Современные аппаратные и программные средства допускают использование словарей большого объема, содержащих подробную грамматическую информацию. Информация может быть представлена как в декларативной (описательной), так и в процедурной (учитывающей потребности алгоритма) форме.

Современный машинный перевод следует отличать от использования компьютеров в помощь человеку-переводчику. В последнем случае имеется в виду автоматический словарь, помогающий человеку быстрее подбирать нужный переводной эквивалент. Хотя и в том, и в другом случае компьютер работает вместе с человеком (переводчиком или редактором), в содержание термина «машинный перевод» входит представление о том, что главную, бóльшую часть работы по переводу и отысканию переводных эквивалентов и переводных соответствий машина берет на себя, оставляя человеку лишь контроль и исправление ошибок, в то время как компьютерный словарь в помощь человеку – это чисто вспомогательное средство для быстрого нахождения переводных соответствий; при этом, однако, в такого рода словарях в ограниченной степени могут быть реализованы и некоторые функции, присущие системам машинного перевода.

В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для пост-редактирования. Такого рода системы машинного перевода используются в организациях, потребности которых в оперативных и качественных переводах достаточно велики.

Теоретической основой начального (конец 1940-х – начало 1950-х годов) периода работ по машинному переводу был взгляд на язык как кодовую систему. Пионерами МП были математики и инженеры. Описания их первых опытов, связанных с использованием только что появившихся ЭВМ для решения криптографических задач, были опубликованы в США в конце 1940-х годов. Датой рождения машинного перевода как исследовательской области обычно считают март 1947; именно тогда специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного перевода, сравнив ее с задачей дешифровки.

Тот же Уивер после ряда дискуссий составил в 1949 меморандум, в котором теоретически обосновал принципиальную возможность создания систем машинного перевода. Вскоре началось финансирование исследований; в 1952 состоялась первая конференция по машинному переводу, организованная логиком и математиком Й.Бар-Хиллелом.

Помимо очевидных практических нужд важную роль в становлении машинного перевода сыграло то обстоятельство, что предложенный в 1950 английским математиком А.Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с человеком на естественном языке таким образом, что тот не в состоянии будет отличить ее от собеседника-человека. Тем самым вопросы компьютерной обработки естественноязыковых сообщений на десятилетия оказались в центре исследований по кибернетике (а впоследствии по искусственному интеллекту), а между математиками, программистами и инженерами-компьютерщиками, с одной стороны, и лингвистами – с другой установилось продуктивное сотрудничество.

В 1954 общественности были предъявлены первые результаты: фирма IBM совместно с Джорджтаунским университетом (США) успешно осуществили первый эксперимент (вошедший в историю под названием Джорджтаунского), в ходе которого система, использовавшая словарь из 250 слов и грамматику из 6 синтаксических правил, осуществила перевод 49 заранее отобранных предложений. В том же 1954 первый эксперимент по машинному переводу был осуществлен в СССР И.К.Бельской (лингвистическая часть) и Д.Ю.Пановым (программная часть) в Институте точной механики и вычислительной техники Академии наук СССР, а первый промышленно пригодный алгоритм машинного перевода и система машинного перевода с английского языка на русский на универсальной вычислительной машине были разработаны коллективом под руководством Ю.А.Моторина. После этого работы начались во многих информационных институтах, научных и учебных организациях страны.

Идея машинного перевода стимулировала развитие исследований в теоретическом и прикладном языкознании во всем мире. Появились теории формальных грамматик, большое внимание стало уделяться моделированию языка и отдельных его аспектов, языковой и мыслительной деятельности, вопросам языковой формы и количественных распределений лингвистических явлений. Возникли новые направления лингвистической науки – вычислительная, математическая, инженерная, статистическая, алгоритмическая лингвистика и ряд других отраслей прикладного и теоретического языкознания. В течение 1950-х годов в учебных центрах многих стран мира были открыты отделения прикладной лингвистики и машинного перевода. Так, в СССР такие отделения были созданы в Москве (МГУ им. М.В.Ломоносова, МГПИИЯ им. М.Тореза – ныне МГЛУ), в Минском МГПИИЯ, в Ереване, Махачкале, Ленинградском университете, в университетах Киева, Харькова, Новосибирска, ряда других городов. Исследования и разработки по машинному переводу развернулись также во Франции, Англии, США, Канаде, Италии, Германии, Японии, Нидерландах, Болгарии, Венгрии и других странах, а также в международных организациях, где велик объем переводов с различных языков. В настоящее время исследования по МП ведутся и в таких странах, как Малайзия, Саудовская Аравия, Иран и др.

Исследования по машинному переводу за свою пятидесятилетнюю историю переживали как подъемы, так и спады. В начале 1960-х годов завершился первоначальный эйфорический этап в развитии МП, чему в сильнейшей степени способствовала публикация так называемой «Черной книги машинного перевода» – доклада Специального комитета по прикладной лингвистике (ALPAC) Национальной академии наук США, в котором была констатирована невозможность создания в обозримом будущем универсальных систем высококачественного машинного перевода. Следствием этой публикации было сокращение финансирования и общее снижение интереса к проблематике МП, однако полного сворачивания исследований, в особенности теоретических, не произошло.

Новый подъем исследований в области МП начался в 1970-х годах и был связан с серьезными достижениями в области компьютерного моделирования интеллектуальной деятельности. Соответствующая область исследований, возникшая несколько позже МП (датой ее рождения обычно считают 1956), получила название искусственного интеллекта, а создание систем машинного перевода было осмыслено в 1970-е годы как одна из частных задач этого нового исследовательского направления.

В школе этого не расскажут:  Стоять 止 Ключевой иероглиф №77

Можно выделить два основных стимула к развитию работ по машинному переводу в современном мире. Первый – собственно научный; он определяется комплексностью и сложностью компьютерного моделирования перевода. Как вид языковой деятельности перевод затрагивает все уровни языка – от распознавания графем (и фонем при переводе устной речи) до передачи смысла высказывания и текста. Кроме того, для перевода характерна обратная связь и возможность сразу проверить теоретическую гипотезу об устройстве тех или иных языковых уровней и эффективности предлагаемых алгоритмов. Эта характеристическая черта перевода вообще и машинного перевода в частности привлекает внимание теоретиков, в результате чего продолжают возникать все новые теории автоматизации перевода и формализации языковых данных и процессов.

Второй стимул – социальный, и обусловлен он возрастающей ролью самой практики перевода в современном мире как необходимого условия обеспечения межъязыковой коммуникации, объем которой возрастает с каждым годом. Другие способы преодоления языковых барьеров на пути коммуникации – разработка или принятие единого языка, а также изучение иностранных языков – не могут сравниться с переводом по эффективности. С этой точки зрения можно утверждать, что альтернативы переводу нет, так что разработка качественных и высокопроизводительных систем машинного перевода способствует разрешению важнейших социально-коммуникативных задач.

В ходе развития идей и создания промышленных систем машинного перевода были разработаны способы автоматического морфологического анализа для основных европейских языков, методы автоматического обнаружения синтаксических структур, сформулированы требования к семантическим компонентам систем. В рамках эффективного международного сотрудничества и обмена терминологией созданы большие автоматические словари с разнообразной лексической информацией, банки терминологических данных по разным тематическим областям (например, словарь ЕВРОДИКАТОМ и ряд других словарей, тематика которых определялась тем обстоятельством, что практический машинный перевод чаще всего имеет дело с научными и техническими текстами). Результаты работ по МП способствовали началу и развитию исследований и разработок в области автоматизации информационного поиска, логического анализа естественно-языковых текстов, экспертных систем, способов представления знаний в вычислительных системах и т.д.

В СССР в качестве головной организации по машинному переводу был в 1974 определен Всесоюзный центр переводов научно-технической литературы и документации (ВЦП), взявший на себя координацию работ в масштабе страны. Под его эгидой был проведен ряд крупных международных научных конференций (1975, 1979, 1983, 1985, 1989) по машинному переводу и проблемам научно-технического перевода. В ВЦП были созданы промышленные системы машинного перевода с английского языка на русский АМПАР (на основе исследований и разработок коллектива Ю.А.Моторина), с немецкого языка на русский НЕРПА, с французского языка на русский ФРАП, автоматические терминологические словари в помощь человеку-переводчику. Система АМПАР длительное время находилась в промышленной эксплуатации; впоследствии на ее базе были созданы более эффективные системы МП для персональных компьютеров семейства СПРИНТ. В ВПЦ была также разработана система МП с русского языка на английский АСПЕРА. Большой вклад в разработку промышленных систем МП был сделан ленинградской общесоюзной группой «Статистика речи» под руководством Р.Г.Пиотровского, а также группами специалистов по компьютерной лингвистике в Минске (А.В.Зубов), Кишиневе (В.А.Чижаковский), Махачкале (А.И.Чапля), Чимкенте (К.Б.Бектаев), Самарканде (Х.А.Арзикулов) и др. На базе исследований и научно-практического подхода группы «Статистика речи» были впоследствии разработаны и сейчас находятся в коммерческом использовании такие системы машинного перевода, как Stylus, Socrat и другие.

В настоящее время в Российской Федерации продолжаются в незначительных масштабах некоторые работы по системам МП, основанным на подходе «текст-смысл-текст», не всегда явно проговариваемым лозунгом которого в момент обоснования этого подхода в 1960-х годов был «машинный перевод без перевода, без машин, без алгоритмов» (см. обзор работ этого направления, принадлежащий Л.Н.Беляевой и М.И.Откупщиковой). Идея подхода заключалась в том, что от лингвиста требуется только декларативное описание фактов языка (т.е. лингвистическая теория, претендующая, правда, на особую точность и формализованность), а алгоритмы перевода составят программист и математик. В рамках этих исследований были получены значительные теоретико-лингвистические результаты (в частности, создана теория так называемых лексических функций, нашедшая применение в лексикографии), однако для создания практических систем подобного рода подход оказался недостаточно эффективным. Все практические системы без исключения используют идею переводных соответствий, т.е. в их основе лежит модель «текст-текст» и они реализуют краткую схему перевода (см. статью ПЕРЕВОД). Неизмеримо выросшие за последние десятилетия возможности вычислительной техники и новые программистские подходы никак не могут помочь реализовать идеи анализа и синтеза, основанные на приоритете выявления только синтаксической структуры с последующим переходом к смыслу. Выявление содержания текста в рамках человеко-машинного интерфейса может производиться, как и во всякой прикладной задаче, только с использованием как декларативных, так и процедурных знаний и при значительной опоре на лексику. Эта точка зрения обоснована, в частности, в недавних работах отечественного специалиста по программированию и искусственному интеллекту А.С.Нариньяни.

За рубежом эксплуатируется целый ряд систем машинного перевода. Наиболее известной из их числа является система SYSTRAN, разработанная и поддерживаемая компанией SYSTRAN Software Inc. и используемая службой машинного перевода при комиссии Европейского союза. Данная служба, объем переводов в которой составляет около 2,5 млн. страниц в год, использует систему SYSTRAN для перевода с английского на немецкий, французский, испанский, греческий и итальянский языки, а также с французского на английский, испанский и итальянский. В практической эксплуатации находится ряд практических систем исследовательского центра Гренобля (Франция), систему CULT (Гонконг, ныне КНР) и ряд других. На рынке коммерческого машинного перевода предлагаются системы таких фирм, как Logos Corp., Globalinc Inc., Toshiba Corp., CompuServe и др., в том числе и санкт-петербургская компания ПроМТ, выпустившая под названием PROMT 98 усовершенствованную версию популярной системы Stylus.

Проблематика машинного перевода находит свое отражение в регулярно проводимых международных конференциях по вычислительной лингвистике COLING, а также на международных конференциях по машинному переводу MT SUMMIT.

Технические инновации 1990-х годов (значительное расширение возможностей персональных компьютеров, появление качественных и доступных массовому пользователю сканеров и эффективных программ оптического распознавания текста, а также развитие глобальной компьютерной сети Internet и средств доступа к ней) придали новый стимул работам по МП, привлекли в данную область новые значительные инвестиции и увенчались серьезными практическими результатами – появлением достаточно эффективных систем машинного перевода и компьютерных словарей для работы на персональном компьютере (в том числе продуктов отечественных компаний ПроМТ, «Бит», «Арсеналъ», отчасти уже упомянутых выше); объединением систем МП с системами оптического распознавания текста и проверки орфографии; созданием специальных средств МП для работы в Internet, обеспечивающих либо перевод текстов на серверах соответствующих компаний, либо онлайновый перевод Web-страниц. В сочетании с пониманием ограничений МП и реалистической формулировкой целей его использования (прежде всего, это ознакомительно-реферативные цели, что хорошо соответствует базовой идеологии Internet как средства «навигации в информационном море») все это позволяет говорить об органичном встраивании систем МП в общий процесс формирования глобального информационного общества.

Эффективность работы современной системы МП в решающей степени зависит от ее удачной настройки на конкретный подъязык (или микроподъязык) естественного языка, на определенную лексику и ограниченный набор грамматических средств, характерных для текстов данной предметной области, а также на определенные типы документов. Учение о подъязыках с точки зрения машинного перевода было впервые сформулировано Н.Д.Андреевым (Ленинградский университет) в 1967, хотя представления о языковых регистрах, стилях, жанрах письменного текста и т.п. были хорошо известны и в традиционной лингвистике. Подъязык, с точки зрения МП, определяется в первую очередь некоторым исходным набором текстов, в рамках которого определяется входной и выходной словари, степень распространения и характер лексической неоднозначности лексем, характер и распространенность синтаксических конструкций, способы их перевода в данной языковой паре и пр. Большую роль играют параллельные тексты и словари-конкордансы, с помощью которых можно достаточно эффективно изучить и использовать в составлении алгоритмов лексическую сочетаемость и дистрибуцию (распределение) языковых элементов в речи (дискурсе, тексте). Статистические характеристики подъязыков помогают упорядочить структуру соответствующих алгоритмов анализа и синтеза. Выходной словарь, ориентированный на потребности синтеза и передачи основных видов соответствий в конкретной языковой паре, обеспечивает приемлемый выходной текст. В любом из современных видов машинного перевода необходимо участие человека-редактора, удобство работы которого обеспечивается качеством и надежностью соответствующего программного обеспечения.

Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «человеческого». Для развития теории важны результаты сопоставительного языкознания, общей теории перевода, теории закономерных соответствий, способов представления знаний, оптимизации и совершенствования лингвистических алгоритмов. Новые и более эффективные словари с необходимой словарной информацией, строгие теории терминологизации лексики, теория и практика работы с подъязыками помогут повысить качество перевода лексических единиц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соответствий в данной коммуникативной ситуации, которая может быть описана в рамках соответствующих прикладных теорий представления знаний. Наконец, новые возможности программирования и вычислительной техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода.

Машинный перевод

О Г Л А В Л Е Н И Е

История развития машинного перевода …………………………. 6

Компьютер на месте переводчика …………………………………. 10

Как переводит компьютер …………………………………………….. 12

Ответ критикам машинного перевода

(или Почему популярны программмы-перводчики) ……….. 15

Машинный перевод – это… инструмент …………………………… 16

Переводчик для офиса ………………………………………………….. 19

Кто в доме переводчик? ………………………………………………… 22

Машинный перевод в Интернете …………………………………….. 25

Как улучшить качество перевода (Практические советы) …. 27

В В Е Д Е Н И Е

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин.

Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке. При этом коммуникативная равноценность, или эквивалентность, понимается как такое качество текста перевода, которое позволяет ему выступать в процессе общения носителей разных языков в качестве полноправной замены исходного текста (оригинала) в сфере действия языка перевода 1 .

Коммуникативная эквивалентность нового текста по отношению к оригиналу обеспечивается выполнением трех основных требований:

текст перевода должен в возможно более полном объеме передавать содержание оригинала, что прежде всего означает недопустимость произвольного опущения или добавления информации;

текст перевода должен соответствовать нормам языка перевода, так как их нарушение, по меньшей мере, создает помехи для восприятия информации, а иногда ведет и к ее искажению;

текст перевода должен быть примерно сопоставим с оригиналом по своему объему, чем обеспечивается сходство стилистического эффекта с точки зрения лаконичности или развернутости выражения.

Однако выполнение указанных требований к тексту перевода часто связано с преодолением разного рода объективно существующих трудностей. В данной работе мы рассмотрим те из них, с которыми мы можем столкнуться при машинном переводе. Понятно, что в данном случае, если перевод не соответствует этим нормам, винить некого, поскольку машинный перевод еще не предназначен для самостоятельного перевода, он требует редактирования. Что же касается других видов этой деятельности, и письменный, и устный переводчики должны отдавать себе отчет в том, что «их работу замечают скорее тогда, когда они терпят неудачу, чем когда перевод идет нормально» 2 .

Круг деятельности, охватываемой понятием «перевод», очень широк. Переводятся с одного языка на другой стихи, художественная проза, научные и научно-популярные книги из различнейших областей знания, дипломатические документы, деловые бумаги, статьи политических деятелей и речи ораторов, газетные материалы, беседы лиц, разговаривающих на разных языках и вынужденных прибегать к помощи посредника – «толмача», дублируются кинофильмы.

Перевод может осуществляться:

с одного языка на другой – неродной, родственный, близкородственный;

с литературного языка на его диалект и наоборот, или с диалекта одного языка на другой литературный язык;

с языка древнего периода на данный язык в его современном состоянии (например, с древнерусского языка на современный русский, со староанглийского на современный английский и т.д.).

Следует заметить, что для машинного перевода характерен лишь пункт 1, поскольку, как мы знаем из экономики, спрос рождает предложения. Я думаю, никто не будет отрицать, что спрос на программу-переводчик, скажем, с английского или немецкого языка на русский намного превышает спрос на перевод с какого-нибудь праязыка.

Итак, развитие кибернетики сделало возможным машинный перевод, т.е. перевод, строящийся на использовании машиной определенных и постоянных для данного вида материала соответствий между словами и грамматическими явлениями разных языков. В настоящее время имеется достаточно широкий выбор па­кетов программ, облегчающих труд переводчика, которые ус­ловно можно подразделить на две основные группы 3 : элек­тронные словари ( electronic dictionary ) и системы ма­шинного перевода ( machine translation system ). Тем не менее, данную работу мне хотелось бы больше посвятить именно системам машинного перевода, нежели электронным словарям (хотя справедливости ради следует будет упомянуть хотя бы об их классификации), поскольку работа с электронными словарями практически ничем не отличается от использования обычного словаря, так как они предоставляют пользователю возможность быстрого поиска лишь 1 отдельного слова (термина) или фразеологизма; системы же машинного перевода обеспечивают связный перевод текстов, учитывающий морфологические, синтаксические и семантические связи членов предложения . Сегодня программы-переводчики умеют строить осмысленные фразы, и за последние несколько лет качество перевода улучшилось. Однако компьютер еще плохо разбирается в грамматических нюансах и жаргоне, поэтому его главное назначение – переводы деловых бумаг, руководств, писем из электронной почты, страничек из Интернета (Web-страниц). Это если вам достаточно лишь общего понимания текста. Другое применение систем – облегчение рутинной работы переводчиков, выполнение за них подстрочного перевода, который можно легко подправить. О наиболее удачных системах мы и поговорим в этой работе.

Я также расскажу о том, как осуществляется машинный перевод, кто занимается составлением программ-переводчиков и как они работают. Особое внимание мне хотелось бы уделить проблематике машинного перевода, поскольку машинный перевод для нас пока еще новшество, область мало в литературе освещенная, поэтому и поле для работы огромно. К тому же я ни за что не поверю, чтобы Вы ни разу не задавали себе вопрос: «А может очень скоро в результате новых компьютерных технологий спрос на переводчиков упадет до минимума?», но тут же успокаивали себя: «Нет, компьютер никогда не вытеснит профессию переводчика, ведь любая компьютерная программа – результат деятельности человека, а главное, мы можем чувствовать, в отличие от машины, а следовательно, лучше подбирать слова и эквиваленты». Тогда нужен ли вообще машинный перевод? Что ж, не будем забегать вперед, и рассмотрим все по порядку.

М А Ш И Н Н Ы Й П Е Р Е В О Д

В последнее время знание иностранных языков может понадобиться не только в путешествии или на приеме гостей из-за рубежа, но и в собственном доме, например, при просмотре популярных голливудских кинолент, при чтении инструкции по использованию заморских товаров или Web-страниц, которые разыскивает по всему свету неутомимый броузер. Таким образом, оказывается, что даже не покидая родных стен, мы нуждаемся в услугах переводчика. Однако необходимую помощь нам вполне может оказать домашний компьютер.

Системы машинного перевода (МП) давно перестали быть диковинкой. Они постепенно выходят из младенческого возраста и вместо бессвязного детского лепета начинают изъясняться на вполне понятном, «человеческом» языке. До последнего времени такие программы были не только очень дороги, уступая в цене разве что мощным графическим и издательским системам, но и весьма сложны и капризны в работе. И вот появились первые переводчики, пригодные для использования на домашнем ПК. Давайте познакомимся с ними поближе и узнаем, на что они способны. Но начнем, конечно же, с истории развития МП.

1. ИСТОРИЯ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА

По свидетельству биографов, еще выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке “вычислительной машины”. В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь. Но, хотя сегодня Бэббидж и считается признанным автором множества идей, лежащих в основе работы компьютера, он так и не сумел ни построить свою машину, ни выполнить обещания по поводу МП. И сегодня эта идея по-прежнему остается в значительной степени нереализованной. Однако в последнее время благодаря появлению Интернет как платформы глобальной связи она вновь начала привлекать широкое внимание и инвестиции.

Вообще, первые программы МП появились в 50-х годах, всего несколько лет спустя после рождения компьютера, но до широкого распространения ПК МП был скорее интересным объектом научных исследований, чем важной сферой использования вычислительной техники, по двум причинам: дороговизна времени работы компьютера и коллективное пользование его ресурсами. Последнее обстоятельство часто не позволяло немедленно обратиться к электронному помощнику, сводя на нет важнейшее преимущество МП перед обычным – его оперативность.

Датой рождения МП (как области исследований) принято считать 1947 г., и все началось с письма Уоррена Уивера, директора отделения естественных наук Рокфеллеровского фонда, к Норберту Винеру в марте того же года, в котором задача перевода сравнивалась с задачей дешифровки текстов. Последняя в то время уже стала выполняться на электромеханических устройствах. За этим письмом последовало множество дискуссий, появился меморандум о целях, и наконец, были выделены средства на исследования. И в 1952 г. состоялась первая конференция, организованная знаменитым математиком Бар-Хиллелем, на которой исследователи обменялись мыслями относительно организации множества синтаксических правил языка, способов описания семантики, морфологических структур, структуры словарей для систем перевода. Достижения в академических исследованиях стимулировали коммерческий интерес к проблеме МП, и фирма IBM совместно с Джорджтаунским университетом в США в 1954 г. сумела показать первую систему, базирующуюся на словаре из 250 слов и 6 синтаксических правил и обеспечивающую перевод 49 заранее отобранных предложений. Этот эксперимент положил начало исследовательскому буму: в следующие 10 лет правительство и военные ведомства США затратили на исследования в области МП около 40 млн. долларов.

От эйфории, связанной с первыми результатами, до практически полного отрицания осуществимости МП прошло всего восемь лет. К подобному выводу пришли на основании обзора, выполненного специальным комитетом по прикладной лингвистике (ALPAC) Национальной Академии наук США. В нем констатировалось, что системы автоматического перевода не смогут обеспечить приемлемое качество в обозримом будущем. Этот отчет драматически повлиял на развитие МП, так как были практически прекращены какие бы то ни было исследования из-за отсутствия финансирования, по крайней мере, в США и Европе. И лишь в конце 70-х годов занятия МП возобновились вместе с возрастанием интереса со стороны проектировщиков и исследователей к лингвистическим проблемам искусственного интеллекта и компьютерного поиска информации.

И только с начала 80-х годов, когда ПК уверенно и мощно начали завоевывать мир, время их работы, естественно, подешевело и доступ к ним можно было получить в любую минуту. А значит, МП наконец-то стал экономически выгодным. К тому же в эти и последующие годы совершенствование программ позволило достаточно точно переводить многие виды текстов, однако некоторые проблемы МП остались нерешенными и по сей день.

90-е годы можно считать подлинной эпохой возрождения в развитии МП, что связано не только с высоким уровнем возможностей персональных компьютеров, появлением сканеров 4 и программ OCR 5 , но и с распространением Интернет/интранет (Internet/intranet), обусловивших реальный спрос на МП. Он вновь стал привлекательной областью вложения капиталов как для частных инвесторов, так и для государственных структур.

И хотя технологии МП по-прежнему страдают множеством недостатков, многие организации вновь стали серьезно относиться к обещанию Бэббиджа. “Машинный перевод все еще далек от совершенства, но любой желающий с его помощью сможет, по крайней мере, понять основной смысл документа”, — считает Луи Монье, технологический директор Alta Vista, крупного поискового Web-узла, который начал эксперимент с МП в онлайновом режиме 6 .

Страны Европейского Союза потратили за последние 15 лет более 70 млн. долл. на исследования по этой проблеме, а японские государственные организации — более 200 млн. долл. По словам T.Р.Педтке (представителя правительства США), сделавшего очень интересный доклад на MT SUMMIT VI о стратегической важности МП для его страны, одну из главных ролей в развитии этого направления продолжает играть правительство. Проблема МП рассматривается как ключевая в вопросах продвижении высоких технологий и обеспечении конкурентоспособности США в глобальном информационном пространстве.

2. ЭЛЕКТРОННЫЕ СЛОВАРИ

Электронные словари (ЭС) начали разрабатываться значительно раньше, чем аль­тернативные им системы МП, поэтому в настоящее время на рынке программного обеспечения имеется черезвычайно широ­кий выбор словарей — от самых простейших (например, DIC) до мощных систем, объединяющих в одной программной обо­лочке несколько лексических баз данных — специализирован­ных тематических словарей, последовательность подключения которых определяется пользователем (LINGVO). Выбор того или иного программного продукта зависит исключительно oт аппаратных возможностей компьютера, которым располагает пользователь, финансовых соображений и конкретных условий, в которых работает переводчик.

Потенциальную аудиторию этих программ можно определить совершенно точно – это учащиеся и студенты, использующие словарь как одно из пособий при изучении иностранного языка, а также домашние и бизнес-пользователи, которым нужен универсальный и простой в применении словарь-справочник для эпизодического перевода деловых бумаг и корреспонденции.

Ниже представлена классификация электронных словарей по их основным техническим и эксплуатационным характерис­тикам. Всю совокупность ЭС можно подразделить по следую­щим критериям.

1. По используемой операционной системе. Наибо­лее простые электронные словари (DIC) работают под управ­лением ОС MS-DOS, начиная с версий 2.21 и 3.30, что позво­ляет их использовать практически на любых IBM-совмести­мых персональных компьютерах, включая XT, АТ-286. На­иболее сложные многооконные и многофункциональные ЭС, позволяющие в одной оболочке подключать различные тема­тические базы данных, работают под управлением ОС WIN­DOWS 3.11, WINDOWS NT, WINDOWS 95 и т.д. Естествен­но, что для их успешного функционирования необходим более мощный компьтер (типа AT-486DX) с оперативной памятью не менее 8 МБ.

2. По способу загрузки. Можно подразделить на нерези­дентные и резидентные. К первым относятся простейшие про­граммы (например, подстрочечный словарь DIC), которые ра­ботают только в собственной среде и не вызываются из других оболочек, например из текстовых редакторов. В большинстве случаев они функционируют в режиме автоматического («па­кетного») перевода. Вторые загружают свое ядро в оператив­ную память компьютера (например, » LINGVO for DOS «) и могут вызываться в любой момент работы компьютера, напри­мер из любого текстового редактора, при помощи нажатия ком­бинации «горячих клавиш» — клавиш оперативного вызова. Эти словари обеспечивают работу переводчика в интерактив­ном режиме.

3. По количеству подключаемых словарных баз (слова­рей). Ранние версии ЭС позволяли подключать только один словарь. Современные программы, например «Система элек­тронных словарей LINGVO «, независимо от того в какой ОС они работают, позволяют подключать до нескольких десятков словарных баз и устанавливать приоритет последних.

4. По возможностям расширения словарной базы. Уста­ревшие ЭС не имели возможности расширения словарных баз пользователем, современные версии, например LINGVO 4.6 и выше, имеют специальные утилиты для создания пользова телем собственных и расширения существующих словарей.

5. По режиму перевода. Можно выделить два основных режима перевода: автоматический пакетный (подстрочечный) и интерактивный (режим «запрос — ответ»).

В первом случае программа вызывается с указанием имени текстового файла, который необходимо перевести, или маски для целой группы текстовых файлов, предназначенных для перевода. Далее автоматически, без участия переводчика, про­изводится прямой перевод каждого отдельного слова с вы­водом на экран монитора или на печатающее устройство толь­ко переведенных слов или исходного текста, под каждым пере­веденным словом которого будет стоять его значение на русском языке, под теми словами, которых не оказалось в ЭС обычно ставится знак «?». Такой режим называется подстрочечным. Словарные базы подобных ЭС весьма ограниченны, качество перевода оставляет желать лучшего. Подобные про граммные продукты вряд ли смогут оказать помощь професси ональному переводчику.

Во втором случае программа работает следующим образом. После загрузки резидентной части программы в оператив­ную память компьютера, пользователь, работая, например, в текстовом редакторе либо непосредственно в оболочке слова­ря, вводит с клавиатуры неизвестное слово на языке оригина­ла, а затем, выделив его, чаще при помощи «мыши», нажатием комбинации » горячих клавиш» активизирует ЭС, который за­меняет текст оригинала на русскоязычный перевод. Время до­ступа к переводу составляет примерно 0,2 секунды, что значи­тельно ускоряет работу переводчика. Именно такие электрон­ные словари, с учетом возможности расширения и одновремен­ного подключения нескольких словарных баз, могут значительно облегчить и ускорить работу переводчика любого уровня профессионализма.

В любом случае, бум, связанный с появлением простейших электронных словарей , позволяющих относительно быст­ро произвести поиск того или иного слова, уже в прошлом. С развитием технологии систем OCR , о которых я уже упоминала, стали разрабатываться авто­матизированные системы машинного перевода . О них-то и пойдет речь.

3. КОМПЬЮТЕР НА МЕСТЕ ПЕРЕВОДЧИКА.

Вычислительная техника, как известно, хорошее подспорье человеку в рутинной работе. Относится ли к таким занятиям перевод текстов? И да, и нет. С одной стороны, труд переводчика во многом формален, а с другой – перевод не может быть выполнен чисто формально. Есть, например, технический перевод, где важно знать принятые за рубежом стандарты обозначений тех или иных понятий. И есть литературный перевод, когда требуется получить текст, по художественной ценности максимально близкий к оригиналу. Возможно ли поручить подобную работу компьютеру?

Говоря о МП, следует прежде всего помнить, что компьютер — создание бездушное. Он не понимает языковых нюансов, намеков в тексте, того, что называется тонкой игрой слов. Да и, собственно, понять содержание текста в полной мере ему не под силу. Мышления как такового при МП не происходит: предложение расчленяется на части речи, в нем выделяются стандартные конструкции, слова и словосочетания переводятся по находящимся в памяти машины словарям. Затем переведенные части речи собираются по правилам другого языка.

Но этого, согласитесь, недостаточно для полноценного перевода. В зависимости от того или иного стиля и назначения текста одно и то же слово нередко имеет разные значения. В какой-то мере эта особенность учитывается в системах МП: предусмотрены сменные словари, иногда для каждого вида текста предусмотрен свой словарь. Если лексики одного машинного словаря не хватает и применяются несколько словарей одновременно, можно указать системе, из какого словаря нужно брать слово, если есть несколько вариантов его перевода. Наконец, программа сама может предлагать на выбор пользователю несколько вариантов перевода, и он выбирает подходящий вариант, так сказать, вручную. Могут возникнуть и проблемы с переводом слов в устойчивых словосочетаниях и фразеологизмах, но это вполне по силам компьютеру.

В школе этого не расскажут:  Спряжение глагола relater во французском языке.

Наряду с установленными правилами построения предложения в каждом языке существуют и свои неписаные законы, которые иногда называются красотами языка. Например, предложение на английском языке «This is my book» дословно переводится «Это есть моя книга», и формально это будет правильным, но по-русски так не говорят. В данном случае можно сказать, что предложение «написано так, будто его составил иностранец». Конечно, приведенный пример является простейшим, и возможность исключения слова «is» очень просто отражается в программе МП. Но на практике получившийся перевод похож на текст, написанный иностранцем.

Текст также может содержать слова, которые нужно понимать в контексте образа жизни людей в конкретной стране. Например, под словом «демократ» в США подразумеваются политики, выступающие за большее вмешательство государства в экономику, а в России те, кто выступает за большую свободу рынка. Это разные понятия.

Заглавные буквы и сокращения таят в себе и другие подвохи. Когда слово начинается с большой буквы, его перевод будет начинаться тоже с большой буквы. Слово, целиком состоящее из таких букв, также будет в переводе записано заглавными. В англоязычной литературе достаточно часто встречаются внешне эффектные аббревиатуры, которые могут быть прочитаны как одно слово. Такая аббревиатура и будет переведена единым словом.

Таким образом, результаты МП часто требуют редактирования. Насколько адекватными можно считать результаты перевода на компьютере? Это определяется не только качеством системы МП, но и качеством последующего редактирования. Нередко систему МП использует в качестве подспорья специалист, которому нужно быстро перевести, например, техническую документацию. Тогда проблема корректного употребления терминов решается сама собой.

Однако МП – это такая специфическая область применения компьютеров, в проблемах которой почти каждый ощущает себя более или менее специалистом. Давайте рассмотрим, каким образом осуществляется перевод.

4. КАК ПЕРЕВОДИТ КОМПЬЮТЕР

Во-первых, всем ясно, что чем больше словарь, тем лучше перевод, значит, первая проблема – проблема создания больших словарей для систем.

Во-вторых, ясно, что система должна переводить такие предложения: «Привет, как дела?». Значит, еще одна проблема — научить систему распознавать устойчивые обороты.

В-третьих, понятно, что предложение для перевода пишется по определенным правилам, по определенным правилам переводится, а значит, есть еще одна проблема: записать все эти правила в виде программы. Вот, собственно, и все.

Самое интересное, что эти проблемы действительно являются основными при разработке систем МП, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как может показаться.

Системы МП семейства PROMT (PROgrammer’s Machine Translation) 7 — очень хороший объект, чтобы продемонстрировать, каким образом эти проблемы могут решаться эффективно.

4. 1. СЛОВАРЬ

Для качественного перевода очень важно, чтобы практически все слова исходного текста легко было найти и в словаре системы. А те из них, которых в нем нет, переносятся в текст непереведенными уже на выходе из системы, и их впоследствии переводят вручную при редактировании результатов перевода. Такие слова могут повлиять на качество перевода предложения. Дело в том, что для определения, к какой части речи относится рассматриваемое слово, система производит анализ всего предложения в целом. При этом имитируется мыслительная деятельность человека (такую систему принято называть системой с элементами искусственного интеллекта). Если значение хотя бы одного слова в предложении не определено, то это может исказить анализ всего предложения, а иногда и результаты всего перевода.

Методы организации больших баз данных достаточно хорошо разработаны, но для перевода не менее, а может быть, и более важно правильно структурировать информацию, которая приписывается элементу базы, правильно выбрать этот самый элемент. Сколько, например, записей в словаре должно соответствовать обыкновенному русскому слову «программа»? И, вообще, большой словарь – это словарь, который содержит много словарных статей, или словарь, который позволяет распознать много слов из текста?

При ближайшем рассмотрении оказывается, что, например, существительные в русском языке изменяются по падежам и по числам, то есть для одного существительного может существовать до 12 разных форм, а для глаголов и прилагательных, как правило, существует еще большее количество различных форм (более тридцати). Следовательно, чтобы переводить предложения, содержащие слова «программу», «программе», «программы» и т.д., хорошо было бы иметь способ соотнесения словарной статьи из автоматического словаря для слова «программа» с соответствующей словоформой из текста. Поэтому для описания и входного, и выходного языка в системе должен существовать некоторый формальный метод описания морфологии, на котором основывается выбор единицы словаря.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

Кроме того, используемая модель морфологии позволила разработать экспертную систему для пользователя – создателя словаря. Эта система фактически автоматизирует процедуру выделения основы и определения типа словоизменения при вводе новых словарных статей.

Однако разработка описания морфологии позволяет решить только проблему того, что является заголовком словарной статьи, по которому происходит идентификация единицы текста и единицы словаря. Но ведь идентификация слова из текста со словарной статьей происходит не ради идентификации, как это требуется в электронных словарях, она необходима для выполнения программой собственно процедур перевода. Какая же нужна информация в словарной статье и как должны быть описаны правила перевода для того, чтобы программа переводила?

4. 2. ГРАММАТИКА

С развитием МП как области прикладной лингвистики появилось множество лингвистических работ, предлагавших структуру описания свойств живого слова в словарной статье машинного словаря. При этом совершенно отдельно появлялись исследования, описывающие, например, «структуру именной группы» или «способы выражения прямого дополнения для глаголов говорения».

Например, на основе признака «принадлежность к части речи» описывалась грамматика такого типа:

• именная группа — это существительное

• именная группа — это прилагательное + именная группа

• глагольная группа — это глагол + именная группа

• предложение — это именная группа + глагольная группа

Понятно, что некоторая часть предложений естественного языка описывается такой грамматикой, но эта часть очень незначительна, и на ее основе нельзя правильно анализировать и переводить хоть сколько-нибудь реальный текст. Но зато можно использовать эффективные методы построения преобразователя по заданной грамматике или, на худой конец, написать программу, которая путем перебора построит деревья зависимостей для ограниченного множества предложений.

Стало принятым делить системы перевода на системы типа TRANSFER и системы типа INTERLINGUA. Это разделение основано на особенностях архитектурных решений для лингвистических алгоритмов.

Алгоритмы перевода для систем типа TRANSFER строятся как композиция трех процессов: анализ входного предложения в терминах структур входного языка, преобразование этой структуры в аналогичную структуру выходного языка (TRANSFER) и затем синтез выходного предложения по полученной структуре.

Системы типа INTERLINGUA предполагают априори наличие некоторого метаязыка структур (INTERLINGUA), на котором можно описать все структуры как входного, так и выходного языков в общем случае; поэтому алгоритм перевода в системе типа INTERLINGUA предполагается как более простой: анализ входного предложения в терминах метаязыка и затем синтез из метаструктуры соответствующего предложения выходного языка. «Единственная» сложность в этом случае – разработать сам метаязык и описать естественный язык в соответствующих терминах.

Несмотря на то, что эта классификация существует, и в среде разработчиков МП считается хорошим тоном спросить, к какому типу относится ваша система, не было разработано еще не одной реальной системы, основанной на принципе INTERLINGUA.

Поэтому анализ простых предложений как структур, состоящих из синтаксических единиц, выполняется на основе фреймовых предикатных структур, которые позволяют эффективно выполнять преобразования. Глагол считается для простых предложений главным элементом и его валентности определяют заполнение соответствующего фрейма. Для каждого типа фреймов существует некоторый закон преобразования в выходной фрейм и оформление актантов. Таким образом, осуществляется TRANSFER на уровне предложений. Анализ сложных предложений требуется в случае формирования согласования времен и правильного перевода союзов.

Хотелось бы надеяться, что эти сведения позволят потенциальным пользователям систем перевода понять, что создание системы МП – задача не такая уж простая, и, что называется, наукоемкая. А, следовательно, количество действительно пригодных к использованию систем перевода, которое может появляться в единицу времени, принципиально ограничено.

В любом случае, стилистические и грамматические огрехи машинного пере­вода компенсируются потрясающей скоростью получения его чернового варианта.

5. ОТВЕТ КРИТИКАМ МАШИННОГО ПЕРЕВОДА


или Почему популярны программы-переводчики

Прежде чем рассказать подробнее о множестве программ-переводчиков, мне хотелось бы ответить на самый, на мой взгляд, распространенный вопрос, который поднимается, как только заходит речь о МП:

«Переводы с русского на английский и с английского на русский не выдерживают никакой критики. Неужели полноценный машинный перевод остается все еще делом будущего?»

Можно, конечно, было бы проигнорировать этот вопрос, хотя бы потому что сам уровень организации, проводившей тестирование вне подозрений, да и популярность как систем, так и сервиса в Интернете, организованном на сайте http://www.translate.ru (более 200.000 переводов за месяц. ) демонстрируют полезность и востребованность МП. Однако именно сейчас, в первую очередь в связи с развитием Интернет, когда МП становится все более и более необходимым обществу, нам представляется полезным обсудить еще раз тему нужны или не нужны системы МП.

В нашей стране разработка систем МП ведется уже более 35 лет, а специалисты компании ПРОМТ занимаются этой проблемой более 20 лет, однако до сих пор эта сфера компьютерной индустрии вызывает много различных дискуссий. Часто приходится слышать от критиков систем МП: «Программы-переводчики переводят плохо, непонятно кому они вообще нужны. Гораздо проще отдать текст «живому» переводчику или выучить язык самому». Причем, к сожалению, резкость критики зачастую бывает обратно пропорциональна знанию языка. Компания, безусловно, не пытается обвинить в этом критиков и полагает, что лично им движет стремление к совершенству.

Итак, компьютер пока во многом не может заменить переводчика. Стоит ли тогда вообще применять системы машинного перевода? Конечно, стоит. Если компьютер используется для перевода литературных текстов, то получается черновой вариант текста, так называемый подстрочник, который превращается в произведение искусства человеком, слабо владеющим языком оригинала, но являющимся хорошим литературным редактором. Если же речь идет о переводе технических текстов, то здесь при правильном выборе словаря по специальности, в рамках которой написан текст, получается вполне удовлетворительный результат, иногда не требующий последующего вмешательства. Вообще необходимость редактирования компьютерного перевода очень часто возникает в связи с проблемами, перечисленными выше. Для этого системы машинного перевода обязательно имеют средства редактирования текстов.

Для некоторых заказчиков такой уровень перевода просто неприемлем. “Машинный перевод — это миф, — считает Линн Сешедри, консультант одной из служб корпорации Electronic Data Systems (Плейно, шт. Техас), принимавший участие в создании глобальной интрасети компании. — Возможно, он годится для технической документации, но во всех остальных случаях вы получаете 15% смысла и 85% ерунды”. Для перевода содержания своей интрасети EDS пользуется услугами профессиональных переводчиков на контрактной основе. Однако других машинный перевод вполне устраивает, в значительной степени потому, что часто ему просто нет реальных альтернатив. Парижский фонд “За развитие гуманизма” (FPH) в свое время также стоял перед выбором: тратить ли существенную часть своего бюджета на переводчиков или испробовать средства машинного перевода. Эта организация, финансируемая из частных источников, выпускает доклады по экологии, экономике и ряду других областей, привлекая для их создания интернациональные коллективы ученых. Ее выбор пал на технологию машинного перевода, а точнее, на продукт фирмы Globalink, представляющий собой вполне качественное и недорогое приложение для ПК. FPH установил его на сервер электронной почты, чтобы общение специалистов, говорящих на разных языках, было проще и эффективнее.

«Это хорошее решение, — считает Марина Урквиди, консультант из FPH. — Многие люди предпочли бы работать не на английском, а на своем родном языке. Теперь у них есть такая возможность». Она не отрицает, что машинный перевод имеет свои недостатки, однако убеждена, что если человек захочет, он сможет понять перевод, сделанный машиной. «Если вы немного подумаете, то сумеете понять, о чем идет речь». Таким образом, если не требовать от МП слишком многого, то, возможно, обещание Бэббиджа о машинном переводе все же исполнится.

6. МАШИННЫЙ ПЕРЕВОД – ЭТО… ИНСТРУМЕНТ

Всем хорошо известно, что хороший перевод текста – это не только творческая, но и достаточно трудоемкая работа. Причем даже самый хороший перевод, как правило, нуждается в редакторской правке. Что касается творческой части, то в обозримом будущем в соревновании компьютер-человек всегда победит «живой» переводчик. Однако для решения проблем, обусловленных трудоемкостью процесса перевода, системы МП могут оказаться хорошим подспорьем. Для того чтобы это лучше понять, перечислим достоинства программ машинного перевода (общие для всех систем МП вообще и систем PROMT в частности):

1. Высокая скорость. Всего несколько секунд и Вы получаете перевод многостраничного текста. Это позволяет быстро понять смысл текста, а если система настроена на перевод текстов этой тематики, требуется минимальная редакторская правка.

2. Низкая стоимость. Это очень легко оценить: если вы обращатесь к профессиональным переводчикам, приходиться платить за каждую страницу переведенного текста (в зависимости от региона и уровня квалификации переводчика страница перевода будет стоить от 5 до 20 долларов), либо вы нанимаете штатного переводчика, которому приходится платить зарплату. В случае с системой машинного перевода, вы платите деньги только один раз – при покупке программы. Что вы предпочтете – разовое капиталовложение или регулярные издержки? По данным пользователей компании ПРОМТ при переводе от 50 страниц текста в месяц программа-переводчик PROMT 98 окупается примерно за месяц.

3. Доступ к услуге. Немаловажный фактор, который многие критики систем МП не принимают в расчет. Программа-переводчик всегда под рукой, а обращаться в переводческое бюро во многих случаях связано с дополнительными затратами времени и сил.

4. Конфиденциальность. Системе МП вы можете доверить любую информацию. Приятно ли вам отдавать на перевод личную переписку? Готовы ли Вы к тому, чтобы посвятить в свои финансовые дела постороннего переводчика? Пойдете ли вы в переводческое бюро для того, что бы перевести какую-нибудь эротическую литературу? Если да, то действительно вопросов нет. Но даже в этом случае, согласитесь, немногие пользователи Вас в этом поддержат. Мы знаем, что многие пользователи регулярно используют наши системы для перевода личных писем, поскольку часто получаем письма от людей, которым наша система помогла устроить личную жизнь. Программа-переводчик сохранит в тайне любые тексты, которой Вы ей доверите.

5. Универсальность. Любой переводчик всегда имеет специализацию, т.е. переводит тексты по той теме, которой он хорошо владеет. Когда переводчик художественной литературы берется за перевод, например, технических текстов, ляпсусов не избежать. Взять хотя бы классический пример: «Голый проводник бежит по автобусу» (в оригинале «Naked conductor runs along the bus»). И это не результат творчества компьютера, этот исторический пример имел место, когда компьютер еще был редкостью. Система МП выгодно отличается тем, что она абсолютно универсальна. Нужно только грамотно подключить специализированный словарь по соответствующей тематике. Следует учесть и еще одно преимущество систем МП: пополнение их специализированных словарей но­вейшими терминами значительно опережает аналогичные словари полиграфического исполнения. В ряде случаев также рекомендуется вести свой собственный словарь новых терминов или новых значений. В этом случае вы гарантированно получаете необходимое качество перевода.

6. Перевод информации в Интернете. В онлайне наиболее ярко проявляются все преимущества систем МП. Более того, в большинстве случаев переводить информацию в Интернете, если Вы, конечно, сами не знаете нескольких языков, можно только с помощью программ-переводчиков. Именно эта потребность обусловила огромный рост интереса к системам МП сейчас в мире. Только благодаря онлайновым системам МП появилась возможность просматривать иностранные сайты, не затрудняясь с их переводом. Кроме того, здесь действуют все вышеперечисленные достоинства систем МП: перевод текстов по любой тематике производится быстро и конфиденциально.

Коллективное использование систем МП в организациях дает дополнительные преимущества:

1. Единообразие стиля и используемой терминологии. Как известно, затраты на постредактирование при работе коллектива переводчиков составляют около 100-140 % от стоимости перевода. Перевод, выданный системой МПа, гораздо легче править, поскольку он выдержан в одном стиле. Если в тексте, какой-либо часто встречающийся термин переведен неправильно, то все эти ошибки можно исправить простой автозаменой. Когда объемный текст переводится группой переводчиков, то приходится вылавливать отдельные неточности, допущенные каждым переводчиком. Редактору в этом случае требуется также «выравнивать» и стиль перевода.

2. Отсутствие затрат на форматирование. Это особенно важно при переводе электронной документации. Программа-переводчик полностью сохраняет исходное форматирование, что позволяет сэкономить время и деньги при подготовке перевода.

Однако вместо того, что бы попытаться использовать те преимущества, которые предоставляет МП, некоторые люди пытаются довести задачу до абсурда, например, пытаясь перевести поговорки, песни или стихотворения, т.е. именно то, для чего системы МП не предназначены. Другие, не удосужившись прочитать описание программы, пытаются переводить текст по медицинской тематике с подключенным банковским словарем, а затем шумно веселятся, увидев на выходе очевидную бессмыслицу. Подчас создается впечатление, что таким образом они борются с собственными комплексами и пытаются, в первую очередь, себе доказать, что они умнее компьютера. Подобные критики зачастую уподобляются известному персонажу анекдота, который подсунул ломик под бензопилу и был страшно горд, увидев плачевный результат.

7. ПЕРЕВОДЧИК ДЛЯ ОФИСА

Итак, машинный перевод уже довольно уверенно вошел в повседневную жизнь современного офиса и ни у кого не вызывает удивления. В мире существует очень много программ МП. У нас наиболее распространены системы PROMT 98 или Stylus (фирма ПРОМТ) и ПАРС (фирма «Лингвистика 93»). PROMT 98 (Stylus) предназначена для профессионального перевода больших объемов информации, но ее лицензионная копия достаточно дорога. Что же касается использования пиратских копий, то они, как правило, имеют всего один-два словаря с относительно небольшим количеством слов. В лицензионной же копии есть широкий выбор специализированных словарей. Таким образом, использование пиратских копий не только неэтично с моральной и правовой точек зрения, но и не позволяет получить качественный перевод многих текстов.

Система ПАРС по некоторым параметрам уступает Stylus, хотя для бытового использования она достаточно удобна и, что очень важно, цена ее лицензионной копии доступна (компакт-диск с этой программой и несколькими специализированными словарями стоит около $20). В продаже есть большой набор словарей к этой системе по различным темам: вычислительная техника, медицина, химия и т.д. вплоть до таких областей, как, например, лесная и бумажная промышленность. Цены на компакт-диски со специализированными словарями к системе ПАРС обычно не превышают $30, она размещается на одном CD со словарями. Эта система спокойно работает в среде Windows 3.1 и более поздних версий. Есть даже ее версия для операционной системы MS DOS, что позволяет использовать для МП устаревшие компьютеры с процессорами 80286, которые вполне пригодны для обработки текстов. В дальнейшем речь пойдет о версии ПАРС для Windows, работающей в среде операционной системы Windows 95.

ПАРС для Windows может работать в двух режимах. В первом случае он переводит файл в формате «текст MS DOS» и результат записывает в другой файл с тем же форматом. Сам же переводимый текст готовится в другом редакторе, причем в среде Windows сделать это затруднительно, так как в ней принята другая кодировка русских букв. Кроме всего прочего, простейший формат «текст MS DOS» все реже применяется для подготовки серьезных документов.

Гораздо удобнее другой режим, когда программа МП работает совместно с мощным внешним текстовым редактором. Таким редактором для ПАРС является Microsoft Word 6.0 for Windows. Кроме удобства появляется возможность работы с текстами в формате RTF (Rich Text Format), где записываются размеры и форма шрифтов, и эти параметры переносятся в результат перевода.

В процессе инсталляции ПАРС определяется наличие на жестком диске инсталлированного текстового редактора Word. Когда редактор успешно обнаружен при инсталляции программы МП, то в его окне наверху появляется еще одно меню – ‘Перевод’. Результат перевода представляется в редакторе как новое окно с текстом. Если сначала была инсталлирована система ПАРС, а потом уже Word, то для их совместной работы потребуется повторно осуществить выборочную инсталляцию программы перевода и элементов ее связи с внешним текстовым редактором.

Но если перевод осуществляется впервые после запуска программы, перед его началом потребуется указать используемые словари. Зачастую пользователи могут недооценивать применение специализированных словарей. Однако следует вспомнить, что переводчики при работе со специализированными текстами используют, как правило, словари по соответствующей тематике, а не произвольные.

Рассмотрим это на примере:

Nokia 9000i Communicator now supports short messages with up to 2 280 characters, the current standard being 160 characters. With the Text Web service based on Smart Messaging, the end-user is able to obtain information in a simple text format without graphics or logos from the Internet by using the short message service. Text Web information can include flight schedules, weather or traffic reports, or the stock news.

Перевод без подключения специализированного словаря:

Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до 2280 характеров (знаков), текущий стандарт, являющийся 160 характерами (знаками). С обслуживанием (службой) Ткани (сети) Текста, основанным на Шикарном (сильном) Messaging, конечный пользователь способен получить информацию в простом формате текста без графики или эмблем от Internet, используя короткое обслуживание (службу) сообщения. Информация Ткани (сети) Текста может включать списки (графики) рейса (полета), погоду или сообщения движения, или новости запаса (акции).

Перевод с подключенным словарем “Телекоммуникации и связь”:

Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до 2280 символов, текущий стандарт, являющийся 160 символами. С Текстовым обслуживанием Сети, основанным на Smart Messaging, конечный пользователь способен получить информацию в простом текстовом формате без графики или эмблем от Internet, используя систему передачи коротких сообщений. Текстовая информация Сети может включать список рейса (полета), погоду или сообщения трафика, или новости фондового рынка.

Как уже было сказано, словари выбираются в зависимости от стиля и тематики текста. Обратим внимание на кнопку ‘Приоритет’. С ее помощью можно перемещать словари в списке. Если в переводимом тексте имеется слово, встречающееся в нескольких из выбранных словарей и в каждом из них его значения различны, то будет выбран вариант перевода из словаря, стоящего в списке первым. Возможность расположения словарей по различному приоритету позволяет гибко подстраивать систему перевода под тексты, содержание которых лежит на границе двух специальностей. Рассмотрим в качестве примера использование словарей компьютерных и химических терминов. Допустим, имеется текст про компьютеризацию химического производства. В нем, конечно, чаще будут встречаться компьютерные, нежели химические термины, и поэтому термин, имеющий двоякое толкование, должен скорее переводиться по словарю компьютерных терминов. В этом случае словарь терминов компьютерных должен иметь больший приоритет, чем словарь химических. Другой вариант – текст про химические процессы в производстве компьютеров. Здесь чаще будем замечать химические термины, и, соответственно, словарь химических терминов будет иметь больший приоритет. Ну и, конечно, используя специальные словари, не следует забывать подключать и словарь общеупотребительной лексики. При переводе технических текстов целесообразно присвоить этому словарю наименьший приоритет.

Но даже тонкая настройка системы под лексику переводимого текста не учитывает всех его особенностей, поэтому переведенные слова, имеющие несколько синонимов, помечаются звездочкой. Указав мышкой на такое слово, можно выбрать подходящий вариант перевода либо оставить то, что предложил компьютер.

Когда варианты перевода выбраны, можно приступать к редактированию переведенного текста, благо Word обладает для этого мощными средствами.

Текст иногда полезно подвергнуть некоторой обработке перед МП. Так, системы МП могут ошибаться из-за наличия в тексте сокращений, заканчивающихся точкой. Если после такого сокращения следует слово, начинающееся с большой буквы, то компьютер воспринимает точку как конец предложения, из-за чего предложение может быть неправильно разобрано, и, следовательно, ошибочно переведено. Значит, точки в сокращениях надо убирать. Сокращения будут перенесены в текст без перевода, и их нужно перевести вручную. В переводимом тексте должны отсутствовать переносы, что, впрочем, легко обеспечивается при подготовке текста в редакторе Word. Особенно внимательно надо просматривать тексты, получаемые в результате распознавания отсканированного изображения, так как содержащиеся в них ошибки нередко приводят к тому, что отдельные слова остаются непереведенными всего-то из-за одной неправильной буквы. Кстати, уже упоминавшаяся система Stylus вместе с программой FineReader входит в состав пакета Stylus Lingvo Office, предназначенного для обработки документов, введенных в компьютер путем сканирования.

Однако не следует забывать, что работа для переводчика найдется не только в офисе, но и дома. Поэтому мне хотелось бы рассказать о некоторых системах машинного перевода, изначально предназначенных домашнего применения.

8. КТО В ДОМЕ ПЕРЕВОДЧИК?

Работа для электронного полиглота найдется практически в каждом доме. Его услугами охотно воспользуются школьники, студенты и аспиранты с их вечными «тысячами», которые нужно сдавать, невзирая на полное или частичное отсутствие времени, желания, а иногда и знаний. Время от времени он будет полезен и другим членам семьи при переводе письма, полученного по электронной почте от знакомого из-за рубежа, инструкции к импортной стиральной машине или кулинарного рецепта из иностранного журнала. Все мы, вне зависимости от возраста и рода занятий, являемся потенциальными «клиентами» домашнего переводчика.

Но какие же системы вправе называться домашними? В первую очередь, естественно, это программы, изначально создаваемые для всей семьи. Они отличаются простотой пользовательского интерфейса, многочисленными вспомогательными функциями и мультимедийными возможностями. Их словари оптимизированы для перевода текстов на обычные домашние темы: хозяйство, отдых, развлечения и т.д. Работать с ними интересно не только взрослым, но и детям.

Вторым критерием пригодности системы МП для использования дома является легкость управления и высокий уровень автоматизации. Мало кто, не являясь профессионалом-лингвистом, возьмется, например, определять языковые характеристики слов. Чаще всего нам нужно просто узнать содержание непонятного текста на иностранном языке, а не получить его литературный перевод.

И наконец, немаловажным фактором при покупке персональных переводчиков является цена. Системы стоимостью выше $60–70 вряд ли смогут получить прописку у многих пользователей на винчестере их домашнего ПК. Поэтому я решила ограничить свой выбор продуктами, которые можно приобрести дешевле $50.

Исходя из приведенных критериев, для домашнего применения можно порекомендовать следующие системы МП: Magic Gooddy (от компании ПРОМТ), «Сократ Персональный 3.0.3» и «Коперник». Первая из них была специально разработана для этих целей, вторая попадает в наше поле зрения благодаря своей компактности и предельной простоте использования, последняя же обладает довольно широким набором возможностей при весьма низкой цене.

В школе этого не расскажут:  Спряжение глагола épouvanter во французском языке.

Выбранные мною системы настолько разнообразны по своим возможностям, что какое-либо их сравнение или тестирование вряд ли имеет смысл. А поскольку цель данной работы состоит не в том, чтобы дать полное руководство пользователя данных программ, то позволю себе отметить лишь особенности, преимущества и полезные функции каждой из них.

Что же выбрать? Оказывается, что выбор домашнего переводчика сегодня однозначно зависит от его функциональных возможностей и предельно прост, поскольку рассмотренные нами программы коренным образом различаются. Сформулировав основные цели перевода, диапазон тематик, а также требования к качеству результата, можно четко определить, какая из систем окажется в данном случае наиболее подходящей.

Magic Gooddy – самый универсальный семейный переводчик. И не удивительно – ведь он «домашний» от рождения. Он вполне годится для перевода учебных текстов, писем, руководств к программам, интерактивной справки, и многого другого, вплоть до кулинарных рецептов. Те, кому уже приходилоси сталкиваться с «Волшебником Гудди», настоятельно рекомендуют эту программу детям. Для них она окажется не только помощником и подсказчиком при выполнении домашних заданий по английскому языку. Magic Gooddy является ценным дополнением к обучающим программам, главным образом благодаря возможности читать вслух произвольные тексты. Не стоит бояться, что Гудди отучит ваших детей работать самостоятельно. Более вероятно, что он пробудит в них интерес к иностранным языкам, а возможно, и к нелегкому труду переводчика.

Что касается качества перевода, скорее всего у вас не будет проблем с переводом руководства к кухонному комбайну, кулинарного рецепта или письма. Фрагмент руководства по Quake II также будет вполне понятным, однако, самые «заковыристые» жаргонные выражения программа переведет не совсем точно. Но есть у этого переводчика и недостаток – зависимость качества перевода от того, насколько точно оригинал соответствует одной из имеющихся тематик. Тексты «на стыке» областей, а также разговорные переводятся хуже.

«Коперник» лучше всего подойдет для домашнего офиса профессионального переводчика. Он обладает достаточными возможностями для подготовки переводных текстов высокого качества. Программа хорошо переводит тексты самых разнообразных тематик, иногда даже без дополнительных словарей. В некоторых случаях после подключения словарей и несложного постредактирования удается получить переводы, удовлетворяющие всем правилам грамматики и стилистики русского языка. Кроме того, эта программа поддерживает четыре языка, в том числе украинский, что в последнее время весьма актуально. К тому же единственная система, которая может работать с таким же набором языков, – Language Master 98 – стоит на порядок дороже. А интеграция с Word и функция выбора вариантов перевода слов позволяют значительно сократить затраты времени на постредактирование.

«Сократ Персональный 3.0.3» – это предельно простая система для ознакомительного перевода небольших фрагментов текста. Ее козыри – компактность и наличие встроенного электронного словаря, она нетребовательна к квалификации пользователя и максимально автоматизирована. Качество перевода этой системы не всегда высокое, но зато мало зависит от тематики текста. Соответственно, эта программа найдет применение при интенсивной работе с разнообразными иностранными текстами на ознакомительном уровне. Лучше всего поддаются переводу с ее помощью тексты интерактивной справки. Их смысл удается понять во всех случаях, а большинство предложений построены грамотно. Также хорошие результаты можно получить при работе с деловыми письмами – здесь сказываются хорошая сбалансированность словаря, большой запас экономической лексики, а также строгость и шаблонность делового стиля речи, под который, в частности, и настраивался программный алгоритм «Сократа». Удовлетворительными можно считать результаты работы с документацией к программам и руководствами к бытовым приборам, однако, понять их содержание, как правило, можно. Слабым местом программы являются научные тексты, личная переписка, разговорные темы и особенно руководства к компьютерным играм. В первом случае сказывается отсутствие в составе «Сократа» словарей специальных терминов. Остальные же представляют собой естественное затруднение для всех систем машинного перевода, вызванное неформализованной лексикой, сложностью оборотов и стилистическим разнообразием указанных текстов.

И в заключение немного о «темных лошадках». Существует еще одна программа, которую, признаться, мне очень хотелось бы видеть среди недорогих домашних переводчиков. Это утилита QTrans, на сегодняшний день поставляемая только в комплекте с PROMT 98. В ней реализованы довольно мощные функции перевода и предельно простой пользовательский интерфейс. К тому же, объединив QTrans с новой коллекцией тематических словарей под названием «Домашняя», компания ПРОМТ могла бы предложить отличный продукт, удовлетворяющий и начинающих, и более опытных пользователей.

Также сейчас наблюдается новый всплеск интереса к системам МП в связи с развитием сети Интернет. Миллионы людей, говорящих на разных языках, оказались в едином информационном пространстве. Доминирует в Сети английский язык, но есть пользователи, которые им не владеют, как, впрочем, есть множество Web­страниц, написанных не по-английски. Для облегчения просмотра страниц Интернет на незнакомом пользователю языке появились дополнения к броузерам, которые осуществляют немедленный перевод выбранных пользователем фрагментов просматриваемой Web­страницы. Достаточно лишь выделить часть текста мышкой и перенести ее на специальную панель либо нажать указателем на специальную кнопку меню. Примером такого переводчика является система Web Trans Site фирмы ПРОМТ, созданная на базе программы Stylus, которая подключается как к броузеру Netscape Navigator, так и к броузеру Microsoft Internet Explorer.

9. МАШИННЫЙ ПЕРЕВОД В ИНТЕРНЕТЕ

Онлайновый перевод информации в Интернете становится все более популярным. Интернет стремительно превращается из преимущественно англоязычной в многоязычную среду, что вынуждает владельцев Web-сайтов предоставлять информацию на нескольких языках. Наиболее часто к услугам МП прибегают информационные и поисковые сайты, которые стремятся привлечь на свои страницы разноязычных пользователей. Так, на канадском информационно-поисковом портале InfiniT ( http://www.infiniT.com ) открылся новый сервис переводов. На сайте теперь доступен онлайновый перевод текста с английского и немецкого языков на французский язык и обратно.

Увеличение числа посетителей портала обусловлено возможностью онлайнового перевода Web-страниц. Для этого пользователю достаточно указать только адрес Web-страницы, выбрать направление перевода и нажать кнопку перевода. В результате через несколько секунд пользователь получает полностью переведенную Web-страницу с сохранением форматирования.

Новый сервис позволяет ликвидировать языковую проблему в канадском Интернете, где в силу исторических особенностей широко используются два языка: английский и французский. Кроме того, онлайновый переводчик открывает доступ к сайтам на немецком языке тем жителям Канады, которые не владеют иностранными языками.

Сервис работает на базе серверного Интернет-решения компании ПРОМТ под названием PROMT Internet Translation Server version 2.0. Проект был реализован совместно с компанией Softissimo, которая занимается продвижением продуктов компании ПРОМТ под торговой маркой REVERSO.

Интересной особенностью Web-сайтов, знакомящих с программами МП, электронными словарями и другими программами лингвистической поддержки, является то, что с работой многих программных продуктов можно познакомиться в интерактивном режиме, используя версию, установленную на сервере и имеющую шлюз для удаленного общения через Web-интерфейс. На сервере Web-издательства «ИнфоАрт» ( http://www.infoart.ru/misc/dict ) организована интерактивная демонстрация словарей Lingvo и «МультиЛекс». Вы можете ввести слово или словосочетание и мгновенно получить перевод, толкование, примеры употребления и устойчивые словосочетания.

Что же посоветовать пытливому читателю, решившемуся на штурм языкового барьера в Интернет? Его оружием могут стать WebTranSite 98 (разработчик – ПРОМТ, цена

$32), WebView (продукт поставляется в комплекте с PROMT и PROMT Internet), PROMT Internet (разработчик – ПРОМТ, цена

$42) или Socrat Internet (разработчик – «Арсеналъ», цена

$30). Наиболее универсальным из них является PROMT Internet . Купив этот пакет, вы получите сразу несколько программ для перевода Web-страниц, и не только их. Можно с уверенностью сказать, что возможностей данного набора приложений вполне достаточно для полноценной работы с документами на английском, французском и немецком языке.

Если вы предполагаете использовать универсальную переводящую программу WebTranSite 98 или броузер WebView больше, чем другие части пакета PROMT Internet, и при этом желаете сэкономить немного денег, то можете приобрести эти продукты по отдельности. В таком случае WebTranSite 98 придется по вкусу тем, кто часто переводит небольшие фрагменты текста не только из Интернет, но и из офисных, почтовых и других программ, а также из системы интерактивной справки. Замечу, что WebTranSite 98 подходит не только для перевода Web-страниц. Она достаточно универсальна и позволяет обрабатывать фрагменты текста из любых приложений, в том числе из текстовых редакторов, электронных таблиц, органайзеров, броузеров. Программа переводит тексты с английского, немецкого или французского языка на русский и обратно.

Что касается WebView , то это – инструмент искушенного «интернетчика», много времени проводящего на иноязычных серверах и не желающего пропустить ни одной крупицы информации. Программа WebView – полноценный броузер для загрузки и просмотра Web-страниц. Так что, используя его при работе с Интернет-документами на иностранном языке, вы можете даже отказаться от привычных Internet Explorer и Netscape Navigator. WebView – это своеобразный «гибрид» броузера Internet Explorer 4.0 и системы машинного перевода PROMT 98. Полученная в результате такого «скрещивания» программа позволяет переводить Web-страницы, полностью сохраняя их внешний вид. WebView может работать с тремя иностранными языками: английским, французским и немецким, причем переводит как с любого из них на русский, так и в обратном направлении. Функции перевода в этой программе шире, чем в WebTranSite 98, и их набор практически такой же, как в PROMT 98. Так, в дополнение к рассмотренным выше операциям со словарями WebView позволяет вводить в них новые слова и фразы. Чтобы облегчить вашу задачу, программа составляет список незнакомых ей выражений, встретившихся в тексте, подсчитывает количество появлений каждого из них и выводит результаты в специальном диалоговом окне. Выбрав любое из этих слов, вы можете либо запретить его перевод, либо добавить в пользовательский словарь. Единственный недостаток, который портит хорошее впечатление о WeView – это то, что программа иногда зависает при несовпадении направления перевода и языка оригинальной страницы.

Однако программы WebTranSite 98 и Web View по отдельности уже сняты с производства. Да и экономия по сравнению с покупкой PROMT Internet не так уж велика.

Socrat Internet – это аналог «переводящего броузера» WebView. С ее помощью можно выполнять «синхронный» перевод Web-страниц с сохранением их форматирования. Однако если WebView по возможностям настройки опций перевода ничем не уступает профессиональной системе PROMT 98, то в Socrat Internet никаких средств управления этими функциями нет вообще. Броузер от компании «Арсеналъ» не позволяет подключать тематические словари, что сильно ухудшает качество перевода специальных текстов (их, кстати, в Интернет очень много). Простота использования, которой так добивались разработчики, отнюдь не пошла на пользу программе, потерявшей гибкость и управляемость, такие важные для систем машинного перевода. В итоге Socrat Internet существенно уступает продуктам «ПРОМТ» по многим параметрам, в том числе и по самому важному – качеству выходного текста.

10. КАК УЛУЧШИТЬ КАЧЕСТВО ПЕРЕВОДА?


Практические советы.

Наверняка многие уже имеют опыт «общения» с системами машинного перевода. Кое-кто сумел уловить правильный подход к работе с этими программами и эффективно использует их. Другие, наоборот, после первого же сеанса работы испытали разочарование, оценив качество полученного текста. Но не стоит отчаиваться. Существуют способы улучшения результатов машинного перевода, доступные каждому пользователю. О некоторых из них мы сейчас и поговорим.

1. Исход работы в значительной мере решается еще до ее начала .

Прежде чем приступить к переводу, обязательно определите две вещи: во-первых, для каких целей предполагается использовать его результаты, а во-вторых, что представляет собой исходный текст.

Назначение перевода играет первостепенную роль при оценке его качества. В самом деле, один и тот же результат можно считать отличным, если нужно просто узнать, о чем идет речь в оригинальной статье, и совершенно непригодным, если нужно получить текст для публикации в книге или журнале. Но иногда даже самый «грубый» перевод оказывается приемлемым, если в нем имеется достаточно информации, по которой специалист в соответствующей предметной области может легко восстановить содержание текста.

С другой стороны, определив, к какому стилю речи принадлежит исходный текст, нетрудно оценить его пригодность для машинного перевода, а значит, и предугадать результат. Чем больше в тексте иносказательных оборотов, метафор, чем свободнее стиль, тем хуже справится компьютер с его переводом.

Лучше других обрабатываются научные, технические и образовательные тексты, которым присуще строгое изложение материала. Если своевременно пополнять специальные словари новыми терминами, то можно получать полностью связный перевод текстов, требующий минимальной стилистической доработки.

Разговорный и публицистический стиль, где много специфических оборотов, но большинство слов используется в прямом смысле, пригодны для ознакомительного перевода, однако для получения грамотного выходного текста потребуется ручная правка. А вот поэзия и художественная литература, к сожалению, совершенно непригодны для машинного перевода. Смысл текста, построенного на иносказательных выражениях, при машинном переводе искажается и недоступен даже для ознакомления.

2. Бойтесь опечаток!

Очень часто причиной неправильного перевода являются опечатки в оригинале. В особенности это касается отсканированных и распознанных текстов. Слова с орфографическими ошибками в большинстве случаев помечаются системой как незнакомые, поскольку в исковерканном виде они в словарях отсутствуют. Сложнее, если опечатка превращает одно слово в другое, которое также существует в иностранном языке, – программа переведет его, но смысл текста будет искажен. Но самыми серьезными «подводными камнями» являются ошибки в пунктуации. Одна неправильно поставленная запятая способна серьезно исказить перевод предложения. Поэтому перед переводом как можно тщательнее проверьте исходный текст.

3. Хороший словарь – половина успеха.

Обязательно найдите и подключите специальные словари по тематике переводимого текста. Если в точности такой тематики нет, определите наиболее подходящую комбинацию имеющихся у вас словарей и, кроме того, обязательно создавайте свои. Идеально, конечно, иметь для каждого текста свой словарик, но оптимальным, с точки зрения продуктивности работы, является разбиение наиболее распространенных тем на подпункты. Например, в рамках компьютерной тематики можно создать словари «Офисные программы», «Графика», «Сети», «Internet и WWW» и т.д.

4. Строим «пирамиду».

Если к системе подключено несколько словарей, то успех перевода во многом зависит от того, в каком порядке программа ищет в них текущее слово. Поэтому организуйте иерархию словарей в порядке от частного к общему. Самый высокий приоритет должен иметь словарь, созданный для текущего текста, затем – тематические (в порядке расширения предметной области), а самый низкий уровень остается за словарем общеупотребительных понятий. Так, при переводе текста о программе Adobe Photoshop лучше всего на самом высоком уровне поставить словарь «Photoshop» (созданный вами специально для этого текста), затем – «Компьютерная графика», «Информатика» и в самом конце списка – общий словарь. Поскольку объем узкоспециализированных пользовательских словарей, как правило, невелик, а общего, наоборот, огромен, то полученная в результате «конструкция» в чем-то походит на пирамиду.

5. Не надо спешить!

Никогда не переводите сразу весь текст. В нем всегда найдется как минимум одно-два слова, отсутствующих в словарях, и превеликое множество таких, которые система переводит неправильно. Покончив с подключением словарей и определением других опций перевода, для начала переведите небольшой фрагмент в начале текста, например первый абзац. Найдите в этом фрагменте слова, переведенные неправильно, и внесите их в словарь самого высокого уровня. Переведите фрагмент заново. Если результат вас удовлетворит, переходите к следующему абзацу. Практика показывает, что для точной настройки системы необходимо перевести таким образом четверть, а иногда даже треть материала и только после этого запускать автоматическую обработку всего текста.

6. Различайте общее и частное !

Прежде чем внести новое слово в пользовательский словарь, определите, будет ли оно переводиться в тексте данным образом только один-два раза или постоянно. Искусство правильной работы с системой машинного перевода состоит в том, чтобы различать общее и частное. В идеальном случае от вас потребуется знание иностранного языка и предметной области текста. В словарь вносите только систематически встречающиеся варианты перевода, единичные же исправляйте вручную. В противном случае слово по всему тексту будет переведено неправильно.

Соблюдение приведенных выше простых правил обычно позволяет существенно повысить качество переведенных компьютером текстов. Нельзя гарантировать, что они всегда окажутся абсолютно правильными и стилистически грамотными. Однако, вероятнее всего, свою первую задачу – понять смысл текста – вы решите.

З А К Л Ю Ч Е Н И Е

Стремительные потоки информационного обмена между вы­сокоразвитыми промышленными странами, лавина научно-тех­нической документации, поступающая от производителей то­варов и современных технологий, требуют совершенно нового подхода к проблеме перевода технической литературы. Выход один: максимально автоматизировать процесс, оставив челове­ку его творческую редакционную часть. В этом помогает систе­ма машинного перевода. Ее параметры должны удовлетворять четырем основным требованиям:

Оперативность машинных систем — это возможность постоянного пополнения словарного запаса и создания новых тематических словарей. В этом параметре они значительно опе­режают привычные типографские издания различных слова­рей.

Гибкость — это возможность «грубой настройки» на конкретную предметную область (для этой цели служат специализированные словари) и «тонкой настрой­ки» на конкретный текст, книгу или группу документов (моди­фицируемые пользовательские словари).

Скорость — возможность автоматического ввода и обра­ботки текстовой информации с бумажных носителей. Только одна система оптического ввода текстов ( OCR-System ) ежедневно заменяет более десяти классных машинисток.

Точность — стилистически и грамматически правильная адекватная передача смысла исходного текста на язык перево­да. Это наиболее «уязвимое» место систем машинного перево­да. Однако столь явное улучшение качества перевода в позд­них версиях систем машинного перевода, как например, PROMT 98, вселяет уверенность, что вско­ре компьютер полностью примет на себя всю рутинную часть перевода.

В ходе данной работы мы выяснили, что машинный перевод — это эффективное средство для просмотра и поиска информации на иностранном языке, и именно эта функция является главной при работе в Internet. Далее, в результате настройки на предметную область и интеграции с другими программами обработки документов средство машинного перевода позволяет автоматизировать получение перевода. И наконец, — это уникальный гуманитарный инструмент, позволяющий преодолевать проблемы общения в системах, работающих на разных языках. И пожалуй, самый главный, поистине революционный для прикладной лингвистики вывод состоит в том, что многие разработчики осознали: при создании программы машинного перевода кроме хорошо реализованной лингвистики необходима достойная программная реализация.

Несомненно, средства машинного перевода никогда не смогут улавливать все смысловые нюансы оригинального текста. Различия в синтаксисе и семантике, особенно между западными и восточными языками, — скажем английским и китайским — слишком велики для этого. Даже сторонники машинного перевода признают, что он способен в лучшем случае передать основную суть документа.

Но нельзя забывать, что ошибки часто случаются и у обычных переводчиков, и наивно ожидать от системы машинного перевода, что она способна исправить ошибки оригинала и выдаст грамотный перевод. Безусловно, тезис о том, что мозг человека совершенней компьютера, не требует никаких доказательств. Хотя честно сказать, после общения на выставках с некоторыми пользователями в этом появляются сомнения.

В заключение хотелось бы подчеркнуть, что программа-переводчик – это, прежде всего, инструмент, который позволяет решить проблемы перевода или повысить эффективность труда переводчика только в том случае, если он используется грамотно.

Англо-русский словарь. Под рук. Мюллера В.К. – М.% Русский язык, 1985.

Аристов Н.В. Основы перевода. – М.: изд-во литер. на иностр. языках, 1959.

Архипов А.Ф. Самоучитель перевода с немецкого языка на русский. – М.: Высш. шк., 1991.

Бархударов Л.С. Язык и перевод. – М.: Международ­ные отношения, 1975.

Бреус Е.В. Основы тории и практики перевода с русского языка на английский. – М.: УРАО, 1998.

Ванников Ю.В. Языковая сложность текста как фактор трудности перевода (Методическое пособие). – М.: Всесоюзный центр переводов, 1988.

Вейзе А.А, Киреев Н.Б., Мирончиков К. Перевод технической литературы с ангилийского языка на русский. – Минск, 1997.

Вейзе А. А., Мирончиков И. К. Перевод технического текста с английского языка на русский. – Мн.: МГЛУ, 1995.

Васильев А. (Компьютер на месте переводчика). // Подводная лодка. – 1998, № 6.

Винокуров А.А.,Чуканов В.О.Новый метод оценки машинного перевода.// Информационные технологии и системы. Hardware Software Security. Тенденции и перспективы – Сборник статей: М., Международная академия информатизации, 1997.

Гвишиани Н.Б. Язык научного общения (вопросы методологии). –М.: Высш. шк.; 1986.

Левин А. Самоучитель работы на компьютере. – 4-е изд., испр. И доп. М.: Ноллидж, 1997.

Каничев М. (Встреча компьютерных толмачей). // Мир ПК. – 1998, № 8.

Климзо Б.Н. Перевод патентов. – М.: МГПИИЯ им. М.Тореза, 1976.

Рецкер Я.И. Теория перевода и переводческая прак­тика. – М.: Международные отношения, 1974.

Русско-английский словарь. Под рук.Смрницкого А.И. – М.: Русский язык, 1997.

Рыбакин А. И. Словарь английских личных имен. – 2-е изд.- М.: Рус. яз., 1989.

Система перевода текста Magic Goody для Windows. Руководство пользователя. — С.-Петербург, фирма «ПРОМТ», 1999.

Система перевода текста PROMT Internet. Руководство пользователя. — С.-Петербург, фирма «ПРОМТ», 1999.

Система перевода текста STYLUS для Windows. Вер­сия 2.51. Руководство пользователя. — С.-Петербург, фирма «ПРОМТ», 1996.

Система перевода текста WebTranSite 98. Руководство пользователя. — С.-Петербург, фирма «ПРОМТ», 1998.

Система перевода текста WebView Руководство пользователя. — С.-Петербург, фирма «ПРОМТ», 1998.

Система электронных словарей LINGVO для DOS и Windows. Версия 4.0. Руководство пользователя. — М.: фир­ма «БИТ», 1995.

Скороходько Э.Ф. Вопросы перевода английской технической литературы. – К.: изд-во Киевского Университета, 1963.

Судовцев В.А. Научно-техническая информация. – М.: Высш. школа, 1989.

Тетради новых терминов № 6 (Англо-русские патентные термины). – 2-е изд., испр. и доп. – Москва, ВЦП, 1975.

Федоров А.В. Введение в теорию перевода. – М.: ищд-во литер. на иностр. языках, 1958.

Федоров А.В. Основы общей теории перевода. – М.: Высш. шк., 1968.

Флорин Сидер. Муки переводческие. – М.: Высш. школа, 1983.

Циммерман М.Г., Веденеева К. 3. Русско-английский научно-технический словарь переводчика. – М.: Наука, 1991.

Черняховская Л.А. Перевод и смысловая структура. – М.: Международные отношения, 1976.

Читалина Н.А. Учитесь переводить (Лексические проблемы перевода). – М.: Международные отношения, 1975.

Чужакин А.П., Палажченко П.Р. Мир перевода, или Вечный поиск взаимопонимания. – М.: Валент, 1999.

гигабайты словарей и программ для перевода

Вход на сайт

Системы машинного перевода

В отличии от систем Автоматизированного перевода, системы Машинного Перевода производят перевод текстов в автоматическом режиме без участия человека.

Формы организации взаимодействия ЭВМ и человека при машинном переводе

* С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат.
* С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка.
* С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.
* Смешанные системы (например, одновременно с пред- и постредактированием).
* Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.
* Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё не уложившееся в схему отдает человеку.

В англоязычной терминологии различаются термины machine translation (MT, полностью автоматический перевод) и machine-aided или machine-assisted translation (MAT, автоматизированный перевод); если же надо обозначить и то, и другое, пишут M(A)T.

История машинного перевода

Мысль использовать ЭВМ для перевода была высказана в 1946 году, сразу после появления первых ЭВМ. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году. Несмотря на примитивность той системы (словарь в 150 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах; в том же 1954 году и в СССР.

К середине 1960-х в США для практического использования были предоставлены две системы русско-английского перевода:

* MARK (в Департаменте иностранной техники ВВС США);
* GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).

Однако созданная для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведённых текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.

Тем не менее, в ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление мини- и персональных компьютеров, а с ними всё более сложных словарных, поисковых и т. п. систем, ориентированных на работу с естественноязыковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области, наступившему примерно с середины 1970-х. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

Впрочем, мечты, с которыми род людской взялся полвека назад за задачу машинного перевода, в значительной мере остаются мечтами: высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода: по оценкам конца 1980-х, до пяти раз.

В настоящее время существует множество коммерческих проектов машинного перевода. Одним из пионеров в области машинного перевода была компания Systran. В России большой вклад в развитие машинного перевода внесла группа под руководством проф. Р. Г. Пиотровского (Российский государственный педагогический университет им. Герцена, Санкт-Петербург).

Качество перевода

Качество перевода зависит от тематики и стиля исходного текста. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке. Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Применение машинного перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бродящих по Интернету шуток. Из пространных примеров наиболее известен текст «Гуртовщики Мыши» (перевод компьютерной документации программой Poliglossum на основе медицинского, коммерческого и юридического словарей); из кратких — фраза «My cat has given birth to four kittens, two yellow, one white and one black», которую программа ПРОМТ превращает в «Мой кот родил четырёх котят, два жёлтых цвета, одно белое и одного афроамериканца».

Чаще всего подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины дословно, к тому же не отличая собственных имён от обычных слов. Та же программа ПРОМТ превращает «bra-ket notation» в «примечание Кети лифчика», «Lie algebra» — в «алгебру Лжи», «eccentricity vector» — в «вектор оригинальности» и т. п.

Понравилась статья? Поделиться с друзьями:
Изучение языков в домашних условиях