Скачивание памяти переводов. «Память переводчика», или Что такое Translation Memory Переводческая память

В данной статье мы собрали программы, в том числе - бесплатные, которые позволяют переводить больше текстов за меньшее время. Надеемся, что Вы найдете здесь что-то полезное для себя.

Программы Translation memory

Translation memory (переводческая память, накопители переводов) - программы, позволяющие «не переводить одно и то же два раза». Это базы данных, которые содержат ранее переведенные единицы текста. Если в новом тексте обнаруживается единица, которая уже есть в базе, система автоматически добавляет ее в перевод. Такие программы значительно экономят время переводчика, особенно если он работает с однотипными текстами.

Trados . На момент написания статьи - одна из самых популярных программ Translation memory. Позволяет работать с документами MS Word, презентациями PowerPoint, HTML-документами и файлами других форматов. В Trados есть модуль для ведения глоссариев. Сайт: http://www.translationzone.com/trados.html

Déjà Vu . Также один из лидеров по популярности. Позволяет работать с документами практически всех популярных форматов. Есть отдельные версии программы для переводчиков-фрилансеров и для бюро переводов. Сайт: http://www.atril.com/

OmegaT . Поддерживает большое количество популярных форматов, но документы в MS Word, Excel, PowerPoint требуется конвертировать в другие форматы. Приятная особенность: программа бесплатная. Сайт: http://www.omegat.org/

MetaTexis . Позволяет работать с документами основных популярных форматов. Предлагается два варианта программы - модуль для MS Word и серверная программа. Сайт: http://www.metatexis.com/

MemoQ . Функционал схож с Традосом и Déjà Vu, стоимость программы (на момент написания статьи) ниже, чем у более популярных систем. Сайт: http://kilgray.com/

Star Transit . Предназначена для перевода и локализации. На данный момент совместима только с ОС Windows. Сайт: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher . Бесплатная система Translation Memory, созданная и поддерживаемая профессиональным переводчиком. Сайт: http://www.wordfisher.com/

Across . Предлагается 4 различных версии программы, отличающихся по объему функционала. Сайт: http://www.across.net/us/translation-memory.aspx

Catnip . Бесплатная программа, «наследница» программы MT2007. Сайт: http://mt2007-cat.ru/catnip/

Электронные словари

Здесь мы представили только электронные словари для автономной работы (без доступа в интернет). Онлайн-словарей значительно больше, им будет посвящена отдельная статья. Хотя интернет проник в самые удаленные уголки планеты, полезно иметь хотя бы 1 словарь для работы в автономном режиме. Мы рассмотрели словари для профессионального использования, разговорники и словари для изучающих язык сюда не вошли.

ABBYY Lingvo . На данный момент позволяет переводить с 15 языков. Есть несколько версий программы с разным объемом словарей. Существует версия для мобильных устройств. Платная версия словаря устанавливается на компьютер и может работать без подключения к интернету, бесплатная доступна только онлайн. Программа совместима с Windows, Symbian, Mac OS X, iOS, Android. Сайт: http://www.lingvo.ru/

Мультитран . Не все знают, что существует офлайновая версия этого популярного словаря. Может устанавливаться на компьютеры (стационарные и карманные), смартфоны. Работает с Windows, Symbian и Android, а также Linux (через браузер). На данный момент позволяет переводить с / на 13 языков. Сайт: http://www.multitran.ru/c/m.exe

Promt . У данной программы есть версии для профессионального использования. Плюс Промта в том, что он позволяет работать совместно с Trados. Сайт: http://www.promt.ru/

Slovoed . Может переводить c/на 14 языков. Устанавливается на стационарные компьютеры и ноутбуки, мобильные устройства и ридеры Amazon Kindle. Работает с операционными системами iOS, Android, Windows, Symbian, BlackBerry, bada, Tizen. У словаря несколько версий, в том числе - узкоспециализированные тематические словари. Сайт: http://www.slovoed.ru/

Программы для распознавания текста

ABBYY FineReader . Распознает текст на фотографиях, сканах, PDF-документах. Последняя (на момент написания статьи) версия распознает текст на 190 языках, а для 48 из них делает проверку орфографии. Сохранить полученный текст можно практически во всех популярных форматах (Word, Excel, PowerPoint, PDF, html и др.) Сайт: http://www.abbyy.ru/finereader/

CuneiForm (OpenOCR). Программа была создана как коммерческий продукт, однако на данный момент распространяется свободно. Совместима с операционными системами Linux, Mac OS X , Windows. Сайт: http://openocr.org/

Программы для подсчета статистики

Translator"s Abacus - бесплатная программа для подсчета количества слов в документах различного типа. Сайт: http://www.globalrendering.com/

AnyCount - платная программа, обладающая большим числом настроек. Например, можно посчитать кол-во знаков с пробелами или без пробелов, кол-во слов, строк, страниц, или задать единицу подсчета самостоятельно. Сайт: http://www.anycount.com/

FineCount - программа доступна в двух версиях, платной и бесплатной, которые различаются объемом функций. Сайт: http://www.tilti.com/

Программы для локализации приложений

Программы для перевода сайтов

Другие программы для переводчиков

ApSIC Comparator - программа для сравнения файлов (исходный текст VS текст с изменениями, внесенными переводчиком). Сайт: http://www.apsic.com/en/products_comparator.html

AfterScan - программа для автоматической проверки и коррекции исходного текста. Обнаруживает и исправляет опечатки, ошибки, отсутствующие пробелы, ошибки при распознавании текста. Сайт:

Память переводов проекта (TM) - это хранилище исходных строк и их переводов на разные языки, которые можно использовать для ускорения перевода одинаковых или похожих строк в вашем проекте или других проектах.

Каждый перевод, сделанный в проекте, автоматически добавляется в память переводов проекта. Владелец или руководители проекта также могут при необходимости загрузить в проект Translation Memory.

Скачивание или загрузка памяти переводов

  1. Перейдите на вкладку TM & MT пункта настройки проекта .
  2. Нажмите кнопку скачать или загрузить .

You can upload and download TM in the following file formats .tmx, .csv, .xlsx.

Если вы загружаете TM в форматах файлов.csv или.xlsx, сопоставьте столбцы с соответствующими языками в диалоге конфигурации.

Привязка ТМ

Чтобы привязать какие-либо конкретные TM для вашего проекта, выполните следующие действия:

  1. Перейдите на вкладку TM & MT пункта настройки проекта .
  2. Нажмите **Привязать TM **.
  3. Выберите необходимые ТМ в открывшемся диалоговом окне.
  4. Кликните по кнопке Сохранить .

Вы можете установить приоритет выбранных ТМ в том же диалоге.

Совместное использование ТМ

Со всеми вашими TM используемыми совместно вы сможете предварительно перевести любой из ваших проектов, используя все общие TM. Кроме того, в редакторе будут показаны предложения по переводу ТМ из всех ТМ, назначенных для проектов, которыми вы владеете.


Применение памяти переводов через предварительный перевод

Предварительный перевод через ТМ позволяет использовать как минимум 100% и совершенные совпадения.

Говоря об автоматизированном переводе, обычно подразумевают программы, осуществляющие перевод на основе технологии машинного перевода (Machine Translation). Однако существует и другая технология - Translation Memory, которая хотя и не столь широко известна российским пользователям, но, тем не менее, имеет ряд преимуществ.

Бурное развитие технического прогресса привело к увеличению числа технических устройств, машин и другой сложной техники, без которых жизнь современного человека практически немыслима. Например, объем документации для европейского самолета Airbus исчисляется десятками тысяч страниц. Как показывают данные исследования, проведенного в конце 2004 года ассоциацией LISA (LISA 2004 Translation Memory Survey), 42% опрошенных переводят около 1 млн. слов в год, у 24% компаний - участников опроса ежегодный объем переводов составляет 1-5 млн., 12% переводят от 5 до 10 млн., объем переводов остальных компаний - от 10 до 500 и более миллионов слов в год. В частности, большинство производителей сегодня не ограничиваются своим локальным рынком и активно осваивают региональные рынки. При этом локализация продукции, в том числе перевод описания продукта на местный язык, является одним из обязательных условий для выхода на новый рынок.

В то же время, хотя производители регулярно выпускают новые версии своих продуктов - автомобилей, экскаваторов, компьютеров и мобильных телефонов, программного обеспечения, - далеко не все из них принципиально отличаются от предыдущих моделей. Подчас новая модель телефона представляет собой слегка измененную (или рестайлинговую) предыдущую модель. Новые версии продаются лучше, поэтому производителям приходится регулярно обновлять свои продукты. В результате документация по каждому из таких продуктов зачастую на 70-90% совпадает с той, что была у предыдущей версии.

Два фактора - большой объем требующих перевода документов и их высокая повторяемость - послужили стимулом к созданию технологии Translation Memory (сокращенно именуется TM, общепринятый русский перевод этого термина отсутствует). Суть технологии TM можно образно передать одной фразой: «Не переводить один и тот же текст дважды». Иначе говоря, Translation Memory используется для повторного использования ранее сделанных переводов. Это позволяет серьезно сократить время на подготовку перевода, особенно при работе с текстами, имеющими высокую степень повторяемости.

Технологию Translation Memory часто путают с машинным переводом (Machine Translation), которая, безусловно, тоже полезна и интересна, но ее описание не является целью настоящей статьи. Использование технологии ТМ повышает скорость перевода за счет уменьшения объема механической работы. Однако важно отметить, что TM не выполняет перевод за переводчика, а является мощным инструментом для сокращения затрат при переводе повторяющихся текстов.

Технология ТМ работает по принципу накопления результатов перевода: в процессе перевода в базе ТМ сохраняются исходный текст и его перевод. Для облегчения обработки информации и сравнения различных документов система Translation Memory разбивает весь текст на отдельные кусочки, которые называются сегментами. Такими сегментами чаще всего являются предложения, но могут быть приняты и другие правила сегментации. При загрузке нового текста система TM осуществляет сегментирование и сравнивает сегменты исходного текста с уже имеющимися в подключенной базе переводов. Если системе удается найти полностью или частично совпадающий сегмент, то его перевод отображается с указанием совпадения в процентах. Сегменты, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается только перевести новые сегменты и отредактировать частично совпадающие.

Как правило, задается порог совпадений на уровне не ниже 75%, так как если установить меньший процент совпадений, то увеличатся затраты на редактирование текста. Каждое изменение или новый перевод сохраняются в ТМ, так что нет необходимости переводить одно и то же дважды!

Важно также постоянно пополнять базу Translation Memory, сохраняя в базе (или в базах, если перевод выполняется по различным тематикам) пары сегментов «исходный текст - правильный перевод». Это позволит значительно сократить время, необходимое для перевода сходных текстов. Помимо снижения трудоемкости перевода система TМ позволяет выдержать единство терминологии и стиля во всей документации.

Использование технологии ТМ обеспечивает переводчику следующие преимущества:

  • повышение производительности труда. Подстановка даже на 80% совпадающих сегментов из базы переводов может сократить время работы над переводом на 50-60%. Как показывает практика, гораздо эффективнее править уже готовый перевод, чем переводить заново - «с нуля»;
  • единство терминологии и стиля при наличии базы переводов по тематике переводимого документа. Это особенно важно при переводе узкоспециальной документации;
  • организация работы коллектива переводчиков с гарантированным качеством перевода благодаря доступу к общей базе Translation Memory.

Отдельно отметим, что в западных странах, где технология Translation Memory давно уже стала де-факто обязательным инструментом переводчика, средства, потраченные на создание базы переводов, рассматриваются не как затраты, а, скорее, как инвестиции в стабильную и качественную работу, что увеличивает не только прибыль, но и стоимость самой компании.

Рынок систем Тranslation Мemory

Бесспорным лидером на рынке систем Translation Memory являются программы SDL-TRADOS. Летом 2005 года произошло объединение двух крупнейших разработчиков систем ТМ - компаний SDL и TRADOS (программные продукты под торговой маркой TRADOS хорошо известны многим пользователям), и теперь они выпускают совместный продукт, который является законодателем стандартов в области Translation Memory.

Новая система SDL-TRADOS имеет расширенные (настраиваемые пользователем) функциональные возможности нечеткого соответствия (поиск по совпадениям в базе переводов), а также инструментарий для проверки качества переводимых документов. Программа осуществляет проверку орфографии и защищает содержимое блоков памяти с помощью технологии шифрования.

Система поддерживает такие форматы, как Word DOC и RTF, online help RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML, включая HTML Help, RC (Windows Resource), Bookmaster (DCF) и Troff. Помимо системы SDL-TRADOS, на IT-рынке имеются и другие системы ТМ. Особенно широко представлены французские производители.

Система французской компании Atril (www.atril.com) называется. Ее разработчики сначала организовали собственное бюро перевода технической документации, после чего возникла идея создания специализированного ПО на основе технологии Translation Memory.

Это самостоятельное приложение с систематизированным меню. Система может создавать базы ТМ, а также базы данных терминологии и подключать словари. Процесс перевода осуществляется в специальной оболочке Project, куда при ее создании прикрепляется файл, который необходимо перевести, и подключаются дополнительные настройки: база ТМ, словари и др. Текст переводится в специальной таблице, где напротив каждой графы его оригинала нужно заполнить вариант перевода. К преимуществам также относится дополнительная функция для перевода файлов различных форматов, которая позволяет сохранить исходное форматирование файла.

В данной статье собраны программы (программы translation memory, электронные словари, программы для распознавания текста, программы для подсчета статистики, программы для локализации приложений, программы для перевода сайтов, другие программы для переводчиков), в том числе – бесплатные, которые позволяют переводить больше текстов за меньшее время. Так же даны краткие описания этих программ с ссылками на первоисточники для скачивания и установки. Надеемся, что Вы найдете здесь что-то полезное для себя.

ПРОГРАММЫ TRANSLATION MEMORY

Translation memory (переводческая память, накопители переводов) – программы, позволяющие «не переводить одно и то же два раза». Это базы данных, которые содержат ранее переведенные единицы текста. Если в новом тексте обнаруживается единица, которая уже есть в базе, система автоматически добавляет ее в перевод. Такие программы значительно экономят время переводчика, особенно если он работает с однотипными текстами.

Trados . На момент написания статьи – одна из самых популярных программ Translation memory. Позволяет работать с документами MS Word, презентациями PowerPoint, HTML-документами и файлами других форматов. В Trados есть модуль для ведения глоссариев. Сайт: http://www.translationzone.com/trados.html

Déjà Vu . Также один из лидеров по популярности. Позволяет работать с документами практически всех популярных форматов. Есть отдельные версии программы для переводчиков-фрилансеров и для бюро переводов. Сайт: http://www.atril.com/

OmegaT . Поддерживает большое количество популярных форматов, но документы в MS Word, Excel, PowerPoint требуется конвертировать в другие форматы. Приятная особенность: программа бесплатная. Сайт: http://www.omegat.org/

MetaTexis . Позволяет работать с документами основных популярных форматов. Предлагается два варианта программы – модуль для MS Word и серверная программа. Сайт: http://www.metatexis.com/

MemoQ . Функционал схож с Традосом и Déjà Vu, стоимость программы (на момент написания статьи) ниже, чем у более популярных систем. Сайт: http://kilgray.com/

Star Transit . Предназначена для перевода и локализации. На данный момент совместима только с ОС Windows. Сайт: http://www.star-group.net/DEU/group-transit-nxt/transit.html

WordFisher . Бесплатная система Translation Memory, созданная и поддерживаемая профессиональным переводчиком. Сайт: http://www.wordfisher.com/

Across . Предлагается 4 различных версии программы, отличающихся по объему функционала. Сайт: http://www.across.net/us/translation-memory.aspx

Catnip . Бесплатная программа, «наследница» программы MT2007. Сайт: http://mt2007-cat.ru/catnip/

ЭЛЕКТРОННЫЕ СЛОВАРИ

Здесь мы представили только электронные словари для автономной работы (без доступа в интернет). Онлайн-словарей значительно больше, им будет посвящена отдельная статья. Хотя интернет проник в самые удаленные уголки планеты, полезно иметь хотя бы 1 словарь для работы в автономном режиме. Мы рассмотрели словари для профессионального использования, разговорники и словари для изучающих язык сюда не вошли.

ABBYY Lingvo . На данный момент позволяет переводить с 15 языков. Есть несколько версий программы с разным объемом словарей. Существует версия для мобильных устройств. Платная версия словаря устанавливается на компьютер и может работать без подключения к интернету, бесплатная доступна только онлайн. Программа совместима с Windows, Symbian, Mac OS X, iOS, Android. Сайт: http://www.lingvo.ru/

Мультитран . Не все знают, что существует офлайновая версия этого популярного словаря. Может устанавливаться на компьютеры (стационарные и карманные), смартфоны. Работает с Windows, Symbian и Android, а также Linux (через браузер). На данный момент позволяет переводить с / на 13 языков. Сайт: http://www.multitran.ru/c/m.exe

Promt . У данной программы есть версии для профессионального использования. Плюс Промта в том, что он позволяет работать совместно с Trados. Сайт: http://www.promt.ru/

Slovoed . Может переводить c/на 14 языков. Устанавливается на стационарные компьютеры и ноутбуки, мобильные устройства и ридеры Amazon Kindle. Работает с операционными системами iOS, Android, Windows, Symbian, BlackBerry, bada, Tizen. У словаря несколько версий, в том числе – узкоспециализированные тематические словари. Сайт: http://www.slovoed.ru/

ПРОГРАММЫ ДЛЯ РАСПОЗНАВАНИЯ ТЕКСТА

ABBYY FineReader . Распознает текст на фотографиях, сканах, PDF-документах. Последняя (на момент написания статьи) версия распознает текст на 190 языках, а для 48 из них делает проверку орфографии. Сохранить полученный текст можно практически во всех популярных форматах (Word, Excel, PowerPoint, PDF, html и др.) Сайт: http://www.abbyy.ru/finereader/

CuneiForm (OpenOCR). Программа была создана как коммерческий продукт, однако на данный момент распространяется свободно. Совместима с операционными системами Linux, Mac OS X , Windows. Сайт: http://openocr.org/

ПРОГРАММЫ ДЛЯ ПОДСЧЕТА СТАТИСТИКИ

Translator’s Abacus – бесплатная программа для подсчета количества слов в документах различного типа. Сайт: http://www.globalrendering.com/

AnyCount – платная программа, обладающая большим числом настроек. Например, можно посчитать кол-во знаков с пробелами или без пробелов, кол-во слов, строк, страниц, или задать единицу подсчета самостоятельно. Сайт: http://www.anycount.com/

FineCount – программа доступна в двух версиях, платной и бесплатной, которые различаются объемом функций. Сайт: http://www.tilti.com/

ПРОГРАММЫ ДЛЯ ЛОКАЛИЗАЦИИ ПРИЛОЖЕНИЙ

ПРОГРАММЫ ДЛЯ ПЕРЕВОДА САЙТОВ

ДРУГИЕ ПРОГРАММЫ ДЛЯ ПЕРЕВОДЧИКОВ

ApSIC Comparator – программа для сравнения файлов (исходный текст VS текст с изменениями, внесенными переводчиком). Сайт.

Download Crowdin project Translation Memory as TMX, CSV, or XLSX file.

Запрос

Примечание: Используйте комбинацию либо идентификатор проекта и ключ проекта либокомбинация идентификатор проекта , имя пользователя , и ключ учетной записи чтобы попасть в эту конечную точку.

GET https://api.crowdin.com/api/project/{идентификатор-проекта} /download-tm?key={ключ-проекта}

GET https://api.crowdin.com/api/project/{project-identifier} /download-tm?login={username} &account-key={account-key}

Параметры

Название Значение Описание
include_assigned необязательный булево Определяет, должны ли привязанные наборы Памяти Переводов быть включены в скачанный TMX-файл. Допустимые значения: 0, 1.
По умолчанию — 1.
source_language необязательный строка Определяет исходный язык для языковой пары. Необходимо использовать языковой код Crowdin .
target_language необязательный строка Определяет целевой язык для языковой пары. Необходимо использовать языковой код Crowdin .
Variables
project-identifier строка Идентификатор проекта.
project-key строка Ключ API проекта. Требуется либо ключ проекта , либо комбинация имя пользователя и ключ аккаунта .
login строка Ваше имя пользователя в Crowdin. Требуется либо ключ проекта , либо комбинация имя пользователя и ключ аккаунта .
account-key строка API Ключ аккаунта. Требуется либо ключ проекта , либо комбинация имя пользователя и ключ аккаунта .

Примеры

wget -O project.tmx

// allows file support for macintosh ini_set ("default_socket_timeout" , 5 ); // socket timeout, just in case file_put_contents ("project.tmx" , file_get_contents ("https://api.crowdin.com/api/project/{project-identifier}/download-tm?key={project-key}" ));