В инструменте Google Translator Toolkit были добавлены новые возможности. Дополнительные параметры ввода

If you do a lot of translating of documents, Google has something called the Google Translator Toolkit, which can help you organize and edit your translations. It uses the Google Translate engine, which searches the Internet for accurate translations and applies them to your documents. When you upload a document to be translated, the toolkit automatically translates and saves the document for you. Then, you can open the translation and edit it.

Google Translator Toolkit, contrary to what the name kind of implies, is not software that you download and install on your computer. It’s a web-based application , just like Google Drive or Gmail, which lives on the Web. You have to use through your Web browser. The main advantage is that you can access the toolkit from any computer, whether you’re at work, at home, or at the library.

When you upload a document, Google gives you the option to purchase a translation of the document from one of its partners. Consider this very carefully. Your document is translated for free by Google Translate when you upload, so don’t think it hasn’t been translated. Google’s translations are okay for casual use, so you don’t really need pay for a translation. However, because Google Translate is not perfect, you may want to purchase a translation for something official or business related. It’s your call, though.

Upload a document to translate

Here’s how to get started with Google Translator Toolkit (see Figure 1 for reference):


В статье рассмотрим веб-сервис для переводов Google Translate Toolkit, который является дополнением к сервису Google Translate. Сервис может быть интересен как профессиональным переводчикам, так и тем пользователям, кто изредка сталкивается с необходимостью перевести текст с одного языка на другой.


В тени Google Translate

Многим, кто активно пользуется интернетом, должен быть хорошо знаком сервис машинных переводов Google Translate (GT). Этот простой сервис позволяет прямо в веб-браузере автоматически переводить слова, фразы, веб-страницы, файлы документов. Отличается быстротой работы, малым потреблением трафика. К тому же технических ограничений на перевод меньше, чем на других веб-сервисах.

Google Translate поддерживает много языков. Сервис имеет дополнительные фишки, например, озвучивание текста. Также этот сервис может быть интегрирован в браузер в виде расширения или непосредственной функции, как в веб-обозревателе Chrome.

В зависимости от пары языков, качества перевода Google Translate вполне хватает для бытового употребления. Несложные тексты на английском вполне сносно переводятся на русский. В случае же пары близкородственных языков, например, русский/белорусский, качество перевода значительно увеличивается.

Однако в дополнение к этому известному сервису Google Translate имеется ещё и веб-сервис Google Translate Toolkit (GTT), о котором знают меньше. В этой статье ближе познакомимся именно с GTT.


Редактор переводов

Google Translate Toolkit - это редактор переводов, специальный несложный инструмент, который позволяет самим пользователям усовершенствовать машинный перевод, сделанный Google Translate.

Такая необходимость возникает, например, если вам нужно перевести документ не только для себя, но и для других. В подобных случаях с помощью GTT можно исправить ляпы автоматического перевода и привести машинный перевод в более человеческий и удобочитаемый вид.

Для тех, кто постоянно занимается переводами, GTT тоже может стать хорошим подспорьем: загрузил документ, открыл в инструментах - и машинный перевод готов, его можно использовать как черновой вариант. А дальше просто правишь этот переведённый текст.

Особенно он удобен при переводе родственных языков. В этом случае объём работы сводится к незначительному количеству правок.

Что касается типов поддерживаемых документов, то в Google Translator Toolkit можно загрузить файл, веб-страницу, статью из Википедии или её гугловского аналога Knol. В GTT можно использовать "память переводов" и собственные глоссарии, о чём подробнее чуть ниже.

Сделанные переводы хранятся на сервере, и вы можете предоставить к нему доступ кому захотите. GTT даёт возможность общаться и сотрудничать с другими переводчиками в интернете. Сам сервис работает через веб-браузер и не требует установки каких-либо программ и модулей.


"Облачное" лирическое отступление

GTT относится к "облачным" сервисам. Особенности компьютерного перевода требуют небольшого отступления, чтобы лучше увидеть те преимущества, которые здесь дают "облака".

Хотя следует уже избегать понятия "облачный" и использовать более точные термины. Если быть педантом, то GTT, как и большинство сервисов Google, относится к сервисам типа "программа как услуга, доступная по Сети" (сокр. SaaS, Software as a Service). То есть основная функциональность (а в нашем случае это машинный перевод и хранение результатов) выполняется на серверах Google. Пользователю предоставляются только результаты работы сервиса и интерфейс управления, обычно это веб-интерфейс.

Про модель вычислений SaaS всё ещё идёт много споров: выгодно это или не выгодно, безопасно или небезопасно, удобно или неудобно и т.д. Однако в случае машинного перевода, а также многих других задач сервис SaaS является более прогрессивным, чем работа локально за своим компьютером.

Во-первых, задача переводов, как и задачи, например, распознавания речи, требуют больших вычислительных ресурсов. Модель SaaS - это централизация вычислений, что позволяет выделять в датацентрах столько ресурсов, сколько трудно вовлечь на отдельной локальной машине. В этом отношении SaaS может предложить уровень решения задач, который раньше на персоналках, казалось, достиг своего предела.

Во-вторых, модель SaaS - это сетевые вычисления, когда в переводах участвует большое количество людей, таким образом может быть организован так называемый "коллективный разум ". Не секрет, что и Google использует человеческие переводы в GTT для усовершенствования своих алгоритмов машинного перевода.

Хотя вышесказанное совсем не значит, что существующий сервис GTT - и есть этот новый уровень переводов и новый уровень коллективного взаимодействия. Но, в целом, SaaS - это правильное направление для переводческой деятельности.


Практика

Инструменты GTT находятся по адресу translate.google.com/toolkit . Для использования, естественно, нужен аккаунт Google.

После входа пользователь попадает в менеджер файлов, который по виду аналогичен менеджеру Google Docs. В главном окне располагается список всех документов, находящихся в процессе перевода. Внизу названия каждого файла будет показываться количество выполненного перевода документа в процентах.

В этом менеджере через кнопку "Открыть доступ" можно пригласить других участников. Через кнопку "Загрузить" выбранный документ можно закачать к себе локально на жёсткий диск.

А основная кнопка - это "Добавить", посредством которой в GTT добавляется документ для перевода. После её нажатия появится форма, позволяющая указать название перевода и выбрать для работы четыре типа документа - файл, веб-страница, статья "Википедии", статья Knol (Knol - это гугловский вариант "Википедии").

В случае добавления файла поддерживаются следующие форматы: AdWords (.AEA), HTML (.html), Microsoft Word (.doc), OpenDocument Text (.odt), простой текст (.txt), Rich Text (.rtf). Также можно загрузить файл субтитров SubRip (.SRT).

В самом низу этой формы добавления документа можно развернуть скрытые опции "Настройки доступа", где выбираются или загружаются свои собственные "память переводов" и глоссарий.

Память перевода (ПП) - это отдельные варианты перевода слов или предложений. Если ПП не указана, то переведенные варианты будут сохраняться в общей памяти Google.

Но можно создать и свою собственную ПП, перейдя по ссылке "Создать отдельную ПП". Здесь сохранятся переведённые вами сегменты текстов, которые будут иметь приоритет при дальнейших переводах. Собственную ПП можно сделать открытой для других пользователей или же закрыть к ней доступ.

Собственная память переводов - это файл в формате XML. Его можно из менеджера документов скачать локально на компьютер в формате TMX.

Глоссарии - это справочник узкоспециализированной терминологии. Так же, как и в случае памяти переводов в GT, можно использовать общий глоссарий, а можно создавать свои собственные.

После выбора всего нужного нажимаем кнопку "Добавить" и попадаем непосредственно в редактор переводов. Интерфейс его очень простой. Это двухпанельное окно, с левой стороны которого будет оригинальный документ, а с правой появится перевод, сделанный автоматически, который нужно довести до более совершенного уровня.

Переводить документ можно последовательно, а можно выборочно, щёлкая мышью по нужному предложению. В обоих случаях редактирование перевода в правом окне будет делаться в специальном плавающем окошке, а не непосредственно в теле документа. Такое плавающее окошко - очень удобная вещь, так как можно сосредоточиться только на переводимом тексте и не нужно отвлекаться на форматирование документа.

Удобством также является и подсветка текста в переводимом документе. Теперь при желании вы можете подсвечивать чистый машинный перевод одним цветом, практически правильный перевод другим цветом, а для собственного перевода использовать третий цветовой вариант. Цветовые палитры настраиваются через меню тулбара "Вид - Настройка цветовой схемы".

На тулбаре редактора имеется кнопка "Инструменты", которая открывает снизу отдельную панель, где могут быть показаны, если они есть, уже существующие переводы конкретного сегмента текста. И здесь эти переводы можно оценивать через рейтинги.

И ещё немаловажным удобством в GTT является проверка правописания.

После завершения редактирования машинного перевода остаётся только через меню "Правка - Полный перевод" завершить редактирование. После чего в менеджере файлов переведённый документ можно загрузить локально или же расшарить его по Сети.

Михаил АСТАПЧИК

вт, 20/10/2009 - 19:00 - admin

Спустя год после анонса в августе 2008 нового инструмента для переводчиков (Google Translation Center) этим летом Google наконец открыл доступ к своему АРМ переводчика под новым названием Google Translator Toolkit.

Translator Toolkit собран из уже известных сервисов Google. Технологии Google Translate используются для получения первичного (чернового) перевода документа, Google Documents для редактирования перевода, в процессе работы с переводом можно посмотреть перевод слов в Google Dictionary и по окончании правки перевод можно опубликовать в Википедии.

Результаты исправленного перевода сохраняются в памяти переводов (translation memory) и будут использованы для улучшения автоматического перевода. Toolkit позволяет использовать свои базы переводов в формате TMX размером до 50Мб. В системе предусмотрена возможность создания многоязычных глоссариев. Создаваемые глоссарии и translation memory можно делать глобальными (доступными всем) или персональными с возможностью предоставить к ним доступ другим пользователям.

Демонстрация работы с Google Translator Toolkit на примере перевода страницы Википедии с одного языка на другой:

Сейчас можно загружать для перевода документы размером до 1Мб в форматах: HTML (.html), Microsoft Word (.doc), OpenDocument Text (.odt), Простой текст (.txt), Rich Text (.rtf). В процессе редактирования документа Toolkit пытается сохранить имеющееся в тексте форматирование.

В ближайшее время мы более подробный обзор возможностей данной системы Google Translator Toolkit - подписывайтесь на новости!

Комментарии

ср, 21/10/2009 - 18:16 - Папа (не проверено)

таблицы

Я все-таки попробую. Дам шанс так сказать. Понял вот что. Нацелен этот проект на так сказать любителей-лингвистов (или как они говорят "casual" пользователей). Второе: заточен он под перевод википедии и на будущее планируется прежде всего для нее.
- Не понял как можно попробовать хотя бы простой перевод но форматированной таблицы, может кто знает, подскажет?
- Перевод pdf документа не получился вообще. На самом деле система не смогла его в себя вобрать. Может и я, правда, чего накосячил.

Жаль, что не русский проект, ну и конечно исходный язык только английский заставляет задуматься.

ср, 21/10/2009 - 00:54 - Вася (не проверено)

направление перевода

Hey, english speaking guys. stop posting in english. This is the Russian-speaking community!

к теме. Не искоренимый недостаток заморских систем - это то, что они заточены на Английский язык, ну плюс сочетание с романскими языками. Так и здесь, в гугле, единственный язык "с которго переводить" - это Английский. И все. А сколько там остальных "на которые" уже не имеет значения.

ср, 21/10/2009 - 00:37 - oo yeah (не проверено)

client privacy

in addition to previous comment of Anonimous

Use of your Content
By submitting your content through the Service, you grant G. the permission to use your content permanently to promote, improve or offer the Services. If G. publicly displays any of the content you submitted through the Service, G. will display only portion(s) and not the entirety of the content at one time.

the link: http://translate.google.com/toolkit/TOS.html

be carefull, big Brother watching U

ср, 21/10/2009 - 00:33 - Anonymous (не проверено)

not available

As said earlier one Franch specialist that concerning our translation business:
Google Never defended privacy as an (absolute) value, don"t expect them to do it in the future.

Если вы много перевозите документы, у Google есть что-то, что называется Инструментом Google Translator Toolkit, который поможет вам организовать и отредактировать ваши переводы. Он использует движок Google Translate, который ищет в Интернете для точного перевода и применяет их к вашим документам. Когда вы загружаете документ для перевода, инструментарий автоматически переводит и сохраняет документ для вас. Затем вы можете открыть перевод и отредактировать его.

Инструмент Google Translator Toolkit, вопреки тому, что подразумевается под именем, - это не программное обеспечение, которое вы загружаете и устанавливаете на свой компьютер. Это веб-приложение , как Google Диск или Gmail, который живет в Интернете. Вы должны использовать его через свой веб-браузер. Главное преимущество заключается в том, что вы можете получить доступ к набору инструментов с любого компьютера, независимо от того, работаете ли вы дома, дома или в библиотеке.

Когда вы загружаете документ, Google дает вам возможность приобрести перевод документа у одного из своих партнеров. Подумайте об этом очень осторожно. Ваш документ составляет без перевода Google Translate при загрузке, поэтому не думайте, что он не был переведен. Перевод Google подходит для повседневного использования, поэтому вам действительно не нужно платить за перевод. Однако, поскольку Google Translate не идеален, вы можете приобрести перевод для чего-то официального или связанного с бизнесом. Это твой звонок.

Загрузить документ для перевода

Вот как начать работу с Инструментом Google Translator Toolkit (см. Рис. 1 для справки):

    В веб-браузере перейдите к переводу. Google. ком.

    В нижней части страницы нажмите «Инструментарий переводчика».

    Войдите в аккаунт Google, который вы хотите использовать с помощью инструментария Translator Toolkit.

    На экране приветствия введите свое имя и фамилию и нажмите «Продолжить». Затем вы видите Инструментарий Translator Toolkit, который очень похож на другие веб-приложения Google, такие как Gmail и Диск.

    Чтобы загрузить документ для перевода, нажмите красную кнопку «Загрузить».

    Нажмите «Добавить контент для перевода» и выберите «Загрузить файл». Справа - список типов файлов, которые вы можете загрузить.

    Нажмите «Обзор» и найдите файл на жестком диске, который вы хотите загрузить.

    Выберите язык, на который вы хотите перевести документ.

    Вам предоставляется возможность приобрести перевод у другой компании. Нажмите «Нет», чтобы разрешить Google Translate обрабатывать перевод.

Документ отображается в списке активных переводов.Нажмите на документ, чтобы просмотреть оригинал и переведенный текст.

Рисунок 1: Инструмент Google Translator Toolkit.

Дополнительные параметры ввода

Вы можете не только загружать документы, но также можете выбрать несколько других способов добавления контента для Инструмента Google Translator Toolkit для перевода:

    URL-адрес ввода: Когда вы выбираете эту опцию, вы можете ввести или скопировать и вставить URL-адрес веб-страницы, который сохраняет эту переведенную страницу в ваших активных переводах. Имейте в виду, что он будет переводить только фактический текст на странице; текст, который появляется в изображениях, не будет переведен.

    Текст ввода: Выбор этой опции дает текстовое поле для ввода или копирования и вставки текста, как на основном сайте Google Translate. Преимущество здесь заключается в том, что перевод будет сохранен в вашем наборе инструментов.

    Введите статью в Википедии: Если по какой-то причине вы хотите перевести статью в Википедии, скопируйте и вставьте URL-адрес статьи. Это может быть не самое полезное из вариантов, потому что сама Википедия предлагает свои статьи на множестве языков.

    Выберите видео YouTube: Этот параметр позволяет вам выбрать видео из своей библиотеки YouTube для перевода.

Google Translator Toolkit - это удобный инструмент, который позволяет быстро переводить и редактировать тексты. Данный сервис как, Вы уже догадались, является разработкой корпорации Google , которая запустила его летом 2009 года. Функционал сервиса, конечно же, намного разнообразнее по сравнению со стандартным онлайн переводчиком от Google . Если вы впервые узнали о данном инструменте, то рекомендуем Вам на YouTube. Хотя оно и на английском языке, однако в нем очень наглядно демонстрируются главные функции сервиса.

Недавно представители Google сообщили о том, что в инструменте Google Translator Toolkit были добавлены новые возможности:

1. Добавлено 100 000 языковых пар.

Теперь с помощью Google Translator Toolkit Вы сможете переводить текст на 345 языках.

2. Добавлена возможность публикации переведенного текста в Google Docs.

Как только Вы закончите перевод, его можно будет опубликовать на Google Docs. После чего Вы сможете пригласить своих друзей или знакомых, для того, чтобы они помогли проверить переведенный текст на наличие ошибок. Также в качестве альтернативы доступна возможность публикации перевода на отдельной веб-странице.

3. Добавлена возможность проверки орфографии.

Как известно, людям свойственно ошибаться, а при переводе большого и сложного текста очень вероятно, что Вы сделаете одну или несколько погрешностей. Но теперь инструмент Google Translator Toolkit имеет встроенную функцию проверки орфографии, и Вы сможете более легко и быстро проверять текст на орфографические ошибки.

4. Добавлена возможность подсветки текста.

Перевод объемного текста иногда занимает немало времени, поэтому для того чтобы помочь Вам увеличить скорость работы в разработчики этого инструмента добавили возможность настраивать вид обработанного текста. Теперь при желании Вы сможете подсвечивать чисто машинный перевод - красным цветом, практически идеальный перевод - оранжевым, а собственный перевод оставлять черным цветом.

5. Добавлена функция отображения статистики перевода.

Данная возможность позволяет просматривать, сколько слов относится к чисто машинному переводу, сколько слов переведены не точно и сколько вообще не были переведены. Благодаря этой функции Вы можете оценить, необходимые затраты усилий, которые Вам нужно будет приложить, чтобы перевести тот или иной текст, фактически до того как Вы приступите к работе.

6. Добавлена возможность разбивать и соединять предложения.

Бывает, что одно предложение на английском языке переводиться как два предложения на китайском. Поэтому теперь Google Translator Toolkit предлагает пользователям возможность разбивать и соединять предложения.

"Разбивая предложения, также как и объединяя их, пользователи могут улучшить качество перевода ", объяснил Сринидхи Висванэта (Srinidhi Viswanatha), инженер данного программного обеспечения.


(на картинке изображен пример перевода текста в сервисе Google Translator Toolkit с английского на немецкий язык )

Воспользоваться инструментом Google Translator Toolkit Вы сможете на этой странице. Только помните, что для этого Вы должны иметь почтовый ящик, зарегистрированный в сервисе