Gamelocalization 🐼
3.58K subscribers
1.24K photos
109 videos
19 files
599 links
Канал Антона Гашенко про локализацию и ее бизнес-сторону. Делюсь своим опытом за 8 лет работы в сфере.

🤝 Работаю в Riot Games (ex-Levsha, ITI)
🎮 Сайт моей школы: www.gamelocalization.ru
😎 По всем вопросам: @gashenkoant

Темы канала в закрепе!
Download Telegram
Привет!

Меня зовут Антон, я основатель блога и школы локализации Gamelocalization. Это канал — наша база в Телеграме.

Кто автор
Антон Гашенко. В локализации с 2017 года. Работаю Localization Operations Manager в Riot Games. Ex-Levsha, ITI.

👉🏻 За плечами 60+ проектов от таких компаний как Blizzard, Square Enix, EA Games и многих других.
👉🏻 Провел больше 20 мероприятий для лингвистов.
👉🏻 Суммарно более 2000 человек прошли мои курсы и приняли участие в марафонах про переводы и локализацию.

Правила 🎮
Получить банхамером по темечку можно за оскорбление других участников. Будьте добры к окружающим и уважайте друг друга. Ну и не нарушайте основные правила Телеграма.

Полезные ссылки 👾
🕹 Я в Инсте: https://www.instagram.com/gamelocalization
🕹 А здесь вы можете записаться на курсы моей школы Gamelocalization и скачать бесплатные руководства: www.gamelocalization.ru
🕹 Вот тут можно посмотреть живые отзывы от учеников моих курсов: @gamelocalization_reviews

Темы канала 🤖
Ниже я собрал хэштеги, которые закреплены за отдельными постами. Просто нажмите на них и читайте подборку! 😁

👉🏻 #LOCHACK — секреты локализационного мастерства
👉🏻 #LOCGOODIES — статьи, истории, подкасты. Все-все-все, что поможет вам экспертами из высшей лиги!
👉🏻 #ЧЗНТ — тренируем насмотренность на чужих ошибках
👉🏻 #глоссарийлокализации — про термины, с которыми мы встречаемся каждый день
👉🏻 #минуткаперевода — совершенствуем переводческие навыки
👉🏻 #самсебесоветчик — мои советы, куда же без них 😅
👉🏻 #локализуйсумом — новые выпуски моего подкаста
👉🏻 #движ — анонсы мероприятий от меня и не только
👉🏻 #лайв — записи прямых эфиров, которые проводим в Телеграме

Личный вопрос админу можно отправить сюда: @gashenkoant

🐼🐼🐼
📖 MT — Machine Translation
Или машинный перевод. Когда Скайнет нейросеть переводит за человека.

Если компания разумно выстраивает процесс, то чаще всего нанимаются еще и лингвисты, которые вычитывают и правят все ошибки за компуктерами. Такой тип работы называется Machine Translation Post Editing (MTPE).

Вся фишка в том, что машинный перевод из коробочки никогда не даст первоклассного результата. Поэтому если на любом проекте и появляется MT, то нужны люди, которые будут править ошибки и обучать нейросеть. И со временем она умнеет. Но занимает это не месяц и даже не год — EA, например, развивает свой движок уже больше 10 лет, но там до сих пор трудятся живые люди перед тем, как текст уйдет в игру.

Если вы только начинаете разбираться в этой теме, то посмотрите вот эти выступления:
- Миша Горбунов из Social Quantum рассказывает про имплементацию МТ в продукты компании (автор канала еще и ведущий тут 😅)
- Обсуждение перспектив MT от Multilingual в 2020 году
- Выпуск подкаста про MT от memoQ

И да, МТ не заменит людей на 100%, не нужно этого бояться. Но вполне ожидаемо, что в каких-то сферах он будет применяться. Особенно на уровне больших компаний. Но повторюсь, полностью заменить человека-переводчика не получится.

Решил вводить небольшой ликбез по терминам, так как на канал постоянно приходят люди. Думаю, такие подборки тоже будут полезными. С вам реакции на пост, если он вам зашел и такие штуки нужно делать чаще ❤️

#глоссарийлокализации
📖 Term Base

Ни один проект не обходится без терминов: будь то игра, программа, сайт авиакомпании или инструкция к кофеварке. Везде вы встретите термины (слово или словосочетание, являющееся названием определённого понятия), которые должны быть единообразно переведены.

На большинстве проектов параллельно могут трудиться переводчики и редакторы. А для них иметь доступ к переводу терминов — это часть хорошо организованного проекта. Для этого как раз и придуман глоссарий, который в CAT и TMS-инструментах называется Term Base (или TB).

Задача простая: дать лингвистам доступ к актуальной версии перевода терминов. От переводчиков и редакторов требуется только одно — вносить их во время работы с текстом.

И когда лингвисты работают с текстом, отдельное окно в редакторе показывает термины, которые могут встретиться в сегменте. И никакой дополнительной работы руками для поиска!

Но в реальной жизни, к сожалению, иногда бывают ситуации, когда за терминологией на проекте не следят. И из-за ошибок на стадии перевода и редактуры fireball, например, может встретиться в тексте как «огненный шар», «мяч огня» или... «файрбол» 🫠

И это не самый лучший исход, который хочется получить в готовом продукте. Игрок просто запутается, о чем идет речь и какое заклинание нужно применять. Поэтому главная идея — сделать текст максимально понятным для пользователя. И переводить один и тот же термин нужно одинаково.

Будет здорово, если у лингвистов также есть возможность обсуждать термины и их перевод. Для этого менеджер может создать отдельный чат (и сразу получит +10 к карме). И да, это нормально обговорить тот или иной термин со своими напарниками по переводу. Локализация — это про работу в команде, а не по одиночке. Поэтому если что-то непонятно, то всегда совещайтесь с коллегами.

Ну а так как Term Base — это неотъемлемая часть CAT и TMS, то есть два самых популярных формата файла для глоссария для загрузки:
📌 XLSX — привычная таблица. Чаще всего туда можно включить термин на исходном языке и его перевод. Единственный момент — у разных инструментов может отличаться архитектура файла для загрузки. Поэтому лучшее заранее посмотреть, как именно должна выглядеть табличка с терминами.

📌 TBX — формат, который вы встретите именно для Term Base. Его можно загрузить в CAT/TMS без дополнительной подготовки.

Понадобится это может в случаях, например, когда пришел клиент со старым проектом и принес глоссарий. И ваша задача подгрузить его в инструмент, чтобы были доступны актуальные термины.

Подробнее про Term Base и термины можно почитать вот эти материалы:
- Термины в комиксах
- Пять советов по работе с глоссарием
- Работа с терминами в memoQ
- Советы по работе с терминами от Microsoft

#глоссарийлокализации
Please open Telegram to view this post
VIEW IN TELEGRAM
📖 Vendor

Локализация не может жить без команды, которая будет переводить тексты, записывать и озвучивать реплики персонажей, тестировать контент на целевых языках, осуществлять контроль качества... И это только верхушка айсберга, зачем здесь нужны люди.

Когда вся эта работа отдается на аутсорс, то фактически она передается вендорам. Если кратко, то вендор — это то звено в цепи локализация, которая выполняет некую работу для клиента. Чаще всего вендором называют отдельно локализационную студию или переводческую компанию. То есть некое большое звено специалистов. Но на деле фрилансеры — это точно такие же вендоры, но в гораздо меньших объемах.

Помимо термина vendor также можно встретить... sub-vendor!

И тут ситуация точно такая же: речь про все те же компании и фрилансеров. Но есть нюанс.

Например, есть разработчик игр XYZ, у которого имеется проект на локализацию. Он обращается в глобальную локализационную компанию (скажем, Tigerbridge) с просьбой сделать ему перевод текстовой составляющей игры на 20 языков.

Естественно, в больших компаниях чаще всего никто не держит такое количество специалистов в штате, так как давно уже налажена работа с фрилансерами (Хотя тут можно рассказать и про тех, кого обычно нанимают напрямую в штат. Если интересно, то оставляйте комментарии под постом, возможно, сделаем отдельный прямой эфир на эту тему) или есть студии на целевых рынках, которые отлично работают с запрашиваемыми клиентом языками.

Поэтому большая локализационная компания Tigerbridge аутсорсит работу либо локализационным компаниям поменьше, которые могут лучше специализироваться на определенных языках, либо работает с фрилансерами.

И в этом случае как раз компании и фрилансеры, которым глобальная локализационная компания Tigerbridge передала работу, и будут называться саб-вендорами.

То есть цепочка перевода с английского на упрощенный китайский может выглядеть вот так:

Клиент отправляет файл на перевод вендору
⬇️
Вендор ищет саб-вендоров под проект (фрилансеры или локализационные студии поменьше на целевых рынках)
⬇️
Саб-вендоры творят магию с текстом

Фактически вендор в таком случае выступает в качестве управленческой прослойки (читайте, манагерят процесс). Рассуждать о целесообразности такой структуры можно долго, так как все зависит от конкретных случаев и потребностей клиента на проекте. Но с именно такой цепочкой в локализации большинство фрилансеров могут встречаться очень часто.

Ну а помимо слов «вендор» и «саб-вендор» также может встретиться обычный... «подрядчик», что в целом значит то же самое.

#глоссарийлокализации
Please open Telegram to view this post
VIEW IN TELEGRAM
📖 Q&A File

Файл с вопросами и ответами (Questions & Answers File) — главный инструмент для связи лингвистов с клиентом. Если что-то непонятно в сегменте, а командный поиск оказался безрезультатным, то всегда открываем файл с вопросами и ответами. Но перед тем, как задать свой вопрос, обязательно посмотрите, не появился ли аналогичный раньше.

Q&A файл чаще всего делается для локализации на все языки, чтобы у подрядчиков был общий доступ к вопросам и ответам. Если по какой-то причине у вас нет ссылки на этот файл, то просто попросите ее. По-хорошему, предоставить ее должен либо менеджер по локализации (если работаете с переводческой компанией/студией локализации), либо контактное лицо на стороне разработчика (если работаете напрямую).

Организовать файл довольно просто. Сначала нам понадобится создать его в формате таблицы. Некоторые компании ратуют за то, чтобы он был в офлайн-варианте для дополнительной секьюрности, поэтому выбор может пасть на что-то из серии Excel. Я же чаще работаю и встречал варианты, когда такой файл создавали просто в Google Таблицах. Главное, не открывать доступ кому попало, а выдать только нужным участникам процесса.

Ну а далее создаем простую структуру файла, куда включаем следующие столбы:
🍄 Date Added: когда внесли вопрос
🍄 Task/File: к какому заданию или файлу привязан вопрос
🍄 ID: ID строки, к которой задаем вопрос
🍄 Source string: исходный текст
🍄 Question: это же... место для вопроса!
🍄 Answer: а это уже для ответа

Можно также добавить пару столбцов для дополнительных/follow up вопросов и ответов. Но тут уже смотрим по обстоятельствам.

Ну а пример файла можно забрать отсюда 😎

И минутка советов:
Не спрашивайте клиента о том, как переводить тот или иной кусочек текста. Он нанимает вас, так как вы — эксперт и знаете язык.
Если не понимаете смысл строки, нет ID, референса или контекста — Q&A файл ваш друг и главный помощник, чтобы получить крупицы информации.

Ну а уже на следующей неделе поговорим подробнее про то, кто задействован в процессах на интенсиве «Локализация за 2 дня». Вся информация о мероприятии доступна тут, а здесь можно записаться на интенсив.

#глоссарийлокализации
Please open Telegram to view this post
VIEW IN TELEGRAM
📖 CAT и TMS

Если вы почему-то подумали про котиков после прочтения заголовка, то почти угадали! Сегодня речь пойдет про лучших друзей лингвистов и менеджеров, а именно про программы, в которых мы трудимся.

Я слабо представляю (и не хочу, честно!) ситуацию, когда проект любого размера мог бы сейчас переводится в Excel или Google Таблицах. Для работы мы используем программы, которые называются Computer-Aided Translation (CAT, «кошка»). Спойлер: не нужно думать, что речь про машинный перевод. Это две разные вещи.

Помощь компьютера заключается в том, что мы открываем тексты в отдельной программе, имеем доступ к хабу с переведенными текстами и глоссарием. В совокупности это экономит как время, потраченное на работу, так и приложенные силы — ведь не нужно метаться между несколькими вкладками с текстом, списком терминов, предыдущими переводами. Все есть в одном месте.

Если раньше CAT были отдельными полноценными программами, то сейчас их чаще всего можно встретить как часть Translation Management Systems. Основная задача TMS — организация работы по локализации. Помимо фишек «кошек» здесь также есть отдельные возможности для хранения файлов, назначения лингвистов и других нюансов координирования работы.

В общем, это неотъемлемая часть hard skills, которая должна быть как и у переводчиков с редакторами, так и у менеджеров.

Если хотите попробовать самостоятельно разобраться с инструментами, то вот самые популярные TMS/CAT в локализации на данный момент:
Smartcat
Crowdin
Matecat
Phrase
memoQ

У большинства вариантов из списка выше есть бесплатные пробные периоды. В Phrase и Crowdin учим работать на курсах «Основы игровой локализации» и «Основы работы в CAT/TMS».

И по традиции ловите подборку полезных материалов про CAT и TMS:
⭐️ Гайд «Как не допускать ошибок в CAT и TMS
⭐️ Полезные фишки memoQ
⭐️ Почему важно подтверждать сегменты
⭐️ Использование TMS и ускорение работы
⭐️ Нюансы работы в TMS
⭐️ Подборка инструментов от Nimdzi

Ну а в рамках рубрики #глоссарийлокализации как раз пока что сосредоточимся на технической части локализации и ее терминах 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
📖 Fuzzy Matches

Если у вас тоже ассоциация с Маззи из детства, то... не в этот раз! На самом деле речь пойдет про одну из ключевых функций в CAT и TMS — фаззи совпадения.

Когда в Translation Memory есть похожий перевод, но он не идентичен текущему сегменту, система предлагает его с указанием процента совпадения. Например, если раньше встречалась строка "Choose a spell to start", а в новом тексте добавилось слово "game", то система покажет ~90% совпадение.

Для чего нужны фаззи?
🔹 Экономия времени: не надо переводить с нуля, можно просто подправить готовый вариант.
🔹 Сохранение единообразия: терминология и стилистика остаются на месте. При переводе одинаковых конструкций в проекте не будет разнобоя. Например, если есть подборка однотипных фраз, в которых меняется пара слов (и не используются переменные), то их будет проще перевести с внесением точеченых изменений в перевод.

Но есть и обратная сторона медали, особенно для переводчиков и редакторов. Fuzzy Matches напрямую влияют на стоимость перевода: чем выше процент совпадения, тем меньше платят за сегмент.

И тут есть нюанс: далеко не всегда совпадения действительно упрощают работу. Например:
🔸 Вроде бы совпадение 70%, но смысл предложения поменялся. Да и вообще нужно переводить с нуля и адаптировать, так как теперь этот сегмент будет в заголовке, а не как предложение в абзаце.
🔸 Автоматический анализ может не учитывать контекст, особенно если меняются ключевые слова.

Поэтому если fuzzy match не снижает реальный объем работы, это стоит обсуждать с клиентами. Тем не менее такие ситуации встречаются гораздо реже (по крайней мере на моей памяти и проектах, которые вел), поэтому пользы от фаззи больше!

#глоссарийлокализации
Translation Memory 🎮

#глоссарийлокализации снова вернулся на канал!

Мы уже поговорили про главный инструмент для менеджера и лингвистов — TMS. А еще обсудили Term Base, одну из самых удобных функции в ней.

Сегодня же поговорим про не менее важную фичу, а именно память переводов.

Translation Memory (TM) — это база уже переведенных сегментов в рамках проекта. Как только вы открываете новый файл на перевод в TMS, система автоматически ищет, есть ли в памяти похожие или идентичные фрагменты, и предлагает их для повторного использования.

Зачем нужна память перевода
⭐️ Экономит время: не надо переводить одно и то же заново.
⭐️ Сохраняет единообразие перевода: это особенно важно в рамках интерфейсов и повторяющихся сегментах.
⭐️ Отображает изменения в реальном времени: топовая штука, когда на проекте несколько лингвистов, которые переводят и редактируют части текста на проекте.

Базово совпадения в TM делятся на:
🪙 100% match: сегмент полностью совпадает с тем, что уже есть в памяти. Если совпадение выше, то это указывает на то, что совпадает и порядок сегментов до и после того, который сейчас переводим.
🪙 Fuzzy match: сегмент похож на тот, что переводили раньше, но не идентичен полностью (например, 75%, 85%, 95% и т.д.). Чем выше процент совпадения, тем ближе текст в новом сегменте по сравнению с теми, что есть в памяти переводов.

Но и тут есть свои нюансы:
🔪 Если TM не «чистят» от мусора, то могут появиться сегменты, которые переведены с ошибками.
🔪 Память перевода нужно обновлять, если какой-то из этапов делается вне TMS. Например, укладка субтитров для маркетингового видео делается вне TMS, а в Subtitle Edit. В таком случае финальные правки нужно также внести в память переводов. Если (вдруг) видео придет на доработку с обновленным текстом, то будет проще подтянуть финальные варианты перевода из TM, чтобы не тратить время на сравнивание с версией после укладки в другой программе.
🔪 Совпадения из ТМ не учитывают контекст. Поэтому не стоит просто игнорировать 100% мэтчи — их тоже нужно проверять.

Тем не менее память переводов действительно может экономить время, если использовать ее с умом. Поэтому не стоит пренебрегать единым хабом с переведенными сегментами на проекте. Это действительно палочка-выручалочка наряду с глоссарием, которые помогают сохранять единообразие при переводе.
Please open Telegram to view this post
VIEW IN TELEGRAM