7. Словари

Для хранения найденных в исходном коде слов, их переводе и пр. используются специальные файлы словарей.

Основным форматом таких файлов является формат PO. Для более простых случаев перевода можно использовать формат CSV, который менее информативен и не поддерживает ряд возможностей программы локализации (неточные переводы, ссылки на источники, пр.) но более прост в работе.

7.1. CSV-формат

Представляет собой обычный текстовый файл, позволяющий сохранить таблицу, границами ячеек являются запятые. В случае если запятая является частью значения ячейки, значение ячейки выделяется кавычками. Все кавычки являющиеся частью значения удваиваются и находятся обязательно внутри кавычек ограничивающих значение.

В данном случае в формат добавлены правила для первых двух строк:

  • 1 строка — служебная информация.
  • 2 строка — названия колонок.

Начиная с третьей строки и далее расположены данные. Описание каждой фразы из исходного кода состоит из четырех частей, в данном случае, колонок, смысл содержания значений которых отражен в названиях колонок.

  1. Оригинал — фраза из исходного кода
  2. Перевод — перевод, которым будет заменен оригинальный текст
  3. Комментарий переводчика — комментарий указанный переводчиком или можно указать комментарий уточняющий для переводчика смысл оригинальной фразы
  4. Комментарий программы — автоматически сформированный комментарий программы локализации, в котором может быть указано, например отсутствие уже переведенной строки в исходном коде (notfound).

Для удобства работы с CSV в текстовом редакторе, значения всегда выделены кавычками.

Пример CSV сгенерированного программой. 

CodePage=UTF8;Format=1;,,,
"Original","Translate","Remark translater","Remark program"
"Значение 1:","Value 1:","",""
"Значение 2:","Value 2:","",""
"Ошибка","Error","",""
"Пример","Example","",""
"Расчет","Calc","",""
"Результат","Result","",""

При пересохранении в редакторе, например OpenOffice, лишние кавычки будет убраны.

Пример CSV сохраненного из OpenOffice. 

CodePage=UTF8;Format=1;,,,
Original,Translate,Remark translater,Remark program
Значение 1:,Value 1:,,
Значение 2:,Value 2:,,
Ошибка,Error,,
Пример,Example,,
Расчет,Calc,,
Результат,Result,,

Редактирование CSV

Простой текстовый редактор

Для редактирования можно воспользоваться любым текстовым редактором поддерживающим кодировку UTF8. Важно следовать правилам разделения значений и другим правилам изложенным в начале этого раздела.

Рекомендую воспользоваться программой NotePad++.

Microsoft Excel

Не рекомендую использовать его. Лучше обратить внимание на пакет OpenOffice рассмотренный далее.

Основные проблемы: 1. Если значение ячейки начинается со знака, например минус, то Excel считает что это вычисляемое поле и заполняет его значением #ИМЯ? 2. Если значение ячейки не выделено кавычками, то Excel может привести значение к формату данных по своему усмотрению. Хотя изначально программа локализации специально добавляет такие кавычки, при сохранении из Excel Они пропадут и повторное открытие может привести к автоматическому преобразованию данных некоторых ячеек.

OpenOffice Calc

Рекомендую использовать OpenOffice.

Особенности первоначальной настройки импорта. Настроить достаточно один раз, так как программа запомнит настройки и в дальнейшем будет предлагать уже их.

Рисунок 1. Настройки импорта CSV в OpenOffice

images/dictionary/OpenOfficeImportCSV.jpg

На скриншоте красным отмечены параметры на которые следует обратить особое внимание.

Рисунок 2. Таблица CSV в OpenOffice

images/dictionary/OpenOfficeTableCSV.jpg

Site      PDF      Content