Транслітерація в латиницю
Перетворення нелатинських символів (кирилиця, грецька, грузинська, вірменська, арабська, деванагарі, японська, корейська та інші) у чисту латиницю (ASCII) для сумісності з бухгалтерськими програмами. 9 шрифтів, понад 50 країн.
Що таке транслітерація?
Транслітерація — це процес перетворення символів з одного алфавіту в інший. У контексті банківських виписок це означає, що нелатинські символи (наприклад, кирилиця, грецька, арабська, деванагарі, кана, хангул) замінюються їхніми латинськими еквівалентами. Це необхідно, оскільки більшість бухгалтерських програм у Чехії та Словаччині не підтримують інші алфавіти, крім латиниці.
Транслітерацію можна налаштувати для кожного текстового поля окремо. Поля, для яких доступна транслітерація:
- Примітка 1 (Note 1)
- Примітка 2 (Note 2)
- Примітка 3 (Note 3)
- Ім'я контрагента (Counterparty name)
- Тип (Type)
- Опис (Description)
- Статус (Status)
Підтримувані шрифти та країни
Транслітерація охоплює 9 шрифтів та символів, що використовуються у понад 50 країнах:
| Шрифт | Мови / країни | Режими |
|---|---|---|
| Кирилиця | Росія, Україна, Сербія, Північна Македонія, Білорусь, Болгарія | Скорочена (ISO 9) + Фонетична (BGN/PCGN) |
| Грецька | Греція, Кіпр (включно з акцентами ά, έ, ή... та діалектикою ϊ, ϋ) | Скорочена (ISO 843 Type 1) + Фонетична (ISO 843 Type 2) |
| Грузинська | Грузія | Національна романізація |
| Вірменська | Вірменія | ISO 9985 |
| Арабська | Саудівська Аравія, ОАЕ, Єгипет, Марокко, Йорданія, Ліван, Ірак, Катар, Кувейт, Бахрейн, Оман та інші | Спрощена романізація |
| Деванагарі | Індія (гінді, маратхі), Непал (непальська) | IAST спрощена |
| Японська | Японія (хірагана + катакана; кандзі не підтримується) | Романізація за системою Гепберна |
| Корейська | Південна Корея, Північна Корея | Ревізована романізація (алгоритмічна декомпозиція складів хангул) |
| Розширена латиниця |
CZ, SK, PL, HU, DE, AT, CH (ä, ö, ü, ß)
,
RO, FR, ES, PT, IT,
TR (Ğ, İ, Ş)
,
HR, BA, SI (Đ)
,
IS (ð, þ)
,
MT (ħ)
,
NO, SE, DK (å, ø)
+ інші країни, що пишуть латиницею, через Unicode NFKD fallback (LV, LT, EE, FI, NL, BE...) |
Видалення діакритичних знаків + відображення в ASCII |
Режими транслітерації
| Режим | Опис | Приклад (Щ) | Використання |
|---|---|---|---|
| Вимкнено | Конвертація не виконується, символи залишаються у первісному вигляді | Щ | Якщо бухгалтерська програма підтримує Unicode |
| Скорочена (ISO 9) | Кожен символ = точно 1 латинський символ. Реверсивний переклад згідно зі стандартом ISO 9:1995 | S | Коли потрібно зберегти однакову довжину тексту |
| Фонетична (BGN/PCGN) | Переклад за вимовою. Один символ може відповідати кільком літерам | shch | Коли ви хочете отримати читабельний і зрозумілий результат |
Російська кирилиця (А-Я)
Повна таблиця перекладу російських символів в обох режимах:
| Символ | ISO 9 | BGN/PCGN | Символ | ISO 9 | BGN/PCGN | |
|---|---|---|---|---|---|---|
| А а | A a | A a | П п | P p | П п | |
| Б б | B b | B b | Р р | R r | R r | |
| В в | V v | V v | С с | S s | S s | |
| Г г | G g | G g | Т т | T t | T t | |
| Д д | D d | D d | У у | U u | U u | |
| Е е | E e | Ye ye | Ф ф | F f | F f | |
| Ё ё | Йо йо | Йо йо | Х х | H h | Х х | |
| Ж ж | Z z | Zh zh | Ц ц | C c | Ц ц | |
| З з | Z z | Z z | Ч ч | C c | Ч ч | |
| И и | I i | I i | Ш ш | S s | Sh sh | |
| Й й | J j | Y y | Щ щ | S s | Щ щ | |
| К к | K k | К к | Ъ ъ | " | (пропущено) | |
| Л л | Л л | L l | Ы ы | Y y | Y y | |
| М м | M m | М м | Ь ь | ' | (пропущено) | |
| Н н | N n | N n | Э э | E e | E e | |
| О о | O o | O o | Ю ю | Yu yu | Yu yu | |
| Я я | Я я | Я я | ||||
Грецька абетка
Переклад грецьких символів згідно з нормою ISO 843:1997:
| Символ | ISO 843 | Символ | ISO 843 | |
|---|---|---|---|---|
| Α α | A a | Ν ν | N n | |
| Β β | V v | Ξ ξ | X x | |
| Γ γ | G g | Ο ο | O o | |
| Δ δ | D d | Π π | P p | |
| Ε ε | E e | Ρ ρ | R r | |
| Ζ ζ | Z z | Σ σ/ς | S s | |
| Η η | I i | Τ τ | T t | |
| Θ θ | Th th | Υ υ | Y y | |
| Ι ι | I i | Φ φ | F f | |
| Κ κ | K k | Χ χ | Ch ch | |
| Λ λ | L l | Ψ ψ | Ps ps | |
| Μ μ | M m | Ω ω | O o |
Грецькі знаки з наголосом (тонос і діалектика)
Грецькі літери з наголосом автоматично перетворюються на відповідні латинські літери. Наприклад, ім'я Ψυχούλα правильно перетворюється на Psychoula (а не Psychola).
| Символ | Переклад | Символ | Переклад | |
|---|---|---|---|---|
| Ά ά | A a | Ό ό | O o | |
| Έ έ | E e | Ύ ύ | Y y | |
| Ή ή | I i | Ώ ώ | O o | |
| Ί ί | I i | ϊ ϋ (діалітика) | i y | |
| ΐ ΰ | i y |
Розширена кирилиця (українська, сербська, македонська, білоруська)
Символи, характерні для окремих мов:
| Символ | Мова | ISO 9 | BGN/PCGN |
|---|---|---|---|
| Ґ ґ | Українська | G g | G g |
| Є є | Українська | Є є | Є є |
| І і | Українська | I i | І і |
| Ї ї | Українська | Yi yi | Yi yi |
| Ђ ђ | Сербська | D d | Дж дж |
| Ј ј | Сербська | J j | J j |
| Љ љ | Сербська | Лж лж | Лж лж |
| Њ њ | Сербська | Nj nj | Нь нь |
| Ћ ћ | Сербська | C c | C c |
| Џ џ | Сербська | Dz dz | Dz dz |
| Ѓ ѓ | Македонська | G g | Гй гй |
| Ѕ ѕ | Македонська | Dz dz | Dz dz |
| Ќ ќ | Македонська | K k | Кй кй |
| Ў ў | Білоруська | U u | W w |
Інші не-ASCII символи
Турецькі, румунські та балканські спеціальні символи:
| Символ | Мова | Переклад |
|---|---|---|
| Ğ ğ | Турецька | G g |
| İ i | Турецька | I i |
| Ş ş | Турецька | S s |
| Ă ă | Румунська | A a |
| Ș ș | Румунська | S s |
| Ț ț | Румунська | T t |
| Đ đ | Балкани (хорватська, сербська) | D d |
| Ð ð | Ісландська | D d |
| Þ þ | Ісландська | Th th |
| Ħ ħ | Мальтійська | H h |
Крапки та коси риски в GPC
У полі імені контрагента (20 символів у GPC) зберігаються крапки (.) та косих рисок (/). Ці символи важливі для читабельності титулів та правових форм:
- Dr. Novák — науковий ступінь
- s.r.o., a.s. — правова форма компанії
- a/s — данська юридична форма (aktieselskab)
Грузинська абетка (მხედრული)
Переклад грузинських символів згідно з національною романізацією:
| Символ | Переклад | Символ | Переклад | Символ | Переклад | ||
|---|---|---|---|---|---|---|---|
| ა | а | ლ | l | ц | ts | ||
| б | b | მ | m | ძ | dz | ||
| ก | g | ნ | n | წ | ts | ||
| დ | d | о | o | ჭ | ch | ||
| ე | e | პ | p | х | kh | ||
| v | v | ж | zh | ჯ | j | ||
| ზ | z | р | r | H | h | ||
| ת | t | ს | s | ||||
| ย | i | т | т | ||||
| კ | k | у | u |
Вірменська абетка (Հայոց այբուբdelays)
Переклад вірменських символів згідно з ISO 9985:
| Символ | Переклад | Символ | Переклад | Символ | Переклад | ||
|---|---|---|---|---|---|---|---|
| Ա ա | А а | Ծ Ծ | Ts ts | С с | S s | ||
| Б б | B b | Կ կ | K k | В в | V v | ||
| Г г | G g | Հ հ | H h | Т т | T t | ||
| Д д | D d | Ձ ձ | Dz dz | Ր ր | R r | ||
| Е е | E e | Ղ ղ | Gh gh | Ց ց | Ts ts | ||
| Զ з | Z z | Ճ ճ | Ch ch | Ւ ւ | W w | ||
| Է é | E e | Մ մ | M m | Փ փ | P p | ||
| Ը ը | Y y | Յ й | Y y | К к | K k | ||
| Т т | T t | Н н | N n | Օ օ | O o | ||
| Ժ ж | Zh zh | Ш ш | Sh sh | Ֆ ф | F f | ||
| Ի ի | I i | Ո ո | O o | ||||
| Л л | L l | Ч ч | Ч ч | ||||
| Х х | Kh kh | П п | P p |
Арабська (العربية)
Основні арабські літери (без діакритичних знаків ташкіл):
| Символ | Переклад | Символ | Переклад | Символ | Переклад | ||
|---|---|---|---|---|---|---|---|
| ا | a | ز | z | ق | q | ||
| ب | b | س | s | ك | k | ||
| ت | t | ش | sh | ل | l | ||
| ث | th | ص | s | م | m | ||
| ج | j | ض | d | ن | n | ||
| ح | h | ط | t | ه | h | ||
| خ | kh | ظ | z | و | w | ||
| د | d | ع | a | ي | y | ||
| ذ | dh | غ | gh | ||||
| ر | r | ف | f |
Деванагарі (देवनागरी)
Переклад для хінді, непальської та маратхі (IAST спрощений):
| Символ | Транскрипція | Символ | Транскрипція | Символ | Переклад | ||
|---|---|---|---|---|---|---|---|
| अ | а | ч | ча | п | па | ||
| आ | aa | ज | я | б | ba | ||
| и | i | Т | та | м | ма | ||
| у | u | д | da | y | я | ||
| A | e | ण | на | र | ра | ||
| ऐ | ai | त | та | л | ла | ||
| О | o | द | da | ш | ша | ||
| औ | au | न | на | с | sa | ||
| к | ка | ख | kha | х | ha | ||
| г | га | घ | gha |
Японська (日本語) — Кана
Хірагана та катакана перекладаються за системою транслітерації Гепберна. Кандзі (китайські ієрогліфи) не підтримуються — для них потрібна словникова транслітерація.
| Хірагана | Катакана | Переклад | Хірагана | Катакана | Переклад | |
|---|---|---|---|---|---|---|
| あ | ア | а | на | На | на | |
| і | イ | і | ні | ニ | ні | |
| у | У | у | ха | ハ | ха | |
| е | エ | е | ма | マ | ма | |
| о | О | о | я | Я | я | |
| ка | カ | ка | ра | ラ | ра | |
| са | サ | са | ва | ワ | ва | |
| та | タ | та | н | ン | н |
Відображаються лише основні склади. Варіанти дакутен (が, ガ → ga) та хандакутен (ぱ, パ → pa) також підтримуються.
Корейська мова (한국어) — Хангул
Склади хангіль розкладаються алгоритмічно на початкову приголосну, голосну та кінцеву приголосну згідно з Revised Romanization of Korean. Приклад: 한국 → hanguk.
| Початкові приголосні | Голосні (вибір) | |||||||
|---|---|---|---|---|---|---|---|---|
| ㄱ | g | ㅁ | m | ㅏ | a | ㅗ | o | |
| ㄴ | n | ㅂ | b | ㅐ | ae | ㅜ | u | |
| ㄷ | d | ㅅ | s | ㅓ | eo | ㅡ | eu | |
| ㄹ | r | ㅈ | j | ㅔ | e | ㅣ | i | |
Коли використовувати транслітерацію?
- POHODA — рекомендуємо увімкнути транслітерацію, формат GPC підтримує лише символи ASCII
- Money S3 — рекомендуємо увімкнути транслітерацію для GPC, SEPA XML підтримує Unicode
- FlexiBee — SEPA XML підтримує Unicode, для GPC увімкніть транслітерацію
Якщо ви обробляєте виписки з банків, де імена та примітки вказані кирилицею (наприклад, платежі з Росії, України, Білорусі, Сербії), транслітерація забезпечить, що ці дані будуть читабельними латиницею.
Джерела та стандарти
- ISO 9:1995 — міжнародний стандарт транслітерації кирилиці в латиницю (1 символ = 1 символ)
- BGN/PCGN — фонетична система Board on Geographic Names (США) та Permanent Committee on Geographical Names (Велика Британія)
- ISO 843:1997 — міжнародний стандарт транслітерації грецької мови в латиницю