Transliteracja na alfabet łaciński
Konwersja znaków spoza alfabetu łacińskiego (cyrylica, grecki, gruziński, ormiański, arabski, devanagari, japoński, koreański i inne) na czysty alfabet łaciński (ASCII) w celu zapewnienia zgodności z programami księgowymi. 9 czcionek, ponad 50 krajów.
Czym jest transliteracja?
Transliteracja to proces przekształcania znaków z jednego alfabetu na inny. W kontekście wyciągów bankowych oznacza to, że znaki spoza alfabetu łacińskiego (np. cyrylica, grecki, arabski, devanagari, kana, hangul) zostaną zastąpione ich odpowiednikami w alfabecie łacińskim. Jest to konieczne, ponieważ większość programów księgowych w Czechach i na Słowacji nie obsługuje alfabetów innych niż łaciński.
Transliterację można ustawić osobno dla każdego pola tekstowego. Pola, dla których dostępna jest transliteracja:
- Uwaga 1 (Note 1)
- Uwaga 2 (Note 2)
- Uwaga 3 (Note 3)
- Nazwa kontrahenta (Counterparty name)
- Typ (Type)
- Opis (Description)
- Status (Status)
Obsługiwane czcionki i kraje
Transliteracja obejmuje 9 alfabetów i znaków używanych w ponad 50 krajach:
| Alfabet | Języki / kraje | Tryby |
|---|---|---|
| Cyrylika | Rosja, Ukraina, Serbia, Macedonia Północna, Białoruś, Bułgaria | Skrócona (ISO 9) + Fonetyczna (BGN/PCGN) |
| Grecki | Grecja, Cypr (w tym akcenty ά, έ, ή... oraz dialaktyka ϊ, ϋ) | Skrócona (ISO 843 Typ 1) + Fonetyczna (ISO 843 Typ 2) |
| Język gruziński | Gruzja | Krajowa transkrypcja |
| Język ormiański | Armenia | ISO 9985 |
| Język arabski | Arabia Saudyjska, Zjednoczone Emiraty Arabskie, Egipt, Maroko, Jordania, Liban, Irak, Katar, Kuwejt, Bahrajn, Oman i inne | Uproszczona transkrypcja |
| Devanagari | Indie (hindi, marathi), Nepal (nepalski) | Uproszczona IAST |
| Japoński | Japonia (hiragana + katakana; kanji nie jest obsługiwane) | Transkrypcja Hepburn |
| Koreański | Korea Południowa, Korea Północna | Revised Romanization (algorytmiczna dekompozycja sylab hangul) |
| Rozszerzona alfabet łaciński |
CZ, SK, PL, HU, DE, AT, CH (ä, ö, ü, ß)
,
RO, FR, ES, PT, IT,
TR (Ğ, İ, Ş)
,
HR, BA, SI (Đ)
,
IS (ð, þ)
,
MT (ħ)
,
NO, SE, DK (å, ø)
+ inne kraje piszące alfabetem łacińskim poprzez Unicode NFKD fallback (LV, LT, EE, FI, NL, BE...) |
Usunięcie znaków diakrytycznych + mapowanie na ASCII |
Tryby transliteracji
| Tryb | Opis | Przykład (Щ) | Zastosowanie |
|---|---|---|---|
| Wyłączone | Brak konwersji, znaki pozostają w oryginalnej postaci | Щ | Jeśli program księgowy obsługuje Unicode |
| Skrócona (ISO 9) | Każdy znak = dokładnie 1 znak łaciński. Konwersja odwracalna zgodnie z normą ISO 9:1995 | S | Gdy trzeba zachować tę samą długość tekstu |
| Fonetyczna (BGN/PCGN) | Konwersja zgodnie z wymową. Jeden znak może odpowiadać kilku literom | shch | Gdy chcesz uzyskać czytelny i zrozumiały wynik |
Rosyjska cyrylica (А-Я)
Pełna tabela konwersji znaków rosyjskich w obu trybach:
| Znak | ISO 9 | BGN/PCGN | Znak | ISO 9 | BGN/PCGN | |
|---|---|---|---|---|---|---|
| А а | A a | A a | П п | P p | P p | |
| Б б | B b | B b | Р р | R r | R r | |
| В в | V v | V v | С с | S s | S s | |
| Г г | G g | G g | Т т | T t | T t | |
| Д д | D d | D d | У у | U u | U u | |
| Е е | E e | Ye ye | Ф ф | F f | F f | |
| Ё ё | Yo yo | Yo yo | Х х | H h | Kh kh | |
| Ж ж | Z z | Zh zh | Ц ц | C c | Ts ts | |
| З з | Z z | Z z | Ч ч | C c | Ch ch | |
| И и | I i | I i | Ш ш | S s | Sh sh | |
| Й й | J j | Y y | Щ щ | S s | Shch shch | |
| К к | K k | K k | Ъ ъ | " | (pominięte) | |
| Л л | L l | L l | Ы ы | Y y | Y y | |
| М м | M m | M m | Ь ь | ' | (pominięte) | |
| Н н | N n | N n | Э э | E e | E e | |
| О о | O o | O o | Ю ю | Yu yu | Yu yu | |
| Я я | Ya ya | Ya ya | ||||
Alfabet grecki
Konwersja znaków greckich zgodnie z normą ISO 843:1997:
| Znak | ISO 843 | Znak | ISO 843 | |
|---|---|---|---|---|
| Α α | A a | Ν ν | N n | |
| Β β | V v | Ξ ξ | X x | |
| Γ γ | G g | Ο ο | O o | |
| Δ δ | D d | Π π | P p | |
| Ε ε | E e | Ρ ρ | R r | |
| Ζ ζ | Z z | Σ σ/ς | S s | |
| Η η | I i | Τ τ | T t | |
| Θ θ | Th th | Υ υ | Y y | |
| Ι ι | I i | Φ φ | F f | |
| Κ κ | K k | Χ χ | Ch ch | |
| Λ λ | L l | Ψ ψ | Ps ps | |
| Μ μ | M m | Ω ω | O o |
Greckie znaki akcentowane (tonos i dialetyka)
Greckie litery z akcentami są automatycznie zamieniane na podstawowy odpowiednik łaciński. Na przykład imię Ψυχούλα zostanie poprawnie zamienione na Psychoula (a nie Psychola).
| Znak | Konwersja | Znak | Konwersja | |
|---|---|---|---|---|
| Ά ά | A a | Ό ό | O o | |
| Έ έ | E e | Ύ ύ | Y y | |
| Ή ή | I i | Ώ ώ | O o | |
| Ί ί | I i | ϊ ϋ (dialektyka) | i y | |
| ΐ ΰ | i y |
Rozszerzona cyrylica (ukraiński, serbski, macedoński, białoruski)
Znaki specyficzne dla poszczególnych języków:
| Znak | Język | ISO 9 | BGN/PCGN |
|---|---|---|---|
| Ґ ґ | Ukraiński | G g | G g |
| Є є | Język ukraiński | Ye ye | Ye ye |
| І і | Język ukraiński | I i | I i |
| Ї ї | Język ukraiński | Yi yi | Yi yi |
| Ђ ђ | Serbski | D d | Dj dj |
| Ј ј | Język serbski | J j | J j |
| Љ љ | Serbski | Lj lj | Lj lj |
| Њ њ | Język serbski | Nj nj | Nj nj |
| Ћ ћ | Język serbski | C c | C c |
| Џ џ | Język serbski | Dz dz | Dz dz |
| Ѓ ѓ | Język macedoński | G g | Gj gj |
| Ѕ ѕ | Język macedoński | Dz dz | Dz dz |
| Ќ ќ | Język macedoński | K k | Kj kj |
| Ў ў | Białoruski | U u | W w |
Inne znaki spoza ASCII
Znaki specjalne języków tureckiego, rumuńskiego i bałkańskich:
| Znak | Język | Konwersja |
|---|---|---|
| Ğ ğ | Turecki | G g |
| İ i | Turecki | I i |
| Ş ş | Turecki | S s |
| Ă ă | Rumuński | A a |
| Ș ș | Rumuński | S s |
| Ț ț | Rumuński | T t |
| Đ đ | Bałkany (chorwacki, serbski) | D d |
| Ð ð | Islandzki | D d |
| Þ þ | Islandzki | Th th |
| Ħ ħ | Maltański | H h |
Kropki i ukośniki w GPC
W polu nazwy kontrahenta (20 znaków w GPC) zachowuje się kropki (.) i ukośniki (/). Znaki te są ważne dla czytelności tytułów i form prawnych:
- Dr Novák — tytuł naukowy
- s.r.o., a.s. — forma prawna firmy
- a/s — duńska forma prawna (aktieselskab)
Alfabet gruziński (მხედრული)
Transkrypcja znaków gruzińskich zgodnie z krajową romanizacją:
| Znak | Transkrypcja | Znak | Transkrypcja | Znak | Przekształcenie | ||
|---|---|---|---|---|---|---|---|
| ა | a | ლ | l | c | ts | ||
| ბ | b | მ | m | ძ | dz | ||
| ก | g | ნ | n | წ | ts | ||
| ד | d | o | o | ჭ | ch | ||
| ე | e | პ | p | ხ | kh | ||
| v | v | ჟ | zh | ჯ | j | ||
| ზ | z | ร | r | H | h | ||
| ת | t | S | s | ||||
| i | i | ต | t | ||||
| კ | k | u | u |
Alfabet ormiański (Հայոց այբուբdelays)
Konwersja znaków ormiańskich zgodnie z normą ISO 9985:
| Znak | Konwersja | Znak | Konwersja | Znak | Konwersja | ||
|---|---|---|---|---|---|---|---|
| Ա ա | A a | Ծ Ծ | Ts ts | Ս ս | S s | ||
| B b | B b | K k | K k | V v | V v | ||
| G g | G g | H h | H h | T t | T t | ||
| D d | D d | Ձ ձ | Dz dz | Ր ր | R r | ||
| E e | E e | Ղ ղ | Gh gh | Ց ց | Ts ts | ||
| Զ з | Z z | Ճ ճ | Ch ch | Ւ ւ | W w | ||
| Է é | E e | M m | M m | Փ փ | P p | ||
| Ը ը | Y y | Յ յ | Y y | Q q | K k | ||
| Թ թ | T t | N n | N n | O o | O o | ||
| Ժ ժ | Zh zh | Շ շ | Sh sh | Ֆ f | F f | ||
| I i | I i | U u | O o | ||||
| L l | L l | Չ չ | Ch ch | ||||
| Kh kh | Kh kh | P p | P p |
Język arabski (العربية)
Podstawowe znaki arabskie (bez znaków diakrytycznych taškhíl):
| Znak | Tłumaczenie | Znak | Transkrypcja | Znak | Konwersja | ||
|---|---|---|---|---|---|---|---|
| ا | a | ز | z | ق | q | ||
| ب | b | س | s | ك | k | ||
| ت | t | ش | sh | ل | l | ||
| ث | th | ص | s | م | m | ||
| ج | j | ض | d | ن | n | ||
| ح | h | ط | t | ه | h | ||
| خ | kh | ظ | z | و | w | ||
| د | d | ع | a | ي | y | ||
| ذ | dh | غ | gh | ||||
| ر | r | ف | f |
Devanagari (देवनागरी)
Transkrypcja dla języków hindi, nepalskiego i marathi (IAST uproszczona):
| Znak | Transkrypcja | Znak | Transkrypcja | Znak | Przeliczanie | ||
|---|---|---|---|---|---|---|---|
| अ | a | च | cha | p | pa | ||
| ā | aa | j | ja | B | ba | ||
| i | i | T | ta | m | ma | ||
| u | u | đ | da | y | ya | ||
| A | e | ň | na | r | ra | ||
| ऐ | ai | त | ta | l | la | ||
| O | o | d | da | š | sha | ||
| औ | au | n | na | s | sa | ||
| k | ka | kh | kha | h | ha | ||
| g | ga | घ | gha |
Japoński (日本語) — Kana
Hiragana i katakana są konwertowane zgodnie z transkrypcją Hepburna. Kanji (chińskie znaki) nie są obsługiwane — wymagają transliteracji słownikowej.
| Hiragana | Katakana | Konwersja | Hiragana | Katakana | Konwersja | |
|---|---|---|---|---|---|---|
| あ | ア | a | な | ナ | na | |
| i | イ | i | に | ニ | ni | |
| u | ウ | u | ha | ハ | ha | |
| e | エ | e | ma | マ | ma | |
| o | オ | o | や | ヤ | ya | |
| か | カ | ka | ra | ラ | ra | |
| sa | サ | sa | wa | ワ | wa | |
| ta | タ | ta | ん | ン | n |
Wyświetlane są tylko podstawowe sylaby. Obsługiwane są również warianty dakuten (が, ガ → ga) i handakuten (ぱ, パ → pa).
Język koreański (한국어) — Hangul
Sylaby hangulowe są algorytmicznie rozkładane na początkową spółgłoskę, samogłoskę i końcową spółgłoskę zgodnie z Revised Romanization of Korean. Przykład: 한국 → hanguk.
| Spółgłoski początkowe | Samogłoski (wybór) | |||||||
|---|---|---|---|---|---|---|---|---|
| ㄱ | g | ㅁ | m | ㅏ | a | ㅗ | o | |
| ㄴ | n | ㅂ | b | ㅐ | ae | ㅜ | u | |
| ㄷ | d | ㅅ | s | ㅓ | eo | ㅡ | eu | |
| ㄹ | r | ㅈ | j | ㅔ | e | ㅣ | i | |
Kiedy stosować transliterację?
- POHODA — zalecamy włączenie transliteracji, format GPC obsługuje tylko znaki ASCII
- Money S3 — zalecamy włączenie transliteracji dla GPC, SEPA XML obsługuje Unicode
- FlexiBee — SEPA XML obsługuje Unicode, dla GPC włącz transliterację
Jeśli przetwarzasz wyciągi bankowe, w których nazwy i uwagi są zapisane cyrylicą (np. płatności z Rosji, Ukrainy, Białorusi, Serbii), transliteracja zapewni, że dane te będą czytelne w alfabecie łacińskim.
Źródła i normy
- ISO 9:1995 — międzynarodowa norma transliteracji cyrylicy na alfabet łaciński (1 znak = 1 znak)
- BGN/PCGN — system fonetyczny Board on Geographic Names (USA) i Permanent Committee on Geographical Names (Wielka Brytania)
- ISO 843:1997 — międzynarodowa norma dotycząca transliteracji języka greckiego na alfabet łaciński