Сводный таблицы правил транслитерации

UrlTranslit: Красивый читаемый урл

Выходные данные

  • используемый набор: [0–9a-z_\-]
  • все буквы маленькие
  • слова разделены подчёркиванием
  • не встречается два подчёркивания подряд
  • не встречается _-_
  • UrlTranslit(~UrlTranslit(string)) == UrlTranslit(string)

Формальные правила


[_\s\.,?!\[\](){}]+ _
aaa_-+_bbb aaa--bbb
-{2,} --
-+$ (пусто)
[A-ZА-Я] [a-zа-я]
[а-я] [a-z]
(всё остальное) (пусто)

Supertag: Короткий однозначный идентификатор

Выходные данные

  • используемый набор: [0–9a-z\-]
  • Supertag(Supertag(string)) == Supertag(string)
  • Supertag(UrlTranslit(string)) == Supertag(string)

Формальные правила


-{2,} -
-+$ (пусто)
[A-ZА-Я] [a-zа-я]
[а-я] [a-z]
(всё остальное) (пусто)

BiDiTranslit: Взаимно-однозначный транслит

Выходные данные

  • двустороннее взаимно-однозначное преобразование текста
  • входной набор: [0–9a-zA-Zа-яА-Я\-_ ]
  • выходной набор: [0–9a-zA-Z\-'_+]
  • все символы, не включающиеся во входной набор, are omitted

Формальные правила


[а-яА-Я+] [a-zA-Z+]

Приложения

Односторонняя транслитерация кириллицы

абвгдезиклмнопрстуф
abvgdeziklmnoprstuf


Странности:

Ё e
Ж zh
Й j
Х x
Ц ts
Ч ch
Ш sh
Щ sch
Ъ, Ь (пусто), если перед согласной
j, если перед гласной, однако не должно быть jj
Ы y
Э e
Ю ju
Я ja

Восстановимая транслитерация кириллицы

абвгдезиклмнопрстуф
abvgdeziklmnoprstuf


Странности:

ё jo
ж zh
й jj
х kh
ц c
ч ch
ш sh
щ shh
э eh
ю ju
я ja
ы y
ъ ~ (тильда)
ь ' (апостроф)
Ъ _~
Ь _'

От ГОСТ 16876–71 отличается транслитерацией мягкого и твёрдого знаков (отказ от знака дюйма для более простого представления в теле HTML-страниц).


Заглавные буквы

Ж Zh
Shh Щ

Оператор «плюс» — смена языка