Транслитерация Unicode в ASCII

24.01.22

Разработка - Универсальные функции

Приведен пример функции.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
Транслитерация Unicode в ASCII:
.txt 1,18Kb
0 1 850 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Иногда (особенно при обмене с внешними системами) требуется перекодировка "с сохранением читаемости", т.е. Ń, Ņ и Ň должны быть перекодированы в N.

Простая функция, на сервере Xeon 3.5ГГц x64 на строке 25 символов (из них 10 - перекодируемые) работает примерно 10 мс. 
Можно модифицировать транслитерируемые символы, добавляя их в строки Юни и Аск.

В коде приведена половина набора Latin-1 Supplement (U+00C0 ... U+00FF). Более полные строки (то же + Latin Extended A + Latin Extended B U+00C0 ... U+024F) - в приложенном файле.

Имейте в виду, что стандартный редактор 1С символы со U+0181 по U+0189 криво показывает ("лепит" в одно место), но копируются и работают они корректно.

Использована таблица Unicode отсюда.

 
 Код

 

Функция ЮниВАски(Строка) // 0,008 сек
	Юни = "ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖרÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿ";
	Аск = "AAAAAA?CEEEEIIII?NOOOOO*OUUUUY??aaaaaa?ceeeeiiii?nooooo?ouuuuy?y";
	НоваяСтрока = "";
	Для к = 1 по СтрДлина(Строка) Цикл
		Символ = Сред(Строка, к, 1);
		Если КодСимвола(Символ) >= 192 и КодСимвола(Символ) <= 591 Тогда
			Позиция = СтрНайти(Юни, Символ);
			Если Позиция > 0 Тогда
				Символ = Сред(Аск, Позиция, 1);
			Иначе
				Символ = "?";
			КонецЕсли;
		КонецЕсли;
		НоваяСтрока = НоваяСтрока + Символ;
	КонецЦикла;
	Возврат НоваяСтрока;
КонецФункции

 

Вступайте в нашу телеграмм-группу Инфостарт

Функция UNICODE UTF ASCII

См. также

Универсальные функции Работа с интерфейсом Программист 1С v8.3 Бесплатно (free)

Порой необходимо временно отключить расширение 1С, не удаляя его, чтобы не потерять данные. Но в этом случае при каждом запуске всем будет лезть уведомление о неактивном расширении, хотя очевидно, это техническая информация, которой не стоит лишний раз пугать пользователей.

14.05.2025    4185    DeerCven    9    

49

Универсальные функции Программист 1С v8.3 1C:Бухгалтерия Бесплатно (free)

Благодаря этим пяти строчкам можно больше не заморачиваться с загрузкой из внешних файлов. Пользуюсь везде, всегда и постоянно.

21.05.2024    43408    dimanich70    83    

159

Универсальные функции Программист 1С v8.3 1C:Бухгалтерия Абонемент ($m)

Задача: вставить картинку из буфера обмена на форму средствами платформы 1С.

1 стартмани

18.03.2024    6408    6    John_d    13    

58

Универсальные функции Программист Стажер 1С v8.3 1C:Бухгалтерия Бесплатно (free)

Пришлось помучиться с GUID-ами немного, решил поделиться опытом, мало ли кому пригодится.

12.02.2024    53052    atdonya    31    

67

Универсальные функции Программист 1С v8.3 Бесплатно (free)

На заключительных этапах, когда идет отладка или доработка интерфейса, необходимо много раз переоткрыть внешний объект. Вот один из способов автоматизации этого.

30.11.2023    8160    ke.92@mail.ru    17    

67

WEB-интеграция Универсальные функции Механизмы платформы 1С Программист 1С v8.3 1C:Бухгалтерия Бесплатно (free)

При работе с интеграциями рано или поздно придется столкнуться с получением JSON файлов. И, конечно же, жизнь заставит проверять файлы перед тем, как записывать данные в БД.

28.08.2023    21752    YA_418728146    8    

174
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. SerVer1C 992 24.01.22 17:47 Сейчас в теме
Это не транслитерация, а обрезание диакритических значков.
so-quest; +1 Ответить
Для отправки сообщения требуется регистрация/авторизация