Про файловые потоки: работа с любыми данными и в любом количестве

23.06.24

Эта небольшая статья - некоторого рода шпаргалка по файловым потокам: как и зачем с ними работать, какие преимущества это дает.

На мой взгляд, механизм работы с данными через файловый поток в 1С недооценен: я редко где-то встречаю его реализацию, а запрос в Google или поиск по Инфостарт не выдает практически никаких результатов - если речь заходит о потоках, то, как правило, о ПотокахВПамяти, которые позволяют в некоторых ситуациях избежать создания временного файла при работе с данными

А ведь по своему опыту могу сказать, что узнав о файловом потоке лишь однажды, ты навсегда начинаешь смотреть на любой объект Записи/Чтения, инициализированный через путь к файлу, как на страшный моветон, вроде запроса в цикле или венгерские нотации

Чем же он так хорош?

Файловый поток позволяет читать и записывать файлы любого размера. В отличии от объекта ДвоичныеДанные, при использовании которого весь файл помещается в оперативную память, данный механизм обрабатывает данные частями, практически не напрягая железо
При помощи потока данные можно записывать кусками в цикле или даже дописывать их к информации, уже существующей в файле на данный момент

При этом, вся эта благодать поддерживается большинством записывающих/читающих объектов, работающих с двоичными данными по умолчанию: Запись/ЧтениеДанных, Запись/ЧтениJSON, Запись/ЧтениеТекста и др.

Но показать проще всего на примерах, некоторые из которых мы сейчас рассмотрим:

Запись данных любого размера

Как уже было сказано ранее, данные можно записывать в цикле частями. Это позволяет не только не положить сервер на непосредственной записи, но и разделить выборку больших данных на несколько кусков: например запрос, возвращающий огромный массив информации, может быть разбит на несколько поменьше по отборам, а механизм записи, при этом, останется прежним, не повышая нагрузку.

Запись в данном случае выглядит следующим образом

	РезультатЗапроса = Запрос.Выполнить();
	
	ВыборкаДетальныеЗаписи = РезультатЗапроса.Выбрать();
	
	Поток        = Новый ФайловыйПоток("C:/1.csv", РежимОткрытияФайла.Дописать); // Открываем файловый поток по пути
	ЗаписьТекста = Новый ЗаписьТекста(Поток);                                    // Передаем поток в запись текста
	
	Пока ВыборкаДетальныеЗаписи.Следующий() Цикл
		
		МассивДанных = Новый Массив;
		
		// Проходим все колонки и записываем значения в массив
		Для Каждого Колонка Из РезультатЗапроса.Колонки Цикл
			 МассивДанных.Добавить(ВыборкаДетальныеЗаписи[Колонка.Имя]);    
		КонецЦикла;
		
		// Соединяем массив в строку через запятые (формат CSV)
		СтрокаДанных = СтрСоединить(МассивДанных, ",");
		ЗаписьТекста.ЗаписатьСтроку(СтрокаДанных);
		
	КонецЦикла;
	
	ЗаписьТекста.Закрыть(); // Закрываем поток

Здесь идет выполнение запроса, текст которого остался за кадром. Далее мы, при помощи объекта ФайловыйПоток, открываем поток на основе пути к файлу. Для нас тут более всего интересен второй параметр - режим открытия файла, который может принимать следующие значения:

Дописать - открывает существующий файл и начинает запись с его конца или создает новый, в случае отсутствия
Обрезать - открывает существующий файл и очищает его, начиная запись с начала. Исключение, если файл не существует
Открыть - просто открывает существующий файл. Исключение, если файл не существует
ОткрытьИлиСоздать - то же, что и Обрезать, но создает новый файл, если он не существует
Создать - я так и не нашел отличия от ОткрытьИлиСоздать
СоздатьНовый - создает новый файл, исключение, если уже существует

Нас, в данном случае, интересует вариант Дописать, так как только он подразумевает сохранение данных, уже существующих в файле на момент записи туда новой информации.

Единственный нюанс: необходимо не забывать удалять/очищать файл, когда подразумевается запись абсолютно новых данных с нуля

Так как работать с потоком напрямую сложно и неудобно, нам необходим объект-помощник. В данном случае это ЗаписьТекста, но в зависимости от ситуации это также могут быть, например, ЗаписьДанных или ЗаписьJSON

Для записи текста мы формируем из полученных в запросе данных строку с запятыми в качестве разделителей - CSV формат, после чего записываем её в файл. Запись одной строки не создает практически никакой нагрузки на сервер - регулировать остается лишь размер выборки данных из базы. Если оперативы для нее хватает - писать можно хоть пока не закончится место на диске

Более жизненный вариант: те же данные но в формате JSON:

	РезультатЗапроса = Запрос.Выполнить();
	
	ВыборкаДетальныеЗаписи = РезультатЗапроса.Выбрать();
	
	Поток = Новый ФайловыйПоток("C:/2.json", РежимОткрытияФайла.Дописать); // Открываем файловый поток по пути
	JSON  = Новый ЗаписьJSON(); 
	JSON.ОткрытьПоток(Поток);
	
	JSON.ЗаписатьНачалоМассива();
	
	Пока ВыборкаДетальныеЗаписи.Следующий() Цикл
		
		СтруктураДанных = Новый Структура;
		
		// Проходим все колонки и записываем значения в структуру
		Для Каждого Колонка Из РезультатЗапроса.Колонки Цикл		
			Поле = Колонка.Имя;
			СтруктураДанных.Вставить(Поле, XMLСтрока(ВыборкаДетальныеЗаписи[Поле]));
		КонецЦикла;
		
		ЗаписатьJSON(JSON, СтруктураДанных);
		
	КонецЦикла;
	
	JSON.ЗаписатьКонецМассива();
	JSON.Закрыть();

Здесь вместо записи текста мы уже используем запись JSON: для того, чтобы JSON был валиден, мы добавляем дополнительно запись начала и конца массива ('[' и ']' в начале и конце файла), а потом, в цикле, при помощи функции ЗаписатьJSON записываем в файл сформированную структуру - функция сама определит, как это должно выглядеть в виде текста JSON, а также, что очень приятно, сама поставит запятую перед новой строкой, для разделения элементов JSON-массива при дописывании данных

Отдельно хочется выделить популярный сейчас формат NDJSON, который может использоваться как источник данных в некоторых БД. Для его формирования, в нашем случае, мы можем скомбинировать ЗаписьJSON и ЗаписьТекста, чтобы автоматические механизмы работы с JSON не наставили лишних запятых и скобок

    ФайловыйПоток = Новый ФайловыйПоток("C:/2.json", РежимОткрытияФайла.Дописать);
    ЗаписьТекста  = Новый ЗаписьТекста(ФайловыйПоток);
    
    Для Каждого Запрос Из МассивЗапросов Цикл
        
        РезультатЗапроса = Запрос.Выполнить();
        Выборка           = РезультатЗапроса.Выбрать();
        
        Пока Выборка.Следующий() Цикл
            
            СтруктураДанных = Новый Структура;
            
            // Проходим все колонки и записываем значения в структуру
            Для Каждого Колонка Из РезультатЗапроса.Колонки Цикл		
                Поле = Колонка.Имя;
                СтруктураДанных.Вставить(Поле, XMLСтрока(Выборка[Поле]));
            КонецЦикла;
        
            ЗаписьJSON    = Новый ЗаписьJSON();
            ПараметрыJSON = Новый ПараметрыЗаписиJSON(ПереносСтрокJSON.Нет);
            ЗаписьJSON.УстановитьСтроку(ПараметрыJSON);
            
            ЗаписатьJSON(ЗаписьJSON, СтруктураДанных);
            СтрокаJSON = ЗаписьJSON.Закрыть();
            
            ЗаписьТекста.ЗаписатьСтроку(СтрокаJSON);        
              
        КонецЦикла;
        
    КонецЦикла;
    
    ЗаписьТекста.Закрыть();

В данном случае мы проходим в цикле несколько запросов, формируя на каждый элемент выборки JSON-строку, которая в последствии записывается просто через объект ЗаписьТекста

Итоговый файл выглядит следующим образом:

{"Код":"JYLWG","Наименование":"Бесы","Дата":"1872 г.","НаСайте":"true","Слов":"194511"}
{"Код":"000000029","Наименование":"Милый друг","Дата":"1885 г.","НаСайте":"false","Слов":"0"}
{"Код":"000000030","Наименование":"Таинственный незнакомец","Дата":"1916 г.","НаСайте":"false","Слов":"0"}
{"Код":"0VR4J","Наименование":"Братья Карамазовы","Дата":"1880 г.","НаСайте":"true","Слов":"288434"}
{"Код":"UDUMD","Наименование":"Преступление и наказание","Дата":"1866 г.","НаСайте":"true","Слов":"168997"}
{"Код":"PW125","Наименование":"Дон Кихот","Дата":"1605 г.","НаСайте":"true","Слов":"345759"}
{"Код":"WA7J1","Наименование":"Критика чистого разума","Дата":"1781 г.","НаСайте":"true","Слов":"172208"}
...

Чтение из файла любого размера

Если записать можно что угодно, то и прочитать можно что угодно. Принцип схож: мы инициализируем поток и дополнительный объект чтения в зависимости от типа данных, после чего обрабатываем все по частям в цикле

    Поток = Новый ФайловыйПоток("C:/2.json", РежимОткрытияФайла.Открыть); // Открываем файловый поток по пути
	
    ЧтениеJSON = Новый ЧтениеJSON;
    ЧтениеJSON.ОткрытьПоток(Поток);
    
    Структура    = Новый Структура;
    МассивЧтения = Новый Массив;
	
    Пока ЧтениеJSON.Прочитать() Цикл
        
        Если ЧтениеJSON.ТипТекущегоЗначения = ТипЗначенияJSON.ИмяСвойства Тогда
            Имя = ЧтениеJSON.ТекущееЗначение;
            
        ИначеЕсли ЧтениеJSON.ТипТекущегоЗначения = ТипЗначенияJSON.Булево
            Или ЧтениеJSON.ТипТекущегоЗначения = ТипЗначенияJSON.Строка
            Или ЧтениеJSON.ТипТекущегоЗначения = ТипЗначенияJSON.Число Тогда
            
            Структура.Вставить(Имя, ЧтениеJSON.ТекущееЗначение);
            
        ИначеЕсли ЧтениеJSON.ТипТекущегоЗначения = ТипЗначенияJSON.КонецОбъекта Тогда
            
            МассивЧтения.Добавить(Структура);
            Структура = Новый Структура;
            
        КонецЕсли;
     
    КонецЦикла;

В данном случае запись идет в массив, так что, по итогу, все данные все равно окажутся в памяти. Но это для примера: в действительности, вместо добавления в массив, скорее всего будет запись в базу. Следовательно, память будет заниматься только в рамках одного объекта

Немного про HTTP-запросы

Часто проблема работы с большими объемами данных возникает при использовании HTTP-запросов - причем как во время создания своего запроса, так и при получении большого объема данных в ответе. У самих объектов HttpЗапрос и HttpОтвет есть, конечно, методы для установки и получения тела из потока, но нам это здесь не поможет, так как речь идет про потоки в памяти

Однако, вариант потокового чтения и записи в файловом потоке для тела Http-запроса/ответа есть. Заключается он в использовании функции УстановитьИмяФайлаТела (для запроса)...

    Запрос = Новый HTTPЗапрос("/");
    Запрос.УстановитьИмяФайлаТела("C:/2.json");

...и параметра ИмяВыходногоФайла у функций отправки запроса Http-соединения (для ответа)

    Соединение = Новый HTTPСоединение("exemple.com");
    Соединение.ВызватьHTTPМетод("GET", Запрос, "C:/reponse.json");

Т.е. для запроса данные не формируются целиком в оперативную память, а пишутся в файл через поток, после чего путь к этому файлу устанавливается как путь к файлу тела. Для ответа же, данные сохраняются сразу в файл на диск, а уже потом могут быть обработаны из файлового потока, как это показано во втором разделе

В общем говоря, использование файловых потоков позволяет очень сильно сократить потребление оперативной памяти при работе с файлами - как на чтение, так и на запись. В частности, они идеально подходят для реализации различных обменов между системами с использованием файлов стандартных форматов, вроде CSV, JSON или XML

Спасибо за внимание!

 

 Мой GitHub:     https://gitub.com/Bayselonarrend 
 Лицензия MIT:   https://mit-license.org

DatabaseCompressionTool: сжатие и свертка базы 1С

DatabaseCompressionTool — сжатие и свертка любой базы 1С

Инструмент DatabaseCompressionTool (DCT) позволяет безопасно сжать и свернуть любую базу 1С, освободив сотни гигабайт и увеличив производительность системы. Доступна демо-версия для оценки эффективности.

Подробнее

Вступайте в нашу телеграмм-группу Инфостарт

Поток запись большие данные json файловыйпоток

+177 –

См. также

15 мифов о платформе 1С

Механизмы платформы 1С Программист Бесплатно (free)

Разберем 15 мифов о работе платформы «1С:Предприятие 8» – как распространенных, так и малоизвестных. Начнем с классики: «Код, написанный в одну строку, работает быстрее, чем многострочный». Так ли это на самом деле?

16.07.2025 31249 TitanLuchs 106

149

Текучий интерфейс в 1С

Механизмы платформы 1С Работа с интерфейсом Программист Стажер 1С:Предприятие 8 Бесплатно (free)

Про ООП в 1С и о том, как сделать свой код более кратким и выразительным при помощи использования текучего интерфейса (fluent interface).

03.02.2025 17108 bayselonarrend 127

XDTO и работа с JSON

Механизмы платформы 1С Программист 1С:Предприятие 8 Бесплатно (free)

В этой статье подробно рассматривается работа с JSON в XDTO в 1С:Предприятие. Вы узнаете, как сериализовать и десериализовать объекты XDTO в JSON, интегрировать 1С с веб-сервисами и API, а также корректно обрабатывать данные при обмене. Разбираются особенности работы с коллекциями, использование функций восстановления и частые ошибки при работе с JSON и XDTO.

30.01.2025 20734 user2122906 9

Гайд по XDTO для чайников

Механизмы платформы 1С Файловый обмен (TXT, XML, DBF), FTP Программист 1С:Предприятие 8 Бесплатно (free)

Этот материал познакомит вас с механизмом XDTO (XML Data Transfer Objects) в 1С и научит эффективно использовать его возможности. Мы разберёмся, как работать с XML-схемами, создавать модели данных, манипулировать объектами XDTO, а также сериализовать и десериализовать их в XML. Вы узнаете, как использовать XDTO для интеграции с внешними системами, избегать типичных ошибок и оптимизировать код. К концу вы будете уверенно применять XDTO для решения сложных задач обмена данными и автоматизации процессов.

17.01.2025 36136 user2122906 12

Поинтегрируем: WebSocket’ы в платформе 1С. Часть 1

Механизмы платформы 1С WEB-интеграция Программист 1С:Предприятие 8 Бесплатно (free)

В платформе 8.3.27 появилась возможность использовать WebSocket-клиент. Давайте посмотрим, как это все устроено и чем оно нам полезно.

14.01.2025 31902 dsdred 106

148

Передача параметров процедур и функций. Особенности "Знач"

Механизмы платформы 1С Программист 1С:Предприятие 8 Бесплатно (free)

Особенности "Знач" и разбор документации к нему.

10.01.2025 18067 VAAngelov 59

109

Сервисы интеграции без Шины и интеграции

Механизмы платформы 1С Программист Стажер 1С:Предприятие 8 1C:Бухгалтерия Бесплатно (free)

Пример использования «Сервисов интеграции» без подключения к Шине и без обменов.

13.03.2024 15203 dsdred 22

Поинтегрируем: сервисы интеграции – новый стандарт или просто коннектор?

Перенос данных 1C Администрирование СУБД Механизмы платформы 1С Системный администратор Программист Стажер 1С:Предприятие 8 Бесплатно (free)

В платформе 8.3.17 появился замечательный механизм «Сервисы интеграции». Многие считают, что это просто коннектор 1С:Шины. Так ли это?

11.03.2024 34976 dsdred 76

113

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. Поручик 4609 24.06.24 08:21 Сейчас в теме

Спасибо.

Ответить

2. period 7 24.06.24 08:50 Сейчас в теме

Не совсем понимаю логики, поэтому переспрошу: разве в целях производительности мы не должны, наоборот, избавиться по возможности от файловых операций и держать максимум оперативной информации в оперативной памяти? Опять же, скорее всего, все эти операции операционная система закэшит в памяти, поэтому не так страшно. Но сэкономит ли это саму память в конечном итоге?

3. bayselonarrend 3106 24.06.24 08:58 Сейчас в теме

(2)

Должны, пока количество оперативной информации не превысит количество доступной оперативной памяти. При попытке, например, записать несколько миллионов строк в файл за раз, мы получим вылет по памяти либо уже на выборке данных из базы, либо на самой записи в файл. То же и с чтением: попытка открыть файл в несколько десятков ГБ через, например, двоичные данные, приведет к схожему результату

В случае же с потоком, мы можем разбить выборку на несколько запросов или даже открывать файл на запись несколько раз. При этом данные туда будут дописываться, без необходимости выгружать уже существующие в оперативную память. Чтение же вообще будет тратить памяти в размере одного блока информации за раз (json объекта, например)

Разница примерно как у РезультатЗапроса.Выбрать() и РезультатЗапроса.Выгрузить(), только с данными файла

17. DrAku1a 1792 26.06.24 12:32 Сейчас в теме

(3) Всё правильно сказано, только в начале статьи

узнав о файловом потоке лишь однажды, ты навсегда начинаешь смотреть на любой объект Записи/Чтения, инициализированный через путь к файлу, как на страшный моветон, вроде запроса в цикле или венгерские нотации

Важно понимать, что бывают ситуации, когда и запрос в цикле, и РезультатЗапроса.Выгрузить() и типовые операции чтения/записи файлов единым блоком - вполне рабочие, т.к. в итоге приводят к незначительной нагрузке. И эти ситуации бывают довольно часто.
Важно знать и помнить про то, что когда работа идёт с большим блоком информации - нужны иные подходы и инструменты, и в этом плане Ваша статья очень полезна.

Прикрепленные файлы:

4. KirillZ44 12 24.06.24 11:15 Сейчас в теме

Большое спасибо, очень познавательно.

5. kamisov 225 24.06.24 15:09 Сейчас в теме

Не понял... Выложил статью только вчера, уже целых 78 плюсов, и никто не увидел?

Прикрепленные файлы:

6. bayselonarrend 3106 24.06.24 15:10 Сейчас в теме

(5)Самое глупое, что я это правил, но не сохранил похоже. Спасибо

7. bayselonarrend 3106 24.06.24 15:20 Сейчас в теме

(5)

Не понял... Выложил статью только вчера, уже целых 78 плюсов, и никто не увидел?

Выглядит конечно странно со стороны, но а что я сделаю

8. kamisov 225 24.06.24 16:19 Сейчас в теме

(7) я про то что 78 человек не просто пролистали, а еще и плюс ткнули. И никто ведь не обратил внимание. Странно!

9. qwinter 684 24.06.24 16:41 Сейчас в теме

(8) Многие добавляют интересные длинные статьи в избранное, что бы прочитать позже.

10. kuzyara 2246 25.06.24 04:54 Сейчас в теме

Как извлечь файлы из zip-архива в поток? записать из потока в zip-архив?

11. siamagic 25.06.24 05:44 Сейчас в теме

ЗаписьТекста всегда позволяла дописывать, что изменил файловый поток в вашем примере?
Ничего.

13. uno-c 272 25.06.24 14:36 Сейчас в теме

(11) Если открыть ЗаписьТекста через ФайловыйПоток - то можно управлять параметром ЗаписатьBOM и по-умолчанию BOM не будет добавляться. Если ЗаписьТекста инициализовать напрямую через файл (без посредника в виде ФайловыйПоток) то, например, в UTF-8 запись BOM добавится без вариантов.

Вывод: пример из статьи все-таки кое-что изменил, а именно убрал три первых байта из csv-файла. При записи как в примере через Поток - в итоговом файле будет отсутствовать маркер последовательности байтов UTF-8 (EF BB BF)

16. siamagic 25.06.24 21:21 Сейчас в теме

(13) В статье эта информация отсутствие, как и информация по управлению размером буфера.

23. SergMuravev 884 25.01.25 03:08 Сейчас в теме

(16) Зачем нужно управлять размером буфера?

12. uno-c 272 25.06.24 14:28 Сейчас в теме

узнав о файловом потоке лишь однажды, ты навсегда начинаешь смотреть на любой объект Записи/Чтения, инициализированный через путь к файлу, как на страшный моветон

Файловый поток - это объект, предназначенный для записи/чтения данных. Инициализируется Файловый поток через путь к файлу. Выходит, файловый поток - тоже страшный моветон.

Не понятно, чем две строки

Поток = Новый ФайловыйПоток("C:/1.csv", РежимОткрытияФайла.Дописать);
ЗаписьТекста = Новый ЗаписьТекста(Поток);

"выгоднее", чем одна строка

ЗаписьТекста = Новый ЗаписьТекста("C:/1.csv",,,Истина);

Разве что в возможности управления параметром ЗаписатьBOM.

Или эти три строки

Поток = Новый ФайловыйПоток("C:/2.json", РежимОткрытияФайла.Дописать);
JSON  = Новый ЗаписьJSON(); 
JSON.ОткрытьПоток(Поток);

непонятно, чем они "выгоднее", чем две

JSON  = Новый ЗаписьJSON(); 
JSON.ОткрытьФайл("C:/2.json");

По чтению то же самое, лишняя строчка, лишний объект, непонятно какие выгоды от файлового потока.

ЗаписьТекста.Закрыть(); // Закрываем поток

Здесь закрывается не поток, а ЗаписьТекста. Сам Поток остается открытым. Например, после ЗаписьТекста.Закрыть() можно ниже дописать, и оно сработает:

Буфер = ПолучитьБуферДвоичныхДанныхИзСтроки("BinaryDataBuffer");
Поток.Записать(Буфер,0,16);

21. mikukrnet 182 23.09.24 17:14 Сейчас в теме

(12) Разница под капотом. Если вы натравите filebeat на свои логи - то через ЗаписьТекста вы туда ничего не запишите. А через поток - легко

18. SergMuravev 884 26.06.24 17:22 Сейчас в теме

(0) Есть еще МенеджерФайловыхПотоков, было бы здорово, если бы рассказали и про него.

19. pstrig 27.06.24 08:37 Сейчас в теме

Интересно, возможно ли применить потоки при чтении/записи xlsx файлов?

20. n_mezentsev 112 04.07.24 14:32 Сейчас в теме

А как насчет конкурирующей записи / чтения в/из Файлового потока? Для чего нужны ДоступноЧтение и ДоступнаЗапись?

22. Serezhzhzha 21.11.24 13:52 Сейчас в теме

Круто, спасибо!

24. user652103_rupert4 05.08.25 22:09 Сейчас в теме

очень интересно.
а как бы в это еще добавить передачу с клиента на сервер и с сервера на клиент.
иначе в части задач смысл теряется.

Для отправки сообщения требуется регистрация/авторизация

Автор:

Антон Титовец (bayselonarrend)

Рейтинг: 3106

Для получения уведомлений о новых публикациях автора подключите телеграм бот: Инфостарт бот

Публикация:

№ 2133335

Создание 23.06.24 20:00

Обновление 23.06.24 20:00

Статистика:

Просмотры 27983

Загрузки 0

Рейтинг 177

Комментарии 22

Характеристики:

Код открыт Да

Рубрики Механизмы платформы 1С

Кому Программист ,
Стажер

Тип файла Нет файла

Платформа 1С:Предприятие 8

Конфигурация 1C:Бухгалтерия

Операционная система Не имеет значения

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Бесплатно (free)

Про файловые потоки: работа с любыми данными и в любом количестве

Запись данных любого размера

Чтение из файла любого размера

Немного про HTTP-запросы

DatabaseCompressionTool — сжатие и свертка любой базы 1С

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис

Мероприятия

Видеозаписи

Биржа заказов

Форум

Мерч

О компании