Формат баз 1CD - классические и 8.3.8

14.07.16

Разработка - Механизмы платформы 1С

Некоторые дополнения к описанию формата 1CD от awa и описание нововведений в 8.3.8

В первую очередь хочу поблагодарить за публикацию многоуважаемого awa. А его утилита Tool_1CD спасла уже не одну базу.
Я буду ссылаться на эту публикацию, предварительное ознакомление с ней обязательно. Сподвигло меня на написание то, что 1С выкатила новый формат, описаний которого мне пока не попадалось. Данная статья будет полезна как для понимания ограничений данного формата, так и для создания утилит восстановления испорченных баз.

1. Дополнения и уточнения к описанию от awa

Страницы

Чтобы избежать терминологической путаницы, введем термин "страница" - это блоки, из которых состоит файл базы. До версии платформы 8.3.8 (формат 8.2.14 и младше) размер блока был строго равен 4096 байт, начиная с версии 8.3.8 фирма 1С ввела новый, пока необязательный, формат с возможностью увеличения размера страницы - допустимыми стали значения 4Кб, 8Кб, 16Кб, 32Кб и 64Кб. Страницы в файле нумеруются с нуля четырехбайтным целым числом, предположительно без знака (UINT32). Таким образом, для страницы в 4К теоретический максимум размера файла - 16Тб, но другие ограничения не дадут реализовать этот потенциал. Страницы 0, 1 и 2 имеют специальное назначение: в странице 0 содержится заголовок файла, страница 1 содержит объект, содержащий список свободных страниц файла, страница 2 содержит "корневой" объект базы, ссылающийся на все таблицы.

Потоки

Введем понятие "поток" (Stream) данных - логическая сущность, последовательность данных. Например, пространство для хранения записей таблицы или данных неограниченной длины. Поток размещается на последовательности страниц и имеет размер, не превышающий суммарный размер всех страниц. Данные хранятся в потоках.

Объекты данных

"Объект" в базе представляет собой описание к потоку, содержащему данные. Заголовочная страница содержит среди прочего актуальную длину потока данных и список страниц, содержащих список страниц потока ;). В странице описания объекта первые 24 байта служебные, остальные 1018 32-разрядных значений содержат список страниц (назовем их "таблица размещения"). Каждая из страниц таблицы размещения содержит 4096 / 4 = 1024 32-разрядных целых. Первое значение описывает сколько значений из оставшихся 1023 используется на данной странице. И так для каждой страницы таблицы размещения. Таким образом поток данного объекта может содержать максимум 1018*1023=1041414 страниц по 4К, т.е. чуть меньше 4Гб. Поскольку на каждую таблицу выделяется по отдельному объекту для данных записей, индексов и данных неограниченной длины (BLOBов), следует что каждый из этих составляющих не может занимать больше 4Гб. Если в таблицу попробовать добавить больше данных, платформа выдаст критическую ошибку с вариантами "закрыть" и "перезапустить".

Объект описания свободных страниц

Объект, описывающий список свободных страниц, устроен несколько отличным образом. Отличий два: поле длины потока содержит количество свободных страниц в списке, и каждая страница таблицы размещения не использует первое значение под количество номеров в странице, а использует всё пространство (1024 значения) под список свободных страниц. Таким образом, этот объект может содержать список из максимум 1018*1024=1042432 страниц при размере страницы 4К, т.е. описывает свободное пространство почти в 4Гб. Отсюда следует достаточно занятное следствие - базы, содержащие более 4Гб данных, подвержены "утечкам страниц" и бесконтрольному разбуханию. Например, мы удаляем из базы две таблицы, которые суммарно занимали 5Гб пространства. Допустим, что перед операцией список свободных страниц был пуст, тогда он заполнится максимальным значением номеров (4Гб), а ссылки на остальные страницы (1Гб) будут потеряны. Поскольку при обновлении конфигурации платформа проводит реструктуризацию способом "сделать копию таблиц, перелить данные, старые удалить", то при определенном объеме обрабатываемых таблиц "утечка" становится неизбежной.

Кстати, в списке свободных страниц номера страниц совершенно не обязаны идти по порядку. Движок 1С просто добавляет высвобождаемое пространство в конец списка, и страницы для использования берет из конца списка. Отсюда появляется еще один интересный эффект - внутренняя фрагментация потоков данных, т.е. поток может быть размазан по всей базе. Это не может положительно влиять на скорость работы базы, и только выделение больших объемов оперативной памяти для кэширования и размещение базы на SSD может минимизировать негативный эффект. Это же замечание актуально и для свободных блоков в потоках данных неограниченной длины (BLOB-ах). Т.е. если рассматривать фрагментацию файла базы данных на диске как первичную, то фрагментация потоков внутри базы - вторичная, а то что данные в блоках BLOB-ов могут идти непоследовательно внутри потока - третичная. В частности поэтому я размещаю базы с которыми приходится работать на SSD, а в случае каких-то разовых работ (обновление, перенос данных из баз заказчивов) - размещаю базы на RAM-Drive, на виртуальном диске в оперативной памяти.

Организация хранения данных неограниченной длины (BLOBs)

Поток хранения BLOB разбит на блоки по 256 байт, при этом первые 6 байт используются под заголовок блока (ссылка на следующий блок и объем реально используемых данных в блоке). Блоки нумеруются 32-разрядными (беззнаковыми?) целыми, таким образом максимальный размер объекта под BLOB может быть 2^32*256=2^40=1Тб. Первый блок всегда выделен под организацию цепочки свободных блоков потока.

Внимание! Потоки данных и BLOBов свежесозданных таблиц, не содержащих данных, могут быть пустыми, т.е. не иметь в таблице размещения ни одной страницы, даже под первую запись для организации цепочки свободных блоков/записей.

Корневой объект

Корневой объект описывается на странице 2 файла базы. Его поток содержит служебные данные, и список номеров страниц, на которых размещаются объекты с описанием таблиц. Используется текстовое описание таблиц в формате сериализации 1С с использованием двухбайтовой кодировки UCS2. Каждое описание содержит имя таблицы, списки полей и индексов, а так же номера страниц с объектами данных записей таблиц, BLOB-ов и индексов. Подробнее описано в статье awa.

Формат сериализации 1С

1С активно использует текстовый формат сериализованных структурированных данных, идеологически сходный с JSON. Значения в этом формате могут иметь типы:

  • Список - последовательность значений (в т.ч. списочных), разделенных запятыми, окруженных фигурными скобками. Например: {1,2,{3,4}}
  • Строка - строковое значение заключается в двойные кавычки. Двойные кавычки внутри значения удваиваются. Например: {"Строка1","Строка ""2"" с кавычками "}
  • Пустое значение - пропущенное значение, например {1,,3}
  • Числовое значение
  • GUID - например: {2,e5c73637-e8d6-47e0-9c15-2fa1802ee5b0,76702e9e-fa7a-4b98-befa-f9b37db2dae0}
  • Двоичное значение - в виде последовательности шестнадцатиричных знаков: 0123456789abcdef

Возможно существуют и другие типы, но мне пока не встречались. В тексте между синтаксическими элементами могут встречаться переводы строк. Этот формат используется в частности для описания структуры таблиц, конфигурации, пользователей в таблице V8USERS и т.д.

Хранение GUID в записях

1С активно использует GUID в данных, в частности как суррогатные первичные ключи в таблицах. При этом физически они хранятся как двоичные значения длины 16 байт. Но и тут 1С не обошлась без "особенностей": GUID вида AAAAAAAA-BBBB-CCCC-DDDD-EEEEEEEEEEEE хранится как DDDDEEEEEEEEEEEECCCCBBBBAAAAAAAA, т.е. компоненты 4,5,3,2,1
Соответственно для обратного преобразования требуется разбить двоичные данные на группы и 4,12,4,4,8 шестнадцатеричных знаков и соединить как группы {$5-$4-$3-$1-$2}

2. Новое в формате 8.3.8

Заголовок базы

Страница 0 почти не изменилась. В качестве версии формата используется 8,3,8,0, в отличие от предшественника 8,2,14,0. Добавилось поле типа UINT32 с описанием размера страницы, и теперь структура выглядит так:

struct { 
    char sig[8]; // сигнатура “1CDBMSV8” 
    char ver1; 
    char ver2; 
    char ver3; 
    char ver4; 
    unsigned int length; 
    int unknown; 
    unsigned int pagesize; 
} 


Заголовок базы формата 8.3.8 с размером страницы 8К

Объект - описатель свободных блоков

Структура описания объектов в новом формате заметно поменялась и теперь выглядит так:

struct { 
    unsigned int object_type; //0xFF1C 
    unsigned int pages_count; 
    int version; 
    unsigned int pages[]; 
}

Во-первых, изменились "магические символы" - теперь тип блока определяется 32-разрядным целым числом. Для типа "список свободных блоков" используется константа 0x0000FF1C. Следом идет количество свободных страниц в списке, затем нечто служебное, а затем список страниц таблицы размещения списка свободных блоков. Для размера страницы 4К в новом формате теперь под список страниц таблицы размешения отводится 1021 значение. Принципиально же склонность крупных баз к утечке свободных страниц новый формат не решает, точнее решает экстенсивным путем - за счет возможности увеличить размер страницы. Так, для размера страницы 8К в базе может храниться информация о (2048-3)*2048=4188160 свободных страницах, что соответствует примерно 32Гб свободного пространства. Таким образом если размер вашей базы заметно больше  условно 5-6Гб имеет смысл попробовать перейти на новую платформу с увеличенным размером страницы.


Описание объекта - списка свободных страниц в базе формата 8.3.8 с размером страницы 8К. В данном случае имеется только одна страница в таблице размещения - 0xD9, количество актуальных записей в списке - 0x14=20.

Прочие объекты

Структура объектов теперь выглядит следующим образом:

struct { 
    unsigned int object_type; //0xFD1C или 0x01FD1C 
    unsigned int version1; 
    unsigned int version2; 
    unsigned int version3; 
    unsigned long int length; //64-разрядное целое! 
    unsigned int pages[]; 
}

Следует обратить внимание на два момента. Первое - размер потока данных теперь описывается 64-разрядным (8-байтовым) значением. При размере страницы 8К или больше это становится актуальным.

Второе - на самом деле используется две версии такой структуры, сокращенная и полная. Сокращенная версия использует код типа объект 0xFD1C, и предназначена для небольших объектов, когда содержимое таблицы размещения может полностью поместиться в массив pages. Для размера страницы 4К это 1018 значений. В этом случае отдельная таблица размещения не используется. Как только количество страниц таблицы размещения превышают доступный размер массива pages, описание объекта конвертируется в полный формат - код объекта меняется на  0x01FD1C, содержимое массива pages выносится в отдельную таблицу размещения, а в массив pages помещаются номера страниц таблицы размещения. Для страницы в 4К сокращенный вариант используется для объектов с размером потока не более 1018*4096=4169728 байт. Для страницы в 8К это будет (2048-6)*8192=16728064 байт. Содержимое страниц таблицы размещения для полного формата тоже немного изменилось - теперь первое значение не используется для описания количества значений в странице, и для 4К страницы могут использоваться все 1024 значения.


Пример описания полноформатного объекта в базе формата 8.3.8. Выделены поля с кодом типа объекта и размером объекта.

Рассмотрим максимальные размеры потоков объектов (или "внутренних файлов" называет их 1С в некоторых сообщениях об ошибках): 
Под таблицу размещения отводится (РазмерСтраницы-24)/4 номеров страниц, каждый содержит до РазмерСтраницы/4 номеров страниц по РазмерСтраницы каждый. Если РазмерСтраницы=2^n, тогда максимальный размер объекта будет немного меньше 2^(3*n-4). Таким образом получаем:

Размер страницы Максимальный размер объекта
4К  4Гб
8К  32Гб
16К  256Гб
32К  2Тб
64К  16Тб

Формат корневого объекта

Существенно изменился формат корневого объекта, содержащего ссылки на описания таблиц. Ранее описания таблиц размещались в отдельных объектах, а корневой объект содержал только ссылки на номера страниц этих объектов. В формате 8.3.8 структура потока корневого объекта полностью совпадает со структурой потока BLOB-а, поток так же разбит на блоки по 256 байт, каждый блок так же содержит 6-байтовый заголовок со ссылкой на блок с продолжением данных, а нулевой блок начинает цепочку свободных блоков в потоке.

Данные в первом блоке имеют формат (за исключением 6-байтового заголовка блока) корневого потока из формата 8.2.14:

struct { 
    char lang[32]; 
    int numblocks; 
    int tableblocks[numblocks]; 
} 

Но массив tableblocks содержит теперь не номера страниц в файле, а номера блоков в этом же потоке, в которых размещено описание таблиц. Таблицы описываются такой же структурой как и раньше, но используют однобайтовую кодировку (возможно UTF-8, на используемом наборе символов она не отличима от Win-1251 или ANSI).


Начало корневого объекта

На приведенном рисунке виден пустой блок 0, ссылающийся на следующий пустой блок в этом потоке номер 0x35, содержимое блока 1 размером 0x0088 байт с идентификатором кодовой страницы ru_RU,  размером таблицы 0x00000019 и 25 значений - номера блоков описаний 25 таблиц, в частности таблицы IBVERSION, размещенной в блоке 2.

3. Заключение

В новом формате 1С предусмотрела возможность увеличения размера страницы, что позволяет увеличить размер одного объекта более 4Гб и снизить вероятность самораспухания баз, содержащих более 4Гб данных. Были оптимизированы структуры описаний объектов и таблиц, что вряд ли даст заметный прирост производительности, но, в какой-то степени упрощает работу с базой на низком уровне.

Если есть замечания и дополнения, прошу писать в комментариях и я дополню статью

1CD формат баз структура баз восстановление баз

См. также

Механизмы платформы 1С Программист Стажер Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

Эта небольшая статья - некоторого рода шпаргалка по файловым потокам: как и зачем с ними работать, какие преимущества это дает.

23.06.2024    7508    bayselonarrend    20    

154

Механизмы платформы 1С Программист Стажер Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

Пример использования «Сервисов интеграции» без подключения к Шине и без обменов.

13.03.2024    5964    dsdred    16    

80

Механизмы платформы 1С Программист Стажер Платформа 1С v8.3 Бесплатно (free)

Все мы используем массивы в своем коде. Это один из первых объектов, который дают ученикам при прохождении обучения программированию. Но умеем ли мы ими пользоваться? В этой статье я хочу показать все методы массива, а также некоторые фишки в работе с массивами.

24.01.2024    17793    YA_418728146    26    

71

Механизмы платформы 1С Программист Бесплатно (free)

Язык программирования 1С содержит много нюансов и особенностей, которые могут приводить к неожиданным для разработчика результатам. Сталкиваясь с ними, программист начинает лучше понимать логику платформы, а значит, быстрее выявлять ошибки и видеть потенциальные узкие места своего кода там, где позже можно было бы ещё долго медитировать с отладчиком в поисках источника проблемы. Мы рассмотрим разные примеры поведения кода 1С. Разберём результаты выполнения и ответим на вопросы «Почему?», «Как же так?» и «Зачем нам это знать?». 

06.10.2023    23785    SeiOkami    48    

135

WEB-интеграция Универсальные функции Механизмы платформы 1С Программист Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

При работе с интеграциями рано или поздно придется столкнуться с получением JSON файлов. И, конечно же, жизнь заставит проверять файлы перед тем, как записывать данные в БД.

28.08.2023    14776    YA_418728146    7    

166
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. awa 2610 15.07.16 10:18 Сейчас в теме
Спасибо. Прочитал, вроде все правильно написано. Единственно, в описании объектов (сейчас я их предпочитаю называть файлами) вместо
unsigned int object_type;

я у себя разбил это на два поля
 unsigned short int signature; // 1C FF для таблицы свободных блоков, 1C FD для остальных файлов
unsigned short int fatlevel; // количество промежуточных слоев таблицы размещения (0 или 1)

Исходя из этого я ожидаю, что в будущем 1С исправит ситуацию с таблицей свободных блоков, если свободных блоков будет очень много, то можно использовать промежуточный слой и не терять свободные блоки.
ЗЫ Сигнатуры, как и раньше, похожи на говорящие: 1C FF - 1C File Free (pages), 1C FD - 1C File Data.
2ncom; zels; GusevNA; h00k; begemot; nsirotkin@mail.ru; JohnyDeath; Serj1C; Pasha1st; +9 Ответить
2. Pasha1st 849 15.07.16 12:16 Сейчас в теме
(1) awa, По разбиению кода типа на два двухбайтовых значения. Пока тут только два варианта, на мой взгляд рано говорить о тенденциях. Что интересно, для объекта списка свободных страниц это второе слово пока имеет нулевое значение.
3. Serj1C 483 18.07.16 12:30 Сейчас в теме
в 8.3.8 поменялся только формат 1cd файлов? Внешние отчеты и обработки имеют обратную совместимость при пересохранении?
4. Pasha1st 849 18.07.16 13:17 Сейчас в теме
Остальное не менялось - новой замечательно открылись старые обработки, и созданная в 8.3.8 обработка открылась в 8.3.7
Да и новый формат пока опция, насколько я смог заметить по умолчанию 8.3.8 создает базы старого формата, в новый их надо явно конвертировать
5. PetroP 26.07.16 11:30 Сейчас в теме
Я правильно понимаю, что
Таким образом, для страницы в 4К теоретический максимум размера файла - 16Тб

следует читать как
Таким образом, для страницы в 64К теоретический максимум размера внутреннего файла (объекта) - 16Тб

?
6. Pasha1st 849 26.07.16 14:10 Сейчас в теме
(5) PetroP, Файл состоит из страниц, нумеруются 32-разрядным (беззнаковым) целым, т.е. общий размер файла (теоретический) - 2^32*РазмерСтраницы, что в случае страницы 4К - 2^44, т.е. 16Тб, а для страницы в 64К - 2^48, т.е. 256Тб. Но это исключительно теоретический предел, поскольку при размере страницы 4К максимальный размер внутреннего объекта - 4Гб, и для использования всего объема потребуется создать очень много таблиц. Это первое ограничение, на самом деле практически не достижимое.
Размер одного объекта - другое ограничение. Максимальный размер одного объекта (в т.ч. потока для хранения записей, BLOBов, индексов) определяется как:
Первая страница содержит массив ссылок на номера страниц таблицы размещения, в таблице размещения хранится массив номеров страниц под хранение реальных данных. Пусть размер страницы 2^n, для 4К - n=12, для 64К n=16
Таблица размещения может содержать (РазмерСтраницы-24)/4 страниц, т.е. чуть менее чем 2^(n-2)
Одна страница таблицы размещения может содержать до РазмерСтраницы/4 ссылок (РазмерСтраницы/4-1 в старом формате), т.е. тоже 2^(n-2)
Одна страница данных - 2^n байт.
Итого размер объекта будет чуть менее чем (2^(n-2))*(2^(n-2))*2^n=2^(3*n-4)
Т.е. для страниц 4К это 2^32, для 64К - 2^44=16Тб
Таким образом Вы перечислили различные ограничения, которые получаются из различных исходных данных, но в числах, да, совпадают.
7. PetroP 26.07.16 17:12 Сейчас в теме
(6) ясно. Тут в обсуждении возник вопрос об ошибке максимально допустимого размера внутреннего файла. Было бы неплохо для наглядности нарисовать две таблички - максимальный размер файла (пусть теоретический) и максимальный размер внутреннего файла (объекта) для разных настроек размера страницы.
8. Pasha1st 849 26.07.16 20:06 Сейчас в теме
(7) Терминологическая путаница, которой способствует отсутствие официального глоссария от 1С.
Когда я говорю про файл, я имею в виду именно файл 1CD
Ошибка 1С про размер "внутреннего файла" говорит о переполнении какого-то из "объектов" базы. Если честно, мне не очень нравится название от 1С "внутренний файл".
На одну таблицу приходится три "объекта" или "внутренних файла" - для данных, для индексов, и для BLOBов (данные неограниченной длины). С чем именно связана обсуждаемая по ссылке проблема надо смотреть на месте.
9. PetroP 27.07.16 16:11 Сейчас в теме
(8) бог с ней с обсуждаемой ссылкой. Я говорю, что данную статью можно дополнить такой информацией. Если максимальные размеры файла иб носят преимущественно академический характер, то максимальные размеры внутренних файлов (объектов) имеют большей частью практический интерес.
10. Pasha1st 849 27.07.16 17:59 Сейчас в теме
(9) PetroP, Дополнил. Мне казалось что я делал такие расчеты, видимо казалось.
11. echo77 1906 28.08.16 17:43 Сейчас в теме
Интересный вопрос: как управлять размером страницы?
12. Pasha1st 849 29.08.16 19:00 Сейчас в теме
(11) echo77, В составе платформы 8.3.8 (в каталоге bin) появилась консольная утилита cnvdbfl.exe
Запуск без параметров (в консоли, т.е. из cmd.exe или PowerShell) выдает подсказку по ключам
Например cnvdbfl.exe -i e:\base\1Cv8.1CD покажет формат базы и размер страницы, а cnvdbfl.exe -c -f 8.3.8 -p 16k e:\base\1Cv8.1CD сконвертирует базу в формат 8.3.8 с новым размером страницы. Допускаются форматы 8.3.8 и 8.2.14, размеры страниц 4k, 8k, 16k, 32k, 64k
13. sss999 48 05.03.17 22:11 Сейчас в теме
скажите как найти индекс блока описания таблицы, чтобы добавить его в рут..
14. Pasha1st 849 06.03.17 22:01 Сейчас в теме
(13) стоит найти описание любой таблицы (например, CONFIG), учитывая что теперь используется однобайтовая кодировка. Это будет одна из страниц, принадлежащей потоку корневого объекта. Или даже сразу по строке "ru_RU" из первого блока. И искать ссылки на номер этой страницы. Обычно всё это располагается в начале базы.
15. sss999 48 07.03.17 05:35 Сейчас в теме
(14)я в курсе что там есть корневой объект, как в нем искать, и как определять индекс объекта
16. Pasha1st 849 07.03.17 18:25 Сейчас в теме
(15) Тогда опишите более подробно ситуацию, пока не очень понятно что Вы хотите сделать и почему
17. sss999 48 07.03.17 23:15 Сейчас в теме
(16)например заново проиндексировать рут который пустой или от другой базы
18. sss999 48 07.03.17 23:19 Сейчас в теме
(16)или например в руте найти где лежат данные таблицы а где описание должно лежать, если вдруг описание затерлось, то мне нужно отдельно скопировать данные а потом добавить описние и в рут добавить
19. Pasha1st 849 08.03.17 14:41 Сейчас в теме
Проблема в том что если в старых форматах описания таблиц были в отдельных объектах, то в 8.3.8 они находятся уже в потоке корневого объекта. Если данные корневого объекта потеряны, то вероятнее всего потеряно и описание таблиц. И проблема не только в ссылках на объекты с данными таблиц, но теряются и сами описания (состав полей). Так же и при удалении таблицы блоки корневого объекта похоже зачищаются с потерей данных для восстановления. В этом плане восстановление потерянного корневого объекта в новом формате становится мягко говоря затруднительным.
Если же сами данные есть вне базы (переносятся из внешних файлов), то потребуется:
1. создать объекты для данных, блобов и индексов, заполнить данными. Запомнить номера страниц этих объектов
2. в корневом объекте (работа как с данными блоба - блоками по 256 байт) либо найти свободное место либо расширить размер и дописать в свободные блоки описание таблицы (не забыв скорректировать в части "Files" ссылки на номера страниц объектов, использованных на шаге 1), номер первого блока описания потребуется добавить в первый блок корневого объекта ссылку на добавленный блок с описанием таблицы и увеличить количество таблиц в этом блоке.
20. sss999 48 15.06.19 05:04 Сейчас в теме
Я что-то давно не занимался этим всем, прошу помощи, задача найти начало таблицы config, не подскажите?раньше онf на config начинались а теперь как я понял просто по адресу лежит, как найти ее в файле через хекс, задача вырезать ее из одного файла в другой.
21. AngryCrow 27.02.20 12:56 Сейчас в теме
Заинтересовался структурой 8.3.8, единственное не понимаю, можно ли в hex-редакторе по индексам корневого объекта искать те данные, на которые эти индексы ссылаются (В 8.2.14 более понятно, т.к. индексы указывают на соответствующее смещение)? И как это делать? Надеюсь на ваш ответ, спасибо
22. Pasha1st 849 27.02.20 22:25 Сейчас в теме
(21) Требуется внимательно разбирать данные. Корневой объект аналогичен объектам хранения blob таблиц, а номера объектов теперь не смещения а номера блоков в blob-объекте.
1.Т.е. смысл такой - определяем цепочку "страниц" корневого объекта, т.е. получаем его поток.
2.На смещении 0x100 от начала потока корневого объекта находим таблицу индексов описаний таблиц. Если таблиц много - склеиваем блоки по 256 байт по правилам blob, получаем таблицу целиком.
3.В таблице номера - номера блоков в корневом объекте, каждый блок - 0x100 байт. Но чтобы найти начало описания - надо учесть расположение корневого объекта - из п.1
23. AngryCrow 28.02.20 14:04 Сейчас в теме
(22)У меня есть тестовая работоспособная база формата 8.3.8, в структуре которой я пытаюсь разобраться, прикрепляю скриншот корневого объекта. Здесь таблица корневого объекта прерывается и следом продолжения нет, т.е. остальные части находятся в другом месте, т.к. таблиц в базе 145D (5213 тб.). Судя по первым четырем байтам первого блока, продолжение таблицы находится в блоке 0x0000009A относительно потока корневого объекта. Верно ли я мыслю, что продолжение таблицы должно располагаться по смещению 0x0000FA00 (начало потока 6000 + 9A блоков длинной 0х100, т.е. 9A00)? Дело в том, что по этому смещению ничего нет, но база абсолютно точно рабочая

Заранее, благодарю
Прикрепленные файлы:
24. Pasha1st 849 28.02.20 18:29 Сейчас в теме
(23) Надо смотреть на таблицу размещения корневого объекта - в блок 4000 от начала файла.
Очевидно размер страницы 8к = 0x2000
Там будут указаны страницы 3 (6000), 4 (8000) и дальше.
Соответственно продолжение таблицы действительно должно находиться в блоке 9A корневого объекта, это 9A00 от начала в потоке корневого объекта. Но сам корневой объект не обязан располагаться сплошным куском, его размещение смотрим в блоке 4000 от начала файла.
Если продолжение таблицы по смещению 9A00 корневого объекта, это 9A00 / 2000 = 4*2000+1A00, т.е. пятая страница размещения корневого объекта, смещение 1A00 в странице.
Если страница 2 файла, смещение 4000, начинается с 1C FD 00 00 ("упрощенный вариант"), то список страниц размещения корневого объекта идёт со смещения 4018 файла.
Смотрим на значение по смещению 0x4018+4 (номер страницы объекта)*4 (размер int, байт) = 0x4028. Там будет номер страницы файла, соответствующий странице 4 объекта. И в этой странице по смещению 1A00 будет продолжение таблицы.
AngryCrow; +1 Ответить
25. AngryCrow 29.02.20 09:17 Сейчас в теме
(24) Теперь все понятно, большое спасибо за разъяснение!

И последний вопрос: как теперь в таблице размещения корневого объекта (0х4000) рассчитать длину этого объекта?
Прикрепленные файлы:
26. Pasha1st 849 29.02.20 17:43 Сейчас в теме
(25) Да, выделенное значение и есть размер корневого объекта в байтах.
0x16BF00 / 8192 = 181.96875, т.е. используется 182 страницы размещения, в таблице размещения будет 182 значения
AngryCrow; +1 Ответить
27. ponter 14.01.21 18:19 Сейчас в теме
(26) Как с Вами можно списаться, есть вопрос, личка не доступна.
28. dctvghbdtn 29.07.21 20:06 Сейчас в теме
Добрый день.
Вроде все понятно, но ничего не понятно.
Создал справочник. Нашел в HEX-редакторе его описание (описание таблицы). Нашел в HEX-редакторе даже созданные данные справочника.
Но не пойму как определить используя HEX-редактор сколько записей в справочнике и найти начало (и конец) таблицы данных этого справочника (в ней предполагаю аккуратно сложены те самые данные упорядоченными "блоками").
Оставьте свое сообщение