Описание формата импорта
Импорт данных в систему происходит в собственном формате CompanyMedia:
- Текстовые файлы c расширением *.documents, в которых хранятся описание полей загружаемых документов.
- Папка content содержит файлы и содержание документов
Структура данных
Структура загружаемых данных выглядит следующим образом:
- Папка <Идентификатор модуля>
- content
- <Идентификатор документа>-appendix-<Номер>-<Название файла>.<Расширение файла>
- <Идентификатор документа>-body.bin
- ...
- 001.documents
- 002.documents
- nnn.documents
- content
Папка <Идентификатор модуля>
Так как система CompanyMedia модульная, то при импорте необходимо указать идентификатор модуля, в который будет производиться загрузка.
Идентификатор модуля берется из системы и создается папка с этим названием. В папку помещаются импортируемые данные.
Файл с расширение *.documents
Файлы с расширением *.documents нарезаются по 4 МБ.
Содержание файла
,где
- <Идентификатор документа> - уникальный строковый идентификатор документа. Состоит из 48 символов в 16-теричной системе счисления.
Строка $$$$$ <Идентификатор документа> $$$$$ является разделителем между данными разных документов - <Поле> - название поля
- <Тип поля> - описывает тип передаваемых данных:
- S - строка
- N - число (целое, с плавающей запятой)
- D - дата
- A - название прикрепленного файла
- R - ричтекст
- <Значение> - значение\массив значений разделенный знаком ";"
Пример:
$$$$$ 99558FBAF2524939432584B1005916A8432584B10056D893 $$$$$
subject;S;О внесении изменений в распоряжение от 28.04.2018 № 32-пр
appendix;A;2-пр от 18.01.2019.pdf
appendix_UnformattedText;S; - 2-пр от 18.01.2019.pdf\n
outdate;D;18-01-2019
count;N;1.0
$$$$$ 1FD458382BF2524939432584B10059168432584B10056893 $$$$$
subject;S;О внесении изменений в распоряжение от 28.04.2018 № 32-пр
appendix;A;2-пр от 18.01.2019.pdf
appendix_UnformattedText;S; - 2-пр от 18.01.2019.pdf\n
outdate;D;18-01-2019
count;N;1.0
Папка "content"
В папке находятся файлы двух типов:
- Прикрепленный файл к документу. Структура названия файла: <Идентификатор документа>-appendix-<Номер>-<Название файла>.<Расширение файла>. Описание
- <Идентификатор документа>- уникальный строковый идентификатор документа. Состоит из 48 символов в 16-теричной системе счисления.
- <Номер> - позиция файла. Если у документа один прикрепленный файл, то будет 01. Если несколько, то будет последовательность 01,02,03...99.
- <Название файла>.<Расширение файла> - название и расширение файла, которое будет отображаться в импортированном документе.
- Содержание документа. Формат хранения HTML. Структура названия файла: <Идентификатор документа>-body.bin.
- <Идентификатор документа>- уникальный строковый идентификатор документа. Состоит из 48 символов в 16-теричной системе счисления.