Модуль «Управление данными»
Описание модуля
Модель управления данными в Цифровом Двойнике Предприятия (ЦДП) основана на высокопроизводительных технологиях для обработки, хранения и анализа больших объемов данных в реальном времени. Основными компонентами модели являются:
Технология ETL (Extract, Transform, Load)
Для сбора данных из различных источников (ERP, MES, SCADA) используется ETL-процесс, реализованный с помощью open-source инструментов, таких как Apache Airflow и R Targets. Данные проходят этапы нормализации и агрегирования перед загрузкой в аналитические базы данных.
Хранилище данных (ClickHouse)
Колонко-ориентированная СУБД, оптимизированная для высокоскоростной аналитики больших данных. Используется для хранения и обработки временных рядов и аналитических данных, что позволяет быстро выполнять запросы к большим объемам данных.
Конвейер обработки данных строится на основе модулей и функций, необходимых для заказчика, и обеспечивает отслеживание всех преобразований исходных данных, а также применяемых моделей для получения конечного результата.

Хранилище данных и документов
Хранение эталонных значений (данных, мастер-данных и метаданных) реализовано с помощью СУБД. Модуль хранения эталонных значений включает в себя:
Перечень бизнес-метрик (показателей, характеристик, параметров), методов расчета и корреспонденций между источниками, хранилищем и получателями данных
Схемы преобразования наборов данных (ETL-job)
Эталонные мастер-данные (аналитические измерения, классификации), в том числе справочники - местоположений, функций, объектов, ролей, стадий жизненного цикла, версий, сценариев и пр.
Модели данных, используемые для хранилища и нормирования данных, а также для управления документами
Каталоги (справочники) источников и получателей данных
Граф структурно-технологической схемы предприятия

Функции модуля
Методология и математико-экономическое обеспечение модуля
Модуль хранения фактографических и графических данных (исходных, промежуточных и результирующих) реализован в виде хранения плоских и структурированных наборов данных на файловом хранилище, связанных с каждым узлом обработки конвейера (R Targets). Модуль включает хранилище эталонных значений бизнес-метрик, а также следующую фактографическую информацию:
ретроспективная и прогнозно-плановая статистика финансово-хозяйственной деятельности предприятия;
динамика состояния производственных фондов (оборудования, зданий и сооружений);
динамика рынков готовой продукции и сырья;
производственные и инвестиционные программы.
Last updated