Разработчик
Другие разработчики
Автономная некоммерческая организация «Институт развития информационного общества»
Технический комитет
Международные аналоги
Настоящий стандарт разработан на основе международного документа ITU-T Y.3602 (2022) «Большие данные – Функциональные требования в отношении происхождения данных» (Recommendation ITU-T Y.3602 (2022), Big data – Functional requirements for data provenance).
ОКС/МКС/ISO
ОКС 35.020
Описание
В настоящем стандарте устанавливаются функциональные требования к происхождению данных в экосистеме больших данных, как она определяется в Рекомендации МСЭ-Т Y.3600 [ITU-T Y.3600]. Данный стандарт вводит понятия происхождения данных, а также происхождения данных в экосистеме больших данных, и описывает концептуальную модель, операции, логические компоненты и функциональные требования, относящиеся к информации о происхождении больших данных. Содержащиеся в стандарте функциональные требования получены путем анализа вариантов использования.
Приглашаем обсудить проект ПНСТ о требованиях в отношении происхождения данных
Публичное обсуждение проекта продлится до 10 октября 2023 г.
Надёжность данных является важным фактором при определении надёжности результата анализа. Информация о происхождении данных помогает обеспечить надёжность данных посредством обеспечения прозрачности их исторического пути. В среде больших данных сложная обработка данных и их миграция, связанная с жизненным циклом больших данных и их распространением, приводят к разного рода трудностям при управлении информацией о происхождении данных. В первую очередь больших усилий и затрат требует сбор надёжной и достоверной информации о том, что происходило с большими данными на различных этапах их жизненного цикла.
В настоящем стандарте описана концептуальная модель автоматического сбора, управления и сохранения информации о происхождении больших данных по мере их обработки, использования и хранения в экосистеме больших данных. Реализация данной концепции, хотя и не решит проблему отслеживания происхождения данных полностью, однако позволит сократить затраты и существенно повысить полноту и достоверность собираемой информации о происхождении, что, в свою очередь, будет способствовать прозрачности, подотчётности, объяснимости и доверию к использующим большие данные системам и к результатам анализа больших данных.