Разработчик
Автономная некоммерческая организация «Институт безопасности труда»
Технический комитет
Технический комитет ТК 55 «Терминология, элементы данных и документация в бизнес-процессах и электронной торговле»
Международные аналоги
Настоящий стандарт идентичен международному документу ISO 24615:2010 «Управление языковыми ресурсами. Система синтаксического аннотирования (SynAF)» (Language resource management –Sintactic annotation framework (SynAF)).
ОКС/МКС/ISO
ОКС 35.240.60
Описание
В настоящем Международном стандарте описывается система синтаксического аннотирования SynAF, являющаяся высокоуровневой моделью для представления синтаксической аннотации лингвистических данных с целью обеспечения возможности работы со всеми языковыми ресурсами или компонентами обработки языковых данных. Настоящий стандарт является дополнением стандарта ISO 2461, тесно связан с ним в части схемы морфосинтаксического аннотирования MAF (morpho-syntactic annotation framework) и предоставляет метамодель для синтаксических представлений, равно как и эталонные категории данных для представления информации по составляющим элементам и отношениям зависимости в сложных предложениях или других сопоставимых высказываниях и сегментах.
Приглашаем обсудить проект ГОСТ Р Система синтаксического аннотирования (SynAF)
Публичное обсуждение - до 31 декабря 2015г.
Настоящий стандарт основан на многочисленных проектах и рабочих материалах, предшествовавших этапу стандартизации, которые разрабатывались в течение 1990-х годов [9] и касались создания эталонных моделей и форматов представления синтаксической информации, являющейся результатом работы синтаксического анализатора или аннотациями языковых ресурсов (в банках древовидных структур). На протяжении ряда лет стандартом де-факто для построения банков древовидных структур служил проект инициативной группы Пенсильванского университета Penn Treebank; однако более поздние работы, например, инициативные проекты Negra/Tiger в Германии (см: http://www.ims.uni- stuttgart.de/projekte/TIGER/TIGERCorpus/) и ISST в Италии [18], продемонстрировали практическую востребованность более однородной базовой системы, которая способна охватывать в равной степени как отношения иерархической соподчинённости компонентов, так и явление зависимости в синтаксическом аннотировании.
“Затравкой” для стандартизации стал проект “LIRICS” группы eContent, объединивший усилия множества экспертов, которые инициировали разработку проекта стандарта ISO 24615 (по системе SynAF). На подготовительном этапе эта группа подтвердила, что в существующих инициативных проектах в действительности используется общая модель данных, которая обеспечивает добротную основу для построения метамодели SynAF [см. результаты проведённых исследований в информационном бюллетене Deliverable D.3.1 “Evaluation of initiatives for morpho-syntactic and syntactic annotation” (“Оценка инициативных проектов в области морфосинтаксического и синтаксического аннотирования”)] в рамках проекта Евросоюза LIRICS, информацию о котором можно получить по адресу http://lirics.loria.fr/doc_pub/Del3_1_V2.pdf).
Настоящим Международным стандартом предлагается метамодель для синтаксического аннотирования со списком релевантных категорий данных, которые она охватывает. Эти категории данных доступны на сервере ISOCat (http://www.isocat.org/) в синтаксическом профиле (определённом в соответствии со стандартом ISO 12620:2009).