Все обсуждения

  Показать описание и файлы проекта

Обсуждения

Приглашаем обсудить проект ГОСТ Р Система синтаксического аннотирования (SynAF)

Публичное обсуждение - до 31 декабря 2015г.

Настоящий стандарт основан на многочисленных проектах и рабочих материалах, предшествовавших этапу стандартизации, которые разрабатывались в течение 1990-х годов [9] и касались создания эталонных моделей и форматов представления синтаксической информации, являющейся результатом работы синтаксического анализатора или аннотациями языковых ресурсов (в банках древовидных структур). На протяжении ряда лет стандартом де-факто для построения банков древовидных структур служил проект инициативной группы Пенсильванского университета Penn Treebank; однако более поздние работы, например, инициативные проекты Negra/Tiger в Германии (см: http://www.ims.uni- stuttgart.de/projekte/TIGER/TIGERCorpus/) и ISST в Италии [18], продемонстрировали практическую востребованность более однородной базовой системы, которая способна охватывать в равной степени как отношения иерархической соподчинённости компонентов, так и явление зависимости в синтаксическом аннотировании.

“Затравкой” для стандартизации стал проект “LIRICS” группы eContent, объединивший усилия множества экспертов, которые инициировали разработку проекта стандарта ISO 24615 (по системе SynAF). На подготовительном этапе эта группа подтвердила, что в существующих инициативных проектах в действительности используется общая модель данных, которая обеспечивает добротную основу для построения метамодели SynAF [см. результаты проведённых исследований в информационном бюллетене Deliverable D.3.1 “Evaluation of initiatives for morpho-syntactic and syntactic annotation” (“Оценка инициативных проектов в области морфосинтаксического и синтаксического аннотирования”)] в рамках проекта Евросоюза LIRICS, информацию о котором можно получить по адресу http://lirics.loria.fr/doc_pub/Del3_1_V2.pdf).

Настоящим Международным стандартом предлагается метамодель для синтаксического аннотирования со списком релевантных категорий данных, которые она охватывает. Эти категории данных доступны на сервере ISOCat (http://www.isocat.org/) в синтаксическом профиле (определённом в соответствии со стандартом ISO 12620:2009).

Пожалуйста, зарегистрируйтесь или войдите на сайт, чтобы оставить комментарий.