Название: Методы и средства предикатно-онтологического контроля семантики проектных задач и проектных решений(Шамшев А.Б.) Жанр: Информационные системы и технологии Просмотров: 4123 |
Апробация работы.Основные положения и результаты диссертацион- ной работы докладывались и обсуждались на Международной конференции«Intelligent Systems 2009» (г.Дивноморск), на Международной научной конфе- ренции «Interactive Systems» (2007 и 2009 г.г.) (г. Ульяновск) и на школе-семи- наре аспирантов и молодых ученых «Информатика, моделирование, автомати- зация проектирования» ИМАП-2009 и ИМАП-2010 (г.Ульяновск).Публикации. По материалам диссертационной работы опубликовано 24 печатных работы.Структура и объём работы. Диссертационная работа состоит из введе- ния, четырёх глав с выводами, заключения, библиографического списка ис- пользованной литературы (145 наименований), изложенных на 181 странице машинописного текста, а также 3-х приложений на 27 страницах. Диссертация содержит 54 рисунка и 9 таблиц.КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫВ первой главе диссертационной работы раскрываются вопросы, связан- ные с системной инженерией, жизненного АС, роль онтологии в жизненном цикле АС, обосновывается необходимость использования семантического контроля в жизненном цикле АС. Обосновывается необходимость учета кол- лективной деятельности во время реализации АС. Рассказывается из-за каких причин используется инженерия требований, о её стандартах. Упоминаются во- просы профессиональной зрелости программ, приводится обзор методик рабо- ты с требованиями.
Приводятся аргументы, доказывающие целесообразность контроля
семан- тики (предложений) текстов (постановок проектных задач и принимаемых
проектных решений) исходя из следующих положений:1. Функцию базовой единицы,
для которой необходимо проводить се- мантический контроль, целесообразно
возложить на простое предложение, экземпляры которого будут извлекаться из
текстов постановок проектных задач и проектных решений.2. Контроль семантики
текстовых единиц на рассогласования с онто- логией проекта целесообразно
совместить и согласовать с развитием онто- логии проекта, используя наличие
очередного рассогласования как причину развития или коррекции соответствующей
составляющей онтологии. Онтология Система ценностей(Язык, речь, … , нормы, …) Корпоративная инструментально- технологическаясреда (КСИ )q Реа Время t льн Истинность ос ть (Кон)ТекстПредложение (план выражения) ППiПредикат (план содержания) РРiОбъект связка Свойство Характеристи ки: Количества Качества……..Модальности…….. ПроектировщикПроектировщикПроектировщик Деятельность(разработка АС) ЦельРазрабатываемаяАС (КСП ) j rРис. 2. Модель базового объекта контроляПроведён вопросно-ответный анализ обобщённой постановки задачи с отве- тами на вопросы: как строится предикатная модель простого предложения, как проверяется предикатная модель простого предложения, кто осуществляет по- строения и проверки предикатной модели простого предложения, кто и как ис - пользует результаты проверок предикатной модели простого предложения, что конкретно в предикатно-онтологическом контроле способствует снижению ошибок проектировщиков в концептуальном проектировании АС, какие «пре- цеденты» способны повысить степень автоматизации действий проектировщи- ков в предикатно-онтологическом контроле семантики, какова структура базы прецедентов (базы опыта) и как она материализована, как осуществляются до- ступ к прецедентам.Во второй главе представлены семантические модели лингвистических объектов, предложенные и специфицированные для проведения предикат- но-онтологического контроля в процессе автоматизированного перевода проектной текстовой информации на язык логики предикатов.Раскрыты механизмы, которые используются для предикатной обработки входного потока предложений (рис. 3) из нормативных и рабочих документов, в результате которой выделяются и формируются предикатные представления простых предложений. S (ПП ) ∆S (ПП ) 0 ijk 1 ijk ∆S (ПП ) S(ПП ) 2 ijk… ijk ∆S (ПП ) m ijk∆S (ПП ) M ijk ∆S (ПП ) ∆S (ПП ) m+1 ijk m ijk
Для достижения такой цели на множестве лексем предложений
введено «си- ловое взаимодействие», в состав которого включены аналоги сил
тяготения, кулоновские силы, силы упругости и силы трения. В результате
силового взаи- модействия «лексемы-псевдообъекты» распределяются в специальной
экранной области в группы (рис. 4).Пример действия псев- досил м жж Ч Ч Ч Ч ж цц ц пm xўў t
зз kкул q j qi
kграв m j mi
2 п j jс(вяз)ь еi зз j i 2 j нор 2 i ( , )j з трен( )j ( ) ( ) ( ) чч ( ) ( ) ч ( )
и шн
п ўў зз kкул Чq j Чqi kграв Чmj Чmi 2 2 ч ч ў m4 y j (t)п е зз 2 2 L(i, j) Чkсвязь з xi (t) x j (t) yi (t) y j (t) rнор чч yi (t) y j (t) ч kтрен y j (t)
о и ш где L(i, j) м1, если между i й и j й точкой есть связьно0, иначе Использование таких уравнений в описании всех элементов
системы псевдо- объектов приводит к системе дифференциальных уравнений второго
порядка, для решения которой используется метод Рунге-Кутта четвертого порядка.Псевдофизические
представления и преобразования, их контроль и коррек- ция подготавливают
формирование общего результата работ с простым предло- жением в виде предиката,
записанного в прологоподобной форме. Названные работы и их целевой результат
определяют сущность метода извлечения преди- катов, обобщённая схема которого
имеет следующий вид:1. 1. Расположить слова на псевдофизической
плоскости.2. 2. Провести морфологический анализ слов, получив морфологические
характери- стики и нормальную форму слова.3. 3. Найти связи между словами
на основании результатов морфологического анали- за.4. 4. Назначить
псевдохарактеристики на основании результатов морфологического анализа5. 5.
Определить типы синтаксем.6. 6. Провести уточнение типов синтаксем.7. 7.
Провести псевдофизическое моделирование.8. 8. Каждое простое предложение выделить
на свою закладку.9. 9. Предоставить возможность пользователю изменить
результаты анализа.10. В случае вмешательства пользователя проверить его
корректировки.11. Для каждого простого предложения:11.1. Сформировать предикат;11.2.
Проверить предикат на основании морфологических, синтаксических и синтаксемных
характеристик;11.3. В случае обнаруженных ошибок:11.3.1. Сформировать QA
единицу, которая описывает ошибку;11.3.2. Вывести сообщение пользователю;11.3.3.
Если пользователь выбрал игнорирование ошибок, то сформировать предикат, иначе
А. Темпоратив Q6. if (значение_1 =(< родительный >, < от >, <педметное>>) & Значение_2 =(< родительный >, < до >, <предметное>>)then Sm1:= < темпоратив >;A6. Sm1:= < темпоратив >;
Раскрыты позитивы синтаксемного контроля, в число которых входят про- верка связей между словами в предикате, проверка корректности связей с предлогами и проверка местоположения слов в предикате.Так как каждый извлечённый предикат в предикатной обработке прошёл только предварительные семантико-синтаксические проверки, то необходим его контроль на соответствие семантике проекта. Для таких проверок в диссер- тации предложен и исследован семантический контроль на соответствие онто- логии проекта (в текущем состоянии её содержания). Именно по этой причине (использование дополнительного контроля семантики предиката на соответ- ствие онтологии) метод контроля был назван «предикатно-онтологическим».В проверках предиката на соответствие онтологии осуществляется его сопо- ставление с «эталонным образцом», который включён в библиотеку «эталонов» проекта АС, то есть в онтологию проекта. Сравнение с эталонами широко ис- пользуется в процедурах контроля, особенно в измерительной практике.Для сопоставлений с онтологией в каждом проверяемом предикате выделя- ются варианты употребления понятий. Так, например, для предиката типа«свойство(объект)» в его записиСл1,Сл2,…, СлI, Np (Сл’1,Сл’2,…, Сл’J, Nq), Сл”1,Сл”2,…, Сл”Sприсутствуют два варианта употребления понятийVarС(Np) = Сл1,Сл2,…, СлI, Np = W1,’ W2, … , WK, NpVarС(Nq) = W1,’ W2, … , WK, VarС(Np), Nq,где Np и Nq – имена понятий, а элементы типа Слi обозначает либо одно словоwi, либо группу слов, одно из которых является главным (обозначим wi), аостальные зависимыми (обозначим gi1 gi2… gin ), то есть Слi = Wi = gi1 gi2… gin wi.Каждый из этих вариантов является списком слов, нормализованных с помо-щью морфологического анализатора и каждый из них должен пройти через со- поставление с нормативными списками, зарегистрированными в текущем со- стоянии онтологии проекта как нормативные употребления понятий VarН(Np) и VarН(Nq).Проверки на соответствие онтологии, представляющие собой сравнения списков (рис. 6), начинаются с понятия о свойстве Np, после чего проверяется корректность употребления понятия Nq об объекте.
свойств, названных только в ситуативном VarC(Np); q – общий для VarC (N ) иp pVarН(Np) набор свойств; q2 – набор свойств, присутствующий только в норма- тиве VarН(Np). За положительную оценку соответствия онтологии отвечает со- став (и содержание) списка общих признаков p, который может быть скоррек- тирован за счёт интерактивного визуального анализа списков q1 и q2. Каждый из них разбивается на 2 списка свойств на основании ответов на вопросы: д ей- ствительно ли каждое из свойств, входящих в q1 присутствует в ситуативном варианте VarC(Np) и действительно ли каждое из свойств, входящих в q2 отсут- ствует в VarC(Np)?Приводятся положительные эффекты от каждого типа рассогласований:
логии O(t) подходящего варианта VarН(Np) употребления понятия Np,что мо- жет соответствовать следующим ситуациям и реакциям на них: если это рассо- гласование оценивается как несущественное, то им можно пренебречь иначе следует либо модифицировать VarН(Np), если построение VarН(Np) ещё не за- вершено, либо создать новый нормативный вариант употребления понятия Nq;
нивается как несущественное, то им следует пренебречь, в противном случае следует создавать новый нормативный вариант;рассогласование -q2 подсказывает исполнителю предикации те свойства, которые по тем или иным причинам не были включены в исследуемое предло- жение (то есть -q2 способно выполнять функцию подсказки).В третьей главе диссертации раскрыта общая алгоритмическая схема пре- дикатно-онтологического контроля и приведены её детали. Для представления деталей используются методики и UML-диаграммы.С помощью метода, реализация которого обеспечивает его использование в коллективной проектной деятельности, на каждом рабочем (клиентском) месте осуществляется обработка входного потока нормативной и рабочей текстовой проектной информации. В поток включается только существенная текстовая информация, базовыми единицами которой являются постановки проектных за- дач и формулировки проектных решений, создаваемые на концептуальном эта- пе проектирования АС.Поток текстовых единиц может поступать из процесса проектирования, ис- пользующего любой инструментарий, например, из процессов, осуществляе- мых в инструментальной среде Rational Unified Process (RUP). Но для комплек- сирования разработанных средств со средой RUP необходимо создать автома- тизированные буферные средства. В диссертационном исследовании в качестве источника оперативной текстовой информации использована инструментальная моделирующая среда WIQA.NET, обслуживающая концептуальное проектиро- вание АС, в разработке которой автор принимал непосредственное участие. Ал- горитмическая схема метода, адаптированная к среде WIQA.NET, имеет следу- ющий вид: 1. Действия метода начинаются с выбора текстовой
единицы (в разработанном комплексе из дерева задач
инструментально-технологической среды WIQA), семант и- ка которой должна
контролироваться.2. Выбранный текст Ti преобразуется в список
предложений Sp({Пij}), каждому из которых приписывает второй индекс для
последующей циклической обработки.3. Если список Sp({Пij}) не пуст, то
из него выбирается первое в очереди (и ис -ключается из очереди)
предложение Пij для его семантического контроля, иначеПерейти к п. 4.3.1. Для
предложения Пij осуществляется его псевдофизическое моделирование, в
результате которого формируется список Sp({Пijk}) простых предложений Пijk .3.2. Если
список Sp({Пijk}) не пуст, то из него выбирается первое в очереди предло- жение
Пijk для его семантического контроля, иначе Перейти к п. 3.1.3.2.1. Для
предложения Пijk осуществляется его проверка на соответствие онтологии и
формируется результат проверки R(Пijk).3.2.2. Если R(Пijk) указывает на
соответствие онтологии, то Перейти к п. 3.2.6.3.2.3. Если R(Пijk) указывает
на рассогласование с онтологией, но ошибки отсутству -ют и рассогласование
можно снять за счёт коррекции онтологии, то Перейти к п.3.2.10.3.2.4. Если
R(Пijk) указывает на ошибки, то если Ошибки можно исправить, то Испра- вить
ошибки и Перейти к п. 3.2.1 иначе Сформулировать вопросы об ошибках и Вклю-
чить их в список вопросов Sp({Qp}), а предложение Пijk оставить в списке
Sp({Пijk}) и Перейти к п. 3.23.2.5. Если R(Пijk) указывает на другие причины
(непонимание, неполнота знаний, преждевременная предикация), которые
препятствуют квалифицировать R(Пijk) соот- ветствующим онтологии, то Перейти к
п. 3.2.9.3.2.6. Провести для Пijk синтаксемный анализ и
зарегистрировать его результатSSA(Пijk).3.2.7. Если в Пijk присутствуют
индикаторы вероятностной модальности, то провестианализ вероятностной
модальности и зарегистрировать его результат PA(Пijk).3.2.8. Если в Пijk
присутствуют индикаторы нечёткости (например качественный при-знак), то
провести анализ нечёткости и зарегистрировать его результат FA(Пijk).3.2.9.
Если результаты анализов SSA(Пijk), PA(Пijk) и FA(Пijk) приводят к вопросам, товопросы
{Qr} включить в список вопросов Sp({Qp}), а предложение Пijk оставить в
списке Sp({Пijk}) и перейти к п. 3.2 иначе Предложение Пijk исключить из
спискаSp({Пijk}) и Включить R(Пijk) в «Рабочий словарь».3.2.10. Включить
R(Пijk) в список SpО({R(Пijk)}) заданий на коррекцию и развитие онто-логии.3.2.11.
Пijk оставить в списке Sp({Пijk}) и Перейти к п. 3.2.4. Включить
элементы списка вопросов Sp({Qp}) в дерево задач проекта.5. Конец
L WIQA .NETL LINA (Серверная часть)Сервер рабочего словаря Сервер базы опыта Сервер типов QA единицСеСревревретроилнкофворгмоасцлиоовнонрыяехиСсетровчнеиркоорвгструктур Сервер онтологииСервер Сервер морф. анализа Динамическая предикативного анализасервер QAСервер БД Сервер Код QA протоколаСобытие компиляцияСообщение Серверныеагенты Client LINA (Клиентская часть)рабочий словарь база опыта
СообщениеойМорфологическийслой предикативый анализЛогический процессор
4. Библиотека моделей синтаксем для анализа семантической согла- сованности понятий в предикатах, извлеченных из постановок задач и фор- мулировок проектных решений, каждая из моделей которой представляет соот- ветствующую синтаксему в виде прецедента, что существенно повышает сте- пень автоматизации синтаксемного анализа и контроля.Практическую ценность составляют.Разработанный набор базовых средств моделирующего комплекса WIQA.NET, обслуживающего проектирование сложных автоматизированных систем, а также комплекс LINA, обеспечивающий реализацию предикат- но-онтологического контроля семантики проектных задач и проектных реше- ний.
|
|