Название: Инвариантно-параметрическое представление и обобщенная ассоциативная обработка символьной и смысловой информации(Токмаков Г. П)

Жанр: Информационные системы и технологии

Просмотров: 2886


1.2. машинное моделирование и его атрибуты

За прошедшие полвека развития ВТ средства машинного моделирования прошли определенный путь развития, основные этапы которого рассмотрим ниже. Процесс эволюции программного обеспечения, в рамках которого в основном развивались средства машинного моделирования, показывает, что способы организации данных, их структура постоянно развиваются и усложняются, меняется степень взаимосвязанности между данными и обрабатывающими программами, постепенно переоценивается роль данных и программ в ходе обработки информации на ЭВМ. На смену представлению данных в виде изолированных единичных элементов пришло представление в виде векторов, массивов, списков, файлов. Максимум этого развития пришелся на абстрактные типы данных, обеспечивающих для пользователя выбор наиболее адекватной для решения задач структуры данных.Одновременно изменился и взгляд на взаимоотношение данных и обрабатывающих их программ: от толкования данных как простого придатка к программе к пониманию определенных совокупностей данных как некоторых полей для работы соответствующих процедур. Затем сформировалась концепция БД, в составе которых данные образуют совокупность декларативных знаний, отображающую ПрдО независимо от обрабатывающих процедур.Однако по-прежнему сохраняются два различных подхода к моделированию ПрдО в машинной памяти, развиваемые в рамках систем программирования и обработки данных. В последнее время предпринимаются попытки интеграции этих двух парадигм машинного моделирования, но дальше простого слияния, упрощающего доступ к средствам друг друга, этот процесс пока не пошел. Поэтому проблема разработки модели данных, интегрирующей данные и средства их обработки, по-прежнему сохраняет актуальность.1.2.1. Понятие предметной области и представление объекта в машинном моделированииОсновная трудность в процессе машинного моделирования заключается в том, как в машине с ее примитивной памятью в виде последовательности ячеек фиксированной разрядности представить предметы и явления внешнего мира с их сложной структурой и взаимосвязями. Машинные модели предполагают определенный взгляд на моделируемую реальность, отражающий ее с той или иной степенью полноты (или ограниченности). Так как реальные объекты имеют бесконечное число свойств, в машинном представлении полное описание объекта, во всем многообразии его свойств, принципиально невозможно. Компромиссное решение этой проблемы заключается в том, что в памяти машины представляется лишь часть свойств объектов, которые необходимы для решения конкретной задачи, а не описание объекта в целом. Дискретные факты относительно предметов и явлений РД, зарегистрированные в памяти машины в виде представлений, называются данными.В качестве инструментов машинного моделирования на сегодняшний день используются языки программирования и средства обработки данных, которые определенным образом формализуют моделируемую реальную действительность. В рамках этой формализации фрагмент РД, отображаемый в памяти машины, рассматривается как ПрдО, под которой подразумевается совокупность объектов, связей и отношений между объектами, а также процедуры преобразования этих объектов при решении задач [40].При составлении алгоритма решения задачи программист, в первую очередь, выделяет объекты, имеющие отношение к решаемой задаче [41]. На современном этапе развития машинного моделирования, объект понимается как абстракция множества предметов и явлений РД, когда каждый конкретный предмет представляет собой экземпляр этого объекта, и что все экземпляры подчинены одному и тому же набору правил поведения [42]. Объекты могут рассматриваться как атомарные или как составные, причем один и тот же объект в одном приложении может рассматриваться как атомарный, а в другом как составной. Для составного объекта должны быть определены его внутренние составляющие, внутренняя структура, в соответствии с которой определяется порядок композиции составляющих. Каждый объект в определенный момент времени характеризуется определенным состоянием. Это состояние описывается с помощью ограниченного набора свойств и связей (отношений) с другими объектами.Объекты должны иметь иерархическую структуру, т.е. включать в себя другие объекты, которые могут иметь, одно или множество вхождений в состав идентификатора, включающего объекта, либо не иметь их совсем. Описанная система представлений позволяет определить структуризацию объектов ПрдО и является способом формализации объектов, называемым агрегацией. Агрегация позволяет конструировать объекты или типы объектов из составных объектов или типов объектов, т.е. определять новый объект как связь своих компонентов путем представления отношений типа "часть-целое".Другим важнейшим типом отношений между объектами ПрдО являются родовидовые отношения. Для их представления используется способ формирования объектов из класса других объектов, называемый обобщением. На современном этапе машинного моделирования используется способ обобщения при определении типа объектов, когда в один класс объединялось множество объектов, обладающих некоторым общим признаком (одинаковым набором свойств). Аналогично могут обобщаться и типы объектов. При этом тип объектов более высокого уровня обобщения будем называть родовым типом, а более низкого - видовым типом или категорией.Обобщение типов объектов подчеркивает их общие свойства, игнорируя индивидуальные особенности. Процесс выявления отдельных категорий, составляющих общий род, называется категоризацией. Категоризация отличается от обобщения противоположной направленностью. Выделяемые при этом виды, производимые от родов, ассоциируются с различными аспектами рассмотрения общего родового объекта и поэтому называются его ролями. Описанное представление о ПрдО приведено на рис. 15.Приведенное описание не будет полным, если не указать на некоторые аспекты, связанные с динамикой ПрдО. Эти представления в большей степени важны для понимания принципов действия механизмов доступа к данным. Информационная модель (ИнфМ) фигурирует в памяти машины в виде множества объектов с заданными на нем отношениями, выраженными через определенные значения свойств. Работа такой системы представляется действиями, которые

изменяют состояние указанных представлений. Для того чтобы практически использовать такую систему, каждому объекту и действиям над ними необходимо поставить в соответствие их внешнее представление с тем, чтобы пользователь имел возможность манипулировать объектами внутреннего представления.

гФ-сь-ак

Подпись:  Подпись:  Подпись:
Подпись:
О 121 О 122

- объект - внутренние связи объекта

/ ч - компонент объекта - родовидовые связи объекта

О - свойство компонентна - межобъектные связи

Рис.15. Представление ПрдО как совокупности объектов со связямиВ результате теоретического и практического осмысления изложенных положений к настоящему времени в области машинного моделирования сформировался вычислительный механизм, названный объектно-ориентированным программированием (ООП), который базируется на следующих утверждениях:Предметы и явления РД представляются в памяти в виде агрегата свойств, обладающих определенным поведением. Поведение свойств описывается с помощью функций, называемых методами.Объекты, имеющие одинаковый набор таких свойств, объединяются в классы. Таким образом, класс - это такая абстракция множества объектов РД, все элементы которого обладают одинаковыми свойствами, которые подчиняются одним и тем же правилам поведения.Каждое свойство, являющееся общим для всех возможных экземпляров класса, абстрагируется как атрибут и обеспечивается именем, уникальным в пределах класса.Диапазон допустимых значений, которые атрибут может принимать, называется доменом. Описание домена можно дать либо перечислением возможных значений, которые атрибут может принимать, либо приведением диапазона значений, либо формулировкой правила, определяющего допустимые значения.Конкретные значения атрибутов определяют экземпляр класса или объект, входящий в данный класс.Если часть свойств некоторого класса совпадает со свойствами другого класса, то между ними с помощью механизмов наследования устанавливаются родовидовые отношения. При этом общие свойства описываются в одном классе, называемым родовым.Изменения во внешней среде абстрагируются как события. Относительно к машинным моделям события возникают при работе с объектом, чаще всего при определенных действиях пользователя, иногда как результат действия системы.При возникновении события система посылает сообщение объекту, которое может быть исполнено функцией-методом, специально созданным при конструировании класса.Сообщение - это сигнал управления, который может переносить данные для использования функцией-методом с целью достижения объектом заданного состояния.С каждым событием связана некоторая деятельность, называемая действием.В настоящее время ООП стремительно развивается, однако обладает и существенными недостатками, которые вытекают из различия стиля мышления человека и программиста на объектно-ориентированном языке. Вместо того, чтобы мыслить в терминах действий, ООП предлагает решать задачу в терминах индивидуальных свойств объектов и их реакций на внешние события. Например, мысль "Я хочу написать письмо" в ООП должна быть сформулирована как "Я хочу, чтобы мой документ выполнил метод создать". Результаты исследований в области психологии показывают, что человек все происходящее запоминает как действия, а не как изменения свойств тех или иных объектов. ООП действительно эффективно, но только в тех областях, где основную роль играют объекты, с которыми связаны строго определенные и независимые процедуры обработки.Кроме этого, прежде чем делать что-то с объектом, вы должны получить ссылку на него. Для этого нужно составить выражение, которое обеспечивает доступ к этому объекту; при этом ссылку на очередной объект в иерархии можно получить через соответствующие свойства или методы - accessorbi объектов. При этом очень важно четко представлять себе место конкретного объекта в иерархии объектов, так как невозможно работать с объектом, пока не пройден путь доступа к нему, проходящий по иерархии объектов. Обычно это означает, что для доступа к объекту нужно последовательно пройти все объекты, расположенные выше него. В связи с этим поиск альтернативных подходов к моделированию все еще остается актуальным.1.2.2. Конечные автоматы, знания и решение задач через поискВ последнее время в прессе оживленно дискутируется вопрос о возможности замены теоретической основы современной ВТ, базирующейся на концепции машины Тьюринга. Согласно этой концепции машина вычисляет решение, обрабатывая любую входную ситуацию единообразным алгоритмом, подчиненном минимаксной стратегии управления, не имея при этом заранее сформированного множества ситуаций и ответов на них [43,44,45].Человек решает задачи, используя накопленный опыт и сопоставляя текущую ситуацию с набором стереотипных ситуаций, составляющих его жизненный опыт. Машина же не умеет пользоваться накопленным опытом и в каждый раз воссоздает все возможные ситуации. При этом каждая следующая задача практически решается "с нуля". Описанный стиль решения задач диктуется фон-Неймановской архитектурой современных компьютеров. Но существуют и другие подходы к решению задач, и в этом смысле большой интерес представляет вопрос организации вычислительного процесса на основе конечных автоматов (КА), базирующейся на теории множеств и хорошо согласованной с описанным выше объектно-ориентированным подходом к моделированию. Согласно этой теории для решения задачи необходимо описать три множества:входных сигналов;состояний;соответствий переходов и выходов.При этом разработчик должен заранее перебрать все возможные ситуации и запрограммировать адекватные действия, которые следует выполнять при возникновении каждой из ситуаций. Однако сложность решения задачи на машине Тьюринга определяется по выражению а*х, где а - число состояний объекта, х - число объектов, а сложность решения задачи с помощью КА оценивается экспоненциальной зависимостью согласно выражению а. Поэтому даже при незначительном увеличении количества объектов и их состояний, при решении задачи методом КА, имеет место резкое повышение ее сложности [46], и разработчик физически не сможет проанализировать все возможные ситуации. Необходимы способы, которые;с одной стороны, автоматизировали бы процесс формирования множества возможных состояний КА, с другой стороны, уменьшили бы число его возможных состояний.С этой точки зрения большой интерес представляет так называемая инженерия знаний, опирающаяся на исследованиях из области искусственного интеллекта (ИИ) по моделированию процессов решения задач человеком. Из этой теории известно, что мыслительная деятельность человека опирается на знания и поиск. Под знаниями при этом подразумевается знание всех возможных ситуаций задачи, а процесс поиска формализует решение задачи путем сопоставления входной ситуации со стереотипными ситуациями, хранящимися в системе знаний.Использование поиска позволяет свести процесс решения задач к единой форме не зависимо от их содержания, что служит хорошим фундаментом для формализации задач. Кроме этого, поиск осуществляется путем сопоставления на каждом его этапе входной ситуации с одной из типовых ситуаций, хранящихся в системе знаний. Если мы будет иметь дело только с результатом этого сопоставления, а не с состояниями самих объектов, то получаем резкое уменьшение числа возможных состояний задачи, что значительно облегчает процесс решения задач с помощью КА.На данном этапе развития инженерии знаний процесс получения знаний не формализован и в основном представляет собой различные методики извлечения знаний о решаемой задаче. В процессе решения задач при этом привлекаются всевозможные эвристики, основанные на личном опыте разработчика. Поэтому формализация этого процесса имеет очень большое значение для теории ИИ.1.2.3. Машинное моделированиие и его три составные частиНесмотря на большое разнообразие типов ПО в современной ВТ, все они по сути дела решают одну задачу: создание в памяти машины модели фрагмента РД. ПрдО считается определенной, если известны существующие в ней предметы, их свойства и отношения между ними. Моделирование осуществляется с целью воплотить в модели основные свойства моделируемых предметов с тем, чтобы решать задачи, не прибегая к самим предметам, а с помощью их моделей.В ситуации моделирования каждый моделируемый объект одновременно существует в трех сферах.Первая сфера - это РД, в которой объекты существуют и обладают определенными свойствами.Вторая сфера - это отображение моделируемых объектов РД и их свойств в памяти человека, называемое пользовательским представлением.Третья сфера - это отображение моделируемых объектов ПрдО и их свойств в памяти машины, называемое машинным представлением. Пользовательское и машинное представления существенно отличаются другот друга и реализованы в значительно различающихся физических средах. Поэтому изменение состояния ИнфС в процессе ее функционирования осуществляется не напрямую, а путем обращения к функции доступа, обозначенной некоторым символом. Эта функция, являясь принадлежностью машинного представления, осуществляет изменения над свойствами определенных объектов внутреннего представления. Для того чтобы получить доступ к конкретному объекту в памяти машины, необходимо связать имя этого объекта с функцией доступа, которая по этому имени вычисляет его адрес в памяти машины. Таким образом, мы имеем два типа функций: одни осуществляют доступ к объектам в памяти машины, а другие производят изменения свойств этих объектов. Согласованное действие этих функций организуется путем подчинения одних функций другим. Причем функции, изменяющие свойства, играют роль функционалов, а функции, обеспечивающие доступ к объектам, - роль аргументов этого функционала.Для обозначения функционалов и их функций-аргументов, т.е. объектов и действий над ними, в моделях ПрдО используются имена, которые пользователь может тем или иным способом воспроизводить эффекторными и воспринимать рецепторными органами. Имена объектов, называемые идентификаторами, имена действий над объектами, называемые операторами, и правила композиции операторов и идентификаторов составляют язык. Единицами этого языка являются так называемые языковые конструкции, включающие в свой состав символьное обозначение оператора, и символьные обозначения объектов в качестве аргументов данного оператора. Любая языковая конструкция отражает некоторое отношение между представлениями в памяти машины, согласно которой в нем происходят определенные изменения. Без языка формирование модели и последующее ее использование невозможно и поэтому язык можно рассматривать как атрибут модели.Любой язык предполагает наличие некоторой "машины", способной его интерпретировать, т.е. поставить в соответствие внешним представлениям объектов их внутренние представления, а обозначениям действий над объектами -функции, реализующие эти действия над внутренними представлениями. Именно с помощью этих функций, аргументами которых являются внутренние представления объектов, осуществляется функционирование ИнфМ, которое выражается в создании, изменении и уничтожении внутренних представлений объектов. Эти функции доступа, отделенные от их обозначений, составляют еще один компонент модели, связывающий символьное представление ПрдО с ее машинным представлением. В функции этого компонента процесса моделирования входит распознавание символьной конструкции и реализации соответствующей функции доступа над теми объектами, символьные обозначения которых входят в функцию доступа в качестве аргументов.Описанная ситуация напоминает употребление знака в повседневной речи, называемой знаковой ситуацией, в которой также можно выделить три компонента:система знаков или речевые средства (внешнее представление модели);объекты, называемые внутренним представлением, репрезентируемые системой знаков и составляющие смысл знаковых конструкций;интерпретатор, использующий знаковые конструкции, составленные по определенным правилам, и преобразующий их в фрагменты внутреннего представления.Конечно, здесь речь идет только о внешнем сходстве описанных компонентов моделирования РД человеком и машиной. Что же касается сходства между природой моделирования РД человеком и машиной, то здесь обнаруживаются принципиальные отличия. Если человек отражает РД в обобщенном виде, то машинное моделирование имеет дело с единичными представлениями. Языковые средства машинного моделирования отличаются строгостью синтаксических построений и ограниченными выразительными средствами. А единичный характер отражения РД машиной приводит к тому, что речевые средства машинного моделирования обеспечивают представление единичных объектов, что не позволяет построить конечную систему знаков для их обозначения. Перечисленные отличия машинного и естественного моделирования приводят к отсутствию единого подхода к моделированию данных, средств доступа к ним и интерфейсов.Развитие средств общения между человеком и машиной тесно связано с развитием форм представления данных о моделируемой РД и идет в направлении сближения к естественным для человека формам общения. Человек и машина выступают при этом как элементы одной системы, и обмен между ними может иметь место только в рамках тех знаний, которыми обладают оба эти элемента. Если в машине содержится недостаточный объем этих знаний, то это приходится компенсировать тем, что на долю человека приходится дополнительная нагрузка, так как эти недостающие сведения и навыки он должен содержать в своей памяти, как это показано на рис. 16.Отсюда следует, что для того, чтобы между машиной и человеком имело место общение в ЕЯ терминах, машина должна поддерживать концептуальное представление реальной действительности с ее физическими объектами и связями. Таким образом, ситуация моделирования РД независимо от ее формы (машинной или в памяти человека) представляется с помощью следующих компонентов.Имени, обозначающего объект и отличающего его от других объектов. С помощью имен создается так называемое внешнее представление ПрдО, которое определяется соображениями удобства и общности с пользовательским представлением; именно с этим представлением имеет дело пользователь. Назовем этот компонент символьным.

Пользовательское представлениеМашинное представление

Система знаний человекаЗнания о ВнтП машины Внутреннее представление модели

Подпись:
Языковые знанияУмение программировать

Подпись:
Речевые навыки Навыки ввода-вывода информации вмашину

=0^

Подпись:
Внешний Мир: Объекты и Материальные знаки

Рис.16. Компоненты знаковой ситуации и машинного представленияСостояния, которое определяется в каждый данный момент и может изменяться с течением времени. Этот компонент машинной модели отражает внутреннее или физическое представление РД в памяти машины и определяется соображениями экономии места и эффективности доступа. Состояния, записанные в памяти машины, определяют смысл имен, поэтому этот компонент назовем смысловым.Функций доступа, играющих роль интерфейса, обеспечивая соответствие между символьным (внешним) и смысловым (внутренним) представлениями. С помощью данного компонента, который назовем интерфейсным, пользователь через языковые конструкции может создавать и уничтожать объекты внутреннего представления, проверять и изменять их состояния, а также комбинировать их между собой.ВЫВОДЫ И ЗАДАЧИ ИССЛЕДОВАНИЙОсновной вывод, который можно сделать по результатам данного краткого обзора, заключается в том, что при использовании средств ассоциативной обработки для моделирования интеллектуальных задач прослеживается тенденция приспособления адресных ЗУ. Это позволяет представить в памяти машины довольно сложные структуры данных, а проблема быстродействия, возникающая при этом, решается путем использования древовидных структур^ однако в рамках рассмотренных технических решений не удается решить важнейшую проблему теории искусственного интеллекта, касающуюся установления ассоциаций между различными реализациями объекта.Констатируется, что решение этих проблем нужно искать не в области технических решений, а в области теории ассоциативной обработки информации в части реализации более эффективных моделей данных и соответствующих вычислительных механизмов. С этой целью рассматриваются основные положения, на которых базируется современное машинное моделирование, и выявляются принципиальные недостатки традиционных вычислительных механизмов с точки зрения моделирования интеллектуальной деятельности человека.З.В связи с отмеченными недостатками ставится вопрос замены теоретической базы современной ВТ, базирующейся на концепции машины Тьюринга. В качестве альтернативной теории в последнее время привлекает внимание теория КА, основанная на учете предварительно сформированного пространства состояний. Однако широкому распространению данной теории препятствует тот факт, что сложность решения задач на ее основе оценивается экспоненциальной зависимостью, в то время как сложность решения задач на машине Тьюринга повышается пропорционально по отношению к росту числа объектов. Для преодоления этой проблемы предлагается использовать методы инженерии знаний, позволяющие формализовать процедуры формирования пространства состояний, и тем самым автоматизировать этот процесс.4.Однако прогресс в этом направлении упирается в отсутствие инструментария обобщенного представления ПрдО. Сложность реализации обобщенного представления ПрдО во многом вызвана тем, что современные вычислительные модели слабо используют структурную информацию, и чтобы скомпенсировать отсутствие этой важнейшей информации о природе моделируемых объектов, приходится писать сложный программный код. 5.Решение перечисленных проблем нами видится в разработке математической модели обобщенного представления с последующей интерпретацией ее на символьных и смысловых структурах и реализации на базе этих интерпретаций вычислительного механизма обобщенного отражения. Выполнение поставленной задачи осуществляется по следующей схеме:сначала разрабатывается математическая модель обобщенного отраженияЩзатем разработанная модель используется для формализации такой формы обобщенного отражения, как понятие;эта же модель обобщенного отражения используется для формализации всех уровней языковой подсистемы, а именно: фонемного, морфемного, лексемного, словосочетаний и предложений;проблема доступа к элементам обобщенного отражения ПрдО рассматривается как решение задачи поиска языковых конструкций в модели обобщенного отражения языковой подсистемы, соответствующих конструкциям входной символьной последовательности.