Название: Инвариантно-параметрическое представление и обобщенная ассоциативная обработка символьной и смысловой информации(Токмаков Г. П)

Жанр: Информационные системы и технологии

Просмотров: 3091


3.логические структуры инвариантно-параметрического представления смысловой и символьной информации

В настоящее время в системах программирования используются различные методы нотации, в которых имена отражают некоторые свойства и природу (тип) объектов (например, венгерская нотация). Однако сколь угодно можно изощряться, но не придумано еще ничего лучше, чем "называть вещи своими именами", т.е. использовать для обозначения объектов его свойств, компонентов и отношений, в которые он вступает, слова ЕЯ.В традиционных языках программирования и системах обработки данных эту идею реализовать невозможно, так как представление объектов в памяти машины не соответствует представлению внешнего мира в памяти человека. Поэтому нельзя проецировать словарь ЕЯ, приспособленный для обозначения понятийных структур, представляющих собой конечную систему обобщений, на систему единичных представлений, которая как множество имеет несравненно большую мощность. Отсюда следует вывод: машина должна поддерживать понятийную модель РД, т.е. устанавливать соответствие между понятийными структурами и структурами памяти машины. Однако ввиду отсутствия математических моделей обобщенного представления, известные сведения о понятиях и ситуациях до сих пор не удавалось использовать при машинном моделировании РД, что сдерживает использование констру1сций ЕЯ для обозначения моделируемых объектов.Современные технологии машинного моделирования РД предполагают наличие тесной связи между множеством данных, описывающих объект, и процессом их обработки. Это обусловлено тем, что обычно подготавливаются и накапливаются в виде данных только такие параметры объекта, которые будут использованы в соответствующем процессе обработки. Однако, как правило, не удается заранее в полном объеме реализовать непосредственную связь между программой обработки и способом хранения параметров объекта. Поэтому необходимо искать пути к такому описанию объектов, при которых обеспечивается решение задач широкого класса, т.е. необходимые параметры данных должны определяется из описывающих объект данных.Применение компьютеров для ведения и обработки данных приводит к разделению данных и интерпретации. Компьютеры имеют дело главным образом с данными как таковыми, и большая часть интерпретирующей информации вообще не фиксируется в явной форме. Вне этой интерпретации данные представляют собой не более чем совокупность битов в памяти машины. Как правило, интерпретация данных осуществляется в программах, в которых манипуляции с ними проводятся в соответствии с их семантикой. Однако в условиях совместного использования данных, когда одни и те же данные интерпретируются различными программами, целесообразно связать данные с механизмами интерпретации и обеспечить однократность представления интерпретирующей информации. В результате данные из совокупности битов превращаются в семантически значимое представление части реального мира. Такое представление, с одной стороны, должно обладать гибкостью, чтобы адекватно отражать изменяющееся состояние реального мира, с другой стороны, должно иметь возможность единообразного представления данных различной природы и содержания. Интеллектуальное средство, позволяющее реализовать интерпретацию данных, "уложенных" в некоторую единообразную форму, независимо от его содержания называют моделью данных.К настоящему времени нет единства относительно того, как представлять объекты ПрдО в памяти машины, вследствие чего существуют различные подходы к этой проблеме, которые применяются в зависимости от специфики той или иной ПрдО. Но логические законы не зависят от специфики той или иной ПрдО, и, как свидетельствуют исследования в области отражения РД человеческим мозгом [74], человек в форме понятий моделирует любую ПрдО единообразно. С целью использования этой универсальной формы отражения РД при машинном моделировании, важно выяснить форму этого отражения, его составные части. При этом мы рассчитываем получить некоторую единообразную форму представления сведений об объектах РД независимо от того, к каким ПрдО они принадлежат и в решении каких задач участвуют.В настоящей главе, используя математическую модель обобщенного отражения, разработанную в предыдущей главе для формализации известных сведений о принципах обобщенного отражения, сформулируем принципы обобщенного отражения объектов РД, т.е. опишем известные сведения о понятиях в терминах ИПП. При этом мы рассчитываем получить некоторую единообразную форму для представления сведений об объектах произвольной ПрдО, интегрирующей в себе способы представления данных в системах программирования и обработки данных, с тем, чтобы затем использовать их независимо от решаемой задачи. Имея описанную форму представлений, можно разработать систему функций доступа к элементам системы представлений и обозначить полученные функции доступа символьными или языковыми конструкциями.Это довольно сложная проблема, и на сегодняшний день не существует метода доступа, пригодного на все случаи. Поэтому разрабатываются различные методы доступа (в частности, последовательный, индексный и адресный), которые используются в зависимости от ситуации. Наиболее интересным, с точки зрения нашей задачи, является адресный метод доступа, в котором значение записи несет в себе физический адрес ее хранения, что позволяет достичь высокой скорости, как при занесения данных, так и при их выборке. Этот метод обеспечивает ассоциативный доступ к данным, но его использование ограничивается проблемой "неуправляемости" ключа, которая заключается в следующем. Чтобы обеспечить взаимно однозначное соответствие между ключом записи и ее физическим адресом, необходимо предусмотреть в памяти для каждой записи место, определяемое уникальным значением ее первичного ключа. Тогда можно построить простую функцию преобразования ключа в адрес, обеспечивающую запоминание и выборку каждой записи в точности за один произвольный доступ к блоку. Но если в качестве первичного ключа выбрать слово из десяти букв, то это дает 3010 ключевых значений.Нами предлагается близкий к адресному способу метод доступа, где в качестве ключей используются слова русского языка {РЯ), которые, как и объекты, обладают сложной структурой и совокупностью свойств. Следовательно, для хранения ключей можно использовать те же модели данных, которые используются для хранения объектов. Проблема "неуправляемости" ключа в данном подходе решается благодаря использованию оригинальной древовидной структуры, обеспечивающей хранение двух взаимопроникающих иерархий структурных отношений и родовидовых связей свойств. Предлагаемая система иерархий обеспечивает компактное хранение ключей (для хранения словаря 100000 слов РЯ, который при склонении и спряжении дает ~3 млн. словоформ, требуется всего ~3 Мб ОП) и, что особенно важно, очень высокую скорость доступа (сопоставимую с быстродействием кэш-памяти). Согласно данному подходу для доступа к элементам данных средства ЕЯ используются следующим образом:слова используются для доступа к объектам внутреннего представления;словосочетания используются для доступа к компонентам объектов внутреннего представления;фразы используются для доступа к несущественным свойствам объектов с целью изменения их состояния; при этом фраза реализует отношение, определяемое глагольным словом, а именные слова и словосочетания определяют аргументы этого отношения.При разработке обобщенной формы отражения РД в памяти машины и функций доступа к ее компонентам с помощью символьных конструкций полезно рассмотреть сведения о естественных формах обобщенного отражения и доступа к ее элементам.