скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты

скачать рефератыРеферат: Общий обзор экспертных систем

 : некий дельфин наделен умственными способностями

 : все слоны имеют серую окраску

Отличительными чертами логических моделей, в частности приведенных выше моделей представления знаний, являются единственность теоретического обоснования и возможность реализации системы формально точных определений и выводов. По этим причинам немало исследователей в области искусственного интеллекта выбрали для себя предметом изучения именно логические модели. Однако для логических моделей характерен ряд сомнительных моментов, а поскольку большинство исследователей в области искусственного интеллекта – люди с неформальным мышлением, то большая часть достижений в области систем с базами знаний до недавнего времени принадлежала  так называемой группе исследователей нелогического направления. В отличие от исследователей логического направления, которые выбирают предметом своих исследований сравнительно простые задачи, для решения которых используются теоретические подходы, исследователи нелогического направления выбирают сложные задачи и пытаются сконцентрировать все внимание на развитии способностей. Кроме того, в отличие от первой категории исследователей, которые почти не занимаются теоретическими исследованиями, вторая категория придает им большое значение. Другими словами, так называемая “человеческая логика” – это интеллектуальная модель с нечеткой структурой – в этом ее отличие от строгой логики. Более точно следует сказать, что исследователи логического направления ищут пути логического решения (в малой модели) задач, поставленных исследователями нелогического направления, и постепенно расширяют рамки логики. Примерами тому являются модальная логика, многозначная логика и т.п. В 80-х гг. было пересмотрено отношение к преимуществам и значимости логических методов, и они в различных формах стали применяться в нелогических моделях представления знаний. Это обусловлено, с одной стороны, необходимостью в точном представлении знаний, а с другой – ставшими очевидными пределами традиционных систем знаний, чрезмерно тяготеющих к эвристике.

3.2 Продукционная модель представления знаний

В модели правил знания  представлены совокупностью правил вида “ЕСЛИ – ТО”. Системы с базами знаний, основанные на этой модели, называются продукционными системами. Эти системы бывают двух диаметрально противоположных типов – с прямыми и обратными выводами. Типичным представителем первого типа является система MYCIN, используемая для решения задач диагностического характера, а типичным представителем систем второго типа – OPS, используемая для решения проектирования задач.

В системе продукций с обратными выводами с помощью правил строится дерево И/ИЛИ, связывающее в единое целое факты и заключения; оценка этого дерева на основании фактов, имеющихся в базе данных, и есть логический вывод. Логические выводы бывают прямыми, обратными и двунаправленными. При прямом выводе отправной точкой служат предоставленные данные, процесс оценки приостанавливается в узлах с отрицанием, причем в качестве заключения (если не все дерево пройдено) используется гипотеза, соответствующая самому верхнему уровню дерева (корню). Однако для такого вывода характерно большое количество данных, а также оценок дерева, не имеющих прямого отношения к заключению, что излишне. Преимущество обратных выводов в том, что оцениваются только те части дерева, которые имеют отношение к заключению, однако если отрицание или утверждение невозможны, то порождение дерева лишено смысла. В двунаправленных выводах сначала оценивается небольшой объем полученных данных и выбирается гипотеза (по примеру прямых выводов), а затем запрашиваются данные, необходимые для принятия решения о пригодности данной гипотезы. На основе этих выводов можно реализовать более мощную и гибкую систему.

Системы продукций с прямыми выводами среди систем, основанных на использовании знаний, имеют наиболее давнюю историю, поэтому они являются в некотором смысле основополагающими. Эти системы включают три компонента: базу правил, состоящую из набора продукций (правил вывода), базу данных, содержащую множество фактов, и интерпретатор для получения логического вывода на основании этих знаний. База правил и база данных образуют базу знаний, а интерпретатор соответствует механизму логического вывода. Вывод выполняется в виде цикла “понимание – выполнение”, причем в каждом цикле выполняемая часть выбранного правила обновляет базу данных. В результате содержимое базы данных преобразуется от первоначального к целевому, т.е. целевая система синтезируется в базе данных. Иначе говоря, для системы продукций характерен простой цикл выбора и выполнения (или оценки) правил, однако из-за необходимости периодического сопоставления с образцом в базе правил (отождествлением) с увеличением числа последних (правил) существенно замедляется скорость вывода. Следовательно, такие системы не годятся для решения крупномасштабных задач. Упорядочим слабые и сильные стороны хорошо известных  систем продукций. Сильные стороны:

1)   Простота создания и понимания отдельных правил;

2)   Простота пополнения, модификации и аннулирования;

3)   Простота механизма логического вывода.

Слабые стороны:

1)   Неясность взаимных отношений правил;

2)   Сложность оценки целостного образа знаний;

3)   Крайне низкая эффективность обработки;

4)   Отличие от человеческой структуры знаний;

5)   Отсутствие гибкости в логическом выводе.

Таким образом, если объектом является небольшая задача, выявляются только сильные стороны системы продукций. В случаях увеличения объема знаний, необходимости решения сложных задач, выполнения гибких выводов или повышения скорости вывода требуется структурирование базы данных. Первое, что приходит в голову в таких случаях, - это группировка знаний и структурирование базы данных. Другими словами, путем предварительной группировки соответствующих правил в некотором состоянии процесса вывода можно ограничить диапазон выбора правил. В тех случаях, когда объекты, для которых используются правила, также имеют иерархическую структуру, эффективным является структурирование базы данных. Этот подход был реализован в системах EMICIN и MECS-AI, разработанных на базе системы MYCIN с применением универсального языка представления знаний.

Расширенным вариантом модели правил является модель доски объявлений (blackboard), которая была предложена в системе распознавания разговорной  речи HEARSAY-II как модель представления знаний.

3.3 Представление знаний фреймами

Фреймовая модель, или модель представления знаний, основанная на фреймовой теории М. Минского,  представляет собой систематизированную модель памяти человека и его сознания.

Теория фреймов - это  парадигма для представления знаний с целью использования этих знаний компьютером. Впервые была представлена Минским в 1975 году, как попытка построить фреймовую сеть, или парадигму с целью достижения большего эффекта понимания. С одной стороны он пытался сконструировать базу данных, содержащую энциклопедические знания, но с другой стороны,  хотел создать наиболее описывающую базу, содержащую информацию в структурированной и упорядоченной форме. Эта структура позволила бы компьютеру вводить информацию в более гибкой форме, имея доступ к тому разделу, который требуется в данный момент. Минский разработал такую схему, в которой информация содержится в специальных ячейках, называемых фреймами, объединенными в сеть, называемую системой фреймов. Новый фрейм активизируется с наступлением новой ситуации. Отличительной его чертой является то, что он одновременно содержит большой объем знаний и в то же время является достаточно гибким для того, чтобы быть использованным как отдельный элемент базы данных. Термин «фрейм» был наиболее популярен в середине семидесятых годов, когда существовало много его толкований, отличных от интерпретации Минского.

Итак, как было сказано выше фреймы – это фрагменты знания, предназначенные для представления стандартных ситуаций. Термин «фрейм» (Frame – рамка) был предложен Минским. Фреймы имеют вид структурированных компонентов ситуаций, называемых слотами. Слот может указывать на другой фрейм, устанавливая, таким образом, связь между двумя фреймами. Могут устанавливаться общие связи типа связи по общению. С каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например ожидаемые процедуры ситуации, способы получения информации о слотах, значение принимаемые по умолчанию, правила вывода.

Формальная структура фрейма имеет вид:

f[<N1, V1>, <N2, V2>, …, <Nk,Vk>],

где f – имя фрейма; пара <Ni, Vi> - i-ый слот, Ni – имя слота и Vi – его значение.

Значение слота может быть представлено последовательностью

<K1><Li>;...; <Kn><Ln>; <R1>; …; <Rm>,

где Ki – имена атрибутов, характерных для данного слота; Li – значение этих атрибутов, характерных для данного слота; Rj – различные ссылки на другие слоты.

Каждый фрейм, как структура хранит знания о предметной области (фрейм–прототип), а при заполнении слотов знаниями превращается в конкретный фрейм события или явления.

Фреймы можно разделить на две группы: фреймы-описания; ролевые фреймы.

Рассмотрим пример.

Фрейм описание: [<программное обеспечение>, <программа 1С бухгалтерия, версия 7.7>, <программа 1С торговля, версия 7.7>, <правовая программа «Консультант +» проф.>].

Ролевой фрейм: [<заявка на продажу>, <что, установка и покупка программы 1С торговля, версия 7.7>, <откуда, фирма ВМИ>, <куда, фирма «Лукойл»>, <кто, курьер Иванова>, <когда, 27 октября 1998г.>].

Во фрейме-описании в качестве имен слотов задан вид программного обеспечения, а значение слота характеризует массу и производителя конкретного вида продукции. В ролевом фрейме в качестве имен слотов выступают вопросительные слова, ответы на которые являются значениями слотов. Для данного примера представлены уже описания конкретных фреймов, которые могут называться либо фреймами – примерами, либо фреймами – экземплярами. Если в приведенном примере убрать значения слотов, оставив только имена, то получим так называемый фрейм – прототип.

Достоинство фрейма – представления во многом основываются на включении в него предположений и ожиданий. Это достигается за счет присвоения по умолчанию слотам фрейма стандартных ситуаций. В процессе поиска решений эти значения могут быть заменены более достоверными. Некоторые переменные выделены таким образом, что об их значениях система должна спросить пользователя. Часть переменных определяется посредством встроенных процедур, называемых внутренними. По мере присвоения переменным определенных значений осуществляется вызов других процедур. Этот тип представления комбинирует декларативные и процедурные знания.

Фреймовые модели обеспечивают требования структурированности и связанности. Это достигается за счет свойств наследования и вложенности, которыми обладают фреймы, т.е. в качестве слотов может выступать система имен слотов более низкого уровня, а также слоты могут быть использованы как вызовы каких-либо процедур для выполнения.

Для многих предметных областей фреймовые модели являются основным способом формализации знаний.

3.4 Представление знаний семантическими сетями

Одним из способов представления знаний является семантическая сеть. Изначально семантическая сеть была задумана как модель представления структуры долговременной памяти в психологии, но впоследствии стала одним из основных способов представления знаний в инженерии знаний.

Моррис дал точное определение семантическим и прагматическим отношениям в семиотике и определил их как проблемы различных функциональных уровней. Другими словами, семантика означает определенные (общие) отношения между символами и объектами, представленными этими символами, а прагматика – выразительные (охватывающие) отношения между символами и создателями (или пользователями) этих символов.

Первоначально в психологии изучались объекты, именуемые семантическими с точки зрения известных ассоциативных свойств, накапливаемых в системе обучения и поведения человека. Однако с развитием психологии познания стали изучаться семантические структуры, включающие некоторые объекты. Затем были изучены принцип действия человеческой памяти (способы хранения информации и знаний), в частности предположительные (гипотетические) структурные модели долговременной памяти, и созданы моделирующие программы, понимающие смысл слов.

Одной из структурных моделей долговременной памяти является предложенная Куиллианом модель понимания смысла слов, получившая название TLC- модели (Teachable Language Comprehender: доступный механизм понимания языка). В данной модели для описания структуры долговременной памяти была использована сетевая структура как способ представления семантических отношений между концептами (словами). Данная модель имитирует естественное понимание и использования языка человеком. Поэтому основной ее идеей было описание значений класса, к которому принадлежит объект, его прототипа и установление связи со словами, отображающими свойства объекта. В качестве примера на схеме 2 показана весьма простая семантическая сеть для представления концептуального объекта “чайник”. В этой сети определены операторы отношений, называемые классом, свойством и примером, для которых описаны значения.

Схема 2


                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                             В модели Куиллиана концептуальные объекты представлены ассоциативными сетями, состоящими из вершин, показывающих концепты, и дуг, показывающих отношения между концептами. Например, в сети, показанной на схеме 2, с отношением “класс” ассоциируется значение “ёмкость”, со свойством – “металлический”, “фарфоровый”, “наличие носика”, с примером – “металлический чайник”. Подобная ассоциативная структура называется плоскостью, описываемые концепты объекта называются вершинами типа, а связанные с ними соответствующие отдельные слова – вершинами лексем. В любой плоскости существует одна вершина типа и только необходимое для определения концептов, описывающих его, число вершин лексем.

Вершины лексем определяют всевозможные сущности, имеющие место в реальном мире, например, классы, свойства, примеры, время, место, средство, объекты и т. п. Преимущество лексем по сравнению с типами заключается в экономии пространства памяти ЭВМ. Это означает и факт предотвращения дублирования определения концептов.

Итак, исходя из приведенных выше соображений, можно сделать вывод, что в TLC-модели используется представление знаний в форме “элемент”  и ”свойства”. Другими словами, можно попытаться структурировать знания, заменив вершину типа на элемент, а вершину лексемы на свойство.   Благодаря этому данные, основанные на фактах,  в долговременной памяти можно представить с помощью структур трех типов: элементы, свойства и указатели. Элемент представлен заключением, называемым фактом, например объектом, событием, понятием и т. п., обычно за элемент принимается отдельное слово, имя существительное, предложение или контекст. Свойство – это структура, описывающая элемент, оно соответствует таким частям речи как имя прилагательное, наречие, глагол и т.д. указатели связывают элементы и свойства.

Важность модели семантической сети Куиллиана с точки зрения многочисленных приложений определяется следующими моментами:

1)   В отличие от традиционных методов семантической обработки с анализом  структуры предложения были предложены новые парадигмы в качестве модели представления структуры долговременной памяти, в которой придается значение объему языковой активности.

2)    Был предложен способ описания структуры отношений между фактами и понятиями с помощью средства, называемого семантической сетью, отличающейся несложным представлением понятий, а также способ семантической обработки в мире понятий на основе смысловой связи (смыслового обмена) между прототипами.

3)   Была создана реальная система TLC, осуществлено моделирование человеческой памяти и разработана технолгическая сторона концепции понимания смысла.


Список использованной литературы

1.    Представление и использование знаний: Пер. с япон./Под ред. Х. Уэно, М. Исидзука.- М.: Мир, 1989.

2.    Долин Г. Что такое ЭС// Компьютер Пресс. – 1992. –  №2

3.    Сафонов В.О. Экспертные системы - интеллектуальные помощники специалистов.- С.-Пб: Санкт-Петербургская организация общества “Знание” России, 1992.

4.    Шалютин С.М. “Искусственный интеллект”. – М.: Мысль, 1985.

5.    В. Н. Убейко. Экспертные системы.- М.: МАИ, 1992.

Д. Элти, М. Кумбс. Экспертные системы: концепции и примеры.- М.: Финансы и статистика, 1987.    

6.    Экспертные системы: концепции и примеры/ Д. Элти, М. Кумбс.-М.: Финансы и статистика, 1987.


Страницы: 1, 2


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

Обратная связь

Поиск
Обратная связь
Реклама и размещение статей на сайте
© 2010.