История вычислительной техники за рубежом

Инженерия знаний и НЕ-факторы: краткий обзор 08

В статье обсуждается текущее состояние исследований в области НЕ-факторов, рассматриваемых в качестве комплекса базовых элементов технологии знаний.

Моделирование НЕ-факторов: ключевое
направление ИИ в начале XXI века.

На обложке журнала
«Новости искусственного интеллекта». - Вып.2/2004

Введение

Эта статья представляет собой существенную переработку публикации [Нариньяни, 2004\06] . За истекшие четыре года рассматриваемая тема существенно расширилась, что позволяет дополнить и по-новому изложить ряд ее аспектов.

Что инженерия знаний является ядром и базой тематики Искусственного Интеллекта (ИИ) вряд ли требует дискуссии. Мне представляется в данном вопросе существенным то, что именно эта область не смогла до последнего времени выйти из фазы эмбрионального развития и перейти к становлению в качестве пусть молодой, но науки. А отсюда и все вытекающие из этого положения дел муки рождения ИИ, которые, по моему мнению, пока продолжаются, несмотря на успехи в роботостроении и машинном переводе.

Именно эта задержка в развитии, определяемая невероятной сложностью Системы знаний и трудностями формирования адекватной методологии, так или иначе связана с тематикой НЕ-факторов, при том, что этот термин достаточно долго не был широко известен в работах по технологии знаний. Однако последнее время он начинает все более часто встречаться в работах разных авторов, причем в достаточно свободной интерпретации. В связи с этим задачей данной статьи стало не только дать обзор самого комплекса НЕ-факторов и его эволюции, но и представить свою оценку распределения растущего потока публикаций в этой области.

Поскольку эта вторая тема напрямую связана с историей работ по проблеме НЕ-факторов, то и данную статью приходится начинать с ссылок на работы в которых этот термин был предложен более четверти века назад [Нариньяни, 1982, 86] .

Его несколько экзотическая форма связана с тем, что он вводился для обозначения достаточно широкого комплекса свойств, присущих любой реальной Системе знаний (СЗн), но плохо представленных в «классических» формальных системах. Это несоответствие было отражено в тезисе о том, что общие базовые свойства традиционных аппаратов, которые мы привыкли считать необходимыми для любой формальной системы ( точность, полнота, определенность, корректность и др.), являются в знаниях о реальном мире редкими исключениями, представляя лишь искусственные частные случаи таких НЕ-факторов, как недоопределенность, неточность, неполнота, некорректность и др.

НЕ-факторы отнюдь не нечто диковинное, - они "встроены" в нашу Картину мира, как основная составляющая знаний, являясь их материей и строительным материалом. Причем речь не идет только о роли НЕ-факторов в формальном описании Системы знаний в рамках тематики ИИ. Это касается всех наших знаний о знаниях, т.е. всего известного формально и неформально пространства функционирования знаний во всех областях человеческой деятельности. От наивных и бытовых до любых реальных приложений науки и техники, включая и такие, казалось бы далекие от тематики ИИ, как вычислительная математика. И, естественно, знаний в когнитивных и коммуникативных процессах, вплоть до всех компонентов естественного языка.

В этом контексте я уже предлагал для современного аппарата знаний метафору пены, где тонкая пленка поверхности отражает достаточно формализованные знания, которыми мы оперируем сегодня. Именно они придают всей Системе знаний ее текущую видимую и привычную для нас форму. В то же время ее основной реальный объем относится к разделам либо вообще невидимым, либо находящимся на начальных этапах осознания, исследования и создания аппарата описания, базой которого должен стать соответствующим образом разработанный комплекс НЕ-факторов.

1. НЕ-факторы – история вопроса

1.1. В первом абзаце статьи я сослался на свою публикацию [Нариньяни, 2004\06] как на предшествующую версию этой. Однако связь этих двух работ выходит за рамки более ранней и более поздней редакции одной темы. Дело в том, что предыдущая статья писалась в контексте одной обстановки вокруг тематики НЕ-факторов, а данная – в совершенно другой. Именно поэтому определенную часть этого обзора придется посвятить как истории вопроса, так и нового поворота трактовки самого термина.

Такой разворот развития темы для меня был обозначен содержанием того номера журнала « Новости искусственного интеллекта», в котором предыдущая статья вышла (вып.2/2004). Номер включал целый раздел, название которого взято в данной статье за эпиграф. Кроме моей, в него входили еще три статьи, посвященные тематике НЕ-факторов: [Валькман, 2004], [Рыбина, 2004] и [Тарасов, 2004].

И само название раздела, равно как и содержание статей символизируют ту корректировку позиционирования тематики НЕ-факторов в сфере ИИ, которая упоминалась выше. Приведем цитату из введения статьи Ю.Р.Валькмана:

Обратим внимание, что понятие НЕ-факторов было введено еще в 1982 г . Было дано и его достаточно строгое определение. Но почему-то научная общественность и после доклада [ Нариньяни, 1994 ], сделанного в 1994 г ., не обратила внимание на открытие этого чрезвычайно важного научного направления в области ИИ. Соответствующие работы стали появляться лишь в нынешнем веке.

Действительно, история настолько странная, что стоит изложить ее хотя бы кратко для того, чтобы анамнез помог четче оценить текущее положение дел.

1.2. Для меня знакомство с тематикой НЕ-факторов и вхождение в нее в том ее формате, который упомянут выше во Введении, началось в 1980 году с идеи Недоопределенных множеств [Нариньяни, 1980]. Естественно, что она возникла у меня далеко не на пустом месте, - в это время разными авторами активно обсуждалось несколько вариантов представления «нетрадиционных» множеств, начиная с ключевой в тот период концепции fuzzy sets . Однако они не представлялись мне удовлетворительными для представления неполностью определенных множеств, - базового типа данных для систем представления знаний. А вот концепция Н-множества оказалась достаточно удачной, особенно в связи с тем, что обеспечила возможность самоорганизации эффективного процесса вывода \ уточнений на основе управления по данным .

Более того, достаточно быстро стало ясно, что сам подход применим не только ко множествам, но и к другим типам данных, что позволило сформировать идею Недоопределенности как общего явления (фактора). Одновременно выяснилось, что интервальное представление может служить примером как недоопределенного числа, так и неточного с тем принципиальным различием, что первое может уточняться, а второе нет. Отсюда был один шаг до самой концепции системы НЕ-факторов, сформулированной в 1982 [Нариньяни, 1982, 86] .

При этом самоорганизация процесса вычислений доказала свою применимость не только для Н-множеств, но и для других Н-типов (логических, числовых, символьных и др.). Прошли успешные эксперименты с автоматическим решением алгебраических задач. Они обеспечили следующий шаг качественного развития подхода Вычислительных моделей Э.Х . Тыугу [ Тыугу, 1970 ], сложившийся в концепцию Н-моделей и Активных Типов Данных (АТД).

1.3. Чем дальше шел процесс разработки Н-типов, Н-моделей, НЕ-факторов, АТД, тем более принципиально важной представлялась это направление мне и нашему коллективу лаборатории ИИ Вычислительного центра СО АН СССР. Однако, как не странно, несмотря на регулярные доклады и демонстрации этих концепций коллегам на протяжении всех 80-х годов, и на успешную реализацию Н-моделей в проекте СТАРТ (советском проекте технологий 5го поколения), ни понимания, ни интереса тогда со стороны нашей ИИ общественности они не вызывали.

Объяснить такого рода аутизм я не берусь. Вот если бы модное сегодня направление constraint появилось не в 90х, а лет на десять раньше, то, возможно, оно могло бы тогда как-то «сертифицировать» наши работы в глазах российского ИИ, а там, глядишь, обратило бы ее внимание и на НЕ-факторы и Н-модели.

Но, как известно, у истории нет сослагательного склонения. Тогда, в восьмидесятые годы, почти всем казалось, что золотой ключик fuzzy открывает любые двери, а разобраться в пробе этого золота и смысле тех виртуальных дверей, которые он якобы открывает, необходимости никто не чувствовал. Кризис и будущий закат Нечеткости тогда еще не ощущался, так же как многие не чувствуют его даже теперь.

1.4. В общепринятой тематике искусственного интеллекта отсутствие достаточно проработанной концепции НЕ-факторов постоянно ощущается как большая «черная дыра», много раз за истекшие годы порождавшая и поглощавшая поток разного рода сублиматов - fuzzy , rough , soft , pervasive , uncertain , possible, и многих, многих других.

Однако быстро расширяющаяся территория плохо формализуемых явлений не очень-то поддавалась этим усилиям. К началу 21го века стало понятно, что хотя бы минимальный внешний порядок здесь надо попытаться наводить.

Период полного игнорирования завершился и перешел в следующую фазу, связанную с «реинкарнацией» термина НЕ-факторы параллельно его собственному вполне активному существованию.

Никому казалось бы ненужный до этих пор термин НЕ-факторы всплыл в памяти: вроде именно он как раз про то самое, и предлагает так нужную сегодня концепцию, по полкам которой можно попытаться как-то разместить все накопившееся эклектичное терминологическое хозяйство. В потоке этого ощущения новизны «открытия заново» для части неофитов было не так уж и важно, чей это термин и что автор имел в виду. Обозначение подверглось экспроприации и стало употребляться направо и налево, т.е. почем зря.

Большую часть многих десятков публикаций, в которых упоминаются НЕ-факторы, я не только не видел, но даже о них не слышал. Известно только, что на первых порах ссылки на автора встречались намного реже, чем упоминание термина «всуе». Не вижу смысла заниматься здесь анализом этого потока, но в качестве образца такого «уважения авторских прав по умолчанию» можно привести обширный обзор В.Н. Вагина [Вагин, 2002], открывавшийся аннотацией:

Рассматриваются особенности знания и приводятся его метафора: знание как обоснованное истинное убеждение. Описываются НЕ-факторы знания: неполнота, противоречивость, неопределенность, неточность и нечеткость знания, даются нетрадиционные логики, оперирующие с НЕ-факторами.

Обзор профессора В.Н. Вагина превышал по объему данную статью раза в полтора -два. Его список из двадцати одной ссылки включал труды Аристотеля, Платона, самого профессора и еще кое-кого, достойного упоминания в этом ряду. В виду этих ограничений автору не хватило места даже для самой краткой информации об источнике, откуда он лихо и, как показывает сам текст, не слишком квалифицированно, позаимствовал ключевое понятие.

Хотя наука прямо на глазах превращается в масс-культуру, но элементарную этику пока никто не отменял. Если тебе понравился чужой термин, признайся, что он чужой. Если тебе не хватает времени и желания разобраться в том смысле, который связывался с этим термином при его введении, напиши хотя бы что-нибудь, вроде: Я буду использовать термин Х, введенный У-ком, в несколько ином смысле, чем он определялся его автором. Такой минимум обязателен даже для профессора, хотя к нему не мешало бы добавить, а чем же именно отличатся твое определение от авторского.

Я уделил здесь место этой вставке не потому, что меня волнует качество ссылок на мои работы. Просто считаю неправильным, чтобы нужный термин, кто бы его не ввел, пускать по рукам, где ему придается масса смыслов, имеющих мало общего с его собственным.

1.5. Второй период истории НЕ-факторов, представленный в предыдущем разделе, моно было бы назвать «суета и beyond ». Он показал, что термин уже прошел огонь и воду, о чем в частности свидетельствует спектр успешных прикладных проектов и несколько сот публикаций. Но с началом нового века он вступил в фазу медных труб: вдруг понравился публике и пошел « в широкий оборот» .

Однако этот период оказался намного короче первого, и выход упоминаемого журнала « Новости искусственного интеллекта» вып.2/2004 обозначил переход к третьей – текущей – фазе эволюции НЕ-факторов, теперь уже в качестве признанного направления.

С одной стороны приятно, когда тебя публично признают своего рода отцом этого направления, с другой ощущается, что некоторый «конфликт поколений» в трактовке понятия НЕ-факторы продолжается. А отсюда естественно следует, и некоторая неоднозначность самого направления в целом.

2. НЕ-факторы и Система Знаний

2.1. Введение термина НЕ-факторы в начале 80-х годов было связано с попыткой уяснения особенностей прагматики тех свойств, которые соотносятся с различными «дефектами» знаний.

Такие дефекты - неотъемлемая составляющая в сякой Системы знаний, поскольку она реализует опыт формализации текущих знаний о текущих знаниях, и, следовательно, их аппроксимацию. А отклонения от оригинала (в данном случае, от самих формализуемых знаний) свойственны всякой аппроксимации по определению . Поэтому р еальные знания и данные не бывают полными и идеальными, а лишь находятся на каком-то уровне приближения к более полным и адекватным,

Наука сегодня работает в рамках гипотезы, утверждающей, что развитие нашей (т.е. здесь и сейчас ) Системы знаний есть процесс, сходящийся к некоторому знанию Ω, которое принимается этой гипотезой за «полное и абсолютное». Хотя при этом науке неизвестно, возможно ли такое абсолютное Ω объективно, насколько наша текущая СЗн к этому Ω близка и вообще на него похожа.

Оставляя этот деликатный вопрос в стороне, мы можем использовать абстракцию Ω для того, чтобы определить текущую СЗн как коктейль из знания (той части Ω, которую уже удалось постичь) и различных форм незнания, которые включают:

  • Полное незнание, т.е. все то, о чем мы сейчас не имеем никакого представления; к этому незнанию относится как то знание, о котором человечество не узнает никогда, так и достижимое в будущем; последним была, например, почти вся наша сегодняшняя наука не только для финикийцев, но даже для Ньютона и Кеплера.
  • Ложное знание, не имеющего никакого отношения к Ω; например, те три слона, на которых покоится Земля.
  • Частичное знание, которое представляет собой то или иное приближение к Ω, находящееся где-то между Полным незнанием и Полным знанием с той или иной степенью примеси того или иного вида Ложного знания.

2.2. При этом очевидно, что для нас все в нашей СЗн – знание, поскольку перечисленные части этого коктейля СЗн мы различать не можем, иначе состав его был бы иным. Но даже из этой предельно грубой классификации ясно, что нашей СЗн свойственны самые различные формы частичного знания, то есть сочетания именно тех самых НЕ-факторов, которые мы будем обсуждать ниже.

Если же вспомнить о том, что знаний, плохо пока поддающихся формализации, несравнимо больше, чем тех, которые считаются сегодня достаточно хорошо формализованными, то пространство НЕ-факторов оказывается намного более сложным и многомерным, чем то, которое мы до сих пор относили к СЗн. Более того, сама Система знаний без разработанной концепции НЕ-факторов как ее важнейшей неотъемлемой – а, точнее, базовой – части, является всего лишь грубым макетом даже той части знаний, которые, как нам кажется, достаточно хорошо осознаны и описаны формально.

Будем исходить из того, что достаточно полное представление о текущей СЗн (наша профессиональная область) от нас еще весьма далеко. На данном этапе мы сделали только начальный шаг: поняли, что в построении СЗн играют роль не только и не столько те абстрактные свойства, на которых строила до сих пор свои формальные системы математика, сколько их расширения, т.е. НЕ-факторы, отражающие отношение этих свойств к реальной СЗн.

2.3. Представим самую общую структуру сегодняшнего видения комплекса НЕ-факторов, выделив в нем группы свойств, отражающих различные аспекты Системы знаний:

  • принципиальную незамкнутость СЗн и всех ее основных составляющих;
  • неточность, неполноту, недоопределенность и другие свойства, относимые к тем данным и знаниям, которые оцениваются как адекватные, но не достигшие уровня, достаточного для того, чтобы считать их в текущем контексте точными и/или полными и/или определенными;
  • некорректность – комплекс нарушений в данных, знаниях и методах их обработки, при­водящих к возникновению ошибок, искажений и противоречий;
  • необозримость того или иного компонента СЗн и ее в целом, т.е. недостаточность текущих знаний, не позволяющая эффективно использовать их для проверки их адекватности и для решения практических задач.

Перечисленные группы не исчерпывают весь спектр НЕ-факторов. В частности, и потому, что говорить ни о полноте этого перечисления, ни о знании всего спектра НЕ-факторов пока нет никаких оснований, поскольку каждый из них может относиться к разным «этажам» СЗн. Например:

  • К принципам самой СЗн, т.е. к метатеории знаний;
  • К организации понятийной структуры (онтологиям), т.е. к выбору системы понятий и отношений между ними, а также к их соотнесению с реальностью;
  • К методике построения формальных и неформальных средств, их адекватности отображаемым с их помощью элементам нашего текущего представления о реальности;
  • К технологии использования этих средств для представления различных составляющих Системы знаний и\или конкретных фрагментов действительности;
  • К соотношению аппарата естественного языка, средств передачи информации и системы обработки знаний, и т.п.

2.4. Последнее можно проиллюстрировать на НЕ-факторе Недоопределенность – частичном знании о сущности Х, ограниченном информацией о том, что Х является одной из альтернатив, принадлежащих к некоторому конкретному множеству Х . При уточнении знаний/данных об Х, множество вариантов Х сокращается, стягиваясь в потенциале до одного элемента, который и отражает полную информацию об Х .

Понятно, что определяемая так Недоопределенность может относиться к разным уровням СЗн:

  • Недоопределенность значения переменной (параметра), – наиболее разработанный уровень, уже активно используемый в прикладных расчетах; например: Н-значение х ограничено интервалом от 2.1 до 7.4 .
  • Недоопределенность смысла лексемы (омонимия): например, лексема дело насчитывает более десятка значений, уточняемых контекстом его использования.
  • Недоопределенность типа переменной: например, лексема пять может означать (а) число, (б) школьную оценку, (в) спортивную оценку, (г) жаргон - часть тела ( дай пять ) и т.п.
  • Недоопределенность символьного выражения: f(x) = a*xk + b * e0.1*x+2c, где a, k, b и c недоопределены, например a = [1, 100], b = [-2, 16], c = [0, 100], k = [3, 25].
  • Недоопределенность отношения: например, когда из данных не ясно, какое из отношений R 1, R 2, или R 3 связывает параметры Х, Y , Z и выбор происходит либо в процессе решения или при уточнении данных .

Недоопределенность модели (или сценария): в модели некоторый фрагмент может быть представлен несколькими альтернативными вариантами подмодели, причем в процессе уточнения этих компонентов недоопределенности модели множество вариантов подмоделей может сокращаться, поскольку не все они совместимы с уточненным недоопределенным состоянием всей модели. И т.п.

3. НЕ-факторы и Искусственный Интеллект

3.1. Достаточно очевидно, что основная часть "периодической системы" НЕ-факторов нам пока не известна, т.е. относиться к полному незнанию. Даже те из них, которые как-то замечены, остаются почти неизученными или вообще игнорируемыми в традиционной математике, хотя могут с той или иной активностью разрабатываться в инженерии знаний.

Это объясняется тем, что ИИ работает в тех областях, которые до сих пор плохо поддавались формализации и поэтому продолжают оставаться своего рода целиной. Как раз в силу трудностей формализации именно здесь НЕ-факторы "выходят на поверхность" в качестве «наивных» знаний, работа с которыми оказалась просто раем для самых разных, в основном тоже весьма «наивных» подходов.

При этом эта наивная активность настолько поверхностна, что ограничивается, как правило, чисто внешним сходством между моделируемым объектом и предлагаемой моделью. Авторы подобных работ часто напоминают ребенка, путающего с золотом несколько похожий на него внешне п ири?т (железный колчедан ).

ИИ был вынужден оперировать на этих «новых территориях» по трем достаточно взаимосвязанным причинам:

  • Во-первых, потому, что области, отнесенные к хорошо формализуемым, много поколений прорабатывались высокопрофессиональными специалистами точных наук; так что дилетантам из инженерии знаний, области, пока еще в серьезных науках не числящейся, вход туда был просто закрыт.
  • Во-вторых, как и всякое новое направление, ИИ остро нуждался в самоутверждении, кадрах и деньгах, а, следовательно, в пиаре. Для чего, в свою очередь, требовалось зарабатывать очки быстро и дешево, производя максимум впечатления на широкую публику и, главное, на лиц, распределяющих оборонное финансирование.
  • В-третьих, сочетание первого и второго побуждало ИИ на первых этапах осваивать самые простые задачи для макетных имитаций человека под «настоящий искусственный интеллект», что и определяло склонность к моделированию именно человека "наивного". А это, в свою очередь, позволяло без проблем выдавать любой скороспелый результат за открытие, поскольку на "целине" часто рады любому достижению, даже самому поверхностному.

Ясно, что такое перепроизводство «наивности» не способствовало ни качеству результатов, ни авторитету ИИ. Я уверен, что именно эта начальная неосновательность объясняет достаточно низкий - вопреки ожиданиям - эффект работ в ИИ за последние десятилетия. Невысокие успехи процесса становления инженерии знаний связаны с двумя основными методологическими ошибками, определяемыми спецификой ее статуса падчерицы между такими плохо коррелирующими между собой дисциплинами, как математика, информатика, лингвистика и философия. Рассмотрим эти ошибки подробнее.

3.2. Исследуемые в ИИ понятия связываются, как правило, с конкретными лексическими наименованиями (словами и словосочетаниями)[1], позаимствованными из естественного языка. Это порождает принципиальную путаницу, поскольку смысл изучаемого явления и ассоциируемого с ним наименования – далеко не одно и то же.

В устоявшихся областях этот процесс, как правило, не слишком сложен, поскольку любое новое формируется в рамках общепринятой системы понятий и терминов. Но чем моложе область, тем сложнее идет увязка очередного изучаемого явления (обозначаемого) и сопоставляемого ему наименования (обозначающего).

В еще недостаточно сложившемся понятийном пространстве и новому явлению, и непривычному термину не хватает точек опоры. Вводимое словосочетание может иметь целый спектр ассоциируемых значений, не всегда различаемых четко, часто с большим трудом и только в достаточно узких контекстах. Исследуемое же явление или объект определяются их прагматикой, - т.е. их ролью в конкретном контексте реальности. Но и сам этот исследуемый контекст, и его границы, и роль нового понятия в нем тоже далеко не всегда (для нашей темы заведомо) являются достаточно четкими.

Попытка разобраться с моделируемой сутью явления, исходя из семантики его наименования, дезориентирует исследователя, подменяя содержательные выводы кашей из прагматики объекта моделирования и лексической семантики наименования.

В связи со сказанным дальнейшее обсуждение, как обычно, будет вестись с учетом того, что при обсуждении любого НЕ-фактора его имя является всего лишь лексической этикеткой, присвоенной некоторому типу явлений. Именно поэтому оно далее выделяется курсивом и пишется с прописной буквы.

3.3. Пока формальные средства для инженерии знаний создают в основном математики, воспитанные в области, где формальные аппараты, как правило, достаточно проработаны и обкатаны. Поэтому методология традиционного математика исходит из заданности аппарата и подбора задач, к которым он применим. Однако в инженерии знаний обычно нет ни готовых аппаратов, ни достаточно четко определенных задач. Поэтому математик в роли инженера знаний начинает с задачи, которая должна определить для него объект моделирования.

Первое знакомство с таким объектом предлагает исследователю альтернативу: либо делать формальный набросок объекта «на глазок», либо начать более основательное его изучение. Поскольку первый путь математику гораздо ближе профессионально, он обычно выбирает его. В результате, формальный аппарата строится им на основании внешнего, часто очень поверхностного, сходства с якобы отражаемой им реальностью. А будучи создан, он, как и любая формальная система, гипнотически втягивает автора в привычные действия по его развитию, доказательству теорем, углублению и анализу его соотношения с уже известными конструкциями и т.п.

В результате появляется виртуальный «научный артефакт», абсолютно тупиковый с точки зрения задач инженерии знаний. Но вполне плодовитый в рамках науки как масс-культуры: сублимации подхода к решению плохо формализуемой задачи, писанию статей на конференции по искусственному интеллекту, защите диссертаций, получению грантов, выращиванию авторитета и собственной школы. Причем редко это производится сознательно, в основном этому помогает та самая наивность, которую поддерживает общий уровень работ в нашей области.

Именно поэтому, во избежание подобного непорочного зачатия и превращения нашей области в сад камней, всякая формализация в инженерии знаний должна начинаться с тщательного изучения моделируемого явления, т.е. с подготовки и систематизации знания о нем. Этот этап до-формального исследования обязательно должен предшествовать отражению явления в формальной модели, которое без этой фазы никогда не сможет быть достаточно адекватным. Именно этот переход от реального объекта моделирования к его вначале неформальной, а только потом формальной модели и является основной инженерии знаний.

3.4. Сегодня мы, как ежик в тумане, начинаем видеть только несколько кирпичей здания НЕ-факторов, о величине и сложности которого можем пока только строить догадки. Очевидно, что для дальнейшего продвижения предстоит еще огромная работа, включающая следующие этапы:

  • очень аккуратное накопление идей: что может быть НЕ-фактором, его набросок в реальности, его тип - базовый или как-то выбранное множество альтернатив;
  • дифференциация и до-формальное исследование тех НЕ-факторов, представление о которых достигло достаточного уровня отчетливости для выделения в СЗн и разработку их достаточно полной неформальной модели;
  • создание аппаратов, обеспечивающих адекватность отражения естественной прагматики исследуемых НЕ-факторов в жесткой прагматике соответствующих формальных средств,
  • определение взаимосвязи изучаемых НЕ-факторов как составных частей доступных нам фрагментов всего комплекса СЗн.

C казанное выше – некоторое предисловие к краткому обзору текущего положения дел в разработке аппарата НЕ-факторов, который является задачей этой статьи.

4. Выбор метода

4.1. И менно здесь необходимо отметить формирование трех основных направлений работ в области НЕ-факторов, которое наметилось на очередном этапе их эволюции, обозначенном в уже неоднократно цитируемом разделе,

Первое направление, которое можно было бы условно обозначить от инженерии знаний, представляется мной в этой работе и методологически определено в предыдущем пункте 3.4.

Второе определяется описанной в п.3.3 ролью «чистой» математики и может быть обозначено от математики . Это направление работало и до появления идеи НЕ-факторов и после него, да, собственно, и сейчас продолжает работать вполне активно. Его участники обычно не ведают, что творят, поскольку для них только такой подход и представляется совершенно естественным.

Достаточно ознакомится с обзорами в [Валькман, 2004] и [Тарасов, 2004], да и раскритикованным мной выше [Вагин, 2002], чтобы убедится в том, что область плохо формализуемых явлений влекла многих, часто очень талантливых и знаменитых. Одних многозначных логик хватит на серию монографий. Но вот удастся ли найти в них жемчужное зерно, это для меня большой вопрос. Достаточно еще раз обратиться к четырехзначной логике L 4 Л.Белнапа [Белнап, 1981], которую я неоднократно рассматривал в качестве примера «неаккуратного» конструирования многозначных логик в стиле искусства для искусства, и которая с полным пиететом приводится в [Тарасов, 2004] в ряду других удачных экспериментов этих самых логик (см. ниже п.6.4).

Этот ряд, да и многие другие эксперименты подобного рода, жестко фиксируют принципиальную границу между первым и вторым направлением.

4.2. Третье направление я бы обозначил от лингвистики . Действительно, в п.3.2 уже отмечалось гипнотическое влияние слова или словосочетания на понимание и интерпретацию того явления, которое им обозначено. Для лексической семантики это совершенно нормально, поскольку она как раз и занимается смыслами лексики. Но для инженерии знаний это более чем неестественно, поскольку ведет к следующему порочному кругу:

Заинтересовавшись каким-то явлением, исследователь подыскивает для него обозначающее - подходящую лексическую этикетку, как правило, из привычных бытовых слов. Будучи привычными, эти слова имеют свою, закрепившуюся за ними семантику, опять-таки как правило, достаточно неоднозначную (омонимия) и нечеткую как у основной части лексики естественного языка. Поскольку изучаемое явление еще недоопределено, то исследователь подсознательно опираться на привычный смысл обозначающего, и выбранная им этикетка начинает влиять на его интерпретацию обозначаемого . В результате, вместо еще только намеченного объекта исследования, из взаимодействия размытостей объекта и его этикетки рождается «неведома зверушка», творец которой настаивает, что это и есть то самое, что он изучал. А поскольку это самое не слишком-то поддается формализации, то по всем признакам это НЕ-фактор.

Совершенно ясно, что поскольку в русском языке слов много, а словосочетаний еще больше, то такое направление просто обречено на вечный бег на месте.

Несмотря на весь мой сарказм, я хорошо понимаю внутреннюю ловушку этого подхода для разработчика. Ведь если бы мне не повезло с самого начала с достаточно формальным объектом – не полностью определенным множеством – и выбором в качестве этикетки известного математического термина недоопределенный, то очень может быть, что либо НЕ-факторы не родились, либо пошли совсем не в том направлении, которое я здесь так горячо отстаиваю. Действительно, обратите внимание на второй НЕ-фактор – Неточность, который мог оказаться в этом плане фатальным . Тут и этикетка не такая однозначная, и объект далеко не настолько легко подается до-формальному исследованию, недаром он до сих пор не до конца формализован.

4.3. Подводя итог этого раздела и проблеме выбора методологического направления в инженерии знаний вообще и проблеме НЕ-факторов в частности, я бы кратко отразил его так:

  • Направление от математики : оно необходимо и может стать очень плодотворным, если математика займется учетом НЕ-факторов на своей собственной территории (например, см. п.7.6), поскольку здесь и объекты исследования достаточно конкретны и терминологическое пространство совсем не fuzzy. От попыток математиков идти в качестве конкистадоров на новые материки стоит отказаться до того времени, когда на пересечении математики и нашей области накопится для этого достаточно опыта.
  • Направление от лингвистики вносит в инженерию знаний достаточно много работами в области лексической семантики, которая успешно продвигается от формализации смысла отдельных лексем к моделированию тезаурусных (или онтологических) подпространств. При этом чем дальше углубляется этот процесс, тем больше вовлекает прагматику и инженерию знаний.
  • Конечно, сама чистая инженерия знаний играет вполне продуктивную роль в узких предметных областях, требующих разработки достаточно детальных моделей. Но для этих моделей необходим высокоэффективные строительные технологии, и вот тут то пока прогресс сильно буксует.
  • Пока, как мне кажется, в первом и третьем направлении есть известная взаимодополнительность, хотя и требующая ювелирной тщательности и такта. Нечто похожее на серьезную рыбалку: большую рыбу вы на первых этапах обычно больше чувствуете, чем видите, а если и это и получается, то скорее виртуально из-за преломления и непрозрачности воды. Только удача и талант могут помочь тут нащупать и не потерять «контакт с объектом», не позволить ему сорваться и оставить вас с пустыми руками.
    Если вы ощущаете НЕ-фактор достаточно определенно, будьте особенно осторожны с выбором этикетки, чтобы она не увела вас в сторону и не помешала коллегам понять суть того, вокруг чего раскручивается исследование. Если же это скорее интуиция, то выбор этикетки обязан быть прецизионным, как выбор скальпеля хирургом: она должна стать вашим инструментом и помочь вам уточнить направление, а не создать помехи, мешающие его доопределению.
  • К этому последнему пункту я бы добавил еще одну важную составляющую, которую можно было бы продуктивно почерпнуть из всё-той же истории направления fuzzy. Поскольку наши знания базируются в основном на естественном языке, то очень важные и продуктивные факторы действительности, как правило, будут комплексными и нечеткими. В конце концов, на нижнем уровне детализации модели, они никак не обойдутся без строительного материала НЕ-факторов, но на этажах, более близких к общему смыслу и пониманию, они к НЕ-факторам могут прямого отношения не иметь, и такая детализация разработке может даже мешать. Как освоению бронзы могут мешать попытки спуститься на уровень модели атома. В качестве примера такого подхода можно привести работу [Ezhkova, 2004] .

На этом месте будем считать тему методологии пусть схематично, но обозначенной. Поскольку в теме этой статьи центральное место занимают НЕ-факторы, то для иллюстрации содержания этого понятия в нее придется включить их краткий обзор. Который разделен ниже на два раздела, один из которых посвящен Неточности, Недоопределенности, Неоднозначности и Нечеткости, а следующий за ним - Некорректности, Незамкнутости и Переопределенности.

5. НЕ-факторы – первая группа

5.1. Неточность и Недоопределенность.

Различию и взаимосвязи этих двух базовых НЕ-факторов немало место уделялось в нескольких моих публикациях, начиная с [Нариньяни, 1986]. Нет смысла излагать их подробно, - основное различие уже упоминалось выше, а суть этих отношений кратко сводится к следующему:

  • Оба они связаны с использованием интервала значений, что упрощает рассмотрение их содержательных различий;
  • Они не только имеют «внешнее сходство», но содержательно взаимосвязаны, переходя друг в друга на разных уровнях моделирования.

В связи с этим стоит напомнить, что:

  • Для всех НЕ-факторов, использующих интервал для представления их значений, он является не основным, а лишь наиболее наглядным частным случаем представления. В общем случае область значений этих НЕ-факторов является множеством А, и только если это область линейно упорядочена, интервал может интерпретироваться как аппроксимация ее подмножества А'⊆А, в котором содержатся все элементы А, находящиеся между нижним и верхнем элементами А'.
  • Определенные и точные значения, которыми оперирует традиционная математика, в реальных задачах являются исключением, поскольку и Неточность и Недоопределенность - факторы, присущие всем параметрам реальных объектов. Каждая переменная адекватной математической модели в общем случае должна быть одновременно и неточной и недоопределенной, т.е. обладать способностью уточняться, но до предела, заданного уровнем точности ее области значений.

Существенную роль при этом играет базис определения величины Неточности, поскольку многие ее виды связаны с ситуациями, при которых величина неточного параметра определяется совокупностью более частных значений, размер которых непредсказуемым образом меняется в некоторых пределах. Например, при определении размеров доски конкретная точка измерения толщины имеет одно значение и точность, а для всей доски или ее участка точность значения определяется разбросом более точных замеров в различных точках доски (участка).

5.2. Неоднозначность - с ущественно более сложный НЕ-фактор, использующий Недоопределенность как базовый компонент. Поскольку для Н-значения все его альтернативы рассматриваются как равнозначные, оно недостаточно наглядно для представления данных и знаний в когнитивном и\или коммуникативном контексте. Практически в каждом таком контексте, да и во многих прикладных задачах, всякое множество альтернатив может связываться с самыми различными оценками: желательность, возможность, правдоподобие, потребность, адекватность и т.п.

Таким образом, неоднозначное значение параметра Х включает текущее Н-значение, представляющее альтернативы возможных вариантов Х, и заданное на нем распределение оценки каждой из этих альтернатив. Т.е. формально оно представляется парой <Н-значение, распределение оценок>. При этом распределение и Н-значение тесно связаны между собой: стягивание Н-значения приводит к корректировке распределения и, наоборот, если распределение принимает значение ноль на какой-то из альтернатив, то она исключается из Н-значения и оно сокращается (уточняется).

Прагматика распределения в Неоднозначности зависит от содержания каждой из оценок, которые можно разделить на три группы:

  • адекватность каждой из альтернатив,
  • возможность / вероятность элементов выбора,
  • модальность оценок альтернатив (их желательности, допустимости, необходимости и т.п.).

Иначе говоря, в случае Неоднозначности мы имеем дело не с одним НЕ-фактором, а группой или даже пространством НЕ-факторов, сходных по форме ( Недоопределенность и распределение на ней), но могущих быть абсолютно различными по прагматике представляемых ими реальных факторов [Нариньяни, 2003]. И такой «групповой» НЕ-фактор демонстрирует одно из измерений проблемы: роли каждого из НЕ-факторов в общем комплексе могут быть весьма различными: от простых до все более сложных.

5.3. Что и демонстрирует сопоставление Неоднозначности с наиболее популярным НЕ-фактором Нечеткость (fuzzy), связываемой с лингвистической переменной Л.Заде [Заде 1965] . С одной стороны, Нечеткость явно принадлежит той же группе НЕ-факторов. С другой - концепция Нечеткости уже несколько десятилетий распространяется на всю область явлений Неоднозначности как единый и универсальный тип отражения явления fuzzy, без уяснения различий в прагматике тех или иных реальных НЕ-факторов, к которым она применяется, а также связи этой прагматики с конкретной коммуникативной и\или когнитивной ситуацией.

Я позволю себе опустить здесь критику функции принадлежности для Нечеткости, которая достаточное число раз мной уже обсуждалась в предыдущих работах. В контексте этой статьи нам будет полезнее оценить Нечеткость как пример коктейля направлений от математики и от лингвистики .

Своим введением понятий лингвистической переменной, нечеткого множества и функции принадлежности в 1965 году Л.Заде [Заде 1965] более сорока лет назад первым открыл проблемную область, которая в более широкой постановке отнесена здесь к Неоднозначности . Именно это является примером удачи в выборе объекта и этикетки, о которых говорилось выше, и именно поэтому здесь следовало быть особенно осторожным в дальнейшем развитии концепции fuzzy .

Но в данном случае интуиция подвела создателя, а эскиз формального аппарата показался настолько убедительно наглядным, что необходимость до-формального содержательного изучения только что открытой области как-то затерялась в азарте построения нового раздела математики. Лишь в небольшом числе из известных мне работ (например, [ Ежкова, Поспелов, 1977 ], [ Ежкова, Поспелов, 1978 ]) в центр ставилась зависимость функции принадлежности от прагматического контекста использования нечеткого понятия.

В конечном итоге сама концепция fuzzy оказалась не только ошибочной, но даже вредной (пусть история науки простит мне это святотатство!). У дачный образ, заслонивший так и не исследованное «белое пятно», превратился в свою противоположность, в некую панацею, которую адепты этого аппарата использовали и продолжают использовать как святую воду для решения всех проблем в области плохо формализуемых знаний. Фанатично, в сотнях тысяч публикаций, не обращая никакого внимания на их содержательное разнообразие. Объем затраченных усилий, времени и расходов оценить просто невозможно, равно как реальный и моральный вред от применения этой панацеи направо и налево.

Насколько это можно заключить из дискуссии в специальном номере журнала «Новости искусственного интеллекта» [Круглый стол 2001], с большим опозданием ведущим специалистам этого направления становится все более ясно, что оно себя исчерпало, не оправдав надежд, возлагавшихся на него все истекшие десятилетия его кипучей истории.

6. НЕ-факторы – вторая группа

6.1. Некорректность была определена в п.2.3 как группа НЕ-факторов, к которой относятся эффекты, при­водящие к возникновению ошибок, искажений и противоречий в когнитивных и коммуникативных процессах, а также, естественно, в их моделировании в системах обработки данных \ знаний. К этой группе я отнес три типа НЕ-факторов, связанных со следующими нарушениями корректности:

  • недостоверность информации, т.е. ошибки и искажения в поступающих данных \ знаниях,
  • нарушения в формулировке (описании) задачи,
  • ошибки системы обработки данных \ знаний, связанные как со случайными помехами в процессе обработки, так и с ошибками, встроенными в используемую СЗн, включая правила вывода и/или вычислений; в частности, такие как: ошибки интер­претации входной информации; ошибки аппроксимации, связанные с огруб­лением объектов описания и отношений между ними в системе обработки по сравнению с их “реальной” сложностью.

Каждый из перечисленных типов носит комплексный характер и частично связан с другими НЕ-факторами, в частности, и с уже упомянутыми выше. Поэтому аппарат представления знаний должен включать средства контроля достоверности информации и заключений, правильности модели и т. д., учитывающие возможность всех вариантов Некорректности .

В следующих разделах кратко рассмотрены два варианта Некорректности, связанных соответственно с использованием не всюду определен­ных функций и с возможностью противоречий при определении значений переменных. Обсуждаемые ниже Незамкнутость и Переопределенность являются лишь примерами базовых НЕ-факторов этой группы и ни в коем случае ее не исчерпывают.

6.2. Незамкнутость. Рассмотрим формальную систему Q = ( A , F ) , где A область значений, а F – множество операций над А, включающее не всюду определенные операции. Если n -местная операция f F не является всюду определенной, то для нее существуют такие n-ки элементов из А, для которых значение f не определено. Вид Некорректности, возникающий в результате использования не всюду определенных операций, был назван Незамкнутостью .

Контроль Незамкнутости можно представлять как расширение Q ' исходной системы Q добавлением к А нового значения, которое по установившейся традиции называется абсурдом и обозначается Ab . При этом расширение области значений системы Q ', обозначаемое A ' равно A ∪Ab , а операции Q' являются расширения­ми операций из Q, сохраняющими свои значения на А там, где они были определены в Q, и получающие значение Ab на тех n-ках значений из А', на которых они определены не были.

Естественно, что переход к “абсурдному” расширению может потребовать несколько раз­ных значений “абсурд”, отражающих разные ситуации Незамкнутости в Q как модели реальности.

Возможно, что при расширении Q' не все операции в Q' будут на А' всюду определенными . В таком случае возникает необходимость во введении “абсурдов” второго уровня для контроля незамкнутых ситуаций в системе Q' первого уровня. Если, в свою очередь, соответствующее расширение Q'' для системы Q' попадает в ту же ситуацию незамкнутости, то это требует создания расширения Q''' и т. д.

Таким образом, добавляя на каждом очередном уровне те или иные значения “абсурд”, мы порождаем концентрическую систему формальных аппаратов, последовательно расширяю­щихся по способности справляться с незамкнутыми ситуациями в ис­ходной системе Q. При этом любой из таких аппаратов может расширяться в разных направлениях в зависимости от того, с какими случаями незамкнутости и как именно должно справляться следующее расширение.

Поскольку никакая реальная формальная система не может быть замкнутой, то концентрические системы контроля можно встретить повсюду. Более подробно Незамкнутость рассматривалась в моих предыдущих публикациях по тематике НЕ-факторов.

6.3. Переопределенность. Другим источником проявления Некорректности в Системе знаний является возникновение противоречий, связанных с присвоением одной переменной взаимоисключающих зна­чений из двух или более источников (вывод, вычисления, сообщения по различным каналам и т. д.). Например, из одного источника следует, что х = а, а из другого, что х = b, причем a и b - несовместимы . Такая ситуация может быть исключительной и служить поводом для «абсурдного» расширения, но может рассматриваться и как регулярный НЕ-фактор в конкретной СЗн.

При этом формальным отражением его в значении параметра х становится такое же множество альтернатив как при Недоопределенности. Однако, в некотором смысле по своей сути эти два НЕ-фактора “противоположны” — в нашем примере выражение x = {a, b} будет отражать Переопределенность значения переменной x .

Таким образом, включение Переопределенности в формальную систему требует такого же расширения, как и при Недоопределенности. Однако при этом Недоопределенность и Переопределенность сходны только по форме, но совершенно различны по су­ществу, и ни в коем случае не должны смешивать­ся при использовании в формальной системе “на одном и том же уровне”.

Прежде чем перейти к конкретному примеру, стоит обратить внимание на то, что так же как и Недоопределенность, Переопределенность может служить базой Неоднозначности, в частности, распределение оценок может при этом определять релевантность, правдоподобие, надежность и т.п. конкурирующих значений.

6.4. Выше в п.4.1 в качестве отрицательного примера подхода от математики уже упоминалась четырехзначная логика L 4 Н.Белнапа [Белнап, 1981]. В этом качестве она уже неоднократно рассматривалась мной [Нариньяни, 1986] как образец ошибки при введении Недоопределенности и Переопределенности совместно в класс логических значений. Поскольку в публикациях других авторов логика L 4 продолжает приводиться в качестве эталона многозначности, моделирующей НЕ-факторы, здесь мне придется ниже еще раз напомнить, почему она таковой быть не может.

Логика L 4 определяется Н.Белнапом на классе {Т, F, BOTH, NONE }, где Т и F — классические значения истинности, BOTH — это значение, о котором известно, что оно является одновремен­но Т и F ( переопределено ), a NONE — значение, о котором еще ничего неизвестно, т.е.оно недоопределено, и конечно, по умолчанию тоже является множеством {Т, F} только с другой прагматикой, чем BOTH .

Типичный пример дурного влияния лексики: пустота NONE обманчива: в данном случае Н.Белнап ошибочно принимает NONE за пустое подмножество истинностных значений, которое в этом контексте никакого смысла иметь не может. Такое смешение различ­ных компонентов приводит автора к определениям логи­ческих связок, неестественным с точки зрения его же со­держательной интерпретации значений BOTH и NONE .

Логики с несколькими значениями могут быть при их аккуратном конструировании аппаратом для совместного моделирования нескольких НЕ-факторов, примером чего может служить правильное совмещение Недоопределенности и Переопределенности в четырехзначной логике . В качестве другого примера можно рассмотреть взаимодействия НЕ-факторов Переопределенность, Незамкнутость и Недоопределенность . Поскольку переопределенное значение BOTH является ситуацией абсурда для классической двузначной логики, то логика на классе {Т, F, BOTH } может быть ее абсурдным расширением. Соответственно можно рассматривать Н-расширение этого абсурдного расширения {Т, F, BOTH, NONE, А1, А2, А3}, где NONE, А1, А2 и А3 – различные Н-значения на множестве {Т, F, BOTH}: NONE = {Т, F}, А1 = {Т, BOTH}, А2 = {F, BOTH}, А3 = {Т, F, BOTH} .

7. Необозримость

7.1. При упоминании в п.2.3 фактор Необозримости того или иного компонента СЗн определялся как недостаточность текущей суммы знаний об этом компоненте, не позволяющей эффективно использовать их для проверки адекватности этих знаний и использования их для решения практических задач.

Понятно, что Необозримость как термин может относиться к объектам изучения, которые:

  • либо находятся для нас за границей знания,
  • либо слишком фрагментарны и нечетки, так что сам факт их существования недостаточно ясен и они еще не доопределились как понятийное целое,
  • либо достаточно адекватны, но не полны настолько, чтобы решать ту или иную задачу,
  • либо слишком сложны, чтобы совокупность знаний о них была достаточной для их адекватного представления в теории, на практике или в компьютере.

Уже из этого списка следует, что Необозримость не является одним конкретным НЕ-фактором, а представляет собой мета НЕ-фактор, отражающий обобщенное качество компонента Системы знаний, которое:

  • Может характеризоваться «вертикалью» уровней Необозримости, определяющих различную степень проработки модели объекта (знаний о нем), и
  • Совокупность НЕ-факторов, сочетание которых является источником Необозримости данного уровня.

Пока мы находимся в начале пути уточнения, расширения и детализации типологии Необозримости, которая определяется сочетанием причин отнесения объекта к этой категории. Результаты первых попыток автора в этом направлении отражены в публикациях [Нариньяни, 2007а,б], где пока речь шла только об уровнях Необозримости объектов моделирования.

Стоит отметить, что хотя к необозримым сущностям могут относится объекты разного масштаба, но особое место здесь занимают мега объекты, размерность и\или сложность которых предельно велика. При этом некоторые мега объекты могут быть на максимуме Необозримости, в то время как другие до определенной степени неплохо изучены структурно, - например, организм и естественный язык довольно детально описаны морфологически. Тем не менее, до создания полноценных «живых» моделей и того и другого еще далеко, и соответствующие проблемы остаются пока фактически необозримыми.

7.2. Выстраиваемая типология Необозримости пока очень схематична. Однако ее рассмотрение позволяет предположить, что по мере развития она может послужить базой для выделения целого комплекса новых НЕ-факторов. Которые, в сочетании с уже известными НЕ-факторами, смогут более полно отражать специфику обсуждаемых явлений и использоваться при создании подходов к решению части необозримых задач.

На данном этапе мы ограничились разделением Необозримости на зоны и группы, которых удалось наметить пока пять:

  • Необозримость за пределом знания,
  • Необозримость в зоне «тени» между знанием и незнанием,
  • Необозримость «на краю» Системы знаний,
  • Необозримость при неполноте модели,
  • Необозримость при неполноте данных.

В свою очередь эти зоны были разделены на примерно десять более конкретных типов или уровней Необозримости . При этом совершенно очевидно, что этот набросок, хотя и обозначает пространство понятия Необозримость, однако пока не выводит само это понятие за рамки средней зоны уровней Необозримости.

Тем не менее, поостренная «вертикаль» Необозримости позволяет иллюстрировать этапы развития различных компонентов Системы Знаний, которые проходили все этапы от «полного отсутствия» до того уровня сочетания Необозримости и обозримости, которое они достигли сегодня. Сама концепция Необозримости представляется одной из ключевых для обобщения представления о Системе знаний, и я планирую посвятить ей более подробное рассмотрение в ближайшей публикации, которая в данный момент уже закончена и краткую аннотацию которой представляет данный раздел.

7.3. Однако, сказанное выше представляет Необозримость исключительно как мета НЕ-фактор, отражающий обобщенное качество компонента Системы знаний. Далее мы приведем несколько примеров его связи с конкретными типами НЕ-факторов Недоопределенности и Неточности.

Комплексная с вязь Необозримости с системой НЕ-факторов и, в частности, с Недоопределенностью и Неточностью, остается пока открытой.

Однако можно отметить, что если Н-модель содержит число отношений, намного меньшее, чем число связанных ими переменных, то обычно (хотя и не обязательно) пространство ее решений будет настолько широко, что описываемое этой Н-моделью пространство решений может считаться необозримым. Т.е. часть наших знаний об объекте моделирования обозрима и даже организована в модель, но в целом и полная модель и сам объект необозримы (зона Необозримость при неполноте модели ). Другими словами, чем больше недоопределенность самой модели, тем менее обозрима моделируемая система.

Конкретизация связи Необозримости с Недоопределенностью будет обсуждаться ниже для двух типов Н-переменных: Н-множества и традиционной алгебраической Н-переменной.

7.4. Рассмотрим возможный вариант необозримой переменной отталкиваясь от определения Н-множества. Напомним, что н едоопределенное (частично известное) множество A представляется четверкой A = < Аu, A+, A, M >, где

Аu – все потенциальные элементы ( универсум ) множества А;

A+ – множество элементов Аu, которые точно принадлежат А;

A– множество элементов Аu, которые точно не принадлежат А;

М – мощность Н-множества А, представленная недоопределенным целым числом.

Естественно, что с уточнением А количество элементов в A+и A может только возрастать. При этом с оставляющая А u играет ключевую роль как для прикладных использований аппарата Н- множеств, так и для проекции на него понятия Необозримости.

При моделировании может оказаться, что сам универсум Аu тоже недоопределен, т.е. не все его элементы известны. В этом случае, возможность доопределения Н-множества А, т.е. пополнения его составляющей A+, становится проблематичной, разделяясь как бы на два уровня:

(а) уточнение А при фиксированном недоопределенном универсуме Аu за счет известной части универсума Аu (обозначим Аu+ );

(б) уточнение А за счет уточнения универсума Аu, т.е. пополнения множества Аu+.

Необозримость подобного множества с «двухуровневой недоопределенностью» связана с отсутствием информации как на уровне (а) о том, какая часть неизвестных элементов А относится к Аu+, так и на уровне (б) насколько восполнима неизвестная часть универсума Аu. При этом существенна роль составляющей универсум универсума Аu (обозначим Аuu), которая может быть

  • определена и в этом случае Аuu может исполнять функции универсум Аu, хотя и при потере эффективности процесса автоматического вывода с использованием Н-множества А в виду большей размерности Аuu по сравнению с Аu;
  • недоопределена, что ведет к «трехуровневой недоопределенности», включающей систему трех последовательно вложенных универсумов: Аu, Аuu и универсума универсума Аuu;
  • неопределена вообще, что будет означать, что универсум А u пополняется элементами, о которых неизвестно ничего, т.е. которые берутся как бы «ниоткуда», точнее из пространства незнания (например, открытие новых видов небесных тел или субатомных частиц или качественно новых веществ и т.п.).

Таким образом, Н-множество работает в случае ограниченного контекста, достаточно определенной модели и достаточных полных данных. Как только эти условия нарушаются, Н-множество достигает границ обозримости и переходит их.

7. 5. Применим тот же метод для определения границы Необозримости Н-расширения традиционной переменной.

Напомним, что для традиционной переменной x с областью значений Х, существует ее Н-расширение x* с областью значений 2Х, т.е. множеством всех непустых подмножеств области Х .

Если недоопределена сама область значений Х, то часть возможных значений х известно, а часть – нет. В этом случае, Х представимо Н-множеством, т.е. определяется четверкой u, Х+, Х, MХ>.

По аналогии с универсумом Аu Н-множества универсум Х u может быть:

  • определен; в этом случае Х можно заменить на Хu, хотя при этом переменная х, а, следовательно, и ее Н-расширение х*, могут оказаться определенными не на всем множестве Хu; это означает, что такая замена ведет к необходимости построения других типов как для соответствующего расширения переменной х, так и для расширения ее Н-расширения х*; ограниченные рамки этой статьи не позволяют заняться здесь рассмотрением этих новых типов и их возможной связи с границами необозримости традиционной Н-переменной;
  • недоопределен; такое положение приближается к необозримости переменной х, поскольку мы
    (а) не знаем всех значений Х, на которых х определена, и
    (б) не знаем всех кандидатов на место неизвестных значений Х, в связи с чем такая «двухуровневая недоопределенность» ограничивает применимость переменной х, причем это ограничение может варьироваться от минимального (в Х неизвестно мало значений, в пределе, одно) до максимального (и в Х и в Х u известна только небольшая часть элементов);
  • неопределен вообще, что означает, что Х также пополняется элементами, которые берутся «ниоткуда»; естественно, что в этом случае для х необходимо создать новый тип переменной, который на известных элементах Х+ совпадал бы с х, а неизвестные значения Х заменялись бы неким дополнительным значением, которое представляло бы любое из неизвестных; при этом операции и отношения для типа х должны были бы быть переопределены для нового типа.

7. 6. Наконец, если выше мы обрисовали границы Необозримости в связи с Недоопределенностью множества и алгебраической переменной, то для большей полноты картины к ней стоит добавить пример взаимосвязи Необозримости с Неточностью.

В качестве наиболее простой и очевидной иллюстрации может служить накопление ошибки вычислений. Действительно, значение любой континуальной переменной представляется в компьютере неточно из-за округления в связи с ограничениями размерности машинного представления числа. Поскольку эта неточность по ходу выполнения программы возрастает, то при достаточной сложности вычислительного алгоритма размерность округления может существенно исказить результат и даже привести к его полной неадекватности, т.е. сделать объект моделирования необозримым. Естественно, такая ошибка свойственна не только компьютерным вычислением, но и любым достаточно сложным расчетам, поскольку адекватное представление континуального значения в общем случае просто невозможно, а, следовательно, через любое округление ведет к Неточности, накоплению ошибки и смещению результата от корректного.

Если приведенный пример касается роли в Необозримости неточного значения, то для наглядности связи этих НЕ-факторов можно перейти к неточности Картины Мира, т.е. Системы знаний.

Действительно, любое отражение той или иной части реальности в СЗн всегда упрощено, поскольку является ее аппроксимацией, достаточной для удовлетворительного решения связанных с ней задач: «понимание» и «объяснение», прогноз поведения и предсказание последствий, определение нужной реакции и т.п.

Текущего уровня этой аппроксимации реальности нам обычно хватает и для практики и для теории. Но сложность мира растет и наша СЗн обнаруживает все новые точки неадекватности. То, что еще вчера представлялось истиной, сегодня может оказаться либо концептуальной ошибкой либо устаревшим упрощением, требующим радикального пересмотра.

До середины 19го века в неточность обозримой Картины мира прекрасно вписывалась геометрия Эвклида с идеей прямой, отраженной в ее аксиомах. Равно как и до начала 20го века законы механики Ньютона были естественны и несомненны. Однако за последние полтора века Картина мира изменилась настолько, что вышла в пространство Необозримости и неточность классической Системы знаний стала нерелевантной и несовместимой с новыми масштабами реальности. Для преодоления Необозримости расширившейся действительности потребовалась Неточность с другим набором аксиом, при котором прежние стали узким частным случаем, а наиболее актуальные задачи стали концептуально обозримыми.

К примеру этой смены Неточности аксиом стоит добавить отношение неопределенности Гейзенберга: между точностью, с которой одновременно может быть установлено положение частицы, и точностью ее импульса существует определенное соотношение [Гейзенберг, 1934]. Автор этого отношения сформулировал эту смену Неточности прямым текстом: специфическая неточность, обусловленная соотношением неопределенности, в классической физике отсутствует [Гейзенберг, 1963].

8. НЕ-факторы как система

В прежних публикациях в качестве метафоры упоминалось сравнение только начинающего формироваться комплекса НЕ-факторов с некоторым подобием таблицы Менделеева. И если система элементов физического мира включает множество аспектов структурирования самого разного уровня, таких как металлы , неметаллы , лантаноиды , актиноиды , инертные газы и др., то уже сейчас очевидно, что будущая «периодическая система элементов знаний» может оказаться гораздо более многомерной, поскольку должна обслуживать все многообразие форм знаний в нашей быстро усложняющейся Картине Мира.

Проведенный выше беглый обзор показал, что начинающий складываться комплекс НЕ-факторов пока можно скорее сравнить с тем минимумом элементов, который был известен во время перехода от алхимии к химии. На данном этапе мы имеем лишь некоторую коллекцию отдельных примеров НЕ-факторов, в которой еще не видны очертания всей системы, но уже возможна некоторая попытка классификации, разделяющей эти НЕ-факторы на следующие «страты»:

  • базовые НЕ-факторы, например, Недоопределенность или Неточность,
  • системные факторы, например, Неоднозначность, представляющие совокупности базовых НЕ-факторов, сходных по структуре формальных аппаратов, но достаточно различных по своей прагматике; в качестве системного фактора должна была бы выступать и Нечеткость, но этому помешала ошибочная попытка сделать из нее универсальный базовый НЕ-фактор,
  • классификаторы (например, Некорректность ), определяющие множества НЕ-факторов, различных не только по прагматике, но и по моделируемым ими явлениям, но относимым к одному классу по их роли в Системе Знаний,
  • мета факторы, представленные в этой работе Необозримостью, определяющий градации границы между знанием и незнанием.

Это разделение на страты отражает одну намечающуюся проекцию концепции НЕ-факторов. Однако есть и совсем другая (или другие), отраженная в попытке исследования пространства между Знанием и Незнанием [Нариньяни, 2006], в которой взаимосвязь этих проекций пока не обозначилась, хотя она, как представляется, обязательно имеет место.

Заключение

В этой работе была сделана попытка совместить в кратком обзоре проблематики НЕ-факторов несколько взаимосвязанных задач:

  • очередной раз уточнить определение термина и его места в инженерии знаний,
  • отразить текущее видение структуры этого комплекса и взаимосвязей его составляющих, и
  • охарактеризовать сегодняшнее состояние работ по данной теме и три методологических подхода, которые конкурируют на мало еще исследованной территории НЕ-факторов.

С одной стороны сегодня достаточно очевидно, что развитие инженерии знаний осознало важность теоретических работ в этой области, которая становится ключевой в области ИИ. Это понятно, поскольку опыт прикладных технологий доказывает, что игнорируя НЕ-факторы, мы расплачиваемся за это и отсутствием подходов для большинства реальных сложных задач, и потерей качества решений, там где они возможны, и уверенности (часто неосознаваемой) в их адекватности.

С другой стороны, становится все более ясно, что традиционная математика, которая в настоящее время используется в качестве основного инструмента для решения практических задач, сама весьма далека от адекватности. По сложившейся традиции она ищет подходы к представлению знаний «от формальных конструкций», а не в естественном направлении – от реальных знаний к их теоретической модели. И в результате ее возможности остаются в замкнутом пространстве манипуляций с формальными объектами, которые, как правило, слишком абстрактны и плохо отражают сложную прагматику реальности. Чем более сложные модели и алгоритмы она строит, тем более запутанными и недоступными для оценки становятся наслоения различных типов некорректности, вызываемой игнорированием так или иначе участвующих в этом процесс НЕ-факторов.

Вряд ли стоит сомневаться в том, что учесть полностью «эффект присутствия» НЕ-факторов в нашей Системе знаний невозможно в принципе. Однако их исследование и классификация, а так же формализация тех НЕ-факторов, которые ей в той или иной степени поддаются, позволяет существенным образом дополнить СЗн и расширить возможности и математики и систем представления знаний в их основной функции, - естественном отражении действительности и решении реальных задач.

Примечание

1.Ле'ксика — раздел науки о языке , изучающий значения слов . Также под этим словом понимают совокупность слов того или иного языка , части языка или слов которые знает тот или иной человек или группа людей. Лексика является центральной частью языка, именующей, формирующей и передающей знания об объектах реальной действительности. Лексика современного русского языка состоит более чем из полумиллиона слов. (Википедия)

Литература

  1. [Гейзенберг, 1963] Гейзенберг В. Физика и философия. М., ИЛ, 1963.
  2. [Гейзенберг, 1934] Гейзенберг В. Развитие квантовой механики. В кн. Гейзенберг В., Шредингер Э., Дирак П. А. М. Современная квантовая механика. Три нобелевских доклада. М., ГТТИ, 1934, с. 13 – 35.
  3. [Заде 1965] Л.Заде. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976
  4. [Тыугу 1970] Тыугу Э. Х . Решение задач на вычислительных моделях. — ЖВМ и МФ, 1970, т. 10, № 3.
  5. [Ежкова, Поспелов, 1977] Ежкова И.В., Поспелов Д.А. Принятие решений при нечетких основаниях. 1. Универсальная шкала. // Изв. АН СССР. Техн. кибернетика, 1977 ­№ 6 С. 3 - 10.
  6. [Ежкова, Поспелов, 1978] Ежкова И.В., Поспелов Д.А. Принятие решений при нечетких основаниях. 2.Схемы вывода. // Изв. АН СССР. Техн. кибернетика, 1978 ­№ 2 С.53 - 11.
  7. [Нариньяни, 1980] Нариньяни А.С. Недоопределенные множества - новый тип данных для представления Знаний. // Препр. ВЦ СОАН СССР № 232, 1980
  8. [Белнап, 1981] Белнап Н. Как нужно рассуждать компьютеру. — В кн.: Логика вопросов и ответов. М.: Мир. 1981.
  9. [Нариньяни, 1982] Нариньяни А.С. Недоопределенные модели и операции с недоопределенными значениями. - Препринт ВЦ СО АН СССР, N 400, 1982.
  10. [Нариньяни, 1986] Нариньяни А.С. Недоопределенность в системах представления и обработки знаний // Изв. АН СССР. Техн. кибернетика, 1986. ­№ 5. – С. 3 – 28.
  11. [Нариньяни, 1994] Нариньяни А.С. НЕ-факторы и инженерия знаний: от наивной формализации к естественной прагматике В сб. ”Труды IV Национальной конференции “Искусственный Интеллект'94”.v.1, Рыбинск 1994
  12. [Нариньяни, 2000] Нариньяни А.С. НЕ-факторы: неточность и недоопределенность - различие и взаимосвязь. // Изв. РАН, Теор. и сист. упр. - 2000.- N.5. - с.44-56.
  13. [Круглый стол 2001] Круглый стол «Нужны ли функции принадлежности в будущей теории нечетких множеств?» // Новости искусственного интеллекта. N 2 – 3, 2001, стр. 28 – 36
  14. [Вагин 2002] Вагин В.Н. Знания в интеллектуальных системах. Новости искусственного интеллекта. N 6 (54) 2002, стр. 8 – 18
  15. [Нариньяни, 2003] Нариньяни А.С. НЕ-факторы: неоднозначность (до-формальное исследование). Новости искусственного интеллекта. - 2003, NN 5и 6
  16. [Нариньяни, 2004] Нариньяни А.С. НЕ-факторы 2004. В сб. ”Труды IX Национальной конференции по Искусственному Интеллекту - КИИ?2004» . Тверь 2004
  17. [Нариньяни, 2004\06] Нариньяни А.С. НЕ-факторы: краткое введение.// Новости искусственного интеллекта. - Вып.2/2004. -М: КОМКНИГА,2006 , стр. 52 – 63
  18. [Валькман, 2004] Валькман Ю.Р. Моделирование НЕ-факторов: основа интеллектуализации компьютерных технологий. // Там же, стр. 64 - 81
  19. [Рыбина, 2004] Рыбина Г.В. Приобретение знаний, содержащих НЕ-факторы. // Там же, стр. 82 - 94
  20. [Тарасов, 2004] Тарасов В.Б. Логико-семиотический подход к моделированию НЕ-факторов в теории агентов. // Там же, стр. 95 - 114
  21. [ Ezhkova , 2004] Irina Ezhkova. The Principles of Cognitive Relativity , Rationality and Clarity. Cybernetics and Systems, Taylor &Francis, vol.35, 2-3:229-258, 2004.
  22. [Нариньяни, 2006] Нариньяни А.С. Между Знанием и Незнанием – Наивная Топография 2. Искусственный интеллект: междисциплинарный подход. ИИнтеЛЛ. М. 2006. сс. 49 - 74
  23. [Нариньяни, 2007а] Нариньяни А.С. Вычислительная математика и необозримость реальности. Материалы Междунар. Научной конф. «Философия математики, актуальные проблемы», МГУ им. М.В.Ломоносова, М. Издатель Савин С.А. 2007. СС. 45 – 49.
  24. [Нариньяни, 2007б] Нариньяни А.С. Моделирование необозримой системы. Тр. 9-й междунар. конф. «Проблемы управления и моделирования в сложных системах»– Самара: Самарский научный центр РАН, 2007
  25. [Нариньяни, 2007в] Нариньяни А.С. Введение в недоопределенность, Приложение в журналу Информационные Технологии, N 4, 2007, 32 с.

Статья помещена в музей 4.07.2008 года