Прогнозирование в науке на основе использования ассоциативной фактографической информационно- логической системы

Китов А.И.

Для прогнозирования науки необходимо прежде всего иметь достаточно полные сведения о текущем состоянии науки в форме, допускающей быстрый поиск данных по признакам, обновление, систематизацию и классификацию данных. Это может быть достигнуто на основе использования информационно-логических машин, хранящих в своих запоминающих устройствах необходимые данные вместе с отсылками к другим данным (адресами связи), показывающим внутренние смысловые связи и структуру классификации информации.

Подобные системы, предназначенные для накопления фактографических данных о различных объектах (веществах, материалах, приборах, исследованиях, болезнях и т. д.) и выдачи по запросам как адресов первичных источников информации (документов, статей, отчетов и др.), так и конкретных фактических сведений, которые могут использоваться потребителями без дополнительных обращений к первичным источникам, мы будем называть сокращенно АФИЛС.

Учитывая большие объемы информации, подлежащей хранению и узкоспециальный характер задач прогнозирования развития науки, целесообразно создавать АФИЛС для узких разделов знаний с тем, чтобы они содержали максимально исчерпывающие, точные и достоверные данные по данному разделу. Естественно, что каждая отдельная АФИЛС может содержать необходимые отсылки к другим специализированным АФИЛС; таким образом будет получаться система АФИЛС, охватывающих все более широкие области науки и техники. Таким путем может быть осуществлен постепенный переход к машинному накоплению, отбору и систематизации всех научных знаний, приобретенных человечеством и содержащихся сейчас в виде различных письменных материалов. В связи с непрерывным развитием науки АФИЛС должны строиться по гибкому принципу, допускающему непрерывное изменение систем классификации систем связей (отсылок) и состава терминологических словарей.

Основу программной реализации АФИЛС составляют ассоциативные поисковые деревья, ассоциативные узловые структуры и фактографические формуляры объектов, обеспечивающие быстроту поиска, удобство ввода, накопления и вывода данных, возможность построения гибких перекрестных связей и многоаспектную классификацию и поиск данных.

В отличие от библиографических поисковых систем, в которых поисковый массив образуется из поисковых образов документов, содержащих минимально необходимый для поиска набор дескрипторов и не содержащих, как правило, основной фактической информации, имеющейся в документах, в АФИЛС должна содержаться основная фактическая информация о данном объекте, собранная из разных источников. При этом вместо краткого индексирования рефератов, применяемого при пополнении библиографических систем, наполнение АФИЛС должно идти по пути тщательного изучения первичных документов специалистами и отбора из них ценной информации. Для ввода в АФИЛС эта информация должна соответствующим образом подготавливаться.

Таким образом, наполнение информацией АФИЛС в отличие от наполнения информацией библиографических поисковых систем будет представлять собой трудоемкий процесс, требующий творческого участия квалифицированных специалистов.

При вводе каждого нового сообщения в АФИЛС эти специалисты должны запрашивать, как правило, АФИЛС о наличии в ней аналогичных данных, сопоставлять новые сведения с уже имеющимися в АФИЛС, производить необходимые корректировки в старых сведениях, а новые данные вводить с учетом того, что уже имеется в системе. В будущем, по-видимому, значительную часть такой работы по сопоставлению и корректировке данных сможет выполнять сама АФИЛС (используя методы эвристического программирования и синтаксического анализа).

Таким образом, АФИЛС должна представлять собой комплексную человеко-машинную информационную систему, в которой функции творческого анализа, отбора и оценки информации выполняются человеком (во всяком случае, в ближайшем будущем), а функции накопления, хранения, поиска, систематизации и обработки информации выполняются машиной.

За счет того, что около машины для ее наполнения информацией постоянно будет работать коллектив квалифицированных специалистов, в машине будут накапливаться в систематизированном виде полные, точные и свежие данные по соответствующим разделам знаний, и этой информацией смогут оперативно пользоваться все заинтересованные учреждения и предприятия страны. Это должно обеспечить резкое повышение эффективности научно-исследовательских и опытно-конструкторских работ, за счет правильного определения основных направлений развития науки и техники, выявления пограничных областей, в которых возможны наиболее крупные и принципиальные открытия, а также за счет своевременного выявления бесперспективных исследований.

Общая структура и порядок работы АФИЛС представляется следующим образом.

АФИЛС должна включать в себя 5 основных частей:

1. Классификатор основных разделов соответствующей области знания, определяющий состав основных разделов АФИЛС и общую схему классификации объектов в рассматриваемой области. В качестве основы такого классификатора может быть принят, например, для области технических наук, классификатор промышленной продукции (его высшие группировки), который должен быть дополнен теоретическими разделами (методы обработки информации, алгоритмы и программы, методы проектирования и расчета схем, устройств и систем, методы нахождения оптимальных решений, сетевое планирование, методы моделирования, алгоритмические языки и программирование, теория информационно-логических систем и т. д.).

Подобные классификаторы, составляемые априорно, т. е. заранее, до поступления в систему данных о конкретных объектах, должны отражать общую структуру знаний в данной отрасли и явиться основой для построения ассоциативного словаря понятий (определений), который должен строиться автоматически в системе, по мере ввода в систему информации о конкретных объектах. Упомянутый ассоциативный словарь понятий будет представлять собой достаточно полную, детальную и гибкую систему классификации понятий, отражающую реальные соотношения между свойствами объектов данной области науки.

В общем случае каждая специализированная АФИЛС будет иметь несколько таких априорных классификаторов, которые будут соответствовать различным аспектам классификации данного раздела науки или техники. Например, кроме упомянутого выше классификатора продукции промышленности, построенного в основном по принципу назначения продукции, можно иметь еще классификаторы, построенные, например, по принципу действия или природе физических процессов, а также по конструктивным характеристикам изделий (габаритам, весовым данным и т. д.).

2. Вторым элементом каждой АФИЛС должен быть словарь терминов или дескрипторный словарь. Словари терминов должны строиться на основе соответствующих классификаторов; все наименования разделов и подразделов классификаторов должны входить в качестве дескрипторов в соответствующие словари.

В дальнейшем, по мере поступления в систему данных о конкретных объектах, словари терминов должны пополняться новыми терминами или новыми понятиями (определениями).

Терминологический словарь для удобства пользования целесообразно строить в виде ряда специализированных узких словарей, относящихся к узким разделам данной области науки и техники. Кроме того, необходимо будет иметь один сравнительно небольшой словарь общетехнических терминов. При этом каждый потребитель может иметь у себя только общий словарь и один (или несколько) частных словарей по своей специальности.

Следует заметить, что повсеместное распространение этих словарей и их обязательное использование для работы с АФИЛС должно привести также к стандартизации терминологии в соответствующих областях науки и техники, что само по себе имеет большое значение для обмена научно-технической информацией. В машине же все дескрипторные словари будут храниться в виде единого словаря.

Помимо того, что терминологические словари будут служить для образования в машине ассоциативного словаря понятий, эти словари необходимы для точного и однозначного перевода (автоматического или ручного) словесных определений свойств объектов или содержания документов и запросов в коды машинных наименований (основных символов машинного языка). Этот перевод нужен: а) для включения каждого нового объекта в соответствующие подразделения классификации по машинному ассоциативному словарю понятий; б) для определения нужных подразделений классификации, в которых должен производиться поиск объектов по данному запросу.

3. Третьим элементом АФИЛС, ее основной информационной частью, должен явиться массив фактографических данных. Этот массив должен состоять из двух частей:

а) совокупности машинных формуляров объектов;

б) совокупности первичных и вторичных документов об объектах.

Под объектом следует понимать любой предмет, по которому может храниться информация в системе (вещество, материал, прибор, деталь, схема, машина, исследование, явление, метод расчета, процесс, алгоритмы и т. д. Для каждого объекта в АФИЛС должен быть один формуляр и может быть один или несколько документов.

С точки зрения порядка работы АФИЛС всю информацию об объектах удобно разделить на две части: оперативную и дополнительную. Оперативная информация включает в себя основные характеристики и свойства объекта, знание которых требуется для использования данного объекта. Эта информация записывается в формуляре.

Дополнительная информация содержит все дополнительные сведения (в том числе схемы, чертежи, фотографии и т. д.). Эта информация хранится вне АФИЛС, например, на микрофильмах, в виде печатных материалов и т. п. В АФИЛС объем хранимой оперативной информации будет достаточно велик, и в большинстве случаев запросы потребителей должны удовлетворяться без обращения к дополнительной информации.

4. Четвертым элементом АФИЛС является совокупность средств программной реализации процессов накопления, поиска и обработки информации. Сюда прежде всего относится система ассоциативного программирования задач классификации и поиска данных, а также ввода, выборки и выдачи фактических данных. Основу ассоциативного программирования составляют ассоциативные поисковые деревья и ассоциативные узловые структуры. Для формальной машинной записи и преобразований семантической информации о свойствах и характеристиках объектов используется специальный язык и методика ассоциативного программирования.

Ассоциативное программирование — это совокупность способов решения информационно-логических задач, основанных на программной реализации ассоциативных связей между данными, хранящимися в памяти электронных цифровых вычислительных машин. В иностранной литературе этот раздел программирования ЭЦВМ известен под названиями: списковая обработка данных, узловой способ организации данных, способ цепной адресации, метод управляющих слов. Ассоциативное программирование применяется при логической обработке информации о различных объектах, состав и количество которых меняется в процессе решения, когда заранее невозможно определить размеры данных различных видов и произвести точное распределение объема памяти машины.

Характерной особенностью задач, решаемых с помощью АФИЛС, является большой объем данных и частое применение процедур поиска или классификации объектов по их признакам, включения и исключения объектов из различных групп (списков).

Списками называются любые группы данных, объединенных по каким-либо признакам. В машинной памяти строятся либо последовательные списки — путем расположения данных в ячейках с последовательно возрастающими адресами, либо цепные списки — путем объединения данных при помощи адресов связи. Адрес связи хранится совместно с данным членом списка и указывает расположение последующего члена списка. При этом члены списков могут располагаться произвольно в памяти машины. Некоторые члены списков могут указывать ответвления к другим спискам, т. н. подспискам. Любой список со всеми ответвляющимися от него подсписками называется списковой структурой. В виде списковой структуры может быть представлена иерархическая структура понятий (определений), относящихся к какой-либо области знаний. При этом каждое более общее понятие будет содержать в себе отсылки к более частным понятиям, объединяемым этим общим понятием. Такая система называется нами ассоциативным словарём понятий.

Естественно, что программная реализация этих средств представляется совокупностью стандартных алгоритмов и программ, обеспечивающих включение и исключение объектов, их поиск, а также обработку данных и различные контрольные и вспомогательные процессы, в частности, выдачу на печать готовых отчетов, прием словесных запросов и их перевод на внутренний язык АФИЛС; а также обеспечивающих специальные виды обработки: поиск аналогов, статистические оценки, выяснение корреляционных связей, выявление общих свойств и т. д.

5. Техническим средством реализации АФИЛС должна быть специализированная цифровая вычислительная машина, обладающая большой емкостью оперативных, промежуточных и внешних запоминающих устройств, специальной системой команд, содержащей поисковые oперации, и разветвленной системой ввода и вывода данных. Особенностью вывода данных для АФИЛС является наглядное представление (на экранах в виде схем, таблиц, графиков, рисунков) фактографических данных, причем желательно иметь возможность создавать динамически меняющиеся картины, в которых бы автоматически акцентировались наиболее интересные и важные места. Помимо обычного ввода данных, в АФИЛС должен быть предусмотрен динамический ввод запросов, позволяющий с помощью, например, световых указателей, направляемых на отдельные детали картин, вызывать дополнительную информацию или вводить новые исходные данные (например, при машинной проверке гипотез).

С точки зрения общих принципов организации информации в АФИЛС можно выделить 5 уровней.

Уровень, обеспечивающий кодирование вводимых терминов, базовых понятий и фактографических данных. Все термины и базовые понятия после их кодирования становятся как бы основными символами, используемыми в дальнейшей работе системы.
Уровень опознавания понятий во вводимых запросах или поисковых образах объектов. Каждый объект характеризуется информацией двух видов: ассоциативной и собственной. Ассоциативная информация — это набор признаков (понятий), используемых для поиска объекта.

Собственная информация — это сведения, используемые не при поиске, а в процессе обработки и сопоставления. В формулярах объектов хранится как ассоциативная, так и собственная информация; она вся образует оперативную информацию. Кроме того, ассоциативная информация о различных объектах организована в виде поисковых деревьев, которые образуют ассоциативный словарь понятий. Каждый объект может характеризоваться несколькими независимыми понятиями (дескрипторами), и эти понятия будут опознаваться независимо друг от друга с помощью ассоциативного словаря понятий (АСП).
Уровень объединения различных понятий (различных аспектов описания объектов) в единый поисковый образ объекта. Эту функцию выполняет ассоциативная узловая структура, в которой каждый узел представляет один объект и связывает в единый образ различные понятия, относящиеся к данному объекту. Ассоциативные узловые структуры хранятся на отдельных магнитных лентах, и переход к ним от поисковых деревьев осуществляется с помощью специальных отсылок, т. н. заголовков узловых списков.
Уровень хранения оперативной фактографической информации об объектах. Для каждого объекта эта информация представляется в виде машинного формуляра; эти формуляры хранятся на отдельных магнитных лентах. Обращения к нужному формуляру производятся с помощью его адреса, который указывается в ассоциативном узле, относящемся к данному объекту.
Уровень хранения дополнительной информации об объектах. Для каждого объекта могут храниться вне АФИЛС любые дополнительные сведения либо в виде микрофильмов, либо в виде печатных материалов, или в другой форме. Адреса этих материалов указываются в формуляре соответствующего объекта.

Типовыми вопросами, на которые должна отвечать АФИЛС, будут являться:

Сообщить, существует ли объект (вещество, схема, прибор, машина, метод расчета, технологический процесс, история болезни и т. д.), обладающий такими-то характеристиками (или близкими), и выдать все его основные данные (или некоторые указанные данные).
Выдать все или некоторые характеристики объекта (вещества, схемы, узла и т. д.), имеющего такой-то шифр (наименование).
Произвести статистический анализ объектов определенной категории.
Провести сравнительный анализ характеристик однотипных изделий и выдать таблицы или графики, показывающие характер изменения этих характеристик по годам.
Определить необходимый состав и количество исследователей и инженерно-технических работников, необходимых для выполнения разработки, и составить график этой разработки.
Определить состав оборудования, необходимого для изготовления новых приборов и машин, имеющимся аналогом среди существующих образцов.

Последняя группа вопросов может использоваться при решении задач планирования научных работ, опытного производства, материально-технического снабжения, исследований, определения нормативов на вновь выпускаемую продукцию и т. д.

АФИЛС будет работать в двух основных режимах:

А. Режим наполнения данными.

Б. Режим обработки и выдачи данных.

Кроме того, должен быть предусмотрен ряд специальных режимов работы, обеспечивающих корректировку массивов информации, статистический анализ и др. Как при вводе новых сообщений, так и при поиске данных по запросам АФИЛС должна работать по параллельно-последовательному способу. Это значит, что весь процесс работы системы складывается из ряда последовательных этапов, а каждый из этапов выполняется параллельно для большого количества запросов или вводимых сообщений.

Построение описанной информационно-логической системы представляет сложную проблему, которая должна решаться постепенно путем последовательного усложнения состава и содержания задач, развития методов эвристического и ассоциативного программирования, разработки эффективных машинных словарей и накопления формализованных массивов фактографических научных данных по отдельным областям или разделам науки.

По мере развития указанной человеко-машинной системы будут усложняться и задачи научного прогнозирования, решаемые с ее помощью, начиная от простейших задач выдачи справок по состоянию того или иного исследования, свойствам материалов, характеристикам явлений и т. п. и переходя постепенно к машинному анализу тенденций развития определенных исследований.

Cтатья была опубликована в журнале "Вопросы научного прогнозирования" №8 за 1969-й год.
Помещена в музей с разрешения В.А. Китова 27 января 2022