Русский | English   поискrss RSS-лента

Главная  → История отечественной вычислительной техники  → 

В.А. Коптюг и становление химической информатики в СО РАН

В середине ХХ века началось бурное вторжение в органическую химию физических методов исследования соединений – ультрафиолетовой и инфракрасной спектроскопии, массспектрометрии, ядерного магнитного резонанса, рентгеноструктурного анализа. Использование этих спектральных методов позволило во много раз повысить продуктивность работы химиков-органиков и сократить время, которое требуется для установления строения сложных молекул. Но с увеличением числа описанных химических соединений увеличивается и вероятность того, что исследуемое соединение окажется уже известным. Поэтому весьма востребованными оказались каталоги и картотеки, в которых содержалась информация о спектральных характеристиках уже изученных соединений. Очень скоро в химии возникла ситуация «информационного взрыва»: проанализировать и выбрать вручную всю нужную информацию о строении и свойствах химических соединений стало практически невозможным. Осознав эту проблему, химик-органик по специальности, Валентин Афанасьевич Коптюг (1931–1997) одним из первых стал активно внедрять в исследовательскую практику химической науки компьютеризованную обработку накопленной информации.

Его первая работа в области химической информатики – «Использование ЭВМ для опознания химических соединений по спектральным характеристикам. Система поисков ИК-спектров соединений» – опубликована в 1970 г. Спектры поглощения органических соединений в инфракрасной области (ИК) представляют собой сложные, уникальные для каждого соединения кривые, которые можно считать своеобразными «отпечатками пальцев» для органических молекул. В библиотеке спектральной информации Новосибирского института органической химии (НИОХ СО АН) имелось несколько бумажных каталогов ИК спектров и картотеки, в которых ИК-спектры соединений хранились на картах с двухрядной краевой перфорацией. С помощью прорезей на краях карты можно было закодировать положение наиболее интенсивных полос поглощения, а поиск веществ, удовлетворяющих заданному набору спектральных признаков, проводился при помощи спиц. Такая «автоматизированная» система очень скоро перестала удовлетворять сотрудников НИОХ, и вместо спиц было решено воспользоваться электронновычислительной машиной БЭСМ-6.

Над первой компьютерной системой поиска ИК-спектров вместе с В.А. Коптюгом работали как химикиспектроскописты из НИОХ (И.К. Коробейничева, В.С. Бочкарев), так и программисты ВЦ СО АН (Ю.П. Дробышев, Р.С. Нигматуллин, В.А. Лобанов). Совместными усилиями были разработаны способы кодирования данных, пригодные для хранения информации на машинно-читаемых носителях (в частности, дискретное кодирование сплошной спектральной кривой); коллекция спектров была записана на магнитную ленту и стала первой в СССР машинной базой ИК-спектров. Из базы данных (БД), содержащей примерно 18 000 записей, с помощью поисковых процедур за 10 сек работы центрального процессора БЭСМ-6 осуществлялся отбор соединений, наиболее соответствующих параметрам запроса.

С этих первых машинных каталогов ИК-спектров начались работы по химической информатике в НИОХ. Валентин Афанасьевич чётко осознал важность и перспективность научной активности в этой области, и в 1971 году по его инициативе в Институте был создан Научно-информационный центр по молекулярной спектроскопии – НИЦ МС, который позднее, в 80-е годы, был переименован в научно-технический центр химической информатики – НТЦ ХИ. Первым руководителем НИЦ МС был В.А. Коптюг. В 1990 году руководителем Центра стал Б.Г. Дерендяев.

Основными направлениями работ Центра были:

В НИОХ появились свои специалисты в области обработки химической информации. Среди них были как профессиональные математики и программисты – В.И. Смирнов, О.Н. Шарапова, Л.В. Фролова, С.Г. Молодцов, так и химики – С.А. Нехорошев, В.Н. Пиоттух-Пелецкий, В.М. Тормышев, К.С. Лебедев, Б.Г. Дерендяев. Валентин Афанасьевич считал, что лучше химика переквалифицировать в специалиста в области обработки информации, чем математика обучать химии.

Эффективность работы информационно-поисковых систем в любых отраслях науки и техники в значительной степени зависит от объема и качества информации, представленной в базах данных этих систем. Создание химических баз данных на том этапе развития ЭВМ представляло особую трудность в связи с большим объемом накопленной информации, многообразием синтезируемых соединений и проявляемых ими свойств. Информационным фондом для систем, разрабатываемых в Центре, служила созданная НИОХ и ГПНТБ СО АН специализированная библиотека спектров, в которой были представлены картотеки, каталоги, атласы и другая справочная информация по молекулярной спектроскопии. Непосредственно библиотекой спектральной информации занималась Г.Г. Балакина, а руководила этим направлением работ М.И. Подгорная.

Информационная база, описывающая индивидуальные органические соединения, включает в себя название соединения и характеристики его свойств: молекулярный вес, молекулярную формулу (брутто-формулу), точки кипения и плавления, различного вида спектры. Обычно поиск химического соединения в различных спектральных каталогах проводится по его названию, но разобраться в существующих системах химической номенклатуры – названиях соединений – способен не каждый химик. Однозначно органическое соединение определяется своей структурной формулой – химическим графом с оговоренными свойствами вершин и ребер. Поэтому при построении машиночитаемой информационной базы органической химии было желательно решить задачу ввода в ЭВМ и вывода из памяти ЭВМ структурной информации в приемлемом для химика виде.

Первыми машинными БД были базы по ИК-спектроскопии [1, 2], электронной спектроскопии [3] и спектроскопии протонного магнитного резонанса [4]. В них не была представлена структурная формула соединения и не было полного описания спектральной кривой. Поисковые системы на основе этих БД были реализованы на ЭВМ БЭСМ-6 и были, в основном, ориентированы на решение задач по идентификации исследуемых соединений по их спектральным характеристикам.

К середине 70-х годов многие приборостроительные фирмы перешли на выпуск спектрометров в комплекте со специализированными малыми ЭВМ. В НИОХ появилась ЭВМ Минск-32, которая стала базой централизованной системы, связывающей все локальные системы и терминалы в единый комплекс [5, 6]

ЭВМ Минск-32

Через мультиплексный канал к процессору можно было подключать как терминальные комплексы исследовательских групп по различным видам спектроскопии, так и специализированные устройства группы формирования машинных каталогов. Занесение в машинные каталоги спектров изучаемых соединений, которые регистрируются на связанных с ЭВМ спектрометрах, теперь не представляло трудностей, но для ввода в каталог опубликованных ранее спектральных данных потребовались специальные устройства. В НИЦ МС было разработано полуавтоматическое устройство «Контур» для ввода в ЭВМ графической спектральной информации [5]. Предварительно микрофильмированный спектр проецировался на экран из матового стекла и обводился вручную с помощью визира. Специальные датчики фиксировали изменения координат и осуществляли дискретное кодирование спектральной кривой с определенным шагом. Эту закодированную информацию можно было выводить на перфоленту или на магнитную ленту или сразу передавать в ЭВМ. Параллельно, с помощью алфавитно-цифрового дисплея Видеотон-340, можно было вводить сопутствующую текстовую информацию.

Анализируя имеющиеся базы химических данных и опыт, накопленный при разработке технологического процесса создания БД по различным видам молекулярной спектроскопии, сотрудники Центра пришли к выводу, что такие БД должны содержать максимально полное представление данных и быть открытого типа. Основным элементом ряда взаимосвязанных проблемно-ориентированных БД должна стать структурная база данных, содержащая полное графическое описание структурных формул химических соединений. Г.П. Ульянов и А.Р.Маслов разработали оригинальное планшетное устройство ГРАФ для кодирования и ввода структур органических соединений [6]. На планшете размещался специальный бланк, и оператор с помощью электронной шариковой ручки рисовал на этом бланке структуру в привычном для химика виде.

полуавтоматическое устройство «Контур»

ГРАФ

В память ЭВМ заносилась не только матрица смежности, но и координаты вершин вводимого химического графа. Устройство «ГРАФ», а также разработанные алгоритмы и программы манипулирования химической структурной информацией позволили приступить к созданию широкомасштабных БД по структурным формулам органических соединений, соответствующих введённым ранее спектрам [7].

Особенностью создаваемых БД, отличавшей их от многих, известных в то время, было наличие информации о привычном для химика изображении структурной формулы. Благодаря этому стало возможным создавать интерактивные компьютерные системы, обеспечивающие графическое отображение как спектральной, так и структурной информации. Вторым и не менее важным следствием создания БД по структурам органических соединений, соответствующих спектральным базам, стала возможность разработки алгоритмов анализа структур соединений, отбираемых при поиске в спектральных базах данных.

В основе всех проводившихся исследований по анализу результатов спектрального поиска в БД лежит высказанное В.А. Коптюгом предположение о том, что отбираемые при поиске спектрально-родственные соединения в большинстве случаев обладают также и структурным родством. Причем, в отличие от традиционно использовавшихся ранее таблиц спектро-структурных корреляций, с помощью спектрального поиска удаётся извлекать гораздо более детальную информацию об исследуемом соединении.

Работы по извлечению структурной информации из молекулярных спектров, в особенности, массспектров, проводились до этого многими научными группами, однако отличительной особенностью работ Центра стал именно анализ результатов спектрального поиска в БД по молекулярным спектрам.

Первыми исследованиями в данной области стали работы сотрудников НИЦ МС Б.Г. Дерендяева, С.А. Нехорошева, В.И. Смирнова, Л.М. Покровского, О.Н. Шараповой, К.С. Лебедева, В.Н. Пиоттух-Пелецкого, В.М. Тормышева по установлению строения органических соединений на основе их масс-спектров низкого разрешения и соответствующей БД по масс-спектрометрии [8–10]. На начальном этапе нужно было разработать алгоритм сопоставления масс-спектров, позволяющий отбирать спектры, наиболее похожие на спектр исследуемого соединения. При этом требовалось, чтобы структуры соединений, соответствующие отбираемым таким образом спектрам, также были достаточно похожи на структуру исследуемого соединения. Эта задача была успешно решена, и на основе разработанных алгоритмов была создана система «ИНТЕР-МС» [9–10], позволяющая проводить поиск спектрально-родственных соединений в БД по масс-спектрометрии.

Предложенный способ представления структурной информации в базах данных позволил приступить к работам по реализации структурного и подструктурного поиска, работать над созданием систем структурасвойство с целью прогнозирования путей синтеза соединений заданного свойства. Происходило также осмысление открывшихся возможностей более «интеллектуальной» обработки содержащихся в БД спектральных и структурных данных. Разрабатывались алгоритмы и программы извлечения из результатов спектрального поиска информации о фрагментах структуры исследуемого соединения, программы генерации гипотетических структур из выявленных фрагментов, исследован и программно реализован подход к анализу взаимосвязи строения и свойств соединений на основе предложенного нового метода описания структурных формул с помощью исчерпывающих наборов фрагментов структуры.

Результаты, полученные в НИОХ за 20 лет работы по созданию компьютерных баз данных, кратко описаны в последней работе В.А. Коптюга в области химической информатики: «Some Aspects of Computerized Processing of Structural and Graphical Information in Solution of Chemical Problems», написанной в соавторстве с Б.Г. Дерендяевым и опубликованной в сборнике «Chemical Application in Chemical Research and Educations» в 1989 г.

Став председателем Президиума СО АН, В.А. Коптюг включил в сферу своих интересов не только разработки руководимого им Центра, но и работы по информатике, которые проводились в других институтах СО АН. В статьях и докладах, опубликованных как в СССР, так и за рубежом [11], он упоминает стандарт КАМАК (Computer Application to Measurement, Acquisition and Control) и систему голографической памяти, разработанные в Институте автоматики и электрометрии под руководством Ю.Е. Нестерихина и П.Е. Твердохлеба соответственно; банки данных по первичной и вторичной структуре белков и нуклеиновых кислот и программы моделирования биологических объектов (Институт цитологии и генетики, лаборатория В.А. Ратнера); библиотеку программ для квантовохимических расчетов, собранную в Институте химической кинетики и горения группой П.В. Счастнева.

Большое значение В.А. Коптюг придавал возможности оперативного обмена информацией и опытом в области химической информатики между специалистами разных городов и стран. Под его непосредственным руководством проведено восемь Всесоюзных конференций по использованию вычислительных машин в спектроскопии молекул и химических исследованиях, причем семь из них прошли в Академгородке. Три первых были в ранге семинаров «Использование вычислительных машин в спектроскопии молекул». Конференции проходили с международным участием, на них часто приезжали иностранные коллеги из Польши (З. Хиппе и его сотрудники), Болгарии (Д. Бончев), Югославии (М. Пенка и Д. Зупан), а также венгерские, немецкие и румынские исследователи. Со временем изменялась и тематика конференций. На первых конференциях значительная часть докладов была посвящена автоматизации спектральных экспериментов, использованию ЭВМ для поиска и логической обработки спектральной и структурной информации, а также квантово-химическим расчетам. На последней конференции в 1989 г. были представлены работы по конкретным направлениям химической информатики, таким как создание банков данных по структурам и свойствам химических соединений, установление строения химических соединений по их спектральным характеристикам, средства ввода в ЭВМ, обработки и отображения химических структур, установление связи «структура – свойство» химических соединений, планирование синтеза и анализ химических реакций.

Благодаря энергичной научно-организационной работе В.А. Коптюга деятельность НИЦ МС получила международное признание – уже в 1978 году в Академгородке под эгидой ИЮПАК прошла 4-я Международная конференция по применению ЭВМ в химии и химическом образовании. В Сибири смогли увидеть и услышать ведущих специалистов того времени в области химической информатики. С докладами, в частности, выступали П. Лайкос, П. Джурс, С. Хеллер, Т. Випке, Д. Корнелиус – все из США, Т. Клерк (Швейцария), Ж.-Э. Дюбуа (Франция). Ш. Сасаки (Япония), советские ученые Н.С. Зефиров, Л.А. Грибов, В.А. Дементьев, М.Е. Эляшберг, А.В. Богатский, Н.А. Платэ, Р.Г. Жбанков. После этой конференции ещё совсем молодые сотрудники Центра осознали свою вовлечённость в мировую науку.

Через пять лет в Новосибирске был поведен советско-японский симпозиум по аналогичной тематике, сопредседателями оргкомитета были В.А.Коптюг и Шин-ичи Сасаки. В свою очередь сотрудники Центра выступали с докладами на международных конференциях по химической информатике в Германии, США, Франции, Японии, Китае.

Следует напомнить, что в те времена выезд за рубеж в капиталистическую страну был возможен лишь для тех советских граждан, кто предварительно уже выезжал в социалистическую страну. Для специалистов Центра, благодаря В.А. Коптюгу как руководителю делегации и достаточно влиятельному деятелю коммунистической партии, было сделано исключение – первый выезд за рубеж был на 6-ю международную конференцию по применению ЭВМ в химии и химическом образовании, проходившую в США, в Вашингтоне в 1982 г.

В.А. Коптюг, И.Ф. Михайлова, В.Н. Пиоттух-Пелецкий,
М.И. Подгорная и Б.Г. Дерендяев. На втором плане – Белый дом

Слева направо: В.А. Коптюг, И.Ф. Михайлова, В.Н. Пиоттух-Пелецкий, М.И. Подгорная и Б.Г. Дерендяев. На втором плане – Белый дом

К началу 80-х годов созданы и опробованы средства телекоммуникационного доступа к базам данных Центра. За 10 лет до появления сетей ИНТЕРНЕТ были проведены сеансы связи с НИОХ СО РАН, включающие спектральный поиск, из Москвы (ВДНХ) и Софии. Эта работа была отмечена медалями ВДНХ.

Примерно в это же время по инициативе Валентина Афанасьевича в НГУ на кафедре органической химии факультета естественных наук была организована специализация «математические методы в химии». Теперь ее назвали бы «химической информатикой» Каждый год по нескольку подготовленных на ней выпускников становились стажёрами-исследователями Центра.

А в 1988 г. сотрудники Центра получили персональные компьютеры серии Tandon – с десяток 286-х и две 386-х. И это уже совсем другая история…

Список литературы

  1. Дробышев Ю.П., Нигматуллин Р.С., Лобанов В.И., Коробейничева И.К., Бочкарев В.С., Коптюг В.А. Использование ЭВМ для опознания химических соединений по спектральным характеристикам. Система поисков ИК спектров соединений // Вестн. АН СССР. 1970, №8, с. 75-83.
  2. Дробышев Ю.П., Нигматуллин Р.С., Лобанов В.И., Коробейничева И.К., Бочкарев В.С., Коптюг В.А. Использование ЭВМ для опознания химических соединений по спектральным характеристикам. 2. Машинная система поиска ИК спектров по каталогу Садтлера // Изв СО АН СССР. Сер. хим. наук. 1972, №2, вып. 1, с. 108-114.
  3. Бочкарев В.С., Дробышев Ю.П., Коптюг В.А., Коробейничева И.К., Лобанов В.И., Нигматуллин Р.С. Машинная информационно-поисковая система для электронной спектроскопии // Автометрия 1972, №4, с. 124-130.
  4. Бархаш В.А., Соколов С.П., Секерина Л.Ф., Дробышев Ю.П., Коптюг В.А. Машинная система определения структурных фрагментов неизвестных соединений по спектрам ПМР // Изв. СО АН СССР. Сер. хим. наук. 1974, №14, вып. 6, с. 113-114.
  5. Коптюг В.А., Бочкарев В.С., Дерендяев Б.Г., Нехорошев С.А., Пиоттух-Пелецкий В.Н., Подгорная М.И., Ульянов Г.П. Использование ЭВМ при решении структурных задач органической химии методами молекулярной спектроскопии // Ж. структур. химии. 1977, т. 18, №3, с. 440-459.
  6. Ульянов Г.П., Маслов А.Р., Дерендяев Б.Г., Пиоттух-Пелецкий В.Н., Коптюг В.А. ЭВМ и решение аналитических задач органической химии // Вестн. АН СССР. 1978, №3, с. 32-44.
  7. G.P.Ulyanov, V.N.Piottukh-Peletsky, B.G.Derendyaev, M.I.Podgornaya, V.A.Koptyug. Creation and Capabilities of Computerized Data Banks Containing Information on Chemical Structures and Properties // Data for science and technology. Proc. 1980. Oxford, 1981.
  8. Б.Г.Дерендяев, Л.М.Покровский, С.А.Нехорошев, В.И.Смирнов, В.А.Коптюг. Машинная информационно-поисковая система для масс-спектрометрии // Изв. СО АН СССР. Сер. хим. наук. 1977, №4, вып. 2, с. 109-115.
  9. Лебедев К.С., Тормышев В.М., Шарапова О.Н., Мамаева Н.В., Дерендяев Б.Г., Коптюг В.А. Извлечение структурной информации из масс-спектров с помощью ЭВМ. 2. Система «ИНТЕР-МС». Использование сведений о массовых числах и интенсивностях спектральных линий // Изв. СО АН СССР. Сер. хим. наук. 1980, №4, вып. 2, с. 54-64.
  10. Лебедев К.С., Дерендяев Б.Г., Пиоттух-Пелецкий В.Н., Коптюг В.А. Извлечение структурной информации из массспектров с помощью ЭВМ. 5. Машинный анализ набора структур, отобранных по масс-спектрометрическим характеристикам, с целью выделения общих для них структурных фрагментов // Изв. СО АН СССР. Сер. хим. наук. 1982, №2, вып. 2, с. 105-114.
  11. V.A.Koptyug. Computers in Chemical Research at the Novosibirsk Scientific Centre // Computer Application in Chemistry. Amsterdam: Elsevier Science Publishers, 1983, P. 207-224.

Об авторах: Новосибирский институт органической химии им. Н.Н. Ворожцова СО РАН
bogd@nioch.nsc.ru
Материалы международной конференции SORUCOM 2011 (12–16 сентября 2011 года)
Статья помещена в музей 26.03.2012 с разрешения авторов

Проект Эдуарда Пройдакова
© Совет Виртуального компьютерного музея, 1997 — 2017