зам. директора ГНУ «Государственная научная педагогическая библиотека им. К.Д. Ушинского Российской академии образования»
Традиционная лингвистика как основа лингвистического обеспечения информационных систем.
В настоящее время актуальным становится создание и развитие информационно-лингвистических ресурсов и систем, обеспечивающихисследования в области информационного поиска по распределенным интегрированным полнотекстовым базам данных, контентным содержанием которых является научная информация. Любая интеграция информационных систем, электронных ресурсов (каталогов, баз данных и т.д.) предполагает обеспечение доступа к этому массиву и в связи с этим ставит перед создателями большой круг задач:
• анализ методологий,стандартов и приемов построения распределенных информационных систем;
• формирование адекватного лингвистического обеспечения и форматов представления метаданных;
• построение функциональной модели и модели баз данных;
• разработку оптимальной топологии системы;
• разработку протоколов взаимодействия с другими информационными системами;
• проектирование пользовательскихинтерфейсов;
• разработку технологических инструкций пользователям;
• разработку технологических инструкций администраторам системы;
• разработку прототипа программных средств для решения задач в рамках интегрированных информационных систем.
Нас в данной статье интересует аспект проблемы адекватного лингвистического обеспечения научно-информационных баз данных.
Несмотряна то, что уже давно разработан и постоянно совершенствуется лингвистический аппарат автоматической обработки текстов, пока отсутствует координация деятельности исследователей в области лингвистического обеспечения информационных систем и не решены многие теоретические проблемы, необходимые для успешного решения такого рода задач. В результате, российское научное сообщество практически не имеетединого корпоративного профессионально организованного источника электронных лингвистических ресурсов всех возможных типов, обеспечивающих поисковую систему научно-информационных ресурсов. Совершенно очевидно, что назрела необходимость как в координации ученых-лингвистов, так и в интеграционном обновлении информационно-поисковых лингвистических ресурсов. Традиционно в основе информационно-поисковыхлингвистических систем лежат классификационные параметры. В этой ситуации языковые категории должны представлять некоторую систему взаимосвязанных и согласованных друг с другом компонентов, следовательно, изменение определения одной языковой категории непременно приводит к изменениям в каком-либо другом месте трактовки. Системный характер – желательное и, порой, обязательное свойство любой классификации, но напрактике нередко одновременно сосуществуют принципы, ведущие к разрушению строгости классификации. Любая классификация является в той или иной мере условной. Она – часть той коммуникации, которая ведется между исследователями и читателями (потребителями) их трудов. Наиболее убедительная классификация служит одним из приемов, с помощью которых первый пытается описывать реальность (с точки зрения языка, попринципу «от значения к форме») в доступном второму виде, т.е., научную информацию (научный текст) следует рассматривать как часть информационно-коммуникативного поля для корпоративных сообществ (часть коммуникации между исследователями и читателями, которые часто меняются местами).
Однако, на наш взгляд, корпоративные информационные блоки, подлежащие лингвистическому анализу, не имеют прямойсвязи с классификационными системами. Нет исходного положения о том, что каждый информационный объект должен попасть в определенный класс, который окажется семантически релевантным. Поэтому стоит задача объединения, а не разбиения (деления, классификации) как информационных объектов, так и семантически релевантных им лингвистических ресурсов. Под...