Каталогизация заимствованием – развитие технологии в библиотечных системах РУСЛАН и НЕВА

Рябев В.С., Сова Д.Н., ООО «Балтиксофт», Санкт-Петербург

В докладе представлены новые разработки специалистов компании Балтиксофт в области технологии «каталогизации заимствованием», как со стороны программного обеспечения пользователей библиотечных систем – потребителей библиографических ресурсов, так и со стороны программного обеспечения организаций - провайдеров, предоставляющих массивы библиографических данных.

На сегодня тема «каталогизации заимствованием» перешла из разряда теоретических обсуждений в кругах специалистов в область практической реализации в программном обеспечении библиотечных систем и предоставление доступа к реальным ресурсам. Предложение  библиографических ресурсов интересных широкому кругу библиотек активно формируется. В последних версиях ведущих российских библиотечных систем уже имеется возможность выполнять поиск и извлечение библиографических записей в MARC форматах из внешних источников - Z39.50 серверов. В системах по разному обеспечивается эта возможность: в ряде систем - путем подключения дополнительных модулей (Z39.50 клиентов), в АБИС «Руслан» и АБИС «Нева» функция заимствования по протоколу Z39.50 является штатной функцией. Но, так или иначе, задачу обеспечения пользователя необходимым программным инструментом можно считать в основном решенной. Что нового можно предложить пользователю в этой части? Сделать операции заимствования проще и эффективнее.

Раскроем тезис. Операции заимствования не должны занимать у пользователя дополнительное время и по возможности вписываться в обычный цикл обработки новых поступлений или ретрокаталогизации/ретроконверсии каталогов. Например, в библиотечных системах «Руслан» и «Нева» поиск во внешних источниках записи для заимствования может производиться одновременно (одним запросом) с проверкой на наличие дублета в каталоге.  Это достигается за счет того, что поиск в своем каталоге и на внешних серверах производится в одном окне и одной функцией. Переход в режим редактирования дублета или копирования заимствованной записи выполняется по одному щелчку мыши.

Более того, в АРМе Комплектатор-Каталогизатор «Нева», как поиск дублета, так и поиск записи для заимствования может происходить автоматически (в «фоновом режиме») непосредственно во время создания первичного описания – пользователю достаточно установить соответствующие опции в окне редактора записи и следить за специальными цветовыми индикаторами («Дубль?» и «Поиск»). В случае, если найден дублет или подходящая запись для заимствования, переход в режим редактирования или копирования выполняется очень просто, иначе пользователь продолжает создание первичного описания. Это позволяет не затрачивать ни секунды дополнительного времени для предварительного поиска.

Критерий проверки на дублет и поиска записи для заимствования формируется по принципу последовательного уточнения запроса по мере ввода пользователем основных полей описания. Например, в случае отсутствия ISBN при заполнении поля АВТОР с высокой вероятностью будет найден, или дублет, или другая запись, но при  дальнейшем вводе поля ЗАГЛАВИЕ, поиск будет значительно точнее и загоревшиеся ранее индикаторы опций «Дубль?» или «Поиск», вероятно, погаснут. Это означает, что надо продолжить создание новой записи. В случае, если индикатор «Дубль?» не погас даже после ввода выходных данных, с высокой вероятностью в каталоге имеется дубль записи.

Вопросы преобразования заимствованной записи в требуемый MARC формат ранее широко обсуждались. Отметим только, что на сегодня ведущие системы поддерживают загрузку в национальном формате Rusmarc. В некоторых системах при этом производится конвертирование во внутренний формат АБИС, что не может полностью исключить вероятность искажения данных и обуславливает необходимость обязательной проверки пользователем результата конвертирования. Системы «Руслан» и «Нева» изначально ориентированы на работу с форматом Rusmarc и конвертирование не требуется. Это экономит время, а качество полученной записи полностью определяется источником ресурса - ни пользователь, ни разработчик конвертора в этот процесс не вмешиваются.

Новая функция - "Заменить со слиянием" позволяет пользователю заменить созданную ранее запись в каталоге на заимствованную с автоматическим слиянием. При выполнении операции удаляются все поля ранее созданной записи за исключением полей: 001 (ключ), 6хх (тематика), 8хх, 9хх (инвентарные номера, другие данные организации) и копируются все поля из заимствованной записи, исключая поля: 001, 8хх, 9хх. Кроме того, в полученной таким образом записи создается новое поле 035 со значением поля 001 (ключ) заимствованной записи для сохранения ссылки на запись источника.

Новая функция позволяет выполнять заимствование на любом этапе обработки записи (после формирования заказа, в момент регистрации новых поступлений и даже после обработки).

Другая возможность касается не заимствования полных записей, а использования внешних источников для работы со справочниками – при заполнении отдельных полей записи. Здесь  под справочником понимается список терминов доступный для выборки с локального сервера системы и/или внешнего сервера. Выборка данных справочника производится также по протоколу Z39.50, но в специальном формате GRS1 для представления небиблиографических данных. В АРМе Комплектатор-Каталогизатор «Нева» параметры  внешнего сервера для выборки справочников указывается в настройках, и пользователь получает возможность при работе со справочником уточнять, с какого сервера выбирать термины – своего или внешнего. Выполняется это простым переключением режима одним щелчком мыши.

Мы рассматривали технологию со стороны пользователя - потребителя ресурса (комплектатора, каталогизатора, библиографа). Что нового с технологической точки зрения можно предложить провайдеру ресурса – организации, создающей и предоставляющей библиографические записи для заимствования?

Стандартный метод предоставления массивов библиографических записей – поддержка Z39.50 сервера, который обеспечивает доступ различных внешних программ к массивам данных по стандартному протоколу Z39.50 (ISO23950). Это позволяет системам различных производителей работать с данными единообразно - без предварительных доработок программного обеспечения под требования конкретного источника. На сегодня в России мы имеем примеры, как стандартного подхода к обеспечению доступа к своим ресурсам, так и создания своих собственных протоколов. Не будем останавливаться на нестандартных решениях.

Типовой Z39.50 сервер обеспечивает все необходимые для заимствования записей возможности: подключение с авторизацией, позволяющее разграничивать права доступа различных групп пользователей к различным базам данных (каталогам), поиск по широкому набору атрибутов, извлечение записей в различных форматах. Этого вполне достаточно для провайдеров, предоставляющих записи на свободной основе (или ограничивающих доступ по принципу «свой/чужой»). Как правило, это свободные источники, либо источники корпоративного типа (консорциумы, проекты корпоративной каталогизации).

Для коммерческих провайдеров принципиальное значение имеет вопрос учета количества записей, заимствованных конкретным пользователем. На этой основе могут быть решены задачи дифференцированной («справедливой») тарификации услуг, максимального учета потребностей пользователя при минимальной цене. Это позволяет обеспечить и дополнительный уровень защиты ресурса от несанкционированного копирования. Например, даже получив неправомерно пароль для доступа к серверу, невозможно скопировать записей больше, чем предусматривает лимит данной учетной записи. Невозможно организовать «трансляцию» копируемых записей со своего сервера. Такой модуль расширения разработан для Z39.50 сервера «Руслан».

Для каждого пользователя (организации) на сервере провайдера заводится индивидуальная учетная запись. Учетная запись помимо информации о пользователе также включает следующие параметры:

1) "Лимит заимствования по договору" задает количество записей, оплаченных по договору (например, 1000 записей),

2) "Заимствовано всего" показывает количество записей, заимствованных пользователем на текущий момент,

3) "Заимствовано в кредит" показывает количество записей, заимствованных пользователем на текущий момент сверх лимита, оплаченного по договору (первый параметр).

При подключении к серверу провайдера пользователь авторизуется (указывает имя и пароль). Представление результатов поиска производится в текстовом формате. Такое представление не может быть использовано для редактирования и сохранения записи в каталоге, но позволяет принять решение о необходимости заимствования конкретной записи из полученного списка в полном формате. Для заимствования выбранной записи в полном формате (Rusmarc или Usmarc/Marc21) включается специальный режим. Пользователю выводится информационное окно, в котором указаны текущие значения параметров его учетной записи. Пользователь принимает решение о заимствовании записи. В случае выполнения заимствования запись загружается в полном формате в систему пользователя и значение параметра "Заимствовано всего" увеличивается на единицу. Параметр "Заимствовано в кредит" увеличивается на единицу в том случае, если количество заимствованных записей превышает лимит, оплаченный по договору.

Поскольку технология базируется на стандартном протоколе Z39.50, с таким источником могут работать не только системы «Руслан» и «Нева», но и системы других производителей, обладающие функцией извлечения записей с внешних Z39.50 серверов. В частности, имеется опыт успешной работы с сервисом систем: VTLS, Ирбис 32/64 (начиная с версии 2006.2), «МАРК-SQL» (начиная с версии 1.9).

Информация о текущем балансе учетной записи пользователя может быть получена с помощью специального программного агента, который предоставляется бесплатно всем подписчикам сервиса. В системах «Руслан» и «Нева» эта информация выводится непосредственно в окне АРМа Комплектатора-Каталогизатора.

Пользователи систем, не имеющих функции заимствования по протоколу Z39.50, могут использовать программы-посредники (Z39.50 клиенты), позволяющие сохранить заимствованные записи в файл, а затем загрузить записи в свою систему штатной функцией импорта. Например, можно использовать программы Z39.50 клиент «Нева» или Z39.50 клиент «Руслан». Подробную информацию о программах можно получить на сайте нашей компании http://www.balticsoft.ru.

Первым опытом внедрения разработки стало открытие режима доступа по протоколу по протоколу Z39.50 к базе данных Российской книжной палаты “Текущая государственная библиография на книги”. В настоящее время открыта подписка на данный ресурс. Получить подробную информацию об условиях подписки и работе сервиса можно на сайтах РКП http://www.knigainfo.ru и http://www.bookchamber.ru.

Надо отметить, что данная технология может применяться и другими провайдерами библиографических (и не только) ресурсов. Технология также может использоваться для анализа статистики заимствования записей по различным критериям.

С расширением на рынке предложения ресурсов действительно интересных для библиотек технология каталогизации заимствованием будет занимать все более значимое место в текущей работе библиотечных специалистов, что, в свою очередь, потребует дальнейшее развитие программного обеспечения библиотечных систем.