Основные виды поиска документов в справочно-правовых системах.
3.1 – Поиск по реквизитам документа
Поиск документов по реквизитам довольно прост, и уже на самых ранних этапах становления справочных правовых систем программные технологии позволяли эффективно решать такую задачу. Любая СПС сегодня позволяет найти документ по одному или нескольким его реквизитам. Расширенный перечень реквизитов документа позволяет быстро и точно искать запрашиваемый акт. Среди реквизитов, характеризующих документ, пользователь может указать номер и дату принятия документа, номер акта, вид акта, название органа, принявшего акт, дату и номер регистрации в Минюсте России, источник и дату опубликования. При этом можно задавать несколько однотипных реквизитов, соединяя их различными логическими условиями (И, ИЛИ, КРОМЕ), вместо точной даты задавать различные диапазоны времени и т.д. При определении конкретного критерия поиска пользователь может вывести на экран список всех данных по определенному им реквизиту, что позволит избежать ввода критериев, на которые заведомо отсутствуют документы. Поиск по реквизитам документа это наиболее простой, удобный и очевидный способ поиска. Однако он применим только в тех ситуациях, когда точно известны реквизиты конкретного документа. Основная проблема заключается в том, что в большинстве реальных ситуаций чаще всего требуется поиск документов, точные реквизиты которых заранее неизвестны. Другими словами, нужно найти документы, зная только общий смысл проблемы.
3.2 - Поиск по контексту
Если неизвестны реквизиты искомого документа, но известно, о чем идет в нем речь, то можно попытаться найти его по контексту, то есть по словам и словосочетаниям, встречающимся в тексте документа. В СПС должна быть предусмотрена такая возможность. Очевидно, что программная реализация данного инструмента является более сложной задачей, чем реализация поиска документов по формальным реквизитам. Это определяется объективными причинами, связанными с богатством естественного языка общения людей между собой по отношению к формализованному описанию ограниченного числа характеристик документа (его реквизитов). Действительно, слова могут входить в текст документа в различных грамматических формах (число, падеж и т.д.); словосочетания могут быть разбиты другими словами (например, в перечислении); авторы документов могут использовать синонимы или сокращения и т.д. При этом помимо учета указанных особенностей программные инструменты контекстного поиска должны обеспечивать быстроту этого поиска в огромном массиве информации. Технологии контекстного поиска в СПС претерпели наибольшие изменения за время существования СПС. На ранних стадиях развития справочных правовых систем возможности этих технологий позволяли задать несколько слов или словосочетаний, входящих в текст документа, и соединить их простейшими логическими условиями (И, ИЛИ, КРОМЕ). Затем появилась возможность учесть близость нахождения заданных слов в тексте документа. Например, задав для поиска два слова - ГЛАВНЫЙ и БУХГАЛТЕР,- можно было реализовать следующие возможности:
· найти все документы, где встречается хотя бы одно из этих слов: для этого надо соединить их логическим условием ИЛИ;
· найти все документы, где встречаются оба заданных слова: для этого надо соединить их логическим условием и;
· найти все документы, где заданные слова располагаются недалеко друг от друга: для этого надо было дополнительно указать, что слова обязательно должны располагаться в пределах заданного количества строк или слов.
Стандартом для технологий поиска в СПС по тексту документа в настоящее время является предоставление пользователю возможности задать поисковое выражение на естественном языке, так, чтобы при поиске нужных документов система сама учла близость расположения слов в тексте, нашла документы, где заданные слова встречаются в любых грамматических формах (с любыми окончаниями). Более того, желательно, чтобы поисковые технологии позволяли также учитывать возможные сокращения и синонимы. При этом остается важным сохранение возможности делать вручную ряд «тонких» настроек, например, регулировать близость слов в поисковом выражении, осуществлять поиск слов в определенной форме с определенным окончанием и пр.
3.3 - Поиск по специализированным классификаторам
Поиск по классификатору (тематический поиск) - это поиск по тематическому рубрикатору правовой информации. Данный вид поиска удобен для составления тематических подборок документов и для комплексного изучения правовой проблемы. Существует достаточно много разновидностей классификаторов. Общей чертой всех разновидностей поиска по классификаторам является то, что вся информация проходит предварительную обработку и рубрицируется. Это означает, что эксперт ставит в соответствие каждому элементу информационного массива (документу в целом или его части) определенный элемент классификатора, то есть таким образом указывается определенная рубрика. После такой обработки пользователь может выбрать интересующую его рубрику и получить всю подборку документов или их частей, которые были предварительно отобраны экспертом. Чаще всего в основе таких классификаторов лежит предмет правового регулирования, «тема» документа. При этом классификатор представляет собой систему юридических понятий (рубрик, ключевых слов, дескрипторов), отражающих содержание актов, которые составляют информационный массив. В зависимости от расположения рубрик классификаторы можно разделить на иерархические и алфавитные. В первой разновидности классификаторов рубрики расположены в иерархическом порядке, от общего к частному. Такое расположение рубрик более традиционно, оно напоминает оглавление книги и понятно абсолютному большинству пользователей. В разных базах данных используются различные классификаторы этой разновидности: Общеправовой классификатор отраслей законодательства (ОКОЗ), его модификации или другие независимые разработки. Классификаторы второй разновидности разработаны на основе специальных словарей, состоящих из юридических понятий, расположенных в алфавитном порядке (в частности, к этой разновидности классификаторов относятся ключевые слова). Каждая из этих разновидностей классификаторов (чаще вторая) может усложняться путем уточнения и увеличения количества юридических понятий, составляющих классификатор. Рубрики могут состоять из некоторого набора терминов и представлять собой описание определенной ситуации.
3.4 - Интеллектуальный поиск
«Быстрый» поиск осуществляется по всем установленным информационным блокам. Интеллектуальный поиск позволяет найти максимальное количество документов по интересующему пользователя вопросу даже тогда, когда пользователь не может его описать в понятиях тематического или «ситуационного» словаря. Пользователь описывает вопрос так, как он его, понимает, в виде поисковой фразы. Отметим, что в поисковой фразе можно использовать и значения реквизитов документа. Система анализирует поисковую фразу, отбрасывает «шумовые» слова и выделяет наиболее значимые. Проверка соответствия документа поисковой фразе происходит следующим образом:
· вхождение всех значимых слов в название документа; вхождение всех значимых слов в текст документа;
· подсчет количества вхождений каждого слова в текст документа. Для каждого из отобранных документов устанавливается степень близости документа запросу («вес» документа). Список отобранных документов выдается в порядке убывания их «веса»
Заключение
Консультант Плюс предоставляет пользователям на всей территории России широкие сервисные возможности по оперативному доступу и профессиональной работе с юридической информацией. Каталог программных продуктов Консультант Плюс содержит подробную информацию о Справочных Правовых Системах, распространяемых Сетью. Главная задача системы Консультант Плюс - обеспечить все заинтересованные предприятия и организации полной, достоверной и оперативной правовой информацией. Сеть Консультант Плюс объединяет 300 региональных информационных центров в 150 городах России, обеспечивающих одинаково высокий уровень сервиса. Сегодня основное направление развития подавляющего большинства партнёров - региональных центров Консультант Плюс - непосредственно связано со сбытом и информационным обслуживанием правовых систем Консультант Плюс. За годы работы Сети центры значительно выросли: сегодня в среднем в каждом региональном центре работает порядка 30 человек, а в самых крупных РИЦ число только штатных сотрудников превышает 80 - 100 человек. В настоящее время для работы с пользователями в каждом РИЦ существуют специальные отделы сопровождения, в составе которых работают менеджеры по работе с пользователями, инженеры по сопровождению систем, инженеры по телекоммуникациям, инженеры по установке систем и т.д.
Источники информации
1) Введение в правовую информатику. Справочные правовые системы Консультант Плюс. Под общей редакцией Д.Б. Новикова, В.Л. Камынина. - Москва, Вычислительная математика и информатика, 2003.
2) Справочно-правовая система «Консультант Плюс»
3) https://ru.wikipedia.org