L международная выставка-презентация
научных, технических, учебно-методических и литературно-художественных изданий

Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда


НазваниеСпособ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда
Разработчик (Авторы)Тупикова Наталия Алексеевна, Цельник Галина Львовна, Преферансов Сергей Александрович
Вид объекта патентного праваИзобретение
Регистрационный номер 2656982
Дата регистрации07.06.2018
ПравообладательФедеральное государственное автономное образовательное учреждение высшего образования "Волгоградский государственный университет" (RU)
Область применения (класс МПК)G06F 17/30 (2006.01)

Описание изобретения

Изобретение относится к области информационного поиска и манипулирования данными. Техническими результатами являются повышение скорости автоматизированного распознавания документов, обеспечение возможности обработки текстов по структурно-содержательным параметрам и обеспечение возможности осуществлять выборку на основе различных реквизитов. В способе информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда распознают текст и выполняют классификацию материала путем каталогизации структурных и содержательных параметров лингвистических моделей и целевой информации и обработки целевой информации. Документы архивного фонда помещают в разноуровневую информационную библиотеку. При поступлении запроса содержимое документов обрабатывают по принадлежности к уровням. Выполняют поисковый запрос, по результатам которого вычисляют релевантность обязательных и факультативных реквизитов документов, входящих в разноуровневую информационную библиотеку. Как результат поиска маркируют модели выражения деловых отношений, определяют виды документов архивного фонда по содержанию, функции и разновидности документов по тематическим признакам. 2 ил., 4 табл.

 

Настоящее изобретение относится к области информационного поиска и манипулирования данными, а именно к обработке языковых текстов, и может быть использовано для автоматизированного распознавания документов в архивном фонде, каталогизации структурно-содержательных параметров лингвистических моделей выражения деловых отношений.

Известен способ и система семантического поиска электронных документов [1], заключающийся в том, что включает индексную структуру электронного документа маркерами, занимающими одинаковый и фиксированный размер в компьютерной памяти, хранящими в зависимости от своего типа как метаинформацию электронных документов, так и информацию о вхождениях слов естественного языка в электронные документы, полученную с помощью лингвистического анализа.

Подобные системы информационного поиска предназначены для выявления в совокупности корпусе электронных документов таких номиналов, которые в наибольшей степени соответствуют информационной потребности пользователя, сформулированной в виде запроса к системе. С помощью данного способа выполняется отбор документов, метаинформация которых соответствует метаинформации, заданной в запросе, осуществляется ранжирование документов по близости к поисковому запросу на основе сопоставления информации о вхождениях слов в документах и поисковом запросе.

Тем не менее, данный способ не предлагает технического решения автоматизированного распознавания и каталогизации целевой информации в многоуровневой электронной библиотеке документов архивного фонда. Не получает воплощения система маркеров, фиксирующих табличную форму отражения данных и форму целостных неделимых документов, что снижает эффективность оптимизации режима фиксации, хранения и аналитической обработки документных массивов, значительно удлиняет процесс поиска и удорожает его. Полученную автоматически информацию приходится в течение длительного времени визуально-ручным методом досортировывать и пополнять для удовлетворения пользовательских запросов. Отсутствует вычисление релевантности обязательных и факультативных реквизитов, определяющих композиционно-содержательные признаки групп, подгрупп, видов и разновидностей документов. Обнаруживается недостаточная репрезентативность ключевых слов, фраз-лексикантов и их потенциальных комбинаций, отражающих иерархию деловых отношений по казусной и основной части документа, а также формуле заключения.

Предложен изобретенный способ установления адреса объекта по поисковому тематическому признаку [2], в котором для каждого объекта составляют ограниченный набор информативных слов и определяют адрес объекта. При этом наносят элементы этого набора в форме адреса объекта в соответствующие поля носителя информации, приспособленного для считывания с помощью соответствующего считывающего средства. При тематическом поиске составляют поисковый тематический запрос и наносят его в виде поискового тематического предписания на носитель информации, аналогичный носителю информации с полями адресов объектов. Создается возможность предварить поиск тематической подборки документов поиском оптимальной системы тематических поисков в результате того, что считывают поисковое тематическое предписание с носителя информации, сравнивают слова считанного поискового тематического предписания с нанесенными на носители информации названиями полей и определяют адрес объекта по результатам этих сравнений.

Однако данный аналог предполагает манипулирование неполными данными для упорядочения идентификаторов адресатности объекта в зависимости от принадлежности к уровням информационной библиотеки документов или процедуры, подвергаемой учету. Поиск источников по запросу при неполных поисковых тематических признаках объекта может являться причиной прямого искажения смыслов документов и приводить при автоматическом поиске к выдаче нерелевантных, не содержащим точных названий, под которыми объекты значатся и по которым работники хранилища находят эти объекты при помощи поисковых систем, содержащих адреса объектов, несоответствующих теме запроса лингвистических моделей выражения деловых отношений документов. Фиксированный набор информативных слов в предметной, или унитермной, организации тематического поиска может ограничивать лингвистические поля ключевых слов, дескрипторов, необходимых для обработки служебной информации, заключенной в документе, и возможности распознавания последовательности наполнения элементов реквизитов (именования и расположения адресата, соотношения с адресантом и т.д.), определения статусной характеристики адреса объекта (должностного или сословного, официального или частного и т.д.), маркирования устойчивых моделей выражения деловых отношений в документах архивного фонда и вариативных способов представления данных.

Наиболее близким способом того же назначения к заявляемому изобретению по максимальному количеству сходных признаков является программный комплекс по описанию документов Царицынского городового магистрата конца XVIII века как информационная база реконструкции архивного фонда [3], обеспечивающий распознавание текста и классификацию материала. Главной задачей данного программного комплекса является комплектование и последующее электронное хранение копий оригинальных текстов, отложившихся в архиве и имеющих отношение к Царицынскому магистрату. С точки зрения способа организации программный комплекс создан на основе файл-серверной архитектуры под названием «Электронный магистрат» с открывающимися вкладками, позволяющими загружать как текстовые элементы формуляра, так и графическую часть документов. В программном комплексе представлена база данных и интерфейс приложения, что принято за прототип.

Существенные недостатки данного программного комплекса обнаруживаются в выборе подходов к решению задачи рассмотрения разнородных атрибутивных характеристик документов. Подход, связанный с проецированием вида документа на таблицу, предполагает избыточность и повторяемость операций в процессе разработки и использования приложения. Подход на основе эмулирования связи «Ключ-Значение» в реляционной модели имеет недостатком сложность запросов на выборку и последующую их обработку, что сказывается на производительности программы в целом и возникновении проблемы ее масштабирования. Использование документно-ориентированной базы данных как наиболее перспективный подход, централизующий управление доступом входит в противоречие с предъявляемыми требованиями к приложению: подобная архитектура чаще рассчитана на небольшие объемы информации и применение в однопользовательском режиме. Несовершенным является процесс обработки естественно-языковых запросов, сформулированных в виде описания деловой ситуации или модели, ключевые параметры которых близки по структурно-композиционным и содержательным характеристикам уже известным документам, но могут менять степень своей устойчивости как обязательные элементы формуляра документа в зависимости от региональной специфики делопроизводства. Отсутствуют классификационные основания для распознавания в коллекции источников разновидностей как разновидностей документов.

Предлагаемый способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда в значительной мере устраняет названные выше недостатки при обеспечении пользовательских запросов.

В основу изобретения положена задача создания способа информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда. Предложено техническое решение автоматизированного распознавания и каталогизации целевой информации, что позволит проводить обработку текстов по структурно-содержательным параметрам, повысить эффективность хранения архивных документов, оптимизировать режим фиксации, комплектования и хранения документных массивов для удовлетворения пользовательских запросов при просмотре внесенных документов с целью анализа на основе различных реквизитов, редактирования, добавления или удаления документов в многоуровневой автоматизированной библиотеке.

Поставленная задача достигается тем, что способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда, включает распознавание текста и классификацию материала, при этом в качестве обеспечения автоматизированного распознавания текста и классификации материала используют каталогизацию структурных и содержательных параметров лингвистических моделей, целевой информации и ее обработку. Документы архивного фонда помещают в разноуровневую информационную библиотеку. В первый уровень включают книги и реестры, протокольную документацию, раздельные документы. Второй уровень содержит подгруппы. Третий уровень включает виды и разновидности документов. Группа первого уровня книги и реестры, выделяемая по форме представления информации, содержит подгруппы учетные книги, регистрационные документы, предназначенные для фиксации целевого назначения информации о поступающей и исходящей корреспонденции. Группа протокольная документация содержит подгруппы информационно справочные и распорядительные документы. Группа раздельные документы включает подгруппы распорядительные, отчетные, договорные, информационно-справочные и просительные документы, акты принятия на себя каких-либо обязательств, записи показаний судебного и несудебного характера, удостоверительные и учетные документы. Кроме того, при поступлении запроса содержимое документов обрабатывают до принадлежности к уровням. Происходит поисковый запрос, по результатам которого вычисляют релевантность обязательных и факультативных реквизитов документов, входящих в разноуровневую информационную библиотеку. Как результат поиска маркируют модели выражения деловых отношений, определяют виды документов архивного фонда по содержанию и функции и разновидности документов по тематическим признакам.

Сущность изобретения поясняется таблицами, на которых изображено:

В схеме 1 дана классификация документов архивного фонда.

В схеме 2 показаны основные этапы автоматизированной обработки документов архивного фонда.

В табл. 1 представлены формуляр и композиция документов в составе группы «Книги и реестры».

В табл. 2 представлены формуляр и композиция документов в составе группы «Раздельные документы».

В табл. 3 показан порядок следования реквизитов в корреспонденции.

В табл.4 представлены формуляр и композиция документов в составе группы «Протокольные документы».

Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного комплекса осуществляют следующим образом.

В данном способе информационного поиска лингвистических моделей выражения деловых отношений в документах архивного комплекса выделяют обязательные и факультативные элементы реквизитов, элементы композиционной части. Форма отражения данных, получающая воплощение в документах, позволяет рассматривать единицы хранения как целостные неделимые документы.

Классификация документов архивного фонда (схема 1) по форме предполагает как внешние характеристики документа - формат материального носителя, его физические свойства, способ фиксации данных, так и внутреннюю структуру. Помимо формуляра (совокупности реквизитов) в документах выделяется композиционная структура (композиция), то есть схема организации и структурной упорядоченности текста документа. Группа «Книги и реестры» образуют целые дела; источники в «Раздельных документах» характеризуются меньшим объемом (один или несколько листов); «Протокольные документы» представлены в виде многотомных изданий, объединяющих решительные определения и протоколы журналов; встречаются, кроме того, отдельные копии решений, посылаемые в качестве приложения к делам. Все основные сведения в книгах я реестрах включены с постоянными и переменными данными; форму сплошного текста, как правило, имеют раздельные документы (кроме ведомостей и описей); в протокольных документах решительные определения являются целостными текстами, журналы фиксируют информацию в текстовой и графической форме. В зависимости от тематических признаков, то есть отражения каких-либо фактических данных в текстах, в группах книги и реестры и раздельные документы выделены разновидности документов. Например, сведения об объектах и содержании регистрации оказывают влияние на различие деловых записей; это дает возможность разграничить верющие письма, явочные прошения, особые протоколы и др. (схема 1). Предмет учета лежит в основе деления на книги прихода пошлинных денег и книги прихода денежных сборов с купцов города Царицына. Информация о процедуре, подвергаемой документированию, позволяет говорить о разновидностях рапортов (например, связанных с получением указа или предложения), о письменных формах допроса (очная ставка, вопросные пункты) и т.д. В ряде случаев важную роль в классификации деловых бумаг играет авторский номинал, или «самоназвание», который не выделяется в отдельный реквизит и имеет уточняющий характер.

Основные этапы автоматизированной обработки документов архивного фонда (схема 2) соответствуют классификации документов архивного фонда (схема 1). С помощью команды на панели инструментов можно выбрать группу памятников, далее в открывающихся вкладках подгруппу, вид и разновидность (при ее наличии) документа. Открывающиеся окна позволяют обрабатывать текст по форме представления информации - по группе; по целевому назначению информации - по подгруппе; по содержанию и функции - по виду; по тематическим признакам - по разновидности документов.

Большинство реквизитов формуляра и композиция документов в составе группы «Книги и реестры» (табл. 1) соответствуют наименованиям граф таблицы. К обязательным элементам формуляра относят порядковый номер записи, дату, объект регистрации, который прописывают в реестрах, количественные данные, приводимые не во всех книгах регистрации. В учетных документах (книгах прихода и расхода) в качестве обязательных фиксируют порядковый номер, дату (которая может быть не отмечена в книгах прихода денежных сборов), объект и предмет учета, количественные данные Факультативную роль в названной группе выполняют такие реквизиты, как отметки о копии или исполнении документов, скрепы составителей.

По композиции тексты в рамках группы «Книги и реестры» представляют собой упорядоченный перечень сведений о регистрируемой бумаге или процедуре, подвергаемой учету. Реестры входящих указов и предложений, книги регистрации в качестве необходимых идентификаторов включают: адресант/адресат, краткое изложение содержания документа, регистрационный номер. Книги записи представляют собой перечень целостных текстов, полностью переписанных с оригинальных документов, с обязательным указанием их даты и подписи. Каждую такую запись рассматривают как самостоятельный документ. В записях кредитных, верющих писем, контрактов, векселей, протестов по векселям отмечено наличие устойчивых формул заверительной надписи, посредством которой утверждают факт регистрации чего-либо в судебной инстанции. Книги учета содержат данные о факте учета прихода или расхода чего-либо с указанием суммарного итога собранных либо отправленных средств.

Формуляр и композиция документов в составе группы «Раздельные документы» (табл. 2) среди обязательных реквизитов содержит номинал как наиболее последовательно представленный реквизит, а также реквизиты, автор/адресант, адресат, дату, подписи автора (доверенного лица). При этом внутренней документации (копиям с журналов, выпискам из дел, сказкам и др.) и некоторым бумагам частных лиц (подпискам, договорам, «пашпортам») не свойственно обозначение адресанта и адресата. Учетные документы, как правило, не имеют даты и адресанта, что обусловлено их вспомогательной ролью, приложением к основным делам; отсутствие номинала, наблюдаемое в ряде сообщений, связано с непоследовательным его отражением в данном виде документов. Подписи свидетелей являются важным реквизитом при юридическом подтверждении чего-либо третьими лицами (заключения сделки, предъявления паспорта и др.). К факультативным элементам документов в рамках рассматриваемой группы относят скрепы составителя (или духовного наставника), а также различные отметки, например резолюция, проставляемая тогда, когда необходимо принять какое-либо решение на основании полученных сведений. Тексты фиксируют устойчивые способы оформления тех или иных реквизитов, что свидетельствует об общепринятых правилах реализации этих способов. Так, в роли адресанта (который часто совпадает с автором) и адресата могут выступать конкретные должностные или частные лица, тогда обозначается должностное или сословное положение автора, его имя и фамилия (иногда только фамилия). Если адресантом или адресатом является учреждение, то приводится только наименование данной организации. В документах установленную форму имеет реквизит дат, для чего принято два способа, различающихся по расположению составляющих элементов: число, месяц, год и месяц, число, год. На факт придания документу юридической силы указывает порядок следования реквизитов в корреспонденции (табл. 3), наличие подписи авторов (доверенных лиц) в конце текста или после него. К факультативным элементам документов в рамках рассматриваемой группы относят скрепы составителя (или духовного наставника), печать, отметки о получении документа, о копии, резолюция, проставляемая тогда, когда необходимо принять какое-либо решение на основании полученных сведений. На поступающей корреспонденции проставляют отметку о получении документа. Эту отметку оформляют с помощью даты и краткого причастия со значением передачи объекта. Использование названных языковых единиц различают в зависимости от того, передавалась ли бумага самим автором или доставлялась с курьером по почте. Деловые тексты регистрируют принятые способы обозначения приложения к основному документу.

По композиции текст раздельного документа начинают с казусной части: в отчетных документах, в информационно-справочных документах, распорядительных документах с указания на факт проведения юридической процедуры, что отмечено в договорных документах, актах принятия обязательств, записях показаний и удостоверительных текстах. Основная часть как композиционный параметр присутствует во всех раздельных документах, кроме учетных документов. Формулы заключения зафиксированы в подписках, сказках, в расписках, в сообщениях, доношениях, рапортах и документах других видов. Учетные бумаги содержат перечень данных о предметах и лицах.

Рассмотрим структурные особенности документов в рамках некоторых подгрупп.

Распорядительные, отчетные и информационно-справочные документы. Для указов, приказов, наставлений и предложений характерно наличие казусной и основной частей. В рамках казусной части обозначен инициирующий документ - распорядительный акт магистрата или высших органов власти, прошения и доношения частных лиц, определенный вопрос, по которому принимается соответствующее распоряжение. После казусной части в распорядительных текстах приводят суть принятого решения с помощью глаголов принуждения «приказали», глагола речевого сообщения «предлагаю» и др. В конце текста или после него в обязательном порядке проставляют дату, что соответствует правилам делопроизводства указанного периода. Иногда после изложения сути распоряжения могут употребляться различного рода формулы заключения.

Отчетные документы составляют рапорты, в которых излагают суть конкретных поручений подведомственным службам или лицам, поэтому здесь фиксируют казусную часть, содержащую сведения об официальных распоряжениях начальства, а также факт исполнения поручения этими службами и лицами в основной части. Заключительный композиционный отрезок содержит обобщение всех содержащихся сведений посредством использования устойчивой формулы со значением речевого сообщения. Отчетные органы (лица) кроме отчета считают необходимым запросить информацию о принятом вышестоящими службами решении по конкретным вопросам на основании фактов, изложенных в данных текстах.

Информационно-справочные документы включают корреспонденцию (сообщения, доношения, объявления) и создаваемые для внутренних целей бумаги (выписки из дел, копии с журналов).

Входящие и исходящие бумаги указанных функциональных подгрупп отражают иерархию служебной информации в формуляре и композиции документов в составе группы «Протокольные документы» (табл. 4). В таблице показано, что в документах, направляемых в органы власти, равные или низшие по рангу, вначале указывают адресант, то есть место, откуда бумагу посылают. Далее следуют обозначения адресата (либо наименование организации, либо указание должности, имени и фамилии лица) и название документа. В протокольных документах порядок расположения адресанта и адресата разнится в зависимости от того, кем представлен адресант - должностным или частным лицом. Так, в сообщениях сначала указывают «от кого», затем «кому», в объявлениях частных лиц наблюдается обратная ситуация. Данные три реквизита выделяются из текста, название пишется справа. Общим признаком в оформлении отчетных и информационных документов считается частотное использование в их заключительной части этикетных формул с обобщающим значением, выражающим интенцию автора (в сообщениях) и другие. Специфика содержания выписок из дел, копий с журналов заключается в обобщении каких-либо данных о ходе рассмотрения определенного дела, используемых в справочных целях.

Договорные документы. Договорам свойственно закрепление факта совершения сделки, делегирования определенных прав. Важную роль играет факт освидетельствования третьей стороной заключенной сделки в купчих, контрактах, верющих письмах.

Просительные документы. Исходя из состава документов исследуемого фонда, можно заключить, что такой вид, как прошение, имеет различные способы представления данных. Первый из них позволяет достичь сходства по структуре с входящей документацией других видов: из текста выделены адресант и адресат, номинал. Второй способ расположения данных представлен законодательно регламентированной рубрикой документного текста на пункты, свойственные челобитным, входившим в делопроизводственную практику. Обязательным компонентом выступает краткое страдательное причастие от глагола волеизъявления «повелеть» со связочным глаголом прошедшего времени «было». В рамках приведенной фразы, подчеркивающей абсолютную власть императора над всеми уровнями власти, не допускается варьирования.

Основная задача составителя - удовлетворение просьбы - выражают в обозначении даты написания в рамках устойчивого оборота со стержневым компонентом - глаголом «просить» в форме настоящего времени 1-го лица, ед. ч., если автором являлся один человек, или мн. ч., если речь идет о нескольких просителях.

Тексты показывают, что сосуществование в пределах архивного фонда документов с одним и тем же номиналом, различно оформленных, свидетельствует о новизне в развитии делопроизводственной документации, постепенной замене старых формуляров новыми.

Записи показаний допрашиваемых лиц включают такие виды документов, как объяснения, сказки, допросы. Объединить их в одну подгруппу позволил тот факт, что все они так или иначе представляют собой принудительные пояснения лиц по ранее известным фактам, выражающие мнение того лица, которого спрашивают о произошедших событиях посредством принуждения к подробному пересказу всех обстоятельств дела.

Общие черты в форме сказок и допросов. Определяя сказки как письменные показания по определенному вопросу, подававшиеся по разным поводам, когда администрации нужны сведения по какому-либо делу, выделяют их отличительную черту - несудебный характер включаемых в них сведений. Напротив, допросы представляют собой записи показаний свидетелей при расследовании противоправных действий. Однако эти документы объединяют особенности содержания; пересказ каких-либо сведений обусловливает тождественность формы данных деловых бумаг с тем отличием, что в допросах может проставляться подпись свидетеля - духовного наставника или понятых, присутствовавших при даче показаний. Подписи присутствовавших свидетелей являются способом подтверждения третьим лицом факта должного проведения следственной процедуры по правилам, принятым в юридической практике.

Тексты сказок и допросов характеризуются высокой степенью устойчивости композиционной структуры. Документы представлены в форме текста, разделенного на вводную часть (факт проведения юридической процедуры) и основное содержание (показания одного или нескольких лиц). В первой части, не выделяя из текста, обозначают реквизиты: автора документа, место создания. При этом обязательно указывают дату. Факт опроса (допроса) передан в сказках кратким причастием от глагола общения, а в допросах - от глагола речевого воздействия. Сказки и допросы могут подписываться самими авторами либо заверяются рукоприкладством доверенных лиц, что говорит иногда о неграмотности сообщающего и допрашиваемого лица. К свидетелям может добавляться скрепа духовного наставника в виде автографа священнослужителя (сана, имени и фамилии).

В рамках допросов выделены разновидности: очная ставка и вопросные пункты. Первые представляют собой запись показаний нескольких лиц, полученных в результате проведения такой следственной процедуры, как очная ставка, необходимость которой возникает в случае разночтения в данных, полученных от свидетелей и подозреваемых в преступлении. При этом приводится информация сразу обо всех авторах, далее следуют их показания, под каждым из которых проставляется подпись допрашиваемого. Вопросные пункты приближены к современным протоколам допросов. Для этой разновидности характерно включение содержания в таблицу, в которой написаны ряд вопросов, задаваемых следственными органами, и получаемые на них ответы; каждый вопрос (в левой части листа) и ответ (в правой части листа) нумеруются. Из таблицы выделена только вводная часть с указанием автора и места создания документа.

Формуляр и композиция документов в составе группы «Протокольные документы» подвергают строгой регламентации, вследствие чего обязательны все реквизиты текстовой и графической частей формуляра. В рамках названной группы по видовой принадлежности распорядительные документы (подгруппа) являются решительными определениями, информационно-справочные (подгруппа) - протоколами журналов. Решительные определения представляют сплошной текст с указанием даты, места проведения заседания; отдельно расположены регистрационный номер, подписи присутствовавших заседателей и гербовая печать. Специфика оформления журналов связана с комбинированным способом представления документной информации. Основные сведения, посвященные фиксированию процесса заседания членов присутствия, имеют текстовую форму, а по правому краю листа документа приведена таблица. В текстовой части журналов зафиксированы дата, день, место проведения заседания, время его начала и окончания, состав заседателей и их подписи; в графической части (таблице) журналов в целях контроля приводятся сведения о дате скрепления и исполнения решения. По композиции решительные определения включают повестку дня: конкретное дело, его суть, резолюцию, то есть принятое решение по делу.

В журналах в повестке дня представлены несколько вопросов и приведены решения по каждому из них. Для этих документов характерна временная и персональная детализация заседания.

Исследуемые тексты отражают влияние процесса стандартизации в делопроизводстве, что проявляется в использовании образцовых документов, реализации набора обязательных и факультативных реквизитов формуляра, в употреблении устойчивых элементов композиции, утверждении новых документных форм.

Материалом описания являются архивные документы, в составе которых выделено и проанализировано около 1000 реквизитов и более 3000 употреблений лексических единиц (всего рассмотрено 116 документов).

Таким образом, предложенный способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда обладает следующими новыми свойствами: автоматизирует распознавание документов в архивном фонде и каталогизирует целевую информацию при обработке текстов по структурно-содержательным параметрам; повышает эффективность хранения архивных документов; извлекает информацию из языковых текстов; оптимизирует режим фиксации и хранения документных массивов для удовлетворения пользовательских запросов; имеет малую стоимость, высокую скорость и низкие затраты на поддержание информационного поиска при многопользовательском режиме работы архивного фонда, позволяя просматривать внесенные документы, добавлять, редактировать и удалять их, осуществлять выборку на основе различных реквизитов.

Источники информации

1. Осипов Г.С., Тихомиров И.А., Соченков И.В. Способ и система семантического поиска электронных документов. Патент на изобретение RU №2473119. МПК G06F 17/30 (2006.01). (20.01.2013).

2. Шпаков А.А. Способ установления в хранилище местоположения объекта по поисковому тематическому признаку. Патент на изобретение RU №2107942. МПК G06F 17/30 (27.03.1998).

3. Туликова Н.А., Преферансов С.А., Вуйлов Д.А.,. Цельник Г.Л. Программный комплекс по описанию документов Царицынского городового магистрата конца XVIII века как информационная база реконструкции архивного фонда // Информационные технологии и письменное наследие. Петрозаводск; Ижевск, 2012. С. 263-267 (прототип).

Формула изобретения

Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда, включающий распознавание текста и классификацию материала, отличающийся тем, что в качестве обеспечения автоматизированного распознавания текста и классификации материала используют каталогизацию структурных и содержательных параметров лингвистических моделей, целевой информации и ее обработку, при этом документы архивного фонда помещают в разноуровневую информационную библиотеку, в первый уровень включают книги и реестры, протокольную документацию, раздельные документы, второй уровень содержит подгруппы, третий уровень включает виды и разновидности документов, группа первого уровня книги и реестры, выделяемая по форме представления информации, содержит подгруппы учетные книги, регистрационные документы, предназначенные для фиксации целевого назначения информации о поступающей и исходящей корреспонденции, группа протокольная документация содержит подгруппы информационно-справочные и распорядительные документы, группа раздельные документы включает подгруппы распорядительные, отчетные, договорные, информационно-справочные и просительные документы, акты принятия на себя каких-либо обязательств, записи показаний судебного и несудебного характера, удостоверительные и учетные документы, кроме того, при поступлении запроса содержимое документов обрабатывают по принадлежности к уровням, то есть происходит поисковый запрос, по результатам которого вычисляют релевантность обязательных и факультативных реквизитов документов, входящих в разноуровневую информационную библиотеку, и как результат поиска маркируют модели выражения деловых отношений, определяют виды документов архивного фонда по содержанию и функции и разновидности документов по тематическим признакам.

Изобретение "Способ информационного поиска лингвистических моделей выражения деловых отношений в документах архивного фонда" (Тупикова Наталия Алексеевна, Цельник Галина Львовна, Преферансов Сергей Александрович) отмечено юбилейной наградой (25 лет Российской Академии Естествознания)
Медаль Альфреда Нобеля