21.01.2016, Чт, 17:51, Мск, Текст: Павел Притула 3068

Перевод в электронный вид исторических документов и формирование баз данных на основе архивных описей – один из сложнейших видов оцифровки, требующий особого оборудования, технологий и внимательного отношения к оригиналам документов.

Как и во всех остальных отраслях государственной и коммерческой деятельности, оцифровка фондов в государственных и муниципальных архивах служит решению сразу нескольких задач: наведению порядка в фондовом учете, упрощению поиска документов, снижению нагрузки на сотрудников и времени при отработке запросов пользователей, сохранению ветхих оригиналов, переходу к предоставлению архивных услуг в электронном виде, в том числе платных услуг.

Работы по переводу архивных фондов в электронный вид начались еще на рубеже тысячелетий. За прошедшее с тех пор время российскими архивами оцифрованы сотни тысяч исторических документов и описей. Но все равно это лишь малая часть Архивного Фонда РФ.

Два подхода

1. Если условно представить фонды архивного учреждения в виде пирамиды, то основной ее объем будут составлять непосредственно документы, и лишь малую часть на вершине – научно-справочный аппарат (описи), обеспечивающий навигацию по фондам и поиск требуемых дел и документов.


Многие учреждения используют оцифровку для решения разовых, узких задач. По аналогии с внедрением множества программных продуктов под каждую мелкую задачу, такая оцифровка называется «лоскутной». Например, в связи с юбилеем значимой для субъекта РФ личности ожидается увеличение интереса исследователей к архивным документам. Архив получает финансирование, сканирует эти фонды и переводит в формат базы данных 2–3 соответствующие описи.

Например, в связи с юбилеем значимой для субъекта РФ личности ожидается увеличение интереса исследователей к архивным документам. Архив получает финансирование, сканирует эти фонды и переводит в формат базы данных 2–3 соответствующие описи.

Этот путь – несистемный подход, позволяющий отчитаться о выполненной работе в короткий промежуток времени, но никак не отражающийся на общей эффективности работы архива, так как суммарный объем переведенных в электронный вид документов составляет доли процента от фондов учреждений. Многие архивы идут этим путем исключительно из-за недостатка финансирования. Но большинство все-таки понимает, что необходимы долгосрочные, плановые работы.

2. Поэтому многие добиваются длительных программных бюджетов и следуют другой стратегии, гораздо более перспективной с точки зрения развития архивных услуг и онлайн-сервисов. Эту стратегию поддерживает и Федеральное архивное агентство (Росархив).


Приоритет в ней отдается переводу в электронный вид всего научно-справочного аппарата. Этот путь позволяет перейти к полноценному автоматизированному учету фондов, в том числе к созданию единых информационных систем для региональных архивов.

Кроме того, появляется возможность простого и удобного поиска по фондам, что облегчает внутреннюю деятельность и позволяет перейти к предоставлению архивных услуг в электронном виде.

Документы сканируются в текущем режиме при поступлении запросов от пользователей. Для этого архиву достаточно иметь хотя бы один профессиональный сканер. А вот для оцифровки больших по объему массивов, описей, а также особо ценных документов по прежнему привлекаются эксперты из организаций, специализирующихся на сканировании и ретроконверсии.

Специфика оцифровки архивных документов

Теперь рассмотрим чуть подробнее некоторые особенности сканирования и индексирования архивных документов и описей. В отличие, к примеру, от тиражируемых книг, в архивах почти каждый документ уникален. Огромная ответственность ложится на оператора сканирования, который должен увидеть особое состояние документа (ветхость, повреждения, уход текста в корешок, особую сшивку и т.д.) и оперативно настроить оборудование, либо передать документ на реставрацию.

Один из часто сканируемых видов архивных фондов – межевые дела. Это стандартный архивный документ с толстым корешком. Однако среди его листов встречаются вложения формата до А0. Расшивать дела нельзя, протяжную технику не применишь. Исполнитель должен обладать другим классом оборудования – широкоформатными сканерами планетарного типа (пример).

Очень высокое значение приобретает опыт , которого привлекают к работам в учреждении. Как показала многолетняя практика, частая перенастройка оборудования, необходимость в режиме реального времени отслеживать качество оригиналов и получаемых электронных образов не под силу новичкам в оцифровке. Если конкурс выиграла такая компания, велики риски значительно увеличить сроки проекта или получить некачественный ресурс (поэтому нужно обязательно досконально проверять подготовленные электронные образы при сдаче работ).

Оборудование

Особенности документов предъявляют симметрично высокие требования и к оборудованию. Для архивных документов можно использовать исключительно бесконтактную сканирующую технику – планетарные сканеры.

Причем сканер должен обладать высочайшими характеристиками разрешения, цветопередачи и контрастности, так как велико наличие неконтрастных, угасающих текстов и изображений. Какое оборудование пользуется популярностью на рынке планетарных сканеров, можно узнать из нашего обзора 2014 года.

Первый такой сканер был разработан ЭЛАР в рамках проекта оцифровки фонда 350 «Ревизские сказки и исповедальные ведомости» Российского государственного архива древних актов. Для того, чтобы сканировать ветхие оригиналы высотой до 50 см и весом до 50 кг, сканер оснащен моторизированной колыбелью. Безопасный уровень силы прижатия к стеклу контролируется несколькими сенсорами.

Особая структура, толщина, вес архивных документов иногда приводят к необходимости разработки специальной техники. Так, в большинстве государственных архивов среди востребованных фондов генеалогической направленности имеются дела толщиной более 30 см и весом до 60 кг: например, материалы переписей населения (переписные книги), документы церковных приходов о рождении и пр. Долгое время, несмотря на востребованность, эти фонды не сканировались по причине отсутствия оборудования. Подходящие сканеры появились на рынке только в конце 2013 г., но сегодня уже завоевали популярность.

Индексирование

Чтобы вести учет и иметь возможность искать документы, их надо проиндексировать – заполнить карточки в АИС. Большинство архивных документов и описей выполнены вручную или с помощью печатной машинки, то есть не поддаются качественному программному распознаванию. Требуется ручная ретроконверсия.

Снова появляются дополнительные требования к исполнителю. Во-первых, он должен обладать достаточным штатом, чтобы выполнить работу в срок. В наиболее масштабных на сегодня проектах по оцифровке архивных фондов участвовало до 700 операторов индексирования. Держать такой постоянный штат невыгодно, поэтому крупные и опытные компании именно для крупных региональных архивных проектов часто привлекают местное население. Впервые такая технология была применена при оцифровке метрических книг для проекта «Поколения Пермского края». Через Центр занятости были временно трудоустроены несколько сот человек. Причем работали они на дому, через специальное приложение.

Классический пример – в старинном документе указана дата 37 мая. Обученный и здравомыслящий оператор, естественно, не стал вносить неверные данные, а уточнил дату по соседним листам метрической книги.

Главный вопрос – как добиться 100% качества? Ведь в ФИО, датах, номерах ошибаться нельзя. На помощь приходят жесткая система и технологии. Например, метод двойного ввода, когда информация попадает в Базу данных только после одинакового внесения 2 операторами.

Но все равно остается проблема мертвых языков и написания. При ретроконверсии таких документов на первый план выходит опыт руководителей групп индексирования, которым часто приходится решать и сложные нестандартные задачи.

Описи

А теперь о главном. Как уже отмечалось в начале статьи, перспективной стратегией оцифровки архивных фондов является перевод в электронный вид полного НСА. Это – наиболее сложная работа. Методическими рекомендациями Росархива установлены правила ведения баз данных по архивным описям. Поэтому описи необходимо индексировать по широкому набору полей.

Сложность оцифровки архивных описей учтена, в том числе, в 44-ФЗ «О контрактной системе». Согласно ч. 2 ст. 56 закона, «оказание услуг, связанных с необходимостью допуска подрядчиков, исполнителей к учетным базам данных музеев, архивов, библиотек» является основанием для проведения конкурса с ограниченным участием (участие ограничено результатами предквалификационного отбора). То есть только после подтверждения претендентом своих компетенций и опыта выполнения аналогичных проектов.

Описи, как и документы, могут быть ветхими и написаны на одном из мертвых языков. Описи могут иметь очень сложную структуру и содержать . Отличается формат описей для обычной и научно-технической документации, а также объектов нефондового учета. Сформированную базу данных надо заносить в программный комплекс «Архивный фонд» и т.д.

Без глубокого понимания процессов архивной деятельности, знания нормативной и методологической базы осуществить качественный перевод НСА в электронный вид не получится. Поэтому необходимо доверять оцифровку только проверенным компаниям, доказавшим на деле свое умение обращаться с архивными фондами. А оценить бюджет можно, заказав .

Бумага - материал не вечный, быстро стареющий и легко уничтожаемый. Поэтому важную информацию, которая содержится в бумажных документах, можно легко потерять. Кроме этого, в процессе хранения документы на бумажных носителях занимают драгоценное офисное пространство, а также создают множество других проблем.
Справиться со всеми неудобствами и повысить эффективность делопроизводства в целом поможет оцифровка архивов. Современные технологии позволяют перенести всю важную текстовую и графическую информацию на электронные носители, то есть выполнить оцифровку документов.

Актуальность оцифровки

Для многих организаций оцифровка документов актуальна. Ведь чем крупнее организация, тем сложнее структура документооборота в ней, а это значит, что оцифровка бумажных архивов рано или поздно станет жизненно необходимой. Оцифровка архивов представляет собой процесс сканирования и последующей каталогизации всех документов организации.

Что это даёт?

В архивах искать необходимый документ можно часами, даже не смотря на то, что все документы распределены по папкам. Когда необходимо оперативно предоставить какую-либо информацию, лишь предварительная оцифровка бумажных архивов поможет быстро подготовить документы и предоставить их на подпись. Одним словом, используя бумажные архивы, вы теряете очень важное для любого бизнеса качество - оперативность!

Сохранность документов

Бумажные документы очень легко повредить и потерять, если во время архивации документ был размещён неверно. Оцифровка документов полностью исключает их повреждение, а удобная цифровая каталогизация позволяет осуществлять быстрый поиск по документам. Сегодня повысить эффективность делопроизводства достаточно легко.

Результаты оцифровки документов

Таким образом, все документы сохраняются в оригинальном виде с сохранением всех необходимых данных. Когда все бумажные документы пройдут процедуру оцифровки, их описывают и систематизируют. Затем их брошюруют и составляют полный каталог документов в соответствии со спецификой и потребностями организации.

Преимущества работы с нами

Воспользовавшись услугой нашей компании по оцифровке архивных документов, вы сможете снизить нагрузку как на бумажные архивы, так и на отдел ксерокопирования вашей организации, потому что документы будут доступны всем специалистам организации. Так же эффективнее использовать полезную площадь офиса и сократить расходы на содержание бумажного архива, и пользоваться оцифрованными документами удалённо через интернет, что позволит всегда под рукой иметь все необходимые документы.

Оцифровка документов - это перевод документов в цифровой вид с последующим распознаванием определенных полей документа. Если вас интересует эта услуга, обратитесь в наш копировальный центр. Мы сделаем вам выгодное предложение, лучшее по цене и качеству.

Документ в оцифрованном виде - это удобно и практично. Данная услуга приобретает популярность ввиду перехода компаний на электронный документооборот. Клиенты часто обращаются в наш копировальный центр и интересуются, что такое оцифровка архивов. Мы подробно рассказываем им как проходит данная процедура, и о том, какие плюсы она имеет. Среди последних можно отметить то, что оцифрованные документы:

  • не занимают лишнего места;
  • легко редактируются;
  • находятся в упорядоченном состоянии – что позволяет быстро производить поиск определенной информации

При необходимости можно скопировать и распечатать любой файл. Все это займет всего несколько минут.

Процесс оцифровки документов довольно сложный, требующий внимательности и ответственности. Для начала наши специалисты проводят подготовительную работу, выполняют расшивку, а после (сшивку, в некоторых случаях). Затем устраняют механические повреждения – заломы на документе, после чего происходит непосредственно сканирование, и уже после – сверка результата оцифровки с исходным образцом. Таким образом, оцифровка архивных документов может быть выполнена исключительно профессионалом, который знает все тонкости этой работы и имеет соответствующий опыт.

Документы, которые подлежат оцифровке

В нашем копировальном центре вы можете оцифровать практически все документы. Приходите к нам с бумажным образцом, слайдом, книгой, чертежами, журналом. Воспользовавшись современным оборудованием, мы переведем все это в электронный вид за минимальные сроки.

При оцифровке документов цена услуги формируется, исходя из количества материалов, их качества, времени, которым вы располагаете. Все эти данные у вас уточнит наш менеджер. На консультации он спросит, насколько срочно вам нужна оцифровка документов в Москве и на какой бюджет вы рассчитываете. В любом случае, будьте уверены, что мы подберем для вас лучший вариант. Созданные с нашей помощью каталоги и электронные архивы всегда будут под рукой, а вам не придется тратить время на поиски необходимого документа. Очень быстро вы поймете, насколько это удобно.

Чем о более крупной организации, компании идет речь, тем больше хранится документов в ее архиве, тем сложнее ее документооборот, тем более привлекательно выглядят услуги по оцифровке архивов. Итак, что такое оцифровка архивов - это процесс по сканированию и каталогизации документов.

Неудобства при работе с бумажными архивами

Так, в больших архивах на поиск нужного документа очень часто приходится тратить много времени сил. Кроме того, наиболее часто используемые документы со временем могут быть повреждены или вообще "потеряны", если их ошибочно расположили в архиве. Нередко в любом виде бизнеса случаются ситуации, когда требуется высокая оперативность в предоставлении информации: бывает нужно быстро подготовить документы для подписания, сделать бумажные или цифровые копии, аккуратно сброшюровать - при работе с бумажными архивами оперативность теряется. Это далеко не полный перечень неудобств, с которыми приходится сталкиваться при работе с бумажными архивами. Но при этом существует достаточно простой и элегантный способ решения проблемы - оцифровка документов.

Преимущества оцифровки архивов?

  • стоит отметить уменьшение нагрузки на бумажные архивы, а также на участок ксерокопирования. Так, теперь если одновременно нескольким сотрудникам организации понадобился один документ, его совершенно не обязательно ксерокопировать.
  • оцифровка документов позволяет существенно сократить расходы на содержание бумажного архива, а также высвободить некоторую площадь, ранее используемую под хранение бумажных архивов.

Как происходит процесс оцифровки документов?

  • Специально обученные специалисты занимаются сортировкой документов (на территории вашей компании или доставляют их на территорию организации, занимающейся оцифровкой архивов), затем с помощью современных сканеров производят оцифровку архивного фонда в полном объеме или отдельных документов.
  • Штрих-коды и печатные документы системой оптического распознавания символов автоматически переводятся в электронный вид. При этом сохраняются ключевые реквизиты документов: название, дата, тип, контрагент и так далее.
  • Для того, чтобы избежать возможного искажения при перепечатывании контактных данных, телефонов для оцифровки рукописной информации при оцифровке архивов применяется система двойного ввода. То есть, оцифровка документов в будущем даст вам возможность осуществлять полноценный оперативный поиск по ключевыми словам или поиск по определенным типам документов/контрагентам.

Управление файлами

Электронные архивы позволяют управлять файлами, полученными в результате сканирования. После оцифровки архивов бумажные документы подлежат систематизации и описанию. Они брошюруются, составляется систематизированный полный каталог документов с учетом потребностей и специфики компании-заказчика. Это позволяет в дальнейшем существенно экономить силы и время при работе с архивами.

Работы по оцифровке архивов

У вас начались серьезные проблемы с хранением бумажных документов? Полки ломятся от нелепо раздувшихся папок, и вы по три часа ищите нужную бумажку? Тогда пришло время заняться оцифровкой документов, которая сделает ваш кабинет или квартиру более чистой, а способ поиска более простым и удобным. Создайте собственную электронную библиотеку, редактируйте, копируйте и перемещайте цифровые файлы по своему желанию. Возможность создания цифровых документов - одно из благ цивилизации. Так воспользуйтесь им!

Прежде, чем отважиться на оцифровку своих документов, вам следует знать, что хранить их можно двумя способами - в виде изображений и в виде текстовых файлов. Хранение изображений потребует гораздо больше места на жестком диске, но при этом вы сможете сохранить стиль исходного документа. Преобразование отсканированных изображений в текстовый файл потребует дополнительных затрат времени, так как необходимо осуществить процесс оптического распознавания символов OCR (правда, если быть точным, то это название не совсем верно, так как здесь речь идет о работе с цифровой информацией, однако, как это нередко бывает, термин прижился).

Как же выбрать формат хранения документов? Очень просто: если оригинал документа написан от руки, и вам важно сохранить его «характерность» (письмо от любимого человека) или если документ является, к примеру, произведением искусства, то сохраните его в виде изображения (иногда узнаваемый почерк столь же важен, как и написанные слова). Другой более прозаической причиной для сохранения рукописных документов в виде изображений является отсутствие коммерчески доступного программного решения, пригодного для интерпретации рукописных символов. Пока эта технология застряла в КПК и планшетах, в которых она реализована несколько в ином виде, чем нам требуется. Работая с планшетом, вы пишите символы «от руки», вводя их по порядку, а программа в режиме реального времени преобразует их в печатный текст. Распознавание почерка отдельно взятого человека с отсканированного документа - дело будущего.

Сканеры

Независимо от того, в каком виде выбудете хранить ваши документы - в виде изображений или в виде текстовых файлов, вам понадобится сканер для их оцифровки. Если вы хотите оцифровать сравнительно небольшое количество документов, то многофункционального принтера или планшетного сканера вам будет вполне достаточно. Единственный их недостаток - относительно медленная скорость работы. Имейте в виду, что только более дорогие модели имеют функцию автоматической подачи листов для обработки многостраничных документов.


Среди самых лучших моделей назовем ScanSnap S1500 от Fujitsu и ScanJet Professional 3000 от HP. Скорость сканирования документов этих устройств составляет в среднем 20 страниц в минуту и выше. При этом ScanJet Professional 3000 отличается более надежным механизмом подачи бумаги, в то время как ScanSnap S1500 имеет более совершенное программное обеспечение. Оба сканера находятся примерно в одной ценовой категории, так что выбирать вам.

OCR - софт

Большинство сканеров поставляются с программным обеспечением для осуществления OCR, которое устанавливается на вашем компьютере. Если вы недовольны сопутствующим ПО или его нет, то подобные программы вещь довольно распространенная и их можно приобрести отдельно. Существуют следующие рыночные предложения:

FineReader 9 Express от ABBYY, $ 100 за обычную и $ 400 за профессиональную версию программы Pro 10;
. OmniPage 17 Standard от Nuance, $ 150 за обычную версию программы и $ 500 за профессиональную;
. Acrobat X Standard от Adobe, $ 299 за обычную версию и $ 449 за профессиональную;
. PaperPort 12 Standard от Nuance стоит $ 100 за обычную и $ 200 за профессиональную версию ПО, правда здесь нет функции OCR, только вариант управления отсканированными документами.

Разрешение

Для документов, хранящихся в виде изображений, как правило, достаточно выставить разрешение от 150 до 200 точек на дюйм, однако OCR - софт работает гораздо лучше, если изображения сохранены в более высоком разрешении - 300 пикселей на дюйм. Все зависит от того, что вам нужно. Если вы просто хотите сохранить хотя бы минимальную читабельность отсканированного документа, можете снизить требования к разрешению. Если для вас важно высокое качество, то, соответственно, увеличьте его.

OCR в веб

Существует несколько онлайн-сервисов, которые предоставляют услугу распознавания отсканированных документов. Среди наиболее известных назовем бесплатные ресурсы Free OCR , NewOCR и OCR Online . Они прекрасно подходят для небольших проектов, то есть работают только с небольшими по объему документами. Сначала вы должны отсканировать оригинал в память компьютера, а затем загрузить изображение документа на веб-сайт. Естественно, на каждом из ресурсов существуют свои ограничения как по объему, так и по содержанию документа. Так, веб-приложения распознают исключительно текст, без линий или дополнительных символов, которые присутствуют на странице.

Сервис Free OCR является бесплатным, однако размер загружаемого файла не может превышать 2 Мб и не содержать не более чем 5000 пикселей, а это примерно 50 точек на дюйм для документа обычного стандарта. Причем, вы сможете обработать не более 10 подобных документов в час. Услугами сайта NewOCR вы также можете воспользоваться бесплатно, но его интерфейс крайне примитивен, зато объем обрабатываемых документов в 2,5 раза больше - до 5 Мб. И, наконец, ресурс OCR Online требует создания бесплатного аккаунта, но позволяет загружать до 15 файлов в час объемом до 4 Мб в разрешении около 200 точек на дюйм на странице. Если вас такие объемы не устраивают, то можно купить платный доступ за $ 3.95 (8 центов за страницу) и получить возможность обработать до 50 документов за раз или заплатить $ 49.95 за обработку до 5000 (1 цент за страницу). Данное веб-приложение работает как с текстом, так и с графическими элементами, однако ему, естественно, далеко до стандартов Acrobat X или FineReader 10.

E-книги

Наверное, вы, как и я, любите запах настоящей книги, любите ощущение плотной бумаги и вид красивой графики. Однако сегодня все больше и больше людей предпочитают иметь дело с электронными книгами, для чтения которых используются так называемые специальные читалки, планшеты, смартфоны, плееры и прочие портативные устройства. Огромное количество интернет-магазинов предлагает просто гигантские объемы контента. Но что, если вы захотите иметь вашу собственную коллекцию е-книг, которые не доступны в цифровом формате?

Чтобы преобразовать ваши любимые «физические» книги в электронные, требуется их сначала отсканировать, а затем перевести в текстовый формат при помощи программы OCR. Это утомительно даже если вы будете использовать очень быстрый FLATBED-сканер. Такие сканеры напоминают «ксероксы», имея прижимную крышку, поэтому они могут сканировать не только отдельные листы, но и книги целиком. Если же вы готовы «распотрошить» любимую книгу, то можете использовать SHEETFED-сканер, которая работает по принципу факса, то есть с отдельными страницами (как ScanSnap S1500 от Fujitsu и ScanJet Professional 3000 от HP).

После того, как вы переведете свои документы, учебники или книги в форматы PDF, Word или fb2, вы можете воспользоваться специальными программами для организации, редактирования или чтения электронных документов. Например, Calibre или Stanza. - бесплатный органайзер и редактор для вашей коллекции электронных книг. Программа помогает работать с каталогом - организовывать, классифицировать, комментировать, искать, сохранять новые и старые книги на жестком диске вашего компьютера или в памяти е-ридера.