«Мы 70 лет не могли найти деда, а на вашем сайте нашли за 20 минут»
Обобщенный банк данных (ОБД) «Мемориал» функционирует уже 13 лет — с 2007 года. Сайт был создан по инициативе Министерства обороны. В качестве исполнителя они привлекли нас — корпорацию «ЭЛАР» — потому что к тому времени у нас уже был опыт обработки бумажных документов: библиотечных каталогов, бумажных фондов музеев и архивов.
Перед нами поставили задачу в течение 2007 года ввести на ОБД «Мемориал» основной блок данных — это 20 миллионов записей о погибших и пропавших без вести в ходе Великой отечественной войны. Под эту задачу мы разработали свою технологию и ввели 20 миллионов имен. В 2010 году появился сайт про награды «Подвиг народа». В 2014-15 годах — сайт «Память народа», где объединены данные о потерях, наградах, а также прибавлены оперативные документы и карты.
Я был техническим руководителем сайтов ОБД «Мемориал» и «Подвиг народа» — разрабатывал базу данных, давал задание программистам и операторам, т.е. на мне лежала практически вся содержательная часть. Я занялся этой работой, потому что мне ее поручило руководство, но я счастлив, что получил ее, потому что видеть результат работы и понимать, для чего она нужна — это великая вещь.
Основная идея этих сайтов в том, что берутся архивные документы из разных мест и выкладываются в интернет, причем не только в виде базы данных, но и сами документы, на основании которых эти базы делаются, вы можете по ключевым полям находить эти документы и их просматривать.
В первую очередь это документы из Центрального архива Министерства обороны, потом из его нынешних филиалов (раньше они были самостоятельными архивами) — Военно-морского в Гатчине и Военно-медицинского в Санкт-Петербурге. Кроме того, это Российский государственный военный архив, потому что там, допустим, находятся документы НКВД, в ведомстве которого были все погранвойска. Потом ГАРФ.
У нас мощные промышленные сканеры. Что-то делается в самих архивах, что-то привозится на наши площадки. Карточки, если они в хорошем состоянии, можно быстро обрабатывать на протяжных сканерах. Дела — конечно, на бесконтактном сканере, щадящем документ. Документы совершенно не такого вида, чтобы речь могла идти об автоматическом распознавании текста — старые, рукописные, рваные и т.д. — поэтому дальнейшая обработка по большей части делается вручную. Этим занимаются очень многие люди-операторы (в пиковые моменты их было несколько тысяч человек), которые обрабатывают сканированные документы, индексируют данные.
Самое простое — обработать компактные массивы документов, а дальше надо добирать лакуны. Здесь начинаются проблемы. Например, мы обработали фонды безвозвратных потерь ЦАМО, но кроме этого фонда есть огромное количество фондов отдельных частей, у каждой части свой набор дел — и оперативные, и кадровые, и, в том числе, дела по потерям. По идее все они должны были быть продублированы в фонде потерь, но, как говорят сами сотрудники архивов, продублировано процентов 85. Значит, 15 процентов надо как-то добрать. И мы бросаем клич поисковикам: если вы находите дело, в котором есть необработанная нами информация, сообщайте, мы ее обработаем. Потому что брать подряд все дела — получится 85 процентов повторов, выброшенные деньги.
Но самая большая проблема — с военнопленными: по ним нет единого хранилища информации. Трофейные карточки, которые попали в наши архивы (ЦАМО, РГВА), мы, разумеется, обработали. Но что-то хранится в других местах — например, в США. В Германии создали базу по советским военнопленным, она сильно пересекается с именами, которые загружены в ОБД, но есть разделы, которых у нас нет — документы, полученные из КГБ Украины и Белоруссии. Все это надо выискивать. Т.е. мы пытаемся собрать информацию отовсюду, откуда можно.
Несколько лет назад мы начали потихоньку дотягиваться до документов, которые хранятся в военкоматах, потому что там и похоронки, и документы о призыве. Все время говорят, что неизвестно, сколько народу воевало. А как это посчитать, не имея документов о призыве? Слава Богу, во многих местах они сохранились, но далеко не везде. Эти архивы военкоматов обычно хранятся в самых дальних углах, где трубы, пятое-десятое — что-то протекало, где-то был пожар. Другая проблема — информация из военкоматов бывших республик СССР. Белорусские архивы пока не обработаны. С Украиной вообще сложно, на данный момент эта информация недоступна, мы не успели. Допустим, в Киеве есть музей истории Великой отечественной войны, туда свезли похоронки со всей Украины. Они это сделали централизовано. В России ситуация сложнее — в основном все хранится по военкоматам, причем по районным, по месту призыва. А, допустим, в Прибалтике уже нет этих военкоматов, в Латвии документы раскиданы по музеям и архивам, что-то там удается найти. Сейчас начали немножко получать информацию из Национального архива США.
На каждого человека на сайте столько записей, в скольких документах он встретился. Бывают ошибки, и люди могут видеть, откуда они взялись. Например, в какой-то справке неправильно записали фамилию или операторы неверно расшифровали неразборчивый почерк. К тому же бывают документы, которые друг другу противоречат. Например, часто встречается, что человек пропал без вести, а он попал в плен. Поэтому информацию нужно сопоставлять. Все это — материал для собственного анализа.
ОБД «Мемориал» — это сайт, связанный с потерями, это основные документы базы. Но там не только потери, там и те, кто вернулся из плена.
На главной странице сайта можно ввести какой-то минимум информации, остальное нужно искать в расширенном поиске (я сразу пользуюсь расширенным).
Если человек сразу вводит все, он может ничего не найти. Только если у вас очень редкая фамилия или имя. А если что-то распространенное, сразу выпадет столько записей, что вы в них захлебнетесь.
Сначала надо вводить минимальную информацию, которая не является массовой и позволяет что-то найти. Если нашлось очень много, надо думать, как уменьшить результат запроса для первоначального поиска. А если ничего не нашлось — делать менее жесткий запрос. Например, в документе может быть не указан год рождения.
В расширенном поиске можно выбрать, как именно искать. Это не так страшно, как выглядит. Изначально стоит поиск «по умолчанию», и, допустим, книг памяти в этих результатах нет. Если вас интересуют только военнопленные, снимаем все галочки, оставляем только военнопленных. Если интересуют только паспорта захоронений, ставится галочка рядом с ними.
Если нужна конкретика, придется вводить запрос в отдельных полях. Если, скажем, в общем поле ввести «Александров», будут результаты и по фамилиям, и по месту рождения (название города), и по месту призыва.
В поиске много хитрых возможностей. Можно вводить и по точной фразе (подряд идущим словам), и по точному значению поля (полностью совпадающему с указанным в запросе), и с начала поля (первые символы слова). Именно это дает возможность поиска, когда что-то введено в базу неверно. Тем более, могут быть сокращения — в некоторых документах имена даны только инициалами или отчество в виде «Ал-ич». Если мы введем нормальное отчество, такая запись не найдется. А если мы вводим основную часть слова или его начало, сайт ищет.
ОБДМ 1
В расширенном поиске есть и вторая вкладка, там такой же поиск, но не по потерям, а по перемещениям — только по массивам военно-пересыльных пунктов и запасных частей. Эти массивы не пересекаются. Второй массив — вспомогательный. Вот ушел человек на фронт, пропал и при этом неизвестно, где он служил. Как его искать? Вот эти военно-пересыльные пункты и запасные части — ниточка, по которой можно раскапывать всю цепочку. Там вдруг можно увидеть какое-то его перемещение, и уже можно будет искать, куда он делся оттуда дальше, брать документы части в архиве и смотреть в них. Но мы хотя бы будем знать, где искать.
Когда появилась ОБД «Мемориал», эффект, конечно, оказался фантастический. Стали приходить письма такого типа: «Мы 70 лет не могли найти деда, а на вашем сайте нашли за 20 минут». Было письмо, которое нас совершенно сразило: дочка погибшего бойца впервые увидела фотографию отца на карточке военнопленного.
Сайт «Подвиг народа» — про награды. Он делался к 65-летию Победы, в 2010 году. Логика здесь та же самая — есть поиск, есть расширенный поиск. Можно задавать место рождения, ФИО, место службы, звание, с какого года в армии, наименование награды. И находятся записи. Надо сказать, этот сайт тоже оказался очень востребованным, первоначально я его недооценивал. Главное, что там есть — это наградные листы с информацией, за что именно люди получили ту или иную награду. Это оказалось очень интересным для семей!
ОБДМ 2
Затем в 2014 году появился сайт «Память народа», куда влилась информация и из ОБД, и из «Подвига народа», а также добавлены оперативные дела частей, в том числе журналы боевых действий, и большое количество карт.
Здесь очень много всего. Если изначально не задать ограничений, вылезет все — и потери, и награды, и списки, и перемещение, и все, что можно. Допустим, если я введу свою фамилию — Тумаркин — сайт выдаст 5 тысяч документов. Чтобы уточнить запрос, я могу справа убрать галочки, например, в «наградах», тогда останется 3 тысячи записей. Надо еще сокращать поиск. Поэтому потери я ищу на ОБД, а награды — на «Подвиге». Но если человек пытается найти хоть что-то, ему дорога на «Память». Кроме того, поиск устроен по-разному. На ОБД и «Подвиге» — точно по запросу. А на «Памяти» расхождения в 1-2 символа тоже попадают в результат. Полезно, если не уверен в точности.
На этом сайте можно смотреть карты. Допустим, мы сейчас в Москве, и в разделе «Воинские захоронения» можем посмотреть карту — где эти захоронения есть в Москве, перейти на страницу какого-то конкретного захоронения, посмотреть там списки и документы, связанные с ним. На карте можно переключать и современные, и первичные захоронения, и места выбытия, и госпитали, и лагеря. Допустим, в деревне Улитино есть и первичные, и современные захоронения со списками похороненных там бойцов. Первичных — три, а современных — два. Вот южная окраина — список. Захоронено 7 человек. Вот их имена. А вот паспорт, можно листать его страницы. Здесь же есть и фотография памятника, и схема.
ОБДМ 3
На «Памяти народа» есть документы частей. Допустим, мы ищем 261 стрелковый полк и хотим посмотреть только журналы боевых действий. Снимаем все остальные галочки. Но в результатах могут встречаться и документы других частей, в которых есть упоминания 261 сп. Все страницы проиндексированы — какие части в какие даты на них встречаются. Вот, например, документ: «Минометный полк вел огонь. Контроль — командиром 261 сп». И дата, когда это было. Можно уточнить, за какой период нужны документы, тогда их будет меньше.
Также есть раздел «Боевой путь героя». Если про человека известно, что он тогда-то получил награду за подвиг, который был совершен такого-то числа в таких-то местах — ставится точка. А тогда-то он получил награду за подвиг уже в другую дату в другом месте — еще точка. И потом эти точки соединяются. Или известно, что он служил в такой-то части — показывается, как эта часть двигалась. Но, разумеется, это неполная информация — тут только какие-то реперные точки.
ОБДМ 4
Важно сказать, что информация о потерях далеко не всегда точна. Дело в том, что после войны проводились подворные опросы — военкоматы опрашивали население про тех, кто не вернулся с войны. Им сообщали анкетные данные, они отсылали их наверх, в бюро учета, там проверяли, что человек действительно был призван в армию (потому что были случаи, когда пытались получить какие-то льготы без этого), и если человек был призван, то применялся такой алгоритм. Вот есть дата последней связи (письма). Если человек находился на не оккупированной территории, к этой дате прибавляли три месяца и объявляли, что он пропал без вести в таком-то месяце. Если человек жил на оккупированной территории, то три месяца прибавляли к дате ее освобождения. Т.е. даты ставились в какой-то мере «от балды», но это официально обозначенные даты. Теперь человек видит, что «пропал без вести в октябре 1944 года». Если он был в Белоруссии, которую освободили в июле 1944 года, эта дата всего лишь только значит, что к июлю прибавили 3 месяца. А если он жил в Сибири, то три месяца к дате последнего письма. А вот если часть в своих донесениях пишет, что человек пропал без вести такого-то числа, это уже информационная вещь.
Еще более болезненный вопрос — достоверность информации в паспортах захоронений. Когда я начинал проектировать систему, я считал, что эта информация достоверная. Поэтому я сделал, что есть первоначальные захоронения, а есть современные. Но когда начинаешь вдаваться в это дело, вылезают вопросы. У нас перепутаны понятие «захоронение» и «мемориальное увековечение». Зачастую людей, погибших в окрестностях какого-то населенного пункта, увековечивают вместе с захороненными в этом населенном пункте, они как бы числятся на мемориальных плитах, но фактически их захоронения не найдены. Поэтому мы имеем еще варианты, когда человек числится на нескольких захоронениях, которые могут отстоять друг от друга на десятки километров. Т.е. имена на граните могут быть условными. Бывают разные ситуации — как хоронили, как составляли списки. Это имя есть в донесениях о потерях? Нет. Но он воевал тут в окрестностях. Ну, внесем сюда. И формально они считаются увековеченными.
Отдельная боль — перезахоронения. Их было много, они делались в течение многих лет. Может быть, потому что трудно ухаживать за отдельными разбросанными могилами в отдаленных районах — где-то в лесу, в поле. Останки из таких захоронений собирали (и реально, и по верхам), относили в села, строили мемориал. А уж как это делалось?
Дело еще в том, что очень многие населенные пункты называются одинаково. И вот видишь, что один и тот же человек числится захороненным в трех или четырех пунктах с таким названием. Мы можем только выставить информацию на общее обозрение, а дальше люди должны сами анализировать и разбираться, как и что. Люди ищут, пытаются понять по донесениям, насколько совпадает информация. Очень много сейчас делает, например, редакция Книги Памяти Московской области, они в последние годы издали уже много томов. Они очень тщательно выверяют разноречивую информацию.
За последние полгода произошло много изменений. На сайтах появились как новые документы, так и те, которые раньше были закрыты. То, что раньше было совсем закрыто, останется записями без образов, но со ссылкой — где, в каких архивах эти документы лежат. А по призыву и спискам частей образы, надеюсь, еще появятся. Просто пока мы не получили разрешение на их публикацию. Существенно выросло количество загруженных в базу данных документов о военнопленных из Национального архива США, загружены карточки советских военнопленных в финских лагерях из Национального архива Финляндии. Новые массивы появились на сайте «Память народа». И не только массивы, а и сводные записи, где можно увидеть как ссылки на все загруженные документы, связанные с человеком, так и его фотографию. К сожалению, не для всех, но для многих.
На сегодняшний момент в ОБД «Мемориал» содержится 64 млн записей архивных документов (это не 64 млн человек, так как на каждого человека столько записей, сколько раз он встретился в различных документах) и более 11 млн записей из Книг Памяти. В ОБД «Подвиг народа» более 20 млн записей на награждения, а в картотеках учтено более 36 млн наград. На сайте «Память народа», кроме данных из ОБД «Мемориал» и «Подвиг народа» — более 127 тыс. архивных дел с оперативными документами, 5 млн записей из документов военкоматов о призыве и демобилизации, 8 млн записей из документов со списками боевых частей, 8,6 млн записей из карточек учетных картотек ЦАМО и его филиала — архива военно-морского флота.