Одним из главных направлений деятельности ФТАД является изучение электронных документов. Для работы в этой сфере огромное значение имеет Центральный архив документов на электронных носителях Москвы (ЦАДЭНМ).
ЦАДЭНМ был создан в 2002 году для приема на хранения электронных документов Архивного фонда г. Москвы. Он входит в структуру Главного архивного управления города Москвы (Главархив Москвы), преобразованного из объединения "Мосгорархив". Архив возглавляет Владимир Иванович Тихонов, к. и. н., являющийся также сотрудником ВНИИДАД.
Архив хранит только электронные документы.
Опыт хранения электронных документов в России гораздо меньше, чем в западных странах, и накапливаться он стал сравнительно недавно, максимум 15-20 лет назад. Главным образом, это опыт, сложившийся в организациях при оперативном использовании и хранении баз данных. Некоторые ведомственные архивы (имеются в виду вычислительные центры при таких ведомствах как МВД, МПС) ведут отдельные базы данных еще с советских времен. Другие ведомства (МНС, Пенсионный Фонд РФ, Госкомстат) начали аккумулировать информацию в электронном виде с начала-середины 90-х годов. В настоящее время любая организация выделяет значительные средства на формирование и поддержание своих электронных информационных ресурсов. Но это электронные документы, которые имеют каждодневное практическое значение для органов власти, ведомств и организаций. Те же базы данных, которые выходят из оперативного использования как правило погибают. Наиболее наглядно это демонстрирует судьба баз данных, использовавшихся в ведомствах в 70-80-х гг. и утраченных в результате смены технологических платформ и административных преобразований1 .
Методология архивного хранения электронных документов в нашей стране еще только начинает развиваться. Поэтому первой задачей ЦАДЭНМ было формирование методической базы по всем направлениям работы. В отличие от других архивов, руководствующихся "Основными правилами работы" и другими общими нормативными документами, ЦАДЭНМ в своей практике не может полностью опираться на эти документы. В дополнение к ним, архив разработал регламент своей работы, который находится в завершающей стадии утверждения.
К настоящему моменту в ЦАДЭНМ сформированы список организаций - источников комплектования архива, (хотя там пока всего одна организация - Главархив Москвы) и список организаций - потенциальных источников комплектования архива, куда входят 36 органов власти и организаций Москвы. Идет планомерное обследование и экспертиза ЭД в составе информационных систем этих организаций.
Но кроме работы по списку источников комплектования архив занимается решением экстренных задач по приему на хранение подверженных риску полного исчезновения информационных ресурсов московских организаций, например, информационных ресурсов ликвидированных организаций.
Так, в конце 2003 г. ЦАДЭНМ принял на хранение от Московского центра лицензирования строительной деятельности "Мосстройлицензия" базу данных "Лицензии" на 2 единицах хранения в виде CD, содержащих 2 директории и 240 файлов. В базу данных включены документы за 1992 - 2002 годы. База содержит сведения о лицензиях, заявках на их выдачу, данные об организациях-лицензиатах, об организациях, аккредитованных на выдачу лицензий, и др.
Сейчас ведутся переговоры с Московской лицензионной палатой о передаче на хранение в архив базы данных по регистрации в Москве юридических лиц за 1991-2002 гг.
Кроме того, в рамках выполнения научно-исследовательской работы архив с октября 2002 г. формирует коллекцию опубликованных на новостных сайтах в Интернете документов о захвате заложников на мюзикле "Норд-Ост" .
Русскоязычная часть Интернета стала фактом российской культуры и русскоязычного информационного пространства, реальностью повседневной жизни. Она наполнилась событиями политической, общественной, культурной значимости, проявлениями живого интереса пользователей к самым неожиданным сторонам российской действительности. По подсчетам поискового сервера Yandex в конце 2003 г. в русскоязычном сегменте Сети насчитывалось около 700 тыс. хостов, около 100 млн web-страниц и публикаций, общим объемом около 2500 Гбайт информации. Одна только справочно-информационная составляющая Рунета в будущем может оказаться уникальным источником сведений о России и мире. Потерю всего этого электронного богатства ни современные пользователи, ни тем более их многочисленные потомки архивистам не простят. Поэтому выставленные в Сети ресурсы - еще один комплекс потенциальных исторических источников. Ежегодно в Рунете появляются сотни тысяч публикаций, документов, сообщений, справочников которые касаются разнообразных сторон нашей действительности. Интернет-СМИ - содержательно гораздо полнее и разнообразнее, чем их печатные или даже электронные аналоги, а многие форумы и чаты - неоценимый историк для исследователей, изучающих менталитет и умонастроения наших современников. И все это богатство образов, мыслей и смыслов безвозвратно исчезает в пучине Интернета, не оставляя даже намека на свое существование.
Одна из причин сложившейся ситуации заключается в том, что архивы и библиотеки оказались не готовы к такой форме документирования и хранения информации как Интернет. Интернет-документы попросту не укладываются в традиционные схемы комплектования государственных архивов, в центре которых - функциональный подход и оценка значимости фондообразователя (организации или физического лица) в политической, общественной, культурной и пр. жизни общества2 . Наладить контакты с создателями web-документов часто представляется затруднительным, тем более, что их присутствие в Интернете бывает эпизодическим или мимолетным. Здесь нужны какие-то новые подходы, которые позволили бы отразить в Архивном фонде все многообразие и динамизм среды Интернет. Например, целесообразно ставить во главу угла коллекционный способ отбора документов, т.е. формировать документы не вокруг истории какой-то организации или личности, а вокруг события или процесса. Этот подход непривычен для большинства отечественных архивистов, потому что на протяжении десятилетий они придерживались единого принципа систематизации архивных документов - их пофондовой организации. Упорядоченность Архивного фонда России до сих пор рассматривается именно с этих позиций.
Тем не менее, комплектование государственного архива интернет-ресурсами может происходить двумя отмеченными путями: 1) в составе документов, передаваемых на хранение непосредственно от организации/лица - источника комплектования, и 2) в результате научно-исследовательской деятельности самого архива по выявлению и собиранию источников по истории и культуре современного российского общества. Первый путь соответствует пофондовой организации архивных документов, которые поступают в архив на внешних электронных носителях в ходе стандартной процедуры приема-передачи документов. Во втором случае результаты НИР (комплекс интернет-документов, их описание и сопроводительная документация) оформляются в виде архивной коллекции, описи к которой утверждаются ЭПК архива. В качестве источника комплектования в данном случае может рассматриваться сам архив.
Именно последний путь был выбран в ЦАДЭНМ для формирования комплекса интернет-документов, тематически связанных с захватом заложников в Москве в Центре на Дубровке в октябре 2002 г. В коллекцию были включены документы ведущих российских новостных сайтов: ленты новостей, статьи и комментарии, интервью, обсуждение событий на форумах и т.д. В настоящее время коллекция состоит из документов 20 сайтов общим объемом около 450 тыс. единиц учета (из них - более 10 тыс. непосредственно web-документы) и размещается на пяти оптических дисках3 .
Большую часть коллекции составляют новостные ленты, которые архив копирует с различных новостных сайтов. Вторую часть - обсуждения ситуации с захватом заложников на форумах в Интернете. Эти материалы содержат информацию об отношении граждан к событиям на Дубровке, а данных об отношении граждан к историческим событиям в российских архивах отложилось очень мало.
Всегда существуют сомнения в достоверности полученной из Интернета информации. Но подтверждение достоверности сведений - это задачи исследователей. Мы же берем на себя функцию подтверждения того, что информация действительно была представлена в Интернете, что её действительно получило общество и что эта информация оказывала влияние на общественное мнение.
Существуют также определенные проблемы, связанные с авторскими правами на интернет-документы. У архива, осуществляющего их хранение, может не быть возможности связаться с их авторами и заключить с ними договоры. В такой ситуации вопрос стоит так: либо вообще не проводить отбор документов из Интернета (и тем самым оставить их сохранность на волю случая), либо всё равно формировать подобные коллекции, при этом чётко осознавая ограничения в их архивном использовании.
Обойти жесткие нормы и комплектоваться интернет-ресурсами без уведомления об этом их авторов и владельцев позволяют следующие законодательные положения:
Ст. 4 закона об авторских правах определяет (в понятии "воспроизведение"), что "запись произведения в память ЭВМ" является, по существу, изготовлением экземпляра этого произведения. В то же время выставление электронного документа в Интернете является "сообщением для всеобщего сведения", т.е. "показом, исполнением или сообщением произведения … с помощью технических средств в месте, открытом для свободного посещения". Предполагается, что автор или владелец документа выставляет его в Интернете с той целью, чтобы им воспользовались другие (пользователи). А это невозможно осуществить без "записи произведения в память ЭВМ" пользователя. То есть автор/владелец самим фактом опубликования документа в Интеренете предоставляет пользователям право создания одной копии (экземпляра) этого документа. Таким образом, пользователь является правомерным владельцем экземпляра произведения. Поэтому архив вправе получать и хранить, как минимум, один экземпляр интернет-ресурса.
Интернет-публикация представляет собой файл в формате html часто с совокупностью других файлов-приложений и является по сути программой для ЭВМ. Ст. 25 п. 1 того же закона позволяет правомерному владельцу экземпляра программы для ЭВМ изготовить ее копию "при условии, что эта копия предназначена только для архивных целей и для замены правомерно приобретенного экземпляра в случаях когда оригинал программы для ЭВМ … утерян, уничтожен или стал непригоден для использования". Также возможно внесение "в программу для ЭВМ … осуществляемые исключительно в целях ее функционирования на технических средствах пользователя". Эти положения можно рассматривать как обоснование операций по обеспечению сохранности электронных документов в архиве: создание резервных экземпляров и страхового фонда и фонда пользования. Т.е. еще как минимум два правомерных экземпляра произведения могут храниться в архиве.
Наибольшие проблемы возникают при организации использования интернет-ресурсов, находящихся на хранении в архиве. Любое копирование файлов этих документов будет рассматриваться как неправомерное распространение произведения, т.е. нарушение закона. Однако ст. 19 и 20 закона об авторских правах позволяют обойти указанное ограничение. Во-первых, использовать эти ресурсы можно "традиционным" способом: исследователь в архиве вправе делать рукописные выписки и экземпляры произведения с экрана монитора. Во-вторых, сам архив может выдавать справки по исполнению тематических запросов. В-третьих, возможно репродуцирование произведения в единичном (для исследователя) экземпляре, т.е. распечатка документа на бумаге или перевод на фотоносители. В четвертых, возможна выдача исследователям электронных копий этих документов, в которых информация будет представлена не в полном объеме4 .
В дальнейшем коллекция "Захват заложников в Москве в Центре на Дубровке" будет принята либо на государственное, либо на депозитарное хранение как часть библиотечного фонда Главархива Москвы. В любом случае в ЦАДЭНМ будет обеспечено более качественное хранение этих документов, чем если бы они остались в Интернете.
Работа с электронными документами содержит очень большую специфику. Германский архивовед Ганс Хофман писал о двух мирах: мире бумажных документов и мире электронных. И хотя В.И. Тихонов подчёркивает, что между архивными работами с электронными документами и с документами на бумажной основе нет жёсткой грани, многое из того, что делают специалисты по электронным документам для архивиста, работающего с традиционными материалами немыслимо.
В традиционном архиве при формировании страхового фонда создаётся по одной копии на особо ценные документы. У нас ситуация иная. Постоянное развитие информационных технологий приводит к тому, что электронные документы рано или поздно будет невозможно прочесть, поэтому для обеспечения их сохранности в долговременной перспективе приходится изготовлять копии на все документы в страховых, то есть программно независимых форматах. На наиболее используемые документы создаются копии в пользовательских форматах, облегчающие их воспроизведение на дисплей. Кроме того, в целях обеспечения сохранности, и подлинники, и каждая копия электронных документов должны хранится в двух экземплярах, т.е. размещаться на двух разных электронных носителях. Для бумажных документов всё это излишне и нереально, для хрупких компакт-дисков - необходимо и возможно.
Другая немаловажная специфика работы ЦАДЭНМ заключается в том, что файловая структура - предмет описания электронных документов - иерархична, а при составлении описи эту иерархическую структуру следует переводить в более привычную линейную структуру. Поэтому в наших описях присутствуют ссылочные строки, в которых указан путь к описываемым единицам учёта, и отсылки на учётный номер папки, в которую они входят. Кроме того, в описях электронных документов указывается: для файлов - имя файла с расширением, дата и время сохранения документа, его объём в байтах, url-адрес (для интернет-документов), контрольная сумма; для компьютерных папок - объём в байтах, количество вложенных в них файлов и папок. Такая опись имеет очень мало общего с традиционной.
В качестве электронных носителей используются оптические диски с однократной записью информации CD-R. Выбор этих дисков обусловлен следующими обстоятельствами:
- простотой хранения: режим их хранения предполагает более свободные параметры по сравнению даже с бумажными документами;
- распространенностью и преемственностью технологии считывания электронной информации: считывающие CD-приводы (CD-ROM) являются стандартным элементом современных компьютеров и без труда "читают" оптические диски более ранних поколений;
- однократной записью информации, что существенно способствует целям обеспечения аутентичности электронных документов;
- значительными сроками хранения: как минимум 15-20 лет;
- большей плотностью записи информации: на один оптический диск можно записать большее количество файлов, чем на магнитный или магнитооптический диски.
Сейчас в нашей стране и в мире шаг за шагом электронные документы отвоёвывают себе место под солнцем. Даже для традиционных архивистов работа на компьютере становится все более привычной. В Главархиве Москвы и московских архивах уже сотни ПК, компьютеры стали уже обычным инструментом архивной работы.
ЦАДЭНМ комплектуется всё активней, т.к. всё больше электронных документов создается в организациях. Компьютеры и Интернет становятся всё доступней. Не за горами то время, когда электронный документооборот станет повсеместным, а архивация электронных документов будет составной частью деятельности федеральных, муниципальных и ведомственных архивов.
1 См., например: Моисеенко Т., Свищев М. Изучение аграрной истории России последних десятилетий: перспективы "компьютерного источниковедения" // История и компьютер: Новые информационные технологии в исторических исследованиях и образовании. St. Katharinen, 1993.
2 См.: Автократов В.Н. Теоретические проблемы отечественного архивоведения. М., 2001. С. 149-153
3 Подробнее см.: Рощина А.С., Тимофеева Л.А. Создание тематической коллекции интернет-документов // Информационный бюллетень Ассоциации "История и компьютер". №32: Специальный выпуск. Материалы IX конференции АИК. 22-25 апреля 2004 г. Москва-Томск, 2004. С.75-77.
4 Схожую точку зрения на проблему можно найти: Семилетов С.И. Формирование коллекции из интернет-документов и проблема авторского права // Вестник архивиста. 2003. №5-6. С. 258-273; 2004. №1. С.237-255.