Инструкция по набору описей
(редакция от 10.09.2023)
- Рекомендуется использовать браузеры Chrome или Firefox. В Internet Explorer и Edge замечены глюки, их не используем. По другим браузерам статистика пока не собрана, но скорее всего, Safari, Yandex и Opera будут работать нормально;
- Регистрируемся на сайте, подтверждаем регистрацию по ссылке на электронной почте;
- Переключаемся в полноэкранный режим (F11);
- Выбираем раздел «Задания»;
- В верхней таблице находим опись, в наборе которой хотим принять участие, нажимаем зеленую кнопку с плюсиком справа;
- В нижней таблице появляется задание, двойным щелчком мыши заходим в него;
- В окне для набора заголовков важно освоить горячие клавиши, их полный список можно посмотреть, нажав кнопку «Инструкция» справа внизу. Это позволит не использовать мышку вообще и экономить кучу времени:
- Перелистывание страниц описей CTRL+ALT+A и CTRL+ALT+D (либо на цифровой клавиатуре с включенным NUM LOCK стрелки влево и вправо);
- Пролистывание страницы описи вверх-вниз (если она не влезает на экран): CTRL+ALT+W и CTRL+ALT+S (либо на цифровой с NUM LOCK вверх и вниз);
- Переключение между полями ввода CTRL+ALT+влево и CTRL+ALT+вправо (обычные стрелки), а также TAB;
- Ввод данных формы CTRL+ENTER.
- Если на первой странице описи из задания есть продолжение заголовка дела с предыдущей страницы, его вводить не нужно. А на последней странице описи нужно ввести ТОЛЬКО продолжение заголовка с предыдущей страницы (если заголовок перенесся на последнюю страницу; если не перенесся – на последней странице ничего вводить не нужно);
- Если какую-то букву или слово не удается прочесть, записываем, как видим, но берем ВСЁ СЛОВО/ВСЮ ЦИФРУ ЦЕЛИКОМ в [квадратные скобки];
- Если возникли нюансы при наборе описи, вводим их в поле слева внизу.
- После того как все заголовки будут набраны, закрываем окно, а в предыдущем помечаем задание как выполненное (нажав на задание правой кнопкой мышки, а там - "Отметить, как завершенное"). После этого можно взять следующее.
- Если Вы вспомнили, что что-то не доделали в сданном задании - его можно вернуть, пока его не взял в работу корректор. Для этого нажмите зеленую кнопку с желтой стрелочкой рядом с заданием.
Неудобства
Главная идея системы - сделать набор удобным, оптимизировав его и исключив лишние технические действия. Если Вы обнаружили, что это не вполне работает, то сразу же
сообщайте об этом кураторам проектов или в общий чат в Телеграме.
У всех описей разный набор полей, и мы стараемся настроить каждую индивидуально. Но если оказалось, что в набираемой Вами описи не хватает каких-то полей ввода, либо,
наоборот, есть лишние - пишите нам, чтобы мы скорректировали настройки.
Даты
- Всегда вносим в формате ДД.ММ.ГГГГ. Если день не указан, то ММ.ГГГГ. Если месяц тоже не указан - ГГГГ. Год - всегда из четырех цифр.
- Если стоит пометка "без даты" или "б/д", записываем "б/д".
- Если указана только одна дата - пишем ее в поле "Начальная дата", а поле "Конечная дата" оставляем пустым.
- Если даты указаны без года, то год берем из поля "Год (раздел описи)". Иногда бывает, что у начальной год не указан - берем его из года раздела описи, а у конечной указан (другой год).
- Если возникла ситуация, которая не попадает в перечисленные, свяжитесь с нами.
Если значение для поля ввода отсутствует на странице
Иногда бывает, что среди полей для набора есть такие, значения для которых не указаны в листах задания (в основном - "Раздел описи", "Год (раздел) описи", "Связка"). В этом случае необходимо открыть опись целиком (книжечка рядом с номером образа), пролистать ее назад, найти крайнее упоминание этих полей, и внести их в набираемый фрагмент.
Это замечание не относится к полю "Примечание" и к различным галочкам, которые индивидуальны для каждого дела.
ОЦ, МК и т.д.
Пометка "ОЦ" или "ОЦД" означает "особо ценное" или "особо ценное дело". Вносится в набираемую опись путем проставления соответствующей галочки. Пометка "МК" (в описях НАРК) означает, вероятно, "микрофильмировано". Вносится в "Примечание" без расшифровки.
Сокращения
Все сокращения должны быть раскрыты, чтобы при нахождении в поиске отдельного заголовка у человека, который не имеет опыта в архивистике, не возникало трудностей в прочтении. Поэтому:
- Заголовки, которые ссылаются на предыдущие заголовки (например, "То же, о ...") раскрываем целиком, чтобы не нужно было искать предыдущий заголовок для понимания смысла;
- Все сокращения в заголовках раскрываем полностью (не относится к имени и отчеству в ФИО, данным по первой букве);
- Типовые сокращения: "губ." => "губерния", "С.Петербургского" => "санкт-петербургского"
- Чины: "д.с.с." => "действительный статский советник", "т.с." => "тайный советник". Табель о рангах можно полистать в Википедии.
- кр-н - крестьянин
- т-во - товарищество
- об-в - обществ
- с-цо - сельцо
- мещ-на - мещанина
- мещ-ство - мещанство
- вол. - волость
- Улож. о нак. - Уложение о наказаниях
- Уст. о нак. - Устав о наказаниях
- у. - уезд
- г. - господин
Заглавные буквы
- Согласно современным нормам русского языка с большой буквы пишутся названия учреждений. Например, "Тамбовское по воинской повинности присутствие", "Канцелярия Синода".
- С большой буквы пишутся религиозные термины, имеющие ключевое значение: Например, "Священное Писание", "Святая Троица".
- С большой буквы пишутся официальные титулования: "Великий Князь Михаил Александрович", "Его Величество Император Александр I".
- С маленькой буквы пишутся должности и чины: "тамбовский гражданский губернатор", "борисоглебский уездный исправник", "обер-прокурор Синода", "император Александр I".
Устаревшие языковые нормы
- Переводим орфографию и пунктуацию к современному русскому языку: "стариннаго" => "старинного", "Генерал Губернатора" => "генерал-губернатора", "ея" => "ее",
"малакан" => "молокан", "женам скопцев" => "женам скопцов".
- Но при этом всякие старинные формы слов оставляем, например, "сужденных" не надо менять на "осужденных".
Орфография и пунктуация
- Точку в конце заголовка ставить не нужно (за исключением сокращений, которые невозможно раскрыть)
- После точек всегда ставим пробелы. Исключение - сокращенные имя и отчество, между которыми пробел не ставится. Например, "И.В. Петров"
- Если в машинописной описи встречаются скобки, записанные /косыми чертами/, при наборе заменяем их круглыми скобками.
- К исправлению несогласованных падежей к заголовках нужно подходить с большой осторожностью, т.к. заголовки часто составлены так, что разобраться в связях между частями предложений трудно, и не всегда на первый взгляд кажущийся несогласованным заголовок на самом деле таким является.
- Написания имен оставляем неизменным, «Филипа», «Кирила», «Онисима», «Анисима» и т.д.
- Если топоним или фамилия плохо читаются, ставим их в [квадратные скобки]
- Если в описи очевидная ошибка в написании имени собственного, пишем сначала как в описи, а затем в (круглых скобках) правильный вариант. Оригинальное написание обязательно должно остаться в заголовке тоже.
- Фамилии чиновников можно уточнять по Википедии, либо по адрес-календарям, либо по именному указателю на сайте РГИА https://rgia.su/
- Названия губерний, уездов, волостей можно уточнять на этом сайте: http://www.surnameindex.info/
- Названия населенных пунктов можно уточнять в дореволюционных справочниках типа "Список населенных мест". Вот, к примеру, справочник по Тамбовской губернии. По запросу "Список населенных мест ХХХ губернии" в Яндексе, либо на сайте Государственной публичной исторической библиотеки, можно найти почти все регионы.
Связки
Иногда в описях встречаются обозначения типа "св. ХХХ" или "связка № ХХХ" (обычно, в правой части листа). Раньше дела хранились в связках (буквально).
Стопка бумаг, завязанная веревочкой крест на крест. Поэтому номер связки относится к группе дел, которые увязаны вместе.
Чаще всего номер ставится до серии дел из этой связки и распространяется на все последующие, пока не будет написан номер следующей связки. Но иногда бывает,
что связка подписана в конце серии дел. Чтобы посмотреть, как сделано в конкретной описи, нужно открыть начало описи - будет ясно, связка над первым делом или
под группой первых дел.
В некоторых архивах ввод связок не требуется, т.к. архив их уже не использует. В некоторых - требуется. Точно не требуется в ЦАНО и в РГИА. Насчет других
- информация уточняется, поэтому пока что вводим.
Предварительное автоматическое распознавание текста
(редакция от 24.09.2023)
В экспериментальном режиме для части машинописных описей доступно использование предварительно автоматически распознанного текста. В этом случае, между формой ввода заголовка и таблицей появляется желтая панель, состоящая из большого текстового поля и кнопки "Добавить распознанные заголовки" (в вертикальном режиме желтая панель - справа сверху).
Пока что, распознаются только заголовки дел, а номера, даты и количество листов - нет.
Возможно три способа работы с этим материалом:
- Медленный способ. Ввод заголовков, как обычно, с ручным копированием и вставкой текста из этого поля в форму ввода.
- Оптимальный способ. Очистка распознанного текста от мусора - удаление строк, не содержащих заголовки, и затем - нажатие на кнопку "Добавить распознанные заголовки". После этого - редактирование и дозаполнение заголовков в таблице.
- Небезопасный способ. Редактирование заголовков прямо в поле предварительного распознавания, а затем - их добавление в таблицу нажатием на кнопку "Добавить распознанные заголовки". Этот способ опасен тем, что если Вы переключите страницу или закроете окно до добавления в таблицу - результат работы не сохранится.
Важная деталь для 2 и 3 способов! Если перед нажатием на кнопку "Добавить распознанные заголовки" в форме ввода сверху заполнить поля "Раздел", "Год (раздел)", "Связка" и "Порядковый №" под первый из заголовков, то при добавлении эти данные будут учтены (номера проставятся автоматически).
Распознавание текста осуществлено техническими возможностям компании Genotek, за что им огромная благодарность!
Типичные ошибки
Появление большого объема как-то распознанного текста создает соблазн донабрать номера, даты, листаж, и перейти к следующему листу. Но так делать нельзя!
Важно буква за буквой вычитать, сравнивая со сканом, и исправить все огрехи автоматического распознавания согласно общим правилам набора описей. Обращая внимание на все мелочи, включая пробелы и запятые. Вот типичные ошибки, которые возникает желание пропустить после распознавания:
- "То же" и сокращения. Важно соблюсти все правила инструкции. В том числе, заменить все "то же", раскрыть все сокращения.
- Инородные пометы. В машинописных описях часто встречаются пометы карандащом или ручкой. Важно не пропустить их и внести в итоговый текст в нужном месте. Автоматическое распознавание их игнорирует, но наша задача - учесть!
- Знаки препинания и пробелы. При распознавании часто возникают проблемы с точками, запятыми, точками с запятой и другими знаками. Они либо неверно распознаются, либо вообще не распознаются. Кроме этого, часто пробелы оказываются не в тех местах, где должны быть согласно современной языковой норме (например, пробел часто оказывается перед знаком препинания, а не после). Важно внимательно смотреть не только на слова, но и вокруг них.
- Цифры. Автоматическое распознавание, как правило, путает римскую и арабскую единицы. Важно внимательно смотреть на все числа, и не допускать комбинаций типа "I748 год", "I4 сентября", "положение I3I9" (в этих примерах единица записана римской цифрой, а должна быть записана арабской).
- Мусор. Иногда после распознавания в тексте возникают случайные символы. Важно их обнаружить и удалить.
Другими словами, автоматическое распознавание - это не замена процесса набора заголовков описей, а только вспомогательный инструмент, результат работы которого должен быть проверен еще более внимательно, чем результат набора "с нуля"!
Инструкция по набору описей РГАДА
(редакция от 29.09.2023)
- Все общие правила из основной инструкции (см. выше) действуют и для РГАДА, но т.к. описи РГАДА - самые сложные в российской архивистике, здесь есть особенности, о которых - отдельною.
- Если справа (в месте, где, обычно, указаны примечания) стоит что-то, похожее название раздела описи (например, "Приказная изба"), то это нужно вносить в поле "Раздел описи", а не в примечание. Если поля "Раздел" нет - напишите об этом в чат, добавим.
- Если в описи присутствует год по старому летоисчислению (от Сотворения мира), то его нужно указать в поле "Заголовок" перед основным текстом ("7191 год. Текст заголовка"). При этом, если даты по современному летоисчислению не указаны, нужно пересчитать их самостоятельно и внести в поля "Дата" (от старого нужно отнять 5508, чтобы получить современное летоисчисление, т.е. 7191 год от сотворения мира - 5508 = 1683 год от Рождества Христова).
- Если в описании дела присутствуют подразделы (например, несколько документов), и у каждого указаны разные даты и количество листов (или номера страниц), то раздельные сведения о листах и датах вписываем после каждого заголовка (Заголовок, точка, начальная дата - конечная дата, количество листов, буква "л."). А в результирующие поля по всему делу указываем самую раннюю и самую позднюю даты из перечисленных и суммарное количество листов.
Инструкция по набору метрических книг
(редакция от 29.06.2023)
- Данные об обложках, началах разделов и т.п. вносить не нужно, вносим только метрические записи. В отличие от набора описей, здесь задача - набрать только ключевые данные, а не весь текст со всех страниц.
- Номера листов набираем в формате "123об-124", или если метрики не на развороте, то "123об". Точки не обязательны. Пробел имеет смысл ставить только если оборот сочетается с литерой, например "123а об-123б".
- Номер записи вводим вместе с полом: "1м", "2ж".
- Даты крещения и отпевания в основном шаблоне отсутствуют, но при желании их можно добавить.
- При вводе имен и отчеств корректируем орфографию к современным нормам ("Раман"=>"Роман"), но не меняем форму имени ("Иоанн" не нужно преобразовывать в "Иван").
- При вводе сведений об участниках события, всю сопутствующую информацию вводим в то же поле, где и ФИО, и в том же порядке и виде, как записано в оригинале (исправляя орфографию на современную). При этом для скорости имеет смысл пропускать, как минимум, в сельских приходах:
- название населенного пункта, если оно совпадает с пунктом, в котором находится церковь (но если в восприемниках или поручителях перечислены жители разных населенных пунктов, то стоит конкретизировать каждый);
- сословие, если оно соответствует типичному сословию в этом приходе (в селе нет смысла писать "государственный крестьянин", если там все такие; но если половина - однодворцы, а половина - помещичьи, то имеет смысл расписывать, хотя это и не обязательно);
- Фрагмент текста, который не удается прочесть, заключаем в [квадратные скобки].
- Используйте вертикальный режим (кнопочка на панели справа сверху);
- Используйте горячие клавиши для пролистывания страниц и сдвига страниц вверх-вниз (CTRL+ALT+W\S\A\D); для увеличения номера листа в поле ввода (CTRL+ALT+[\]); для переключения между полями (CTRL+ALT+стрелки влево и вправо); для сохранения записи (CTRL+ALT+ENTER) - это существенно сэкономит время;
- Степень заполнения полей каждый может выбрать для себя сам. Кому-то подойдет минималистичный вариант, в котором вводятся только ФИО основных участников (без поручителей и восприемников). А кто-то захочет заполнять все-все-все поля. Чем больше разных ФИО и топонимов введено - тем больше шанс для других найти что-то через поиск на сайте.
- Мы отказались от идея набирать каждое слово в отдельный столбик, т.к. это сильно замедляет процесс набора. Для будущего функционала поиска строго по фамилии, строго по топониму, строго по отчеству и т.п., будет использован автоматический разбор формульного текста на составляющие (поэтому важно не писать отсебятину, а сохранять формат записи из документа).
- При загрузке новых метрических книг вполне подойдут настройки по-умолчанию, за исключением высоты изображения - его лучше установить в значение 1800.
- Пример полного набора метрической книги сельского прихода - тут.
Инструкция по импортированию
(редакция от 29.07.2023)
- принимаются файлы в форматах .csv и .xlsx;
- в импортируемой таблице будет обработан только первый лист;
- первая строка таблицы должна содержать заголовки столбцов;
- со второй строки в таблице должны идти данные, а после данных не должно быть никаких дополнительных строк с комментариями и т.п.;
- для описей возможен импорт только в таблицу с заранее настроенными полями, а для документов возможно создание нового набора полей;
- импорт документов с несколькими типами записей (например, метрические книги) пока что не поддерживается;
- при импортировании все предыдущие записи из документа/описи будут удалены;
- в таблице-сопоставлении допускается использование формул в стиле Excel. Чтобы начать ввод формулы, нужно начать строку со знака '='. Далее допускается перечисление заглавных латинских букв, обозначающих столбцы, текстовых значений, заключенных в одинарные или двойные кавычки, и функций. Все эти значения должны быть записаны через знак '+'. Например:
=A+" "+" "+B+" "+C
Объединит через пробел значения столбцов A, B и C.
Настройки
Возможно привязать записи к изображениям. Для этого в импортируемой таблице должен быть отдельный столбец с именами файлов изображений, совпадающими с теми, которые были загружены в систему. В поле "Столбец с файлами образов" нужно указать литеру соответствующего столбца со знаком '=' в начале. Например,
=P
Создание задач
Возможно создать задачи для доввода или проверки импортированных данных. При этом можно выбрать, будут ли созданы задачи для корректоров (удобно, если импортируются данные, набранные в полном объеме), либо для наборщиков (удобно, если импортируются фрагментарно введенные данные). При этом разбивка на задачи возможна в трех режимах:
- Если импортируемые данные привязаны к изображениям, разбивка возможна по изображениям (не более N изображений в задании)
-
Если же привязки к изображениям нет, возможна разбивка по специальному разметочному столбцу. Для этого нужно вручную добавить в импортируемый файл столбец, в котором разметить будущие задачи.
Например, если мы разбиваем данные на задачи по 10 листов, то у первой строки данных в разметочном столбце ставим цифру "1", листаем образы до 11 страницы (по нумерации в "Великих описях"), находим там первую новую строку данных (или заголовок описи), затем - находим эту же строку в импортируемых данных (если ее нет, создаем ее пустой). В разметочный столбец ставим номер страниц образа (по нумерации "Великих описей").
Не обязательно проставлять номер страницы в каждой записи, достаточно сделать это только для каждой новой записи в задании. При этом важно, чтобы первая запись в задании была первой записью на соответствующем листе!
Поле с заданием разметочного столбца заполняется аналогично полю привязки к именам файлов.
- Самый нежелательный, но простой вариант: создание одного огромного задания на заданный вручную диапазон изображений (для этого нужно открыть документ и выявить, с какого по какой образы охватываются импортирующимися данными).
Функции
ДАТАНОРМ(СТОЛБЕЦ)
Приводит дату к нормальному формату ДД.ММ.ГГГГ, заменяя текстовые названия месяцев и добивая нулями однозначные цифры
Пример: =ДАТАНОРМ(E)
ДАТАЭКСЕЛЬ(СТОЛБЕЦ)
Приводит дату к нормальному формату, если она задана типом "Дата" в Excel (такие даты без преобразования будут отображаться как "М/Д/ГГГГ")
Пример: =ДАТАЭКСЕЛЬ(E)
ДАТАНАЧ(СТОЛБЕЦ) и ДАТАКОНЕЧ(СТОЛБЕЦ)
Применяются, если в исходной описи дата записана диапазоном в одном столбце. Выделяют начальную и конечную части даты. Если начальная и конечная части совпадают, вместо конечной будет возвращена пустая строка.
Эти функции автоматически преобразует дату к нормальному виду (ДД.ММ.ГГГГ).
Пример: =ДАТАНАЧ(E)
ГОДНАЧ(СТОЛБЕЦ) и ГОДКОНЕЧ(СТОЛБЕЦ)
Аналогично ДАТАНАЧ, ДАТАКОНЕЧ.