Полные Тексты Материалов в Коллекции Андрея Савина на сайте Internet Archive

Библиотека Университета Северной Каролины начала оцифрование Коллекции Андрея Савина. Полные тексты оцифрованных материалов находятся на сайте Internet Archive (Архив Интернета) www.archive.org и доступны бесплатно всем читателям. Материалы Коллекции прежде оцифрования должны быть каталогизированы и каталожные записи должны быть введены в электронный каталог Библиотеки. Оцифрование материалов ведётся по мере их каталогизации, если они отвечают требованиям состояния материалов, установленным Internet Archive и если они не подлежат copyright (закону об охране авторских прав).

Поиск в Internet Archive

1. Особенности поиска материалов на Русском языке в Internet Archive

2. Ведение поиска в Internet Archive

3. Ведение поиска по тематическим рубрикам

1. Особенности поиска материалов на Русском языке в Internet Archive:

Транслитерация

Вся библиографическая информация (название книги или журнала, имя автора, издателя, и т.д.) на Русском языке, но написана латинскими буквами, то есть транслитерирована в соответствии с таблицей транслитерирования Библиотеки Конгресса. Вы можете найти эту таблицу здесь: http://www.indiana.edu/~libslav/slavcatman/trrus.html. Пожалуйста распечатайте таблицу и держите её рядом с компьютером при ведении поска в Internet Archive или в электронном каталоге нашей библиотеки и других американских библиотек (об этом см. здесь). При наборе запроса латинским шрифтом игнорируйте все значки над буквами. Например русская буква Ц обозначается двумя латинскими буквами ts с дугой над ними. Дугу игнорируйте и печатайте только ts. Сами оцифрованные материалы воспроизведены на русском языке и написаны кириллицей.

Старая и современная орфография

Другая важная особенность поиска связана со старой и современной орфографией. Например в заглавии книги «Послѣдніе дни Крыма: впечатлѣнія, факты и документы» слова «последние» и «впечатления» написаны через «ять». Слово «последние» транслитерируется как «poslednie» и слово «впечатления» как «vpechatleniia», то есть русская буква «Е» транслитерируется как латинская «e», но буква «ѣ» транслитерируется как «ie». Следовательно заглавие книги правильно транслитерируется как «Posliednie dni Kryma: vpechatlieniia, fakty I dokumenty». Таким образом, если поиск ведётся в транслитерации заглавия, написанного по современной орфографии, эта книга не будет найдена в Internet Archive, нo Вы найдёте искомую запись в электронном каталоге нашей Библиотеки. Каталогизаторы вводят в каталожную запись дополнительные формы заглавия как на нормализированном (современном) русском языке так и в транслитерации современной формы заглавия. Таким образом, в каталоге вы можете найти материалы из Коллекции Андрея Савина ведя поиск используя любую форму заглавия, и следовательно, через каталожную запись подключиться к полному тексту в Internet Archive.

2. Ведение поиска в Internet Archive:

Если Вы хотите найти ВСЕ материалы из Коллекции Андрея Савина, оцифрованные на сегодняшний день, в Internet Archive:

В окне Search (Поиск) напечатайте: Savine Collection
Оставьте All Media Types в соседнем окне как есть
Кликните на красную кнопку GO (см. Ил. 1)

Иллюстрация 1.

Результаты поиска появятся на экране под рубрикой:

«Search Results
Results:
1 through 50 of 384 (0.013 secs)
You searched for: Savine Collection ».

Эта запись сообщает, что в Internet Archive находится 384 наименования и на первой странице размещены первые 50 из 384 (на сегодняшний день – 14 января, 2010). В самом низу первой страницы размещены цифры [1] 2 3 4 5 6 7 8 Next Last. Вы можете перейти на любую страницу списка, кликнув на номер желаемой страницы.

Список состоит из сокращенных библиографических записей. Кликните на название книги и Вам откроется страничка где Вы найдёте три рамки. В правой рамке большого размера на красном поле будет написано название книги в транслитерации и ниже библиографическая информация. В левой рамке, которая называется View the book (Просмотр книги) перечислены форматы в которых Вы можете просматривать книгу или журнал: Read online; PDF; B/W PDF; EPUB; Kindle; Daisy; Full text; DjVu. Напротив каждого формата указан размер файла в данном формате. Форматы EPUB и Kindle предназначены для портативных устройств для чтения книг, и Daisy для работы с программным обеспечением для плоховидящих и слепых.

Иллюстрация 2.

Read online

Кликнув на Read online Вы как бы «откроете» книгу, которую Вы можете читать или просматривать перевёртывая страницы кликнув либо на верхний, либо на нижний угол страницы. Вы можете «перелистывать» страницы вперёд и назад. К сожалению, поиск в самом тексте на русском языке ещё не возможен. Формат Read online работает и в Internet Explorer (IE) и в Firefox (Fх). Формат Read online предоставляет возможность видеть две страницы одновременно или же только одну; увеличивать и уменьшать страницы; oткрыть желаемую страницу и автоматически переворачивать страницы через интервал, установленный Internet Archive. Эти «пульты управления» находятся прямо над изображением книги. Формат Read online представляет собой изображение и, следовательно, копирование частей текста в этом формате невозможно. Если Вы хотите скопировать текст, Вам нужно открыть format Full Text. Когда Вы открываете эти форматы, текст загружается на Ваш компьютер во временную папку и загрузка может продолжаться относительно долгое время в зависимости от метода подключения к Интернету и от размера файла. Вы можете сохранить эти файлы на Вашем компьютере.

В Internet Archive находятся также книги оцифрованные Google. Эти материалы доступны только в PDF (цветном) формате и такие функции как перелёстывание страниц не работают.

Иллюстрация 3.

PDF

Формат PDF также представляет собой изображение и, следовательно, копирование и манипуляция текста невозможны. Данный формат передаёт цветное изображение. Когда Вы открываете текст в формате PDF, на экране появляется окно, в котором программа спрашивает Вас хотите ли Вы сохранить текст книги на Вашем компьютере. Если Вы хотите сохранить текст, кликните на кнопку Save. Если Вы хотите открыть текст, кликните на кнопку Open, и если Вы хотите отменить просмотр в формате PDF, кликните на кнопку Cancel.

B/W PDF

Формат B/W PDF (Black/White PDF – Черно/Белый ПДФ). Некоторые текстовые изображения легче читать в чёрно-белом изображении. Например не ярко выраженный контраст между текстом и пожелтевшей бумагой в цветном изображении оригинала книги «O chekhoslovatskikh legionerakh v Sibiri, 1918-1920 : vospominaniia i dokumenty» затрудняет чтение текста, но в чёрно-белом изображении читается легко.

Full Text

Оцифрование текста в формате Full Text производится с помощью программы Optical Character Recognition OCR (Оптическое распознование текста). Русские издательства в изгнании печатая книги часто придерживались старой орфографии и программа OCR иногда не способна распознать определенные буквы; поэтому вы увидите в этом формате знаки, которые расположены на мест букв, но таковыми не являются. Кроме того, вместо иллюстраций Вы увидите пустое место и вышеупомянутые знаки. При всех его недостатках данный формат позволяет копировать и манипулировать текст, и искать слова на русском языке в самом тексте с помощью функции Find (ПОИСК) в Вашем браузере (IE или Fx). Нажмите одновременно клавиши Ctrl и F. Внизу откроется окно Find, напечатайте слово, которое Вы хотите найти в тексте и оно высветится в тексте. Кликните на Next (Следующий) и программа будет искать данное слово от последнего найденного до конца книги. Если Вы кликните на Previous (Предыдущий), программа будет вести поиск от последнего найденного слова до начала книги. В этом формате Вы тоже можете копировать текст путём высвечивания текста, его «вырезания» и «перенесения» в свой документ.

DjVu

Как и в формате PDF, в формате DjVu (произносится ДежаВу) текст является изображением: поиск на русском языке пока тоже невозможен.

HTTP

HTTP содержит все файлы (папки) относящиеся к данной книге. Их тоже можно копировать на Ваш компьютер.

Внизу данной рамки расположен линк к "помощи для чтения текста" Help reading texts (только на английском).

3. Ведение поиска по тематическим рубрикам

Материалы Коллекции оцифровываются партиями, сгруппированными по определенным темам. На сегодняшний день (3 июня, 2009) сформировано девять тематических групп. В процессе обработки Коллекции, её каталогизации и оцифрования будут формироваться дополнительные тематические рубрики, и уже существующие группы будут пополняться новыми материалами. Каждая тематическая рубрика имеет тематический код:

Тематический код  Тематическая рубрика
        savmil  «Милитария» Книги, журналы, рукописные материалы
        savfw  Книги и журналы первой эмиграции
        savjuv  Детская литература
        savatq  Дореволюционные книги
        savref  Справочные книги; Справочные материалы Савина о Русской эмиграции
        savcos  Казацкие Материалы
        savkad  Кадетские материалы
        savlit  Литература и литературоведение
        savcin  Кинемотография

Вы можете найти все оцифрованные материалы из Коллекции, принадлежащие к определённой тематической рубрике, напечатав код этой рубрики в поисковом окне Internet Archive www.archive.org. Например, если Вас интересует военная история и Белое движение, введите в поисковое окно savmil и далее следуйте инструкциям, описанным выше в разделе 2.