Коллекция цифровых газет Калифорнии - California Digital Newspaper Collection

В Коллекция цифровых газет Калифорнии (CDNC) свободно доступный архив оцифрованных Калифорния Газеты; это доступно через сайт проекта. Сборник содержит 433 033 выпуска, в том числе 4 976 984 страницы и 32 437 924 статьи.[1] Проект является частью Центр библиографических исследований и исследований (CBSR) на Калифорнийский университет в Риверсайде.

История

В Центр библиографических исследований и исследований, был одним из шести первоначальных участников Национальная программа цифровых газет (NDNP);[2] проект оцифровки газет, созданный в результате партнерства между Библиотека Конгресса и Национальный фонд гуманитарных наук. В период с 2005 по 2011 гг. CBSR получил три двухлетних гранта и опубликовал около 300 000 страниц Летопись Америки,[3] публичное лицо NDNP. Представленные опубликованные названия газет включают Звонок в Сан-Франциско, Лос-Анджелес Дейли Геральд, Амадор Леджер, а Imperial Valley Press. В 2015 г. CBSR получил 4-й грант от Проект национальной цифровой газеты. В период с 2015 по 2017 год в рамках проекта было добавлено еще 100 000 страниц из Эра золотой лихорадки, а также, Иностранный язык газеты.

В Коллекция цифровых газет Калифорнии был официально запущен в 2007 году и содержал первые 100 000 страниц, подготовленных для Проект национальной цифровой газеты с 2005 по 2007 год. Еще 50 000 страниц были созданы при поддержке Институт музейного и библиотечного обслуживания, в соответствии с положениями Закон о библиотечных услугах и технологиях, (LSTA), управляемый в Калифорнии Государственный библиотекарь. Весь контент внесен в NDNP также размещен в CDNC, с важными отличиями, отмеченными ниже в разделе «Оцифровка». В период с 2007 по 2013 год CDNC оцифровано около 300 000 страниц через LSTA программа, администрируемая Государственная библиотека Калифорнии. В 2014 году проект анонсировал 5-летний план, при поддержке LSTA, чтобы оцифровать одно название на графство, вплоть до 1923 года.[4]

В 2010 году CDNC инициировал Родился цифровой проект, с целью сбора и размещения современных PDF-файлов от издателей газет. Примерно дюжина издателей участвуют или участвуют в проекте. Видеть Коллекция цифровых газет Калифорнии для дополнительной информации.

Оцифровка

В Коллекция цифровых газет Калифорнии соблюдает стандарты, установленные Национальная программа цифровых газет. Микрофильм или же газетная бумага сканируется для создания Изображения TIFF; при любой возможности, мастер негативного фильма используется. В CBSR управляет архивом примерно 100 000 катушек негативной пленки. Они хранятся и обслуживаются Архив микрофильмов газет Калифорнии.[5] Когда негативная пленка недоступна, можно использовать позитивную, но качество изображения и распознавание текста будут не такими хорошими.

Затем изображения TIFF обрабатываются или «оцифровываются» для создания производных файлов, включая JP2, PDF и METS / ALTO XML для каждой страницы.

В отличие от NDNP, CDNC традиционно оцифровывает на уровне статьи, а не только на уровне страницы. Отдельные «сегменты» на странице - статьи, иллюстрации, реклама и т. Д. - идентифицируются во время оцифровки и могут быть извлечены исследователем. Чтобы проиллюстрировать разницу между уровнем страницы и уровнем статьи, сравните San Francisco Call в CDNC с тем же заголовком в Chronicling America.

Недавно CDNC начал оцифровывать некоторые заголовки на уровне страниц, но большинство из них все еще остаются на уровне статей. Основное преимущество уровня страниц - это более низкая стоимость, когда это делается автоматически, без участия человека.

Обложенные статьи

Рекомендации

  1. ^ "California Digital Newspaper Collection". cdnc.ucr.edu. Получено 2019-11-12.
  2. ^ "Национальная программа цифровых газет | Библиотека Конгресса". www.loc.gov.
  3. ^ Гуманитарные науки, Национальный фонд. «Летопись Америки | Библиотека Конгресса». chroniclingamerica.loc.gov.
  4. ^ "California Digital Newspaper Collection". cdnc.ucr.edu. Получено 2019-11-12.
  5. ^ "Калифорнийский архив микрофильмов газет". cnma.ucr.edu.

внешняя ссылка