[Оглавление]




ПРОБЛЕМЫ  СОХРАНЕНИЯ  КУЛЬТУРНОГО  НАСЛЕДИЯ
В  ЭПОХУ  ЦИФРОВОГО  ТЕКСТА

Доклад, прочитанный на Всероссийской научной конференции
"Филологические аспекты книгоиздания - 2"
Новосибирский государственный педагогический университет
Институт филологии, массовой информации и психологии
Новосибирск, 21 февраля 2012


Ключевые слова: цифровые технологии, электронные книги и библиотеки

Аннотация: Влияние цифровых технологий на формы существования и способы распространения текстов проявляется в ряде культурных трендов и порождает специфические проблемы, требующие техно-филологических решений.


  1. Культура и информационные технологии
  2. Глобальная оцифровка
  3. Электронные библиотеки в России
  4. Вызов и ответ
  5. Задержанное развитие и фетишизация технологии
  6. Тренды
  7. Заключение
    Литература



1. Культура и информационные технологии

Филология есть деятельность по сохранению и передаче во времени духовного наследия социума, выраженного в словесной форме. Важнейшие элементы этой деятельности - текстология (установление текста), истолкование (прояснение смысла текста и задание стратегий его понимания) и комментарий (объяснение или критика отдельных мест) - одни и те же во все времена. Вместе с тем, филологическая задача обеспечения культурной преемственности решается с опорой на информационные и коммуникационные технологии, которые исторически изменчивы. Эти технологические предпосылки филологической работы и являются темой настоящего сообщения.

Важнейшие вехи в развитии коммуникационных технологий таковы: возникновение языка - появление письменности - изобретение книгопечатания - цифровая революция.

В дописьменную эпоху основным методом сохранения и передачи знания было запоминание и устная рецитация.

С развитием письменности ведущая роль перешла к текстам - то есть к речи, запечатленной в материале гораздо более долговечном, нежели устное слово: камень, дерево, кожа, бумага. Но распространение мысли посредством текста сдерживалось трудоемкостью, дороговизной и редкостью каменных и рукописных книг.

Изобретение книгопечатания в середине XV века спровоцировало информационную революцию. Последовало резкое снижение цен на книги при одновременном увеличении их количества и разнообразия. Чтение, а не слушание, стало главным методом обучения и образования. Грамотность перестала быть прерогативой избранных, стал формироваться читательский класс. Стремительное распространение печатных книг, а затем и периодики, сделало возможным массовое распространение любых идей и знаний.

Следующая информационная революция - цифровая, случившаяся в XX веке и продолжающаяся по сей день - оказалась еще более радикальной. Компьютер высвободил текст из оков материальности, а интернет и другие формы электронной коммуникации сняли пространственные ограничения на распространение информации. Новые, или цифровые медиа, основанные на принципах нумерической репрезентации, модулярности, автоматизации и транскодирования [Manovich, 2001] стали принципиально новой формой существования знания. Переход от "галактики Гуттенберга" к электронной "глобальной деревне" [McLuhan 1962, 1964] - наглядное выражение процесса этерификации/эфиризации (etherification), [Тойнби 2009] - перехода от грубых к более тонким формам, от внешнего к внутреннему, от материи к нематериальному эфиру. Этот принцип прогрессивного упрощения (или облегчения) в организации, технологии, производстве и потребления, описанный Тойнби, Маклюэн сформулировал простыми словами: "Делать все больше и больше все с меньшими и меньшими затратами".



2. Глобальная оцифровка

Самым масштабным проектом по оцифровке человеческого знания, запечатленного в книгах, является Google Books - сервис компании Google (объединивший два ее более ранних проекта - Google Book Search и Google Print, оба - с 2004 года), дающий возможность полнотекстового поиска книг, которые Google отсканировал, распознал, и хранит в своей цифровой базе данных.

Источник книг - крупнейшие библиотеки США и Европы, издательства и непосредственно авторы.

Книги, на которые истек копирайт или на распространение которых было получено разрешение издателя, доступны для полного просмотра и бесплатного скачивания. Для книг, находящихся в продаже, вводятся ограничения по просмотру количества страниц и даются ссылки на сайты издательств и магазинов, где их можно купить. Для книг, которые могут подпадать под копирайт или владелец которых не определен, показываются только фрагменты (snippets).

В ряде случаев дается ссылка на Google ebookstore (прежде известный как Google Editions) - Гугловский магазин электронных книг, открытый в 2010 году (пока только для жителей США, Великобритании, Канады и Австралии), позволяющий читать или скачивать книги в различных цифровых форматах. [В марте 2012 Google ebookstore прекратил самостоятельное существования, влившись в облачный сервис по продаже мультимедийного контента Google Play].

Большинство книг были отсканированы с помощью камеры Elphel 323 со скоростью 1000 страниц в час.

При выдаче Гугл использует двуслойный формат (изображение + текст). Качество автоматически распознанного текста во многих случаях оставляет желать лучшего (особенно это касается русских книг). Одна из главных претензий к Google Books со стороны академического сообщества - отсутствие аутентичной идентификации произведений.

На конец 2010 года в базе находилось более 15 миллиона книг, из них около миллиона - в общественном достоянии. Согласно подсчету Google, в мире издано около 130 миллионов уникальных книг (не считая переизданий). Google заявил, что отсканирует их все к концу десятилетия.

Начинание Гугл вызвало двоякую реакцию. С одной стороны, крупнейшие библиотеки, с которыми Гугл заключил соглашения об оцифровке фондов, признаются, что выполнить эту задачу своими силами они были бы неспособны. Книжный проект Гугла сулит невиданную демократизацию доступа к мировому культурному наследию. С другой стороны, консолидация всех книг мира в руках одной коммерческой компании угрожает беспрецедентной по масштабам приватизацией и коммерциализацией культурного достояния человечества.

Среди множества спорных пунктов в соглашениях Гугла - требование, чтобы библиотеки ограничивали доступа к своим же оцифрованным фондам, включая книги, находящиеся в общественном достоянии.

Среди противников этого подхода - общественная организация "Альянс открытой книги" (Open Book Alliance), считающая что Гугл, Ассоциация американских издательств и Гильдия авторов стремятся к монополизации доступа к оцифрованным книгам. Среди членов Альянса - Amazon.com, Internet Archive, Microsoft, писательские и библиотечные ассоциации.

Описанная коллизия несколько смягчается тем фактом, что Гугл все же не единственный, кто занимается оцифровкой. Наличие национальных, коммерческих и общественных проектов по оцифровке книг, к счастью, препятствует созданию абсолютной монополии в этой области.



3. Электронные библиотеки в России

Первые электронные библиотеки в России, как и другие контент-проекты в русском интернете, были созданы частными лицами - любителями и энтузиастами [Gorny 2009]. К ноябре 1994 года была открыта "Библиотека Мошкова" (нынешняя lib.ru). Спустя несколько лет на сцену вышли филологи-профессионалы. В декабре 1999 года открылась "Русская виртуальная библиотека" (РВБ), а в июле 2002 - Фундаментальная электронная библиотека "Литература и фольклор" (ФЭБ).

Официальные проекты по оцифровке, начатые в 2003-4 годах при государственной поддержке, оказались менее эффективны. В целом количество оцифрованных материалов в этих проектах незначительно; культурная значимость этих материалов маргинальна ("редкие книги", "старые журналы", "ноты" и "авторефераты"); формат представления текстов (как правило, нераспознанное изображение в формате jpg или pdf) неприспособлен для работы с текстом; доступ зачастую ограничивается стенами одного учреждения или немногочисленными "виртуальными читальными залами". Под шапкой создания "национальной электронной библиотеки" был создан своего рода спецхран с платным доступом. Эта модель - наглядный пример вливания нового вина в старые мехи: приноравливание революционных технологий цифрового века, утверждающего доступность и неисчерпаемость информации, к архаичной модели мира, озабоченной нехваткой ресурсов и контролем над их распределением.

De facto функцию национальной электронной библиотеки в России выполняют ряд проектов, основанные на принципе открытого доступа. Среди специализирующихся на русской классике это РВБ, ФЭБ и раздел "Классика" на Lib.ru.



4. Вызов и ответ

Любопытно рассмотреть историю проектов, предоставляющих цифровой текст, через призму концепции Тойнби о вызове-и-ответе как механизме развития.

Стимул к созданию библиотеки Мошкова (1994): отсутствие художественных текстов в эпоху становления русского интернета. Задача: оцифровать как можно больше самых разных текстов.

Стимул к созданию РВБ (1999) и ФЭБ (2002): текстов много, но они разрозненны, сделаны по случайным изданиям, в них много ошибок, нет справочного аппарата и т.д., то есть ими невозможно пользоваться в филологической работе. Задача: обеспечить системность, научность и точность электронных публикаций.

Открытый у Мошкова в 2004 году проект "Lib.ru: Классика", несомненно, учитывал опыт РВБ и ФЭБ, но предпочел подойти к делу более просто, сосредоточившись, опять-таки, не на хитростях разметки, метаописаниях и структурных иерархиях, а на массовой оцифровке первичных и вторичных источников, так или иначе попадающих в категорию классики.

Стимул к созданию Либрусека (2007): текстов много, но они то и дело удаляются из сети по требованию правообладателей (примеры: судебное иски к lib.ru от КМ.ру в 2004-2005; иск РАО к ruthenia.ru по поводу публикации стихов Галича в 2008, инициированный его дочерью Александрой Архангельской). Задача: исключить возможность удаления текстов по копирайтным причинам. Ответ: сервер вне российской юрисдикции, "пиратство" как принцип. В 2009 - коммерциализация - подписка, реклама, продажа электронных книг через Литрес и Аймобилко (при сохранении возможности свободного чтения с экрана).

Стимул к созданию Литреса (2006) и Аймобилки (2008) - магазинов, торгующих электронные контентом, в том числе, электронными книгами: многие тексты распространяются нелегально, в то время как можно их легально продавать, отчего выиграют авторы, издательства и компания-посредник. Задача: легализация и монетизация как уже существующего, так и вновь создаваемого контента. Ответ: объединение и легализация крупных пиратских библиотек (Litportal, Aldebaran, Fictionbook и Bookz), сотрудничество с издательствами и звукозаписывающими компаниями для создания цивилизованного рынка электронного контента.



5. Задержанное развитие и фетишизация технологии

Проблемы в развитии проектов по оцифровке могут касаться как содержания, так и формы.

Первый случай - "задержанное развитие", при котором проект, справившийся с проблемой возникновения, в какой-то момент замедляет или вовсе прекращает свой рост. Такой проект может какое-то время пользоваться набранным ранее авторитетом и влиянием и продолжать существовать в окаменевшем виде неопределенный срок, подобно стагнирующему государству, но его дезинтеграция и вытеснение другими, более динамичными проектами - это только вопрос времени.

Второй случай - фетишизация технологии, когда проект растет количественно, но не развивается качественно.

Если взглянуть на электронные библиотека, легко увидеть, что каждая из них несет на себе черты времени, когда она возникла. Например, lib.ru с ее пристрастием к голому тексту и минималистскому дизайну отражает реалии периода перехода от довебовских технологий к вебу. Устройство РВБ явно учитывает опыт вебстроительства 1990-х. Что касается ФЭБ, то структурно она более похожа на CD-ROM, нежели на сетевые проекты своего времени (что объясняется фактом, что концепция и структура ФЭБовских ЭНИ исходно разрабатывалась именно для CD-ROM’ов).

Проблема в том, что успешно ответив на один вызов, каждый проект склонен продолжать некогда выбранную стратегию, даже если изменившийся контекст ставит его перед новыми вызовами.

Так, Lib.ru продолжает выкладывать тексты в бедном формате txt (и более того, конвертирует в него из более богатых форматов - например, при заимствовании текстов из РВБ), несмотря на то, что эпоха файловых хранилищ на ftp давно миновала и что появилось множество более прогрессивных способов представления электронного текста.

Так, РВБ и ФЭБ продолжают размечать тексты согласно стандарту HTML 4.01, имея в виду чтение через браузер и распечатку на принтере, как бы не замечая появления букридеров и прочих мобильных устройств для чтения.

Это фиксация на конкретном технологическом решении можно сравнить с психологическим комплексом, при котором некогда спонтанная реакция на травму воспроизводится снова и снова, становясь все более механической и неадекватной. Очевидно, что воспроизведение принятого шаблона требует гораздо меньших затрат энергии, чем поиск новых решений, и что последовательность в выбранном способе делать дело позволяет сосредоточиться на эффективном делании самого дела. Вместе с тем, застывание формы в потоке времени может оказаться губительным. Кто сейчас высекает романы в камне, кто читает пергаменты?



6. Тренды

Книга как материальный объект все больше замещается носителями книжного содержания в абстрактной форме: книга становится эфемерной, материальны лишь устройства для чтения.

Традиционные каналы, обеспечивающие доступ к книгам - книжные магазины и библиотеки - вступают в неоднозначные отношения (от конкуренции до конвергенции) со своими электронными аналогами.

Электронные книги постепенно вытесняют печатные (подобно тому, как печатные вытеснили в свое время рукописные). Так, количество продаваемых на Амазоне электронных книг в июле 2010 года превысило продажи книг бумажных. Количество книг, которые Амазон предлагал в электронной форме, составлял (полгода назад) 630 тысяч наименований. Для сравнения: в России в то же время (по данным Озона) насчитывалось всего 22 тысячи наименований. Ожидается, что объем американского рынка электронных книг в 2012 г. составит $1,3 млрд. В России - всего $2-2,5 млн. Но это не свой особый путь, а просто стадиальное отставание.

Любопытный тренд - аренда электронных книг. В этом случае книги не покупаются, а заимствуются на время (за умеренную плату или вовсе бесплатно). Так, Амазон дает возможность арендовать книги в формате Kindle сроком на две недели (в настоящее время - только для жителей США). А подписчики сервиса Amazon Prime ($79 в год), пользующиеся Киндлом, имеют возможность бесплатно скачивать одну книгу в месяц (без необходимости когда-либо ее "возвращать"). Количество предлагаемых наименований - более ста тысяч, включая свежие бестселлеры. Библиотеки - еще один источник электронных книг. В сентябре 2011 года Амазон подключился к каталогам 11 тысяч библиотек США, предлагающим электронные книги для чтения с помощью Kindle и подобных приложений на других платформах (для пользования этим сервисом нужно иметь читательский билет).

Еще один тренд - печать по требованию в разных ее разновидностях: от распечатки книг в киосках типа Espresso Book Machine до услуги, позволяющей составлять собственные книги из доступного в сети содержания, задавая при этом их формат и оформление.



7. Заключение

Текст в цифровую эпоху утрачивает привязку к тому или иному конкретному воплощению. Он имеет тенденцию существовать во многих медийных средах и форматах и свободно перетекать из одной среды и формата в другие.

Адекватность этого перехода, однако, зависит от правильного задания алгоритмов транскодирования, что является не только технологической, но и филологической задачей. Речь идет не только об иллюзионистском воспроизведении книги как материального носителя текста, но и о выявлении абстрактных свойств самого текста, которые могут подвергаться познанию, визуализации, статистической обработке, трансформации по заданному алгоритму и т.д.

Спектр техно-филологических проблем электронного века весьма широк. Перечислим некоторые из них:

- оцифровка национального и всемирного культурного наследия (стратегии, финансирование, коллаборация, принципы отбора и структурирования, форматы представления)

- точное воспроизведение существующих печатных изданий и подготовка новых электронных изданий, не имеющих печатного аналога

- структурная и семантическая разметка электронных текстов

- обеспечение всеобщего доступа к оцифрованным материалам (технологические, правовые, финансовые аспекты)

- конвергенция издательств, библиотек и книжных магазинов, предоставляющих тексты как в печатных, так и электронных форматах

- разработка средств автоматизации работы с текстом

- использование возможностей электронной среды для филологической и междисциплинарной коллаборации



Литература




© Евгений Горный, 2012-2024.
© Сетевая Словесность, публикация, 2012-2024.




Версия для широкого дисплея
[В начало сайта]
[Поэзия] [Рассказы] [Повести и романы] [Пьесы] [Очерки и эссе] [Критика] [Переводы] [Теория сетературы] [Лит. хроники] [Рецензии]
[О pda-версии "Словесности"]