«Проблема недоэксплуатирована»*

Увы, в прошлом году редакция как-то пропустила мимо первую конференцию «Информационные технологии в гуманитарных науках». Зато в этом нас было не вытащить с докладов и лекций. Всё хотелось послушать, записать, обо всём рассказать. Да и докладчики постарались, так заявили свои сообщения, что пальчики оближешь: о генераторах «мемов»; как посмотреть миллиард изображений; конструирование истории в интернет-среде; приложение для лингвистической экспертизы; сетевой анализ романа «Война и мир» и проч., проч.

Мы выбрали несколько сюжетов, чтобы показать: цифровые технологии открывают головокружительные возможности именно для исследования культуры, истории, человека.

Повезло Бентаму

Профессор Мелисса ТЕРРАС рассказала об удивительном проекте, реализуемом в Лондонском университете. Забегая вперёд — докладчику аплодировали, а хотелось даже аплодировать стоя.

В этом университете в конце XVIII – начале XIX века работал юрист, философ и реформатор Джереми Бентам, сыгравший большую роль в развитии и данного вуза, и научных знаний вообще. Он был первым англичанином, завещавшим своё тело науке. Его мумифицировали и периодически одевают в костюм, так что Бентам до сих пор присутствует на заседаниях академических советов, только голосовать не может…

Но суть даже не в этой фантастической истории. От философа Бентама осталось 60 тысяч рукописей. В 1959 году их начали транскрибировать, т.е. расшифровывать и переводить в тексты, но за 50 лет смогли обработать лишь 20 тыс. рукописей.

И вот уже в веке XXI придумали программу по расшифровке рукописей. Отсканировали их и перевели в читаемый текст. Осталось эти рукописи сверить с оригиналом, уточнить не разобранное или пропущенное слово, исправить ошибки компьютера. Ресурсов для такой работы в университете не так много, расшифровка затянется ещё лет на 50. И тогда придумали систему привлечения волонтёров. Независимо из какой сферы деятельности человек и где он живёт (хоть на Мадагаскаре) — он может зарегистрироваться на сайте, получить доступ к тексту и работать с ним.

Проект «Расшифруй Бентама» стартовал в июне 2009 года и получил невероятный отклик. За первые 80 часов 20 тысяч добровольцев изъявили желание заняться такими исследованиями; система не справлялась с таким объёмом запросов. В итоге за 9 лет с начала проекта расшифровано 19 тысяч рукописей Бентама — столько, сколько за 50 лет до этого. Имя учёного вновь актуально, его тексты вводятся в научный оборот, обсуждаются — такой судьбе можно только позавидовать. Не говоря о других эффектах и следствиях данного проекта. Ведь создана платформа, на основе которой уже начали работать университеты во всех частях мира. Например, в Австралии таким же образом решили оцифровать старые газеты — и за семь лет проекта 45 тысяч волонтёров исправили 208,571,746 строк текста.

Слушая Мелиссу, задаёшься вопросом: а есть ли в России такой корпус рукописей, который ждёт своих расшифровщиков? Информацию тут же подкидывает сеть. Есть ресурс prozhito.org (лаборатория «Прожито»), где собирают библиотеку дневников, не ограниченную ни языком, ни географией, ни историческими рамками. Многие из этих записей как раз нуждаются в расшифровке. Волонтёрам работы хватит.

Человек маломерен

Доктор физико-математических наук Александр ГОРБАНЬ, некогда работавший в Красноярском научном центре, а теперь вот уже второй десяток лет в Институте Лестера в Великобритании, задал аудитории вопрос: существует ли психологическая предрасположенность к употреблению наркотиков и можно ли выявить этот риск? И сам ответил: да.

Он рассказал о проекте, в котором было изучено более двух тысяч случаев употребления наркотиков, причём респонденты сбалансированы по полу, возрасту, уровню образования, времени употребления, периода неупотребления и др.

Для оценки предрасположенности были выбраны пять основных свойств личности, по которым делались замеры. Как отметил А.Н. Горбань, пяти показателей вполне достаточно, а «выбор параметров заменим, но пятимерность не заменима. Свойства человека скоррелированы и зависят от небольшого числа факторов. Человек вообще маломерен».

В данном исследовании люди оценивались по параметрам: тревожность, интровертность, открытость новому опыту, покладистость, рассудительность.

Так вот, у склонных к наркомании людей высокие показатели по первым трём свойствам и низкие по четвёртому и пятому. Соответственно, у тех, кто может соблазну противостоять — наоборот.

Что касается самой оценки рисков — дело это перспективное. «Явный диагноз — это пережиток прошлого. Надо предсказывать, минуя стадию диагноза».

Кто и когда оцифрует УЖ?

Примеры удивительных проектов привёл профессор Городского университета Нью-Йорка Лев МАНОВИЧ. Так, с группой разработчиков он участвовал в проекте Selfiecity, результатом которого стала интерактивная инфографика о различиях и особенностях селфи в пяти крупных городах — Москве, Нью-Йорке, Берлине, Сан-Паулу и Бангкоке. Пользователям ресурса предлагается изучить зависимости между полом, возрастом, местом проживания, позой авторов селфи, их настроением и т.д. Так, например, можно выяснить, что если в Берлине число «женских» фотографий превышает число «мужских» в 1,9 раза, то в Москве эта разница — в 4,6 раза.

Но не менее удивительными выглядят проекты, которые готовятся буквально за несколько дней в рамках учебных заданий. Конечно, это возможно, когда мы имеем дело с большими уже оцифрованными массивами информации. Так, студенты Мановича сами предложили ему и за уик-энд выполнили такой проект: собрали в один ролик титульную страницу газеты, выходившей более ста лет, и на этом примере смогли увидеть, как менялись тренды в журналистике — от шрифтов, заголовков до иерархии новостей... Вот бы такой проект сделать на основе нашей газеты, ей ведь тоже уже немало, в этом году — 45 лет!

Тема может быть интересна для всех специальностей. Допустим, в Институте фундаментальной биологии и биотехнологий имеется большой объём фотографий флоры и фауны, но они выставляются в классическом виде энциклопедии. А может ли это быть представлено по-другому? И кто бы мог выполнить эту работу — сами биологи, дизайнеры, искусствоведы, айтишники?..

Услышано на конференции от Лейфа Айзексена

«Убедительность Интернета таит опасность. Срабатывает вау-фактор, и люди верят Интернету».

Толстой в ауте

Симпатичный докладчик Даниил СКОРИНКИН из Высшей школы экономики рассказал о теории графов, с помощью которой можно построить самые неожиданные схемы и сделать весьма нестандартные выводы. Графы — это такие схематические множества, которые состоят из узлов, обозначающих объекты, и рёбер, показывающих связи между ними. Например, исследователи в Европе строили любопытные графы на основе средневековых документов по выплате налогов. По этим схемам можно проследить, каким монастырям и кто дарил деньги, в каком размере, какова была частота пожертвований и прочие любопытные штуки.

Собственное исследование Даниила посвящено рассмотрению отношений между персонажами «Войны и мира». Если хоть однажды два персонажа оказались связанными друг с другом в предложении (например, «Николай посмотрел на Соню» или «Наташа думала о Курагине…».) — они попадут в обработку. Поместив все эти связи в схему, можно увидеть интересные сюжеты: кто составляет самый притягательный узел, у кого с кем «жирные» отношения и т.д. Графы, например, демонстрируют, насколько плотно персонажи связаны друг с другом в главах, посвящённых миру, и насколько разрежены и раскиданы их отношения в военное время.

Правда, филолог В.К. ВАСИЛЬЕВ прокомментировал доклад коллеги так: «Слышите шаги? Это Толстой ушёл». Действительно, по словам самого Даниила, вопрос, зачем и кому нужны такие исследования, задают постоянно. Но у него есть ответ, который он позаимствовал у чешского исследователя Ondřej Tichý: «It’s pretty and fashionable», — это красиво и модно. От себя же Даниил добавляет: а ещё наглядно. «Ведь мы конкурируем за внимание людей, и нам нужны способы доносить информацию». Наглядность и математическая стройность нам в помощь.

Валентина ЕФАНОВА

* Сформулировал участник конференции Александр ГОРБАНЬ (Институт Лестера, Великобритания)