«Проблема недоэксплуатирована»*
Увы, в прошлом году редакция как-то пропустила мимо первую конференцию «Информационные технологии в гуманитарных науках». Зато в этом нас было не вытащить с докладов и лекций. Всё хотелось послушать, записать, обо всём рассказать. Да и докладчики постарались, так заявили свои сообщения, что пальчики оближешь: о генераторах «мемов»; как посмотреть миллиард изображений; конструирование истории в интернет-среде; приложение для лингвистической экспертизы; сетевой анализ романа «Война и мир» и проч., проч.
Мы выбрали несколько сюжетов, чтобы показать: цифровые технологии открывают головокружительные возможности именно для исследования культуры, истории, человека.
Повезло Бентаму
Профессор Мелисса ТЕРРАС рассказала об удивительном проекте, реализуемом в Лондонском университете. Забегая вперёд — докладчику аплодировали, а хотелось даже аплодировать стоя.
В этом университете в конце XVIII – начале XIX века работал юрист, философ и реформатор Джереми Бентам, сыгравший большую роль в развитии и данного вуза, и научных знаний вообще. Он был первым англичанином, завещавшим своё тело науке. Его мумифицировали и периодически одевают в костюм, так что Бентам до сих пор присутствует на заседаниях академических советов, только голосовать не может…
Но суть даже не в этой фантастической истории. От философа Бентама осталось 60 тысяч рукописей. В 1959 году их начали транскрибировать, т.е. расшифровывать и переводить в тексты, но за 50 лет смогли обработать лишь 20 тыс. рукописей.
И вот уже в веке XXI придумали программу по расшифровке рукописей. Отсканировали их и перевели в читаемый текст. Осталось эти рукописи сверить с оригиналом, уточнить не разобранное или пропущенное слово, исправить ошибки компьютера. Ресурсов для такой работы в университете не так много, расшифровка затянется ещё лет на 50. И тогда придумали систему привлечения волонтёров. Независимо из какой сферы деятельности человек и где он живёт (хоть на Мадагаскаре) — он может зарегистрироваться на сайте, получить доступ к тексту и работать с ним.
Проект «Расшифруй Бентама» стартовал в июне 2009 года и получил невероятный отклик. За первые 80 часов 20 тысяч добровольцев изъявили желание заняться такими исследованиями; система не справлялась с таким объёмом запросов. В итоге за 9 лет с начала проекта расшифровано 19 тысяч рукописей Бентама — столько, сколько за 50 лет до этого. Имя учёного вновь актуально, его тексты вводятся в научный оборот, обсуждаются — такой судьбе можно только позавидовать. Не говоря о других эффектах и следствиях данного проекта. Ведь создана платформа, на основе которой уже начали работать университеты во всех частях мира. Например, в Австралии таким же образом решили оцифровать старые газеты — и за семь лет проекта 45 тысяч волонтёров исправили 208,571,746 строк текста.
Человек маломерен
Доктор физико-математических наук Александр ГОРБАНЬ, некогда работавший в Красноярском научном центре, а теперь вот уже второй десяток лет в Институте Лестера в Великобритании, задал аудитории вопрос: существует ли психологическая предрасположенность к употреблению наркотиков и можно ли выявить этот риск? И сам ответил: да.
Он рассказал о проекте, в котором было изучено более двух тысяч случаев употребления наркотиков, причём респонденты сбалансированы по полу, возрасту, уровню образования, времени употребления, периода неупотребления и др.
Для оценки предрасположенности были выбраны пять основных свойств личности, по которым делались замеры. Как отметил А.Н. Горбань, пяти показателей вполне достаточно, а «выбор параметров заменим, но пятимерность не заменима. Свойства человека скоррелированы и зависят от небольшого числа факторов. Человек вообще маломерен».
В данном исследовании люди оценивались по параметрам: тревожность, интровертность, открытость новому опыту, покладистость, рассудительность.
Так вот, у склонных к наркомании людей высокие показатели по первым трём свойствам и низкие по четвёртому и пятому. Соответственно, у тех, кто может соблазну противостоять — наоборот.
Что касается самой оценки рисков — дело это перспективное. «Явный диагноз — это пережиток прошлого. Надо предсказывать, минуя стадию диагноза».
Кто и когда оцифрует УЖ?
Примеры удивительных проектов привёл профессор Городского университета Нью-Йорка Лев МАНОВИЧ. Так, с группой разработчиков он участвовал в проекте Selfiecity, результатом которого стала интерактивная инфографика о различиях и особенностях селфи в пяти крупных городах — Москве, Нью-Йорке, Берлине, Сан-Паулу и Бангкоке. Пользователям ресурса предлагается изучить зависимости между полом, возрастом, местом проживания, позой авторов селфи, их настроением и т.д. Так, например, можно выяснить, что если в Берлине число «женских» фотографий превышает число «мужских» в 1,9 раза, то в Москве эта разница — в 4,6 раза.
Но не менее удивительными выглядят проекты, которые готовятся буквально за несколько дней в рамках учебных заданий. Конечно, это возможно, когда мы имеем дело с большими уже оцифрованными массивами информации. Так, студенты Мановича сами предложили ему и за уик-энд выполнили такой проект: собрали в один ролик титульную страницу газеты, выходившей более ста лет, и на этом примере смогли увидеть, как менялись тренды в журналистике — от шрифтов, заголовков до иерархии новостей... Вот бы такой проект сделать на основе нашей газеты, ей ведь тоже уже немало, в этом году — 45 лет!
Тема может быть интересна для всех специальностей. Допустим, в Институте фундаментальной биологии и биотехнологий имеется большой объём фотографий флоры и фауны, но они выставляются в классическом виде энциклопедии. А может ли это быть представлено по-другому? И кто бы мог выполнить эту работу — сами биологи, дизайнеры, искусствоведы, айтишники?..
«Убедительность Интернета таит опасность. Срабатывает вау-фактор, и люди верят Интернету».
Толстой в ауте
Симпатичный докладчик Даниил СКОРИНКИН из Высшей школы экономики рассказал о теории графов, с помощью которой можно построить самые неожиданные схемы и сделать весьма нестандартные выводы. Графы — это такие схематические множества, которые состоят из узлов, обозначающих объекты, и рёбер, показывающих связи между ними. Например, исследователи в Европе строили любопытные графы на основе средневековых документов по выплате налогов. По этим схемам можно проследить, каким монастырям и кто дарил деньги, в каком размере, какова была частота пожертвований и прочие любопытные штуки.
Собственное исследование Даниила посвящено рассмотрению отношений между персонажами «Войны и мира». Если хоть однажды два персонажа оказались связанными друг с другом в предложении (например, «Николай посмотрел на Соню» или «Наташа думала о Курагине…».) — они попадут в обработку. Поместив все эти связи в схему, можно увидеть интересные сюжеты: кто составляет самый притягательный узел, у кого с кем «жирные» отношения и т.д. Графы, например, демонстрируют, насколько плотно персонажи связаны друг с другом в главах, посвящённых миру, и насколько разрежены и раскиданы их отношения в военное время.
Правда, филолог В.К. ВАСИЛЬЕВ прокомментировал доклад коллеги так: «Слышите шаги? Это Толстой ушёл». Действительно, по словам самого Даниила, вопрос, зачем и кому нужны такие исследования, задают постоянно. Но у него есть ответ, который он позаимствовал у чешского исследователя Ondřej Tichý: «It’s pretty and fashionable», — это красиво и модно. От себя же Даниил добавляет: а ещё наглядно. «Ведь мы конкурируем за внимание людей, и нам нужны способы доносить информацию». Наглядность и математическая стройность нам в помощь.
Валентина ЕФАНОВА* Сформулировал участник конференции Александр ГОРБАНЬ (Институт Лестера, Великобритания)