Анна Широканова

Книга Книга для тех, кто не любит статистику, но вынужден ею пользоваться

«Книга…» – это пособие по специфической теме: статистическим тестам на небольших по размеру выборках. Её можно «пройти» как учебник на занятиях или использовать как справочник. Это первое пособие такого рода на русском языке, написанное доступно и даже увлекательно. Одновременно это руководство, которое можно изучать самостоятельно и с помощью которого можно без компьютера рассчитывать тесты для небольших совокупностей (2–20 наблюдений), когда t-тест и дисперсионный анализ менее надежны.

Все, кто достаточно долго изучал статистику для социальных наук, знают историю о том, как одна из посетительниц вечеринки в Кембридже объявила, что может отличить чашку чая, в которую молоко было добавлено первым, от той, в которую чай налили до молока. На вечеринке присутствовал и статистик Рональд Фишер. Он ухватился за ситуацию и описал эксперимент, который мог бы проверить это утверждение. Согласно ему, «чайная леди» окажется права, только если из восьми случайно упорядоченных чашек чая правильно определит четыре, в которые сначала добавили молоко, и еще четыре, в которые сначала наливали чай. Существует 70 комбинаций восьми чашек чая с такими характеристиками, и вероятность того, что дама окажется права, – 1 к 70, что составляет только 1.4%. Это меньше тех 5%, что сам Фишер предложил в качестве порога критической области, позволяющего отвергнуть нулевую гипотезу. (Кстати Дэвид Зальцбург в научно-популярной книге “The Lady Tasting Tea”, вышедшей в 2001 году в Нью-Йорке, указывает, что один из коллег Фишера решил провести такой эксперимент, и леди действительно смогла определить все чашки правильно.)

Эта дегустация чая (классический случай из истории статистики) касалась небольшого количества наблюдений, тогда как те методы, которые сегодня описываются в учебниках, чаще всего касаются больших массивов данных. Маленькие выборки, с которых проще всего начать знакомство со статистикой, сегодня рассматриваются как частный случай – в толстых учебниках им посвящается не больше одной главы, и ближе к концу. Но сами по себе они удобны для знакомства со статистикой, поскольку позволяют рассчитывать многие тесты вручную. Книга Резника восполняет именно эту нишу: рассказывает о разнообразных способах анализа данных, собранных на небольших выборочных совокупностях, когда участников исследования можно буквально пересчитать по пальцам.

Ядро книги состоит из внимательного разбора каждого теста из семейства непараметрических тестов. Для иллюстрации каждого теста Резник использует какую-то житейскую историю, приводит алгоритм его расчета и показывает, как провести расчет в IBM SPSS. Название разделов сочетает и сюжет, и формальное название теста. Например «451 градус по Фаренгейту, или Как получить шкалу интервалов» (в главе рассматриваются интервальные шкалы, примером которых является градусная шкала Фаренгейта; 451 градус по Фаренгейту – это температура горения бумаги и название известного романа-антиутопии Рэя Брэдбери), «Из жизни наркоманов, или Снова вездесущий тест χ2» и т. д. Раздел о хи-квадрате для двух номинальных переменных начинается с описания ситуации и исследовательского вопроса. За ними следуют табличные данные, обоснование выбора именно этого теста, его формула, процедура проверки, содержательный вывод и ответы на популярные вопросы. Завершают раздел пошаговые снимки меню IBM SPSS с пояснениями. Изложение выстроено систематическим образом: от одной выборки – к двум и более.

Кроме самих непараметрических тестов, в пособии наглядно изложены вводные темы по описательной статистике, типам шкал, работе с графиками, теории выборочной совокупности, проверке статистической гипотезы, линейной модели (включая корреляцию, регрессионный и дисперсионный анализ).

По жанру «Книга…» чем-то похожа на детскую энциклопедию для взрослых, поскольку, кроме статистики, в ней обсуждаются занимательные истории и примеры, справочные материалы по каждому тесту и его автору. Например, в именном указателе подряд идут Христос, Цельсий и Эйзенхауэр. А тесты рассмотрены на примерах об эмоциях, беременности, диетах, роботах, курении, алкоголизме и наркопотреблении и т. д.

Трудно назвать другие пособия, в которых так последовательно описывалась бы работа с небольшими выборками. Среди похожих по стилю книг можно вспомнить “Applying Regression and Correlation” Джереми Майлза и Марка Шевлина, где от простого к сложному описывается проведение и диагностика линейной регрессии. Когда "Книга..." вышла в свет в 2008 году, она была хорошо принята профессиональным сообществом и получила премию «Золотая Психея» в номинации «Проект года в психологическом образовании».

Кроме случая первого знакомства со статистикой, «Книгу…» можно рекомендовать и как справочник для начинающих работать в исследовательских областях, где небольшие выборки – это норма (например, в эпидемиологии или психологии), а также для тех, кто раньше имел дело только с большими массивами данных. В то же время формат «Книги…» со времени ее появления мог несколько устареть. Для получения данных к задачам автор приглашает связываться с ним лично. И хотя (поскольку речь о небольших выборках) данные можно полностью воссоздать по приведенным таблицам, если бы книга писалась сегодня, то такой способ обучения наверняка сопровождался бы обучающими видео, архивом данных на сайте издателя и, конечно, электронной версией.

Сегодня бумажное издание стало печатным раритетом, но его можно найти во многих научных библиотеках и все еще можно купить в нескольких магазинах России. До электронной версии дело так и не дошло, но возможно, книгу еще ждет переиздание.

Анна Широканова

доцент НИУ ВШЭ – Санкт-Петербург, старший научный сотрудник ЛССИ НИУ ВШЭ

Рекомендуем

The City of Tomorrow: Sensors, Networks, Hackers, and the Future of Urban Life

Это было навсегда, пока не кончилось. Последнее советское поколение

Методы и методики исследования политической коммуникации

Бизнес-сети в России

Собственная логика городов: новые подходы в урбанистике

Sidewalk

Элементарное введение в статистику (от практики к теории)

Mixed Methods Social Networks Research: Design and Applications

Social Semiotics

City publics: the (dis)enchantments of urban encounters

Четыре установки в теории гуманитарного исследования

Urban outcasts: A comparative sociology of advanced marginality

The Oxford Handbook of Analytical Sociology

Death, Mourning, and Burial: A Cross-Cultural Reader

The Psychology of Human Values

Social and Economic Networks

Discourse as structure and process

Статистика и котики

An Adventure in Statistics. The Reality Enigma

The Social Citizen: Peer Networks and Political Behavior

Exponential Random Graph Models for Social Networks

Field experiments: design, analysis and interpretation

Методический аудит массового опроса

Crowdsourcing in the Public Sector

Бедность и развитие ребенка

Moral Tribes: Emotion, Reason, and the Gap Between Us and Them

Отчёт AAPOR о больших данных

Краудсорсинг. Коллективный разум как инструмент развития

Slide:ology. Исскуство создания выдающихся презентаций

Мастерство презентации