Оценка нередко является этапом, предваряющим вторую форму прикладного исследования — вмешательство с целью коррекции или предупреждения нарушений. В качестве примера, иллюстрирующего особенности программ вмешательства, описаны программы тренировки памяти для пожилых людей. Одной из особенностей программ вмешательства является необходимость выявления потенциальных участников, задача, для решения которой важна точность оценочной методики. Оценка имеет значение и по окончании программы для определения ее эффективности. Актуальным вопросом является также проблема переноса приобретенных навыков на ситуации, выходящие за пределы контекста вмешательства, а также стойкость достигнутых изменений. Наконец, цель многих проектов вмешательства — разработка программ, которые могли бы получить широкое распространение; поэтому важно, чтобы исследовательские проекты были осуществимы и их основные элементы достаточно понятны.
Большинству из нас рассуждать о влиянии на развитие микросистемных факторов (родителей, друзей, учителей и т. д.) значительно легче, чем о влиянии контекстов другого уровня, которые рассматривал Бронфенбреннер в своей теории экологических систем. Задумайтесь о роли мезосистемы, экзосистемы и макросистемы в своем собственном развитии. Как эти контекстуальные факторы более высокого уровня повлияли на то, кем вы стали? Как иначе могло бы происходить ваше развитие, если бы иным оказался экологический контекст?
Проект Head Start работает в более чем 2000 центрах во всех 50 штатах. Посетите по крайней мере один или, если есть возможность, несколько центров Head Stan в своем районе. Попытайтесь посетить их несколько раз, чтобы застать разные занятия. Ознакомившись с тем, как работает Head Stan, подумайте, как можно оценивать эффективность таких программ. Какие оценочные методики, по вашему мнению, было бы необходимо использовать? Найдите книги по этой теме, на которые делались ссылки в этой главе, и сравните собственные идеи с тем, что действительно использовалось и используется в исследованиях, посвященных Head Start,.
Все психологические исследования включают статистическую обработку данных. Нельзя стать исследователем в области психологии, не обладая знаниями основ статистического анализа. Кроме того, не имея элементарных представлений о том, что лежит в основе разных статистических показателей, невозможно понять и оценить исследования других людей.
Сказанное выше хорошо известно всем студентам, достаточно далеко продвинувшимся в изучении психологической науки. Все они также знают, что овладение статистикой — долгий процесс, который требует прослушивания нескольких курсов и прочтения нескольких увесистых учебников. Я не буду пытаться ужать содержание нескольких книг до одной главы. Моя задача намного скромнее: изложить в качестве дополнения к материалам о тестах некоторые основы и принципы, стоящие за статистическими процедурами. Эта глава может быть введением или дополнением к курсу статистики, а также может служить материалом, помогающим освежить уже имеющиеся знания.
Изложение в этой главе идет в направлении от сравнительно простого к более сложному. Начнем с того, что вспомним цели использования статистических показателей, затем, в качестве примера статистического объяснения, приведем уже знакомый вам t-критерий. Остальная часть главы в значительной мере будет посвящена усложненным вариантам простого анализа с использованием t-крите-рия — разнообразным ситуациям, когда нужны другие статистические показатели, их типам, а также основаниям для выбора между этими показателями. Поскольку каждый случай рассматривается кратко и в общих чертах, для каждой из затронутых тем предлагается список литературы.
Использование статистических показателей
Используя статистические показатели, психологи преследуют две цели: описать данные и прийти к логическому заключению об их значении. Первая из этих целей проста и понятна, достижение второй цели связано с определенными трудностями.
Таблица 7.1 Количество агрессивных действий в выборке детей дошкольного возраста (гипотетические данные)
Трехлетние мальчики Трехлетние девочки Четырехлетние мальчики Четырехлетние девочки 5 0 2 3 4 0 27 3 *0 10 3 0 14 3 34 10 5 0 3 1 15 18 38 4' 0 2 0 3 2 0 4 0 9 5 19 4 5 15 35 3 3 0
'Л 5 2 6
2 11 1 0 3 0 16 10 18 1 3 6 10 3
Дескриптивные статистические показатели
Вернемся к одному из предыдущих примеров: исследованию агрессии методом наблюдения в условиях детского сада. Допустим, исследователь собрал данные, представленные в табл. 7.1. Как можно заметить, имеют место значительные индивидуальные различия в частоте агрессивных действий; вполне вероятно, что есть также различия между полами и возрастными группами. Но как разобраться в этом хаосе цифр и определить истинное положение вещей?
Первый шаг — охарактеризовать данные при помощи ряда дескриптивных статистических показателей. Большинство дескриптивных статистических показателей используется для выявления центральной тенденции, или преобладающей формы ответов в выборке. Чаще всего в качестве меры центральной тенденции выступает среднее арифметическое, или просто среднее. Из табл. 7.2 явствует, что группы испытуемых из нашего гипотетического исследования действительно имеют разный средний уровень агрессии.
Чаще всего среднее — наиболее информативный дескриптивный статистический показатель. Однако он не единственный, в ряде случаев знание лишь среднего не дает полного представления о полученных результатах. Сравним группы 3- и 4-летних мальчиков. Как явствует из табл. 7.2, средний уровень агрессии у старших мальчиков выше. Однако сырые данные из табл. 7.1 свидетельствуют о том, что фактически большинство показателей агрессии обеих групп достаточно близки. Более высокое среднее у старших детей явилось следствием наличия нескольких очень высоких показателей. Или же сравним группы 3-летних мальчиков и девочек. Полагаясь на средние значения из табл. 7.2, мы могли бы заключить, что эти группы имеют одинако-
вый уровень агрессии. Однако сырые данные из табл. 7.1 свидетельствуют о том, что эти средние значения имеют разные основания.
Приведенные выше примеры демонстрируют необходимость иных дескриптивных статистических показателей помимо среднего арифметического. Есть еще две меры центральной тенденции. Одна из них — медиана. Медиана — это центр распределения, выше которого находится одна половина показателей, а ниже — другая. Сравним вновь результаты 3- и 4-летних детей. Из табл. 7.2 явствует, что данные результаты имеют общую медиану — 4. Это свидетельствует о фундаментальном сходстве двух распределений, сходстве, которое мешает заметить разница средних. В целом, медиана приобретает особце значение тогда, когда распределение асимметрично, то есть включает несколько необычно высоких или низких показателей. В таких случаях среднее может дать искаженную картину типичных ответов.
Таблица 7.2 Дескриптивные статистические показатели для данных из таблицы 7.1
Среднее Медиана Мода Стандартное отклонение 3-летние 5,6 4 5 5,38 мальчики 3-летние девочки 5,0 3 0 5,88 4-летние 13,4 4 3 13,90 мальчики 4-летние девочки 3,4 3 3 3,29 Мальчики в 9,5 4 3 11,09 целом Деоочки в 4,2 3 . 0 4,75 целом 3-летние в 5,3 3,5 0 5,55 целом 4-летние в целом 8,4 3 3 11,15
Третья мера центральной тенденции — мода. Мода — показатель, наиболее часто встречающийся в определенной группе. Эта мера используется редко, однако в некоторых обстоятельствах ее значение довольно информативно. Рассмотрим, к примеру, данные 3-летних девочек из табл. 7.1. Ранее мы отметили, что средний уровень агрессивных действий в этой группе — 5,0 — практически такой же, как и у мальчиков. Однако, в отличие от мальчиков, для 3-летних девочек модальным было нулевое значение. Этот факт вполне заслуживает того, чтобы упомянуть о нем в отчете.