Многие вероятностные вопросы, которые заботят людей, относятся к одному из следующих типов: Какова вероятность того, что объект A принадлежит категории B? Какова вероятность того, что событие A происходит из процесса B? Какова вероятность того, что процесс В сгенерирует событие A? Отвечая на такие вопросы, люди обычно полагаются на эвристику репрезентативности, в которой вероятности оцениваются по степени, в которой A представляет B, то есть по степени, в которой А напоминает B. Например, когда A в высокой степени представляет В вероятность того, что А происходит из В, считается высокой. С другой стороны, если A не похоже на B, вероятность того, что A происходит из В, оценивается как низкая. Например, когда A в высокой степени представляет В вероятность того, что А происходит из В, считается высокой. С другой стороны, если A не похоже на B, вероятность того, что A происходит из В, оценивается как низкая.
Для иллюстрации суждения по репрезентативности рассмотрим человека, которого бывший сосед описал следующим образом: «Стив очень застенчив и замкнут, неизменно услужлив, но мало интересуется людьми или миром реальности. Кроткая и аккуратная душа, ему нужен порядок и структура, а также страсть к деталям «.
Как люди оценивают вероятность того, что Стив участвует в определенной профессии из списка возможностей (например, фермер, продавец, пилот авиакомпании, библиотекарь или врач)? Как люди распределяют эти профессии от наиболее к наименее вероятным? Например, в эвристике репрезентативности вероятность того, что Стив является библиотекарем, оценивается по степени, в которой он является представителем или подобным стереотипу библиотекаря. Действительно, исследование проблем такого типа показало, что люди упорядочивают профессии по вероятности и сходству одинаково (7). Такой подход к оценке вероятности приводит к серьезным ошибкам, поскольку на сходство или репрезентативность не влияют несколько факторов, которые должны влиять на оценки вероятности.
Нечувствительность к априорной вероятности исходов. Одним из факторов, которые не влияют на репрезентативность, но должны оказать существенное влияние на вероятность, является априорная вероятность или базовая частота исходов. Например, в случае со Стивом тот факт, что среди населения гораздо больше фермеров, чем библиотекарей, должен привести к любой разумной оценке вероятности того, что Стив - библиотекарь, а не фермер. Однако соображения об априорной вероятности не влияют на сходство Стива со стереотипами библиотекарей и фермеров. Поэтому, если люди оценивают вероятность по репрезентативности, априорная вероятность будет игнорироваться. Эта гипотеза была проверена в эксперименте, где были использованы априорные вероятности (7).
Испытуемым были показаны краткие описания личностей нескольких лиц, предположительно случайно выбранных из группы из 100 специалистов - инженеров и юристов. Испытуемых просили оценить для каждого описания вероятность того, что оно принадлежит инженеру, а не юристу. В одном эксперименте испытуемым сказали, что группа, из которой были взяты описания, состояла из 70 инженеров и 30 юристов. В другом эксперименте испытуемым сообщили, что в состав группы входят 30 инженеров и 70 юристов. Вероятность того, что какое-либо конкретное описание принадлежит инженеру, а не юристу, должна быть выше в первом эксперименте, где большинство инженеров, чем во втором, где большинство юристов. В частности, путем применения правила Байеса можно показать, что отношение этих шансов должно быть (0,7 /0,3) 2 или 5,44 для каждого описания. В резком нарушении правила Байеса испытуемые в этих двух экспериментах выдавали по существу одинаковые вероятностные суждения. По-видимому, испытуемые оценивали вероятность того, что конкретное описание принадлежало инженеру, а не юристу, по степени, в которой это описание представляло два стереотипа, практически не принимая во внимание априорные вероятности категорий.
Испытуемые правильно использовали априорные вероятности, когда у них не было никакой другой информации. В отсутствие наброска личности они оценили вероятность того, что неизвестный человек является инженером, как 0,7 и 0,3 соответственно в двух экспериментах априорной вероятности. Тем не менее, априорные вероятности были фактически проигнорированы, когда описание было предоставлено, даже когда это описание было полностью неинформативным. Ответы испытуемых на следующее описание иллюстрируют это явление:
Дик - 30-летний мужчина. Женат, детей нет. Человек с высокими способностями и высокой мотивацией, он обещает быть весьма успешным в своей области. Его в достаточной степени любят коллеги.
Это описание предназначалось для того, чтобы не содержать никакой информации, относящейся к вопросу о том, является ли Дик инженером или юристом. Следовательно, вероятность того, что Дик является инженером, должна равняться доле инженеров в группе, как если бы не было дано никакого описания. Испытуемые, однако, оценивали вероятность того, что Дик будет инженером, равной 0,5 независимо от того, была ли заявленная доля инженеров в группе равной 0,7 или 0,3. Очевидно, что люди реагируют по-разному, когда не дают никаких фактов и когда дают бесполезные факты. Когда нет конкретных фактов, априорная вероятность должным образом учитывается; когда предоставляют бесполезные факты, априорная вероятность игнорируется (/).
Нечувствительность к размеру выборки. Чтобы оценить вероятность получения конкретного результата в выборке из определенной группы населения, люди обычно применяют эвристику репрезентативности. То есть они оценивают вероятность результата выборки, например, что средний рост в случайной выборке из десяти мужчин будет 6 футов (180 сантиметров), по сходству этого результата с соответствующим параметром (то есть, средний рост у мужчин). Сходство статистики выборки с параметрами населения не зависит от размера выборки. Следовательно, если вероятности оцениваются по репрезентативности, то оценочная вероятность статистики выборки будет по существу независимой от размера выборки. Действительно, когда испытуемые оценивали распределения среднего роста для выборок разных размеров, они производили идентичные распределения. Например, вероятности получения среднего роста более 6 футов было присвоено одинаковое значение для выборок из 1000, 100 и 10 мужчин (2). Более того, испытуемые не смогли оценить роль размера выборки, даже если это было подчеркнуто в формулировке задачи. Рассмотрим следующий вопрос:
Определенный город обслуживают две больницы. В большой больнице каждый день рождается около 45 детей, а в маленькой больнице - около 15 детей каждый день. Как вы знаете, около 50 процентов всех детей - мальчики. Тем не менее, точный процент меняется со дня на день. Иногда оно может быть выше 50 процентов, иногда ниже.
В течение одного года в каждой больнице регистрировались дни, когда более 60 процентов рожденных детей были мальчиками. Как вы думаете, в какой больнице зарегистрировано больше таких дней?
► Большая больница (21)
► Маленькая больница (21)
► Примерно то же самое (то есть в пределах 5 процентов друг от друга) (53)
Значения в скобках - это количество студентов, которые выбрали каждый ответ.
Большинство испытуемых оценивали вероятность получения более 60 процентов мальчиков одинаково в маленькой и большой больнице, предположительно потому, что эти события описываются одной и той же статистикой и, следовательно, одинаково репрезентативны для населения в целом. Напротив, теория выборки подразумевает, что ожидаемое количество дней, в течение которых более 60 процентов детей являются мальчиками, в маленькой больнице намного больше, чем в большой, поскольку большая выборка с меньшей вероятностью отклонится от 50 процентов. Это фундаментальное понятие статистики, очевидно, не является частью интуиции людей.
О подобной нечувствительности к размеру выборки сообщалось в оценках апостериорной вероятности, то есть вероятности того, что выборка была взята из одной популяции, а не из другой. Рассмотрим следующий пример:
Представьте себе урну, наполненную шариками, из которых V одного цвета и V другого. Один человек вытащил 5 шаров из урны и обнаружил, что 4 были красными, а 1 - белым. Другой человек вытащил 20 шаров и обнаружил, что 12 были красными и 8 - белыми. Кто из этих двух людей должен чувствовать себя более уверенным, что урна содержит V красных шаров и V белых шаров, а не наоборот? Какие вероятности должен предоставить каждый человек?
В этом случае правильное соотношение составляет 8: 1 для образца 4: 1 и 16: 1 для образца 12: 8, при условии равных априорных вероятностей. Тем не менее, большинство людей считают, что первый образец дает гораздо более убедительные доказательства гипотезы о том, что урна является преимущественно красной, потому что доля красных шаров больше в первой, чем во второй выборке. Здесь, опять же, в интуитивных суждениях преобладает пропорция выборки, и на нее практически не влияет размер выборки, которая играет решающую роль в определении вероятности (2). Кроме того, интуитивные оценки вероятностей гораздо менее экстремальны, чем правильные значения. Недооценка влияния фактов неоднократно наблюдалась в задачах этого типа (3, 4) и получило название «консерватизм».
Заблуждения о случайности. Люди ожидают, что последовательность событий, сгенерированных случайным процессом, будет представлять основные характеристики этого процесса, даже если последовательность короткая. Например, при рассмотрении бросков монеты на орла или решку люди считают последовательность ОРОРРО более вероятной, чем последовательность ОООРРР, которая не выглядит случайной, а также более вероятной, чем последовательность ОО-ООРО, которая не представляет «справедливость» монеты (2). Таким образом, люди ожидают, что основные характеристики процесса будут представлены не только глобально во всей последовательности, но и локально в каждой из его частей. Однако локально репрезентативная последовательность систематически отклоняется от ожидания случайности: она содержит слишком много чередований и слишком мало последовательностей. Другим следствием веры в локальную репрезентативность является «ошибка известного игрока». Например, после наблюдения за долгой последовательностью выпадений красного на колесе рулетки большинство людей ошибочно полагают, что сейчас выпадет чёрное, вероятно потому, что появление чёрного приведет к более репрезентативной последовательности, чем появление опять красного. Случайность обычно рассматривается как самокорректирующийся процесс, в котором отклонение в одном направлении вызывает отклонение в противоположном направлении для восстановления равновесия. В действительности, отклонения не «исправляются», поскольку процесс случайностей разворачивается, и они просто разбавляются в этом процессе.
Заблуждения о случайности не ограничиваются испытуемыми-непрофессионалами. Изучение статистической интуиции опытных исследователей-психологов (5) выявило сохраняющуюся веру в то, что можно назвать «законом малых чисел», согласно которому даже небольшие выборки весьма репрезентативны для групп населения, из которых они взяты. Результаты этих исследователей отражали ожидание того, что достоверная гипотеза о группе населения будет представлена статистически значимым результатом в выборке с небольшим учетом ее размера. Как следствие, исследователи слишком доверяют результатам небольших выборок и сильно преувеличивают надежность таких результатов. При фактическом проведении исследований это искажение приводит к отбору образцов недостаточного размера и к некорректной трактовке результатов.
Нечувствительность к предсказуемости. Людям иногда приходится делать такие числовые прогнозы, как будущая стоимость акций, спрос на товар или результат футбольной игры. Такие прогнозы часто делаются по репрезентативности. Например, предположим, что человеку дается описание компании, и его просят спрогнозировать ее будущую прибыль. Если описание компании очень благоприятно, очень высокая прибыль будет наиболее репрезентативным результатом, исходя из этого описания; если описание посредственное, посредственные результаты деятельности окажутся наиболее репрезентативными. Степень, в которой описание является благоприятным, не зависит ни от надежности этого описания, ни от степени, в которой оно допускает точный прогноз. Следовательно, если люди прогнозируют исключительно с точки зрения благоприятности описания, их прогнозы будут нечувствительны к достоверности данных и ожидаемой точности прогноза.
Такой способ суждений нарушает нормативную статистическую теорию, в которой экстремальность и диапазон прогнозов контролируются соображениями предсказуемости. Когда предсказуемость равна нулю, во всех случаях следует делать тот же прогноз. Например, если описания компаний не содержат информации, относящейся к прибыли, то для всех компаний должно быть спрогнозировано одинаковое значение средней прибыли. Если предсказуемость идеальна, конечно, прогнозируемые значения будут соответствовать фактическим значениям, а диапазон прогнозов будет равен диапазону результатов. В целом, чем выше предсказуемость, тем шире диапазон прогнозируемых значений.
Несколько исследований числового прогноза показали, что интуитивные прогнозы нарушают это правило, и что испытуемые демонстрируют мало или вообще не учитывают соображения предсказуемости (/). В одном из этих исследований испытуемые были представлены в нескольких параграфах, каждый из которых описывает работу студента-учителя на конкретном практическом занятии. Некоторым испытуемым было предложено оценить качество урока, описанного в параграфе, в процентах, по отношению к определенной группе населения. Других испытуемых попросили спрогнозировать, также в процентных показателях, положение каждого студента-учителя через 5 лет после практического занятия. Суждения, сделанные в этих двух экспериментах, были идентичны. То есть прогноз отдаленного критерия (успех учителя через 5 лет) был идентичен оценке информации, на которой основывался прогноз (качество практического занятия). Студенты, которые сделали эти прогнозы, несомненно, знали об ограниченной предсказуемости педагогической компетенции на основе одного пробного урока на 5 лет вперед; тем не менее, их прогнозы были такими же экстремальными, как и их оценки.
Иллюзия действительности. Как мы уже видели, люди часто прогнозируют, выбирая результат (например, род занятий), который является наиболее репрезентативным для исходных данных (например, описание человека). Уверенность, которую они имеют в своих прогнозах, зависит, прежде всего, от степени репрезентативности (то есть от качества соответствия между выбранным результатом и исходными данными), практически не принимая во внимание факторы, ограничивающие точность прогноза. Таким образом, люди выражают большую уверенность в прогнозе, что человек является библиотекарем, когда ему дается описание его личности, которое соответствует стереотипу библиотекарей, даже если описание скудное, ненадежное или устаревшее. Необоснованную уверенность, которая создается путем хорошего соответствия прогнозируемого результата и информации на входе, можно назвать иллюзией достоверности. Эта иллюзия сохраняется даже тогда, когда эксперт осознает факторы, которые ограничивают точность его прогнозов. Общеизвестно, что психологи, проводящие отборочные собеседования, часто испытывают значительную уверенность в своих прогнозах, даже если они знают об обширной литературе, в которой отборочные собеседования очень ошибочны. Продолжающаяся опора на клиническое интервью для отбора, несмотря на неоднократные демонстрации его неадекватности, убедительно свидетельствует о силе этого эффекта.
Внутренняя согласованность структуры исходных данных является основным фактором, определяющим уверенность в прогнозах, основанных на этих исходных данных. Например, люди выражают большую уверенность в прогнозировании итогового среднего балла учащегося, чей первый год обучения полностью состоит из оценок В, чем в прогнозировании среднего балла учащегося, чей первый год обучения включает в себя множество оценок А и С. Высокосогласованные шаблоны чаще всего наблюдаются, когда исходные переменные сильно избыточны или коррелированы. Следовательно, люди склонны доверять прогнозам, основанным на избыточных исходных переменных. Однако элементарный результат в статистике корреляции утверждает, что при заданных исходных переменных заявленной достоверности прогноз, основанный на нескольких таких исходных данных, может достичь более высокой точности, когда они независимы друг от друга, чем когда они являются избыточными или коррелированными. Таким образом, избыточность исходных данных снижает точность, даже если повышает достоверность, и люди часто уверены в своих прогнозах, которые с большой вероятностью могут оказаться неверными (/).
Неправильные представления о регрессии. Предположим, что большая группа детей была обследована на двух эквивалентных версиях теста на способности. Если кто-то выберет десять детей из числа тех, кто проявил себя наилучшим образом в одной из двух версий, он будет обычно разочарован их работой во второй версии. И наоборот, если кто-то выберет десять детей из числа тех, кто получил худшие результаты по одной версии, они получат, в среднем, несколько лучшие результаты по другой версии. В более общем случае рассмотрим две переменные X и Y, которые имеют одинаковое распределение. Если выбрать людей, чей средний балл X отклоняется от среднего значения X на k единиц, то среднее значение их баллов Y обычно будет отклоняться от среднего значения Y менее чем на k единиц. Эти наблюдения иллюстрируют общее явление, известное как регрессия к среднему, которое было впервые задокументировано Гальтоном более 100 лет назад.
В реальной жизни встречается много случаев регрессии к среднему значению при сравнении роста отцов и сыновей, интеллекта мужей и жен или результатов отдельных лиц на последовательных экзаменах. Тем не менее, люди не развивают правильные представления об этом явлении. Во-первых, они не ожидают регрессии во многих контекстах, где это обязательно произойдет. Во-вторых, когда они распознают возникновение регрессии, они часто придумывают ложные объяснения причин (1). Мы предполагаем, что явление регрессии остается неуловимым, потому что оно несовместимо с убеждением, что прогнозируемый результат должен быть максимально репрезентативным для входных данных, и, следовательно, что значение переменной на выходе должно быть таким же экстремальным, как и значение исходной переменной.
Неспособность распознать значение регрессии может иметь пагубные последствия, о чем свидетельствует следующее наблюдение (2). В обсуждении летной подготовки опытные инструктора отметили, что похвала за исключительно плавную посадку обычно сопровождается более плохой посадкой на следующей попытке, в то время как резкая критика после грубой посадки обычно сопровождается улучшением на следующей попытке. Преподаватели пришли к выводу, что словесные награды вредны для обучения, в то время как словесные наказания полезны, что противоречит принятой психологической доктрине. Этот вывод необоснован из-за наличия регрессии к среднему. Как и в других случаях повторного экзамена, улучшение обычно сопровождается плохой успеваемостью, а ухудшение обычно сопровождается улучшевшейся успеваемостью, даже если инструктор не реагирует на достижения стажера с первой попытки. Поскольку инструктора хвалили своих учеников после хороших посадок и предостерегали их после плохих, они пришли к ошибочному и потенциально вредному выводу, что наказание более эффективно, чем похвала.
Таким образом, непонимание эффекта регрессии приводит к переоценке эффективности наказания и недооценке эффективности вознаграждения. В социальном взаимодействии, а также в обучении, вознаграждения обычно назначаются, когда производительность хорошая, и наказания, как правило, назначаются, если производительность низкая. Таким образом, одной лишь регрессией поведение, скорее всего, улучшится после наказания и, скорее всего, ухудшится после вознаграждения. Следовательно, человеческое состояние таково, что только по одной случайности один человек чаще всего получает вознаграждение за наказание других и чаще всего наказывается за вознаграждение их. Люди обычно не знают об этом обстоятельстве. Фактически, неуловимая роль регрессии в определении очевидных последствий вознаграждения и наказания, по-видимому, ускользнула от внимания исследующих эту область.