Суждения в условиях неопределенности: эвристики и искажения

Перевод с английского оригинальной статьи Амоса Тверски и Дэниела Канемана
Искажения в суждениях выявляют некоторые эвристики мышления в условиях неопределенности.
Многие решения основаны на убеждениях относительно вероятности неопределенных событий, таких как исход выборов, вина подсудимого или будущая стоимость доллара. Эти убеждения обычно выражаются такими утверждениями, как «Я думаю, что…», «Cкорее всего…», «Это вряд ли…» и так далее. Иногда убеждения относительно неопределенных событий выражаются в числовой форме как шансы или субъективные вероятности. Что определяет такие убеждения? Как люди оценивают вероятность неопределенного события или значение неопределенной величины? В этой статье показано, что люди полагаются на ограниченное число эвристических принципов, которые сводят сложные случаи оценки вероятностей и прогнозирования значений к более простым оценочным операциям. В общем, эти эвристики весьма полезны, но иногда они приводят к серьезным и систематическим ошибкам.

Субъективная оценка вероятности напоминает субъективную оценку физических величин, таких как расстояние или размер. Все эти суждения основаны на данных ограниченной достоверности, которые обрабатываются в соответствии с эвристическими правилами. Например, видимое расстояние объекта частично определяется его ясностью. Чем резче виден объект, тем ближе он кажется. Это правило имеет определенную силу, потому что в любой данной обстановке более отдаленные объекты видны менее резко, чем более близкие объекты. Однако опора на это правило приводит к систематическим ошибкам в оценке расстояния. В частности, расстояния часто переоцениваются, когда видимость плохая, потому что контуры объектов размыты.

С другой стороны, расстояния часто недооцениваются, когда видимость хорошая, потому что объекты хорошо видны. Таким образом, опора на ясность как показатель расстояния приводит к распространенным искажениям. Такие искажения также обнаруживаются в интуитивном суждении о вероятности. В этой статье описываются три эвристики, которые используются для оценки вероятностей и прогнозирования значений. Перечислены искажения, к которым приводят эти эвристики, и обсуждаются прикладные и теоретические последствия этих наблюдений.

Репрезентативность

Многие вероятностные вопросы, которые заботят людей, относятся к одному из следующих типов: Какова вероятность того, что объект A принадлежит категории B? Какова вероятность того, что событие A происходит из процесса B? Какова вероятность того, что процесс В сгенерирует событие A? Отвечая на такие вопросы, люди обычно полагаются на эвристику репрезентативности, в которой вероятности оцениваются по степени, в которой A представляет B, то есть по степени, в которой А напоминает B. Например, когда A в высокой степени представляет В вероятность того, что А происходит из В, считается высокой. С другой стороны, если A не похоже на B, вероятность того, что A происходит из В, оценивается как низкая. Например, когда A в высокой степени представляет В вероятность того, что А происходит из В, считается высокой. С другой стороны, если A не похоже на B, вероятность того, что A происходит из В, оценивается как низкая.

Для иллюстрации суждения по репрезентативности рассмотрим человека, которого бывший сосед описал следующим образом: «Стив очень застенчив и замкнут, неизменно услужлив, но мало интересуется людьми или миром реальности. Кроткая и аккуратная душа, ему нужен порядок и структура, а также страсть к деталям «.

Как люди оценивают вероятность того, что Стив участвует в определенной профессии из списка возможностей (например, фермер, продавец, пилот авиакомпании, библиотекарь или врач)? Как люди распределяют эти профессии от наиболее к наименее вероятным? Например, в эвристике репрезентативности вероятность того, что Стив является библиотекарем, оценивается по степени, в которой он является представителем или подобным стереотипу библиотекаря. Действительно, исследование проблем такого типа показало, что люди упорядочивают профессии по вероятности и сходству одинаково (7). Такой подход к оценке вероятности приводит к серьезным ошибкам, поскольку на сходство или репрезентативность не влияют несколько факторов, которые должны влиять на оценки вероятности.

Нечувствительность к априорной вероятности исходов. Одним из факторов, которые не влияют на репрезентативность, но должны оказать существенное влияние на вероятность, является априорная вероятность или базовая частота исходов. Например, в случае со Стивом тот факт, что среди населения гораздо больше фермеров, чем библиотекарей, должен привести к любой разумной оценке вероятности того, что Стив - библиотекарь, а не фермер. Однако соображения об априорной вероятности не влияют на сходство Стива со стереотипами библиотекарей и фермеров. Поэтому, если люди оценивают вероятность по репрезентативности, априорная вероятность будет игнорироваться. Эта гипотеза была проверена в эксперименте, где были использованы априорные вероятности (7).

Испытуемым были показаны краткие описания личностей нескольких лиц, предположительно случайно выбранных из группы из 100 специалистов - инженеров и юристов. Испытуемых просили оценить для каждого описания вероятность того, что оно принадлежит инженеру, а не юристу. В одном эксперименте испытуемым сказали, что группа, из которой были взяты описания, состояла из 70 инженеров и 30 юристов. В другом эксперименте испытуемым сообщили, что в состав группы входят 30 инженеров и 70 юристов. Вероятность того, что какое-либо конкретное описание принадлежит инженеру, а не юристу, должна быть выше в первом эксперименте, где большинство инженеров, чем во втором, где большинство юристов. В частности, путем применения правила Байеса можно показать, что отношение этих шансов должно быть (0,7 /0,3) 2 или 5,44 для каждого описания. В резком нарушении правила Байеса испытуемые в этих двух экспериментах выдавали по существу одинаковые вероятностные суждения. По-видимому, испытуемые оценивали вероятность того, что конкретное описание принадлежало инженеру, а не юристу, по степени, в которой это описание представляло два стереотипа, практически не принимая во внимание априорные вероятности категорий.

Испытуемые правильно использовали априорные вероятности, когда у них не было никакой другой информации. В отсутствие наброска личности они оценили вероятность того, что неизвестный человек является инженером, как 0,7 и 0,3 соответственно в двух экспериментах априорной вероятности. Тем не менее, априорные вероятности были фактически проигнорированы, когда описание было предоставлено, даже когда это описание было полностью неинформативным. Ответы испытуемых на следующее описание иллюстрируют это явление:

Дик - 30-летний мужчина. Женат, детей нет. Человек с высокими способностями и высокой мотивацией, он обещает быть весьма успешным в своей области. Его в достаточной степени любят коллеги.

Это описание предназначалось для того, чтобы не содержать никакой информации, относящейся к вопросу о том, является ли Дик инженером или юристом. Следовательно, вероятность того, что Дик является инженером, должна равняться доле инженеров в группе, как если бы не было дано никакого описания. Испытуемые, однако, оценивали вероятность того, что Дик будет инженером, равной 0,5 независимо от того, была ли заявленная доля инженеров в группе равной 0,7 или 0,3. Очевидно, что люди реагируют по-разному, когда не дают никаких фактов и когда дают бесполезные факты. Когда нет конкретных фактов, априорная вероятность должным образом учитывается; когда предоставляют бесполезные факты, априорная вероятность игнорируется (/).

Нечувствительность к размеру выборки. Чтобы оценить вероятность получения конкретного результата в выборке из определенной группы населения, люди обычно применяют эвристику репрезентативности. То есть они оценивают вероятность результата выборки, например, что средний рост в случайной выборке из десяти мужчин будет 6 футов (180 сантиметров), по сходству этого результата с соответствующим параметром (то есть, средний рост у мужчин). Сходство статистики выборки с параметрами населения не зависит от размера выборки. Следовательно, если вероятности оцениваются по репрезентативности, то оценочная вероятность статистики выборки будет по существу независимой от размера выборки. Действительно, когда испытуемые оценивали распределения среднего роста для выборок разных размеров, они производили идентичные распределения. Например, вероятности получения среднего роста более 6 футов было присвоено одинаковое значение для выборок из 1000, 100 и 10 мужчин (2). Более того, испытуемые не смогли оценить роль размера выборки, даже если это было подчеркнуто в формулировке задачи. Рассмотрим следующий вопрос:

Определенный город обслуживают две больницы. В большой больнице каждый день рождается около 45 детей, а в маленькой больнице - около 15 детей каждый день. Как вы знаете, около 50 процентов всех детей - мальчики. Тем не менее, точный процент меняется со дня на день. Иногда оно может быть выше 50 процентов, иногда ниже.

В течение одного года в каждой больнице регистрировались дни, когда более 60 процентов рожденных детей были мальчиками. Как вы думаете, в какой больнице зарегистрировано больше таких дней?

► Большая больница (21)

► Маленькая больница (21)

► Примерно то же самое (то есть в пределах 5 процентов друг от друга) (53)

Значения в скобках - это количество студентов, которые выбрали каждый ответ.

Большинство испытуемых оценивали вероятность получения более 60 процентов мальчиков одинаково в маленькой и большой больнице, предположительно потому, что эти события описываются одной и той же статистикой и, следовательно, одинаково репрезентативны для населения в целом. Напротив, теория выборки подразумевает, что ожидаемое количество дней, в течение которых более 60 процентов детей являются мальчиками, в маленькой больнице намного больше, чем в большой, поскольку большая выборка с меньшей вероятностью отклонится от 50 процентов. Это фундаментальное понятие статистики, очевидно, не является частью интуиции людей.

О подобной нечувствительности к размеру выборки сообщалось в оценках апостериорной вероятности, то есть вероятности того, что выборка была взята из одной популяции, а не из другой. Рассмотрим следующий пример:

Представьте себе урну, наполненную шариками, из которых V одного цвета и V другого. Один человек вытащил 5 шаров из урны и обнаружил, что 4 были красными, а 1 - белым. Другой человек вытащил 20 шаров и обнаружил, что 12 были красными и 8 - белыми. Кто из этих двух людей должен чувствовать себя более уверенным, что урна содержит V красных шаров и V белых шаров, а не наоборот? Какие вероятности должен предоставить каждый человек?

В этом случае правильное соотношение составляет 8: 1 для образца 4: 1 и 16: 1 для образца 12: 8, при условии равных априорных вероятностей. Тем не менее, большинство людей считают, что первый образец дает гораздо более убедительные доказательства гипотезы о том, что урна является преимущественно красной, потому что доля красных шаров больше в первой, чем во второй выборке. Здесь, опять же, в интуитивных суждениях преобладает пропорция выборки, и на нее практически не влияет размер выборки, которая играет решающую роль в определении вероятности (2). Кроме того, интуитивные оценки вероятностей гораздо менее экстремальны, чем правильные значения. Недооценка влияния фактов неоднократно наблюдалась в задачах этого типа (3, 4) и получило название «консерватизм».

Заблуждения о случайности. Люди ожидают, что последовательность событий, сгенерированных случайным процессом, будет представлять основные характеристики этого процесса, даже если последовательность короткая. Например, при рассмотрении бросков монеты на орла или решку люди считают последовательность ОРОРРО более вероятной, чем последовательность ОООРРР, которая не выглядит случайной, а также более вероятной, чем последовательность ОО-ООРО, которая не представляет «справедливость» монеты (2). Таким образом, люди ожидают, что основные характеристики процесса будут представлены не только глобально во всей последовательности, но и локально в каждой из его частей. Однако локально репрезентативная последовательность систематически отклоняется от ожидания случайности: она содержит слишком много чередований и слишком мало последовательностей. Другим следствием веры в локальную репрезентативность является «ошибка известного игрока». Например, после наблюдения за долгой последовательностью выпадений красного на колесе рулетки большинство людей ошибочно полагают, что сейчас выпадет чёрное, вероятно потому, что появление чёрного приведет к более репрезентативной последовательности, чем появление опять красного. Случайность обычно рассматривается как самокорректирующийся процесс, в котором отклонение в одном направлении вызывает отклонение в противоположном направлении для восстановления равновесия. В действительности, отклонения не «исправляются», поскольку процесс случайностей разворачивается, и они просто разбавляются в этом процессе.

Заблуждения о случайности не ограничиваются испытуемыми-непрофессионалами. Изучение статистической интуиции опытных исследователей-психологов (5) выявило сохраняющуюся веру в то, что можно назвать «законом малых чисел», согласно которому даже небольшие выборки весьма репрезентативны для групп населения, из которых они взяты. Результаты этих исследователей отражали ожидание того, что достоверная гипотеза о группе населения будет представлена статистически значимым результатом в выборке с небольшим учетом ее размера. Как следствие, исследователи слишком доверяют результатам небольших выборок и сильно преувеличивают надежность таких результатов. При фактическом проведении исследований это искажение приводит к отбору образцов недостаточного размера и к некорректной трактовке результатов.

Нечувствительность к предсказуемости. Людям иногда приходится делать такие числовые прогнозы, как будущая стоимость акций, спрос на товар или результат футбольной игры. Такие прогнозы часто делаются по репрезентативности. Например, предположим, что человеку дается описание компании, и его просят спрогнозировать ее будущую прибыль. Если описание компании очень благоприятно, очень высокая прибыль будет наиболее репрезентативным результатом, исходя из этого описания; если описание посредственное, посредственные результаты деятельности окажутся наиболее репрезентативными. Степень, в которой описание является благоприятным, не зависит ни от надежности этого описания, ни от степени, в которой оно допускает точный прогноз. Следовательно, если люди прогнозируют исключительно с точки зрения благоприятности описания, их прогнозы будут нечувствительны к достоверности данных и ожидаемой точности прогноза.

Такой способ суждений нарушает нормативную статистическую теорию, в которой экстремальность и диапазон прогнозов контролируются соображениями предсказуемости. Когда предсказуемость равна нулю, во всех случаях следует делать тот же прогноз. Например, если описания компаний не содержат информации, относящейся к прибыли, то для всех компаний должно быть спрогнозировано одинаковое значение средней прибыли. Если предсказуемость идеальна, конечно, прогнозируемые значения будут соответствовать фактическим значениям, а диапазон прогнозов будет равен диапазону результатов. В целом, чем выше предсказуемость, тем шире диапазон прогнозируемых значений.

Несколько исследований числового прогноза показали, что интуитивные прогнозы нарушают это правило, и что испытуемые демонстрируют мало или вообще не учитывают соображения предсказуемости (/). В одном из этих исследований испытуемые были представлены в нескольких параграфах, каждый из которых описывает работу студента-учителя на конкретном практическом занятии. Некоторым испытуемым было предложено оценить качество урока, описанного в параграфе, в процентах, по отношению к определенной группе населения. Других испытуемых попросили спрогнозировать, также в процентных показателях, положение каждого студента-учителя через 5 лет после практического занятия. Суждения, сделанные в этих двух экспериментах, были идентичны. То есть прогноз отдаленного критерия (успех учителя через 5 лет) был идентичен оценке информации, на которой основывался прогноз (качество практического занятия). Студенты, которые сделали эти прогнозы, несомненно, знали об ограниченной предсказуемости педагогической компетенции на основе одного пробного урока на 5 лет вперед; тем не менее, их прогнозы были такими же экстремальными, как и их оценки.

Иллюзия действительности. Как мы уже видели, люди часто прогнозируют, выбирая результат (например, род занятий), который является наиболее репрезентативным для исходных данных (например, описание человека). Уверенность, которую они имеют в своих прогнозах, зависит, прежде всего, от степени репрезентативности (то есть от качества соответствия между выбранным результатом и исходными данными), практически не принимая во внимание факторы, ограничивающие точность прогноза. Таким образом, люди выражают большую уверенность в прогнозе, что человек является библиотекарем, когда ему дается описание его личности, которое соответствует стереотипу библиотекарей, даже если описание скудное, ненадежное или устаревшее. Необоснованную уверенность, которая создается путем хорошего соответствия прогнозируемого результата и информации на входе, можно назвать иллюзией достоверности. Эта иллюзия сохраняется даже тогда, когда эксперт осознает факторы, которые ограничивают точность его прогнозов. Общеизвестно, что психологи, проводящие отборочные собеседования, часто испытывают значительную уверенность в своих прогнозах, даже если они знают об обширной литературе, в которой отборочные собеседования очень ошибочны. Продолжающаяся опора на клиническое интервью для отбора, несмотря на неоднократные демонстрации его неадекватности, убедительно свидетельствует о силе этого эффекта.

Внутренняя согласованность структуры исходных данных является основным фактором, определяющим уверенность в прогнозах, основанных на этих исходных данных. Например, люди выражают большую уверенность в прогнозировании итогового среднего балла учащегося, чей первый год обучения полностью состоит из оценок В, чем в прогнозировании среднего балла учащегося, чей первый год обучения включает в себя множество оценок А и С. Высокосогласованные шаблоны чаще всего наблюдаются, когда исходные переменные сильно избыточны или коррелированы. Следовательно, люди склонны доверять прогнозам, основанным на избыточных исходных переменных. Однако элементарный результат в статистике корреляции утверждает, что при заданных исходных переменных заявленной достоверности прогноз, основанный на нескольких таких исходных данных, может достичь более высокой точности, когда они независимы друг от друга, чем когда они являются избыточными или коррелированными. Таким образом, избыточность исходных данных снижает точность, даже если повышает достоверность, и люди часто уверены в своих прогнозах, которые с большой вероятностью могут оказаться неверными (/).

Неправильные представления о регрессии. Предположим, что большая группа детей была обследована на двух эквивалентных версиях теста на способности. Если кто-то выберет десять детей из числа тех, кто проявил себя наилучшим образом в одной из двух версий, он будет обычно разочарован их работой во второй версии. И наоборот, если кто-то выберет десять детей из числа тех, кто получил худшие результаты по одной версии, они получат, в среднем, несколько лучшие результаты по другой версии. В более общем случае рассмотрим две переменные X и Y, которые имеют одинаковое распределение. Если выбрать людей, чей средний балл X отклоняется от среднего значения X на k единиц, то среднее значение их баллов Y обычно будет отклоняться от среднего значения Y менее чем на k единиц. Эти наблюдения иллюстрируют общее явление, известное как регрессия к среднему, которое было впервые задокументировано Гальтоном более 100 лет назад.

В реальной жизни встречается много случаев регрессии к среднему значению при сравнении роста отцов и сыновей, интеллекта мужей и жен или результатов отдельных лиц на последовательных экзаменах. Тем не менее, люди не развивают правильные представления об этом явлении. Во-первых, они не ожидают регрессии во многих контекстах, где это обязательно произойдет. Во-вторых, когда они распознают возникновение регрессии, они часто придумывают ложные объяснения причин (1). Мы предполагаем, что явление регрессии остается неуловимым, потому что оно несовместимо с убеждением, что прогнозируемый результат должен быть максимально репрезентативным для входных данных, и, следовательно, что значение переменной на выходе должно быть таким же экстремальным, как и значение исходной переменной.

Неспособность распознать значение регрессии может иметь пагубные последствия, о чем свидетельствует следующее наблюдение (2). В обсуждении летной подготовки опытные инструктора отметили, что похвала за исключительно плавную посадку обычно сопровождается более плохой посадкой на следующей попытке, в то время как резкая критика после грубой посадки обычно сопровождается улучшением на следующей попытке. Преподаватели пришли к выводу, что словесные награды вредны для обучения, в то время как словесные наказания полезны, что противоречит принятой психологической доктрине. Этот вывод необоснован из-за наличия регрессии к среднему. Как и в других случаях повторного экзамена, улучшение обычно сопровождается плохой успеваемостью, а ухудшение обычно сопровождается улучшевшейся успеваемостью, даже если инструктор не реагирует на достижения стажера с первой попытки. Поскольку инструктора хвалили своих учеников после хороших посадок и предостерегали их после плохих, они пришли к ошибочному и потенциально вредному выводу, что наказание более эффективно, чем похвала.

Таким образом, непонимание эффекта регрессии приводит к переоценке эффективности наказания и недооценке эффективности вознаграждения. В социальном взаимодействии, а также в обучении, вознаграждения обычно назначаются, когда производительность хорошая, и наказания, как правило, назначаются, если производительность низкая. Таким образом, одной лишь регрессией поведение, скорее всего, улучшится после наказания и, скорее всего, ухудшится после вознаграждения. Следовательно, человеческое состояние таково, что только по одной случайности один человек чаще всего получает вознаграждение за наказание других и чаще всего наказывается за вознаграждение их. Люди обычно не знают об этом обстоятельстве. Фактически, неуловимая роль регрессии в определении очевидных последствий вознаграждения и наказания, по-видимому, ускользнула от внимания исследующих эту область.

Доступность

Существуют ситуации, в которых люди оценивают частоту категорий или вероятность события по легкости, с которой можно вспомнить примеры или происшествия. Например, можно оценить риск сердечного приступа среди людей среднего возраста, вспомнив такие случаи среди своих знакомых. Точно так же можно оценить вероятность того, что рассматриваемое предприятие потерпит неудачу, представив различные трудности, с которыми оно может столкнуться. Эта оценочная эвристика называется доступностью. Доступность - полезный ключ для оценки частоты или вероятности, потому что примеры больших категорий обычно вспоминаются лучше и быстрее, чем примеры менее частых категорий. Однако на доступность влияют другие факторы, кроме частоты и вероятности. Следовательно, зависимость от доступности приводит к предсказуемым искажениям, некоторые из которых проиллюстрированы ниже.

Искажения из-за
нахождения примеров. Когда размер категории оценивается по доступности ее примеров, категории, примеры которых легко получить, будут казаться более многочисленными, чем категории с такой же частотой, примеры которых менее доступны для поиска. В элементарной демонстрации этого эффекта испытуемые выслушали список известных личностей обоих полов, а затем их попросили оценить, содержит ли этот список больше имен мужчин, чем женщин. Различные списки были представлены различным группам испытуемых. В некоторых списках мужчины были относительно более знаменитыми, чем женщины, а в других женщины были относительно более знаменитыми, чем мужчины. В каждом из списков испытуемые ошибочно полагали, что категория (пол), которая включала в себя более известные личности, была более многочисленной (6).

Помимо хорошей осведомленности, существуют и другие факторы, такие как значимость, которые влияют на возможность нахождения примеров. Например, воздействие наличия личного опыта наблюдения за горящим домом на субъективную вероятность такого рода происшествий, вероятно, выше, чем воздействие чтения о пожаре в местной газете. Кроме того, недавние события, вероятно, будут относительно более доступными, чем более ранние события. Общепринято, что субъективная вероятность дорожно-транспортных происшествий временно возрастает, когда кто-то видит машину, опрокинутую на обочине дороги. Искажения, обусловленные эффективностью поискового набора. Предположим, случайным образом выбирается слово (из трех или более букв) из английского текста. Является ли более вероятным, что слово начинается с r или что r - третья буква? Люди подходят к этому вопросу, вспоминая слова, начинающиеся с r и слова, в которых r является третьей буквой, и оценивают относительную частоту по легкости, с которой приходят на ум слова этих двух типов. Поскольку поиск слов по первой букве намного проще, чем по третьей букве, большинство людей считают, что слова, начинающиеся с данной согласной, являются более многочисленными, чем слова, в которых та же согласная является третьей буквой. Они считают так даже для согласных, таких как r или k, которые чаще встречаются в третьей букве, чем в первой (6).

Различные задачи вызывают разные поисковые наборы. Например, предположим, что вас просят оценить частоту, с которой абстрактные слова (мысль, любовь) и конкретные слова (дверь, вода) появляются в письменном английском языке. Естественный способ ответить на этот вопрос - найти контексты, в которых может появиться слово. Кажется, легче думать о контекстах, в которых упоминается абстрактное понятие (любовь в любовных историях), чем думать о контекстах, в которых упоминается конкретное слово (например, дверь). Если частота слов оценивается по доступности контекстов, в которых они появляются, абстрактные слова будут оцениваться как относительно более многочисленные, чем конкретные слова. Это искажение наблюдалось в недавнем исследовании (7), которое показало, что полагаемая частота появления абстрактных слов была намного выше, чем у конкретных слов, приравненных к объективной частоте. Было также оценено, что абстрактные слова встречаются в гораздо большем разнообразии контекстов, чем конкретные слова.

Искажения, связанные с возможностью представить
. Иногда нужно оценить частоту категории, примеры которой не хранятся в памяти, но могут быть сгенерированы в соответствии с данным правилом. В таких ситуациях обычно генерируют несколько примеров и оценивают частоту или вероятность по легкости, с которой могут быть построены соответствующие примеры. Однако легкость конструирования примеров не всегда отражает их фактическую частоту, и этот способ оценки подвержен ошибкам. Для иллюстрации рассмотрим группу из 10 человек, которые формируют комитеты из k членов, 2 <k <8. Сколько разных комитетов из k членов может быть сформировано? Правильный ответ на этот вопрос дает биномиальный коэффициент (* £), который достигает максимума 252 при к = 5. Ясно, что число комитетов из к членов равно количеству комитетов (10 - k) членов, поскольку любой комитет из k членов определяет уникальную группу (10 - k) не членов.

Один из способов ответить на этот вопрос без вычислений - мысленно создать комитеты из k членов и оценить их количество по легкости, с которой они приходят на ум. Комитеты из нескольких членов, скажем, 2, более доступны, чем комитеты из многих членов, скажем, 8. Простейшая схема построения комитетов - это разделение группы на непересекающиеся множества. Легко видеть, что легко создать пять непересекающихся комитетов по 2 члена, в то время как невозможно создать даже два непересекающихся комитета по 8 членов. Следовательно, если частота оценивается возможностью представить в уме или доступностью для придумывания, маленькие комитеты будут казаться более многочисленными, чем более крупные комитеты, в отличие от правильной функции в форме колокола. Действительно, когда простых испытуемых просили оценить количество различных комитетов различных размеров, их оценки были уменьшающейся монотонной функцией размера комитетов (6). Например, средняя оценка числа комитетов из 2 членов была 70, в то время как оценка для комитетов из 8 членов была 20 (правильный ответ 45 в обоих случаях).

Умение представить в уме играет важную роль в оценке вероятностей в реальных ситуациях. Например, риск, связанный с рискованной экспедицией, оценивается путем представления в уме непредвиденных обстоятельств, с которыми экспедиция не сможет справиться. Если много таких трудностей ярко изображено, экспедиция может показаться чрезвычайно опасной, хотя легкость, с которой воображаются бедствия, не должна отражать их фактическую вероятность. И наоборот, риск, связанный с этой экспедицией, может быть сильно недооценен, если некоторые возможные опасности либо трудно представить, либо просто не приходят в голову.

Иллюзорная корреляция
. Чепмен и Чепмен (8) описали интересное искажение в оценке частоты, с которой сосуществуют два события. Они представили простым испытуемым информацию о нескольких гипотетических психически больных. Данные по каждому пациенту состояли из клинического диагноза и рисунка человека, сделанного пациентом. Позже испытуемые определили частоту, с которой каждый диагноз (такой, как паранойя или подозрительность) сопровождался различными особенностями рисунка (такими как своеобразные глаза). Испытуемые заметно переоценили частоту сосуществования нормальных, схожих друг с другом моментов, таких как подозрительность и своеобразные глаза. Этот эффект был назван иллюзорной корреляцией. В своих ошибочных суждениях о данных, которым они были подвергнуты, простые испытуемые «заново открыли» большую часть общего, но необоснованного клинического знания, касающегося интерпретации теста «рисует человек». Эффект иллюзорной корреляции был чрезвычайно устойчив к противоречивым данным. Он сохранялся даже тогда, когда корреляция между симптомом и диагнозом была на самом деле отрицательной, и это препятствовало тому, чтобы эксперты выявляли взаимоотношения, которые фактически присутствовали.

Доступность обеспечивает естественный учет иллюзорно-корреляционного эффекта. Суждение о том, как часто два события сосуществуют, может быть основано на силе ассоциативной связи между ними. Когда связь сильна, можно сделать вывод, что события часто сопряжены. Следовательно, сильные связи будут оцениваться как часто встречаемые вместе. Согласно этой точке зрения, иллюзорная корреляция между подозрительностью и своеобразным рисунком глаз, например, обусловлена тем фактом, что подозрительность легче связывается с глазами, чем с любой другой частью тела.

Опыт всей жизни научил нас, что в целом примеры больших категорий вспоминаются лучше и быстрее, чем примеры менее частых категорий; что вероятные события легче представить, чем маловероятные; и что ассоциативные связи между событиями усиливаются, когда события часто сосуществуют. В результате человек имеет в своем распоряжении процедуру (эвристику доступности) для оценки численности категории, вероятности события или частоты совпадений по легкости, с которой соответствующие умственные операции поиска, создания или ассоциаций могут быть выполнены. Однако, как показали предыдущие примеры, эта ценная процедура оценки приводит к систематическим ошибкам.

Корректировка и закрепление

Во многих ситуациях люди делают оценки, начиная с начального значения, которое корректируется для получения окончательного ответа. Исходное значение или начальная точка могут быть предложены при постановке задачи или могут быть результатом частичного вычисления. В любом случае корректировки обычно недостаточны (4). То есть разные начальные точки дают разные оценки, которые смещены в сторону начальных значений. Мы называем это явление закреплением.

Недостаточная регулировка
. Для демонстрации эффекта закрепления испытуемым было предложено оценить различные величины, выраженные в процентах (например, процент африканских стран в Организации Объединенных Наций). Для каждой величины число от 0 до 100 определялось вращением колеса фортуны в присутствии испытуемых. Испытуемым было дано указание сначала указать, было ли это число выше или ниже значения величины, а затем оценить значение величины, перемещаясь вверх или вниз от заданного числа. Разным группам давали разные числа для каждой величины, и эти произвольные числа оказывали заметное влияние на оценки. Например, средние оценки доли африканских стран в Организации Объединенных Наций составляли 25 и 45 для групп, которые получили 10 и 65, соответственно, в качестве отправных точек. Выплаты за точность не снижали эффект закрепления.

Закрепление происходит не только тогда, когда испытуемому дается начальная точка, но и когда испытуемый основывает свою оценку на результате некоторых неполных вычислений. Исследование интуитивной численной оценки иллюстрирует этот эффект. Две группы старшеклассников в течение 5 секунд оценили числовое выражение, написанное на доске. Одна группа оценила продукт
8*7*6 *5*4*З*2*І
в то время как другая группа оценила продукт
1*2*3*4*5*6*7*8

Чтобы быстро ответить на такие вопросы, люди могут выполнить несколько шагов вычисления и оценить продукт путем экстраполяции или корректировки. Поскольку корректировки, как правило, недостаточны, эта процедура должна привести к недооценке. Кроме того, поскольку результат первых нескольких шагов умножения (выполняемых слева направо) выше в нисходящей последовательности, чем в восходящей последовательности, первое выражение должно оцениваться большим, чем второе. Оба прогноза подтвердились. Медианная оценка для восходящей последовательности составила 512, а медианная оценка для нисходящей последовательности - 2250. Правильный ответ 40 320.

Искажения в оценке конъюнктивных и дизъюнктивных событий.
В недавнем исследовании Bar-Hillel (9) испытуемым была предоставлена возможность сделать ставку на одно из двух событий. Были использованы три типа событий: (i) простые события, такие как извлечение красного мрамора из сумки, содержащей 50 процентов красного мрамора и 50 процентов белого мрамора; (ii) конъюнктивные события, такие как извлечение красного мрамора семь раз подряд с пополнением из пакета, содержащего 90 процентов красного мрамора и 10 процентов белого мрамора; и (iii) дизъюнктивные события, такие как извлечение красного мрамора, по крайней мере, один раз за семь последовательных попыток, с пополнением из сумки, содержащей 10 процентов красного мрамора и 90 процентов белого мрамора. В этом вопросе значительное большинство испытуемых предпочли сделать ставку на конъюнктивное событие (вероятность которого составляет 0,48), а не на простое событие (вероятность которого составляет 0,50). Испытуемые также предпочитали делать ставки на простое событие, а не на дизъюнктивное событие, вероятность которого составляет 0,52. Таким образом, большинство испытуемых делают ставку на менее вероятное событие в обоих сравнениях. Эта модель выбора иллюстрирует общий вывод. Исследования выбора в азартных играх и в оценках вероятности показывают, что люди склонны переоценивать вероятность конъюнктивных событий (10) и недооценивать вероятность дизъюнктивных событий. Эти предубеждения легко объясняются как эффекты закрепления. Заявленная вероятность элементарного события (успех на любом этапе) обеспечивает естественную отправную точку для оценки вероятностей как конъюнктивных, так и дизъюнктивных событий. Поскольку корректировка с начальной точки обычно недостаточна, окончательные оценки остаются слишком близкими к вероятностям элементарных событий в обоих случаях. Обратите внимание, что общая вероятность конъюнктивного события ниже, чем вероятность каждого элементарного события, тогда как общая вероятность дизъюнктивного события выше, чем вероятность каждого элементарного события. Как следствие закрепления, общая вероятность будет завышена в конъюнктивных проблемах и недооценена в дизъюнктивных проблемах.

Искажения в оценке сложных событий особенно значимы в контексте планирования. Успешное завершение предприятия, такого как разработка нового продукта, обычно имеет конъюнктивный характер: для успеха предприятия должно происходить каждое из ряда событий. Даже если каждое из этих событий очень вероятно, общая вероятность успеха может быть довольно низкой, если число событий большое. Общая тенденция к переоценке вероятности конъюнктивных событий приводит к необоснованному оптимизму в оценке вероятности того, что план будет успешным, или что проект будет завершен вовремя. И наоборот, дизъюнктивные структуры обычно встречаются при оценке рисков. Сложная система, такая как ядерный реактор или тело человека, будет работать со сбоями, если какой-либо из ее основных компонентов выйдет из строя. Даже когда вероятность сбоя в каждом компоненте мала, вероятность общего сбоя может быть высокой, если задействовано много компонентов. Из-за закрепления люди будут склонны недооценивать вероятности отказа в сложных системах. Таким образом, направление искажений закрепления иногда может быть выведено из структуры события. Цепеобразная структура союзов приводит к переоценке, воронкообразная структура дизъюнкций приводит к недооценке.

Закрепление в оценке субъективных вероятностных распределений. При анализе решений экспертам часто приходится выражать свои убеждения относительно количества, например, значения среднего индекса Доу-Джонса за определенный день, в форме распределения вероятностей. Такое распределение обычно строится путем запроса человека выбрать значения величины, которые соответствуют указанным процентилям его субъективного распределения вероятностей. Например, эксперта могут попросить выбрать число X90 так, чтобы его субъективная вероятность того, что это число будет выше, чем среднее значение индекса Доу-Джонса, составляет 0,90. То есть ему следует выбрать значение X90, чтобы он просто согласился с вероятностью 9 к 1, что среднее значение индекса Доу-Джонса не превысит его. Субъективное распределение вероятностей для среднего значения индекса Доу-Джонса может быть построено из нескольких таких суждений, соответствующих различным процентилям.

Собирая субъективные распределения вероятностей для многих различных величин, можно проверить эксперта на правильность калибровки. Эксперт должным образом (или поверхностно) калиброван в ряде вопросов, если процент истинных значений оцениваемых величин падает ниже его заявленных значений Xn. Например, истинные значения должны упасть ниже X01 для 1 процента величин и выше X99 для 1 процента величин. Таким образом, истинные значения должны попадать в доверительный интервал между X01 и X99 на 98 процентах вопросов.

Несколько исследователей (11) получили распределения вероятностей для многих величин от большого числа экспертов. Эти распределения указывают на большие и систематические отклонения от правильной калибровки. В большинстве исследований фактические значения оцененных величин либо меньше, чем X01, либо больше, чем X99 для примерно 30 процентов вопросов. То есть испытуемые устанавливают слишком узкие доверительные интервалы, которые отражают большую достоверность, чем это оправдано их знаниями об оцененных величинах. Это искажение характерно для простых и опытных испытуемых, и оно не устраняется путем введения надлежащих правил оценки, которые обеспечивают стимулы для внешней калибровки. Этот эффект, по крайней мере, частично связан с закреплением.

Например, чтобы выбрать X90 в качестве среднего значения индекса Доу-Джонса, естественно начать с обдумывания наилучшей оценки индекса Доу-Джонса и скорректировать это значение в сторону увеличения. Если эта корректировка - как и большинство других - недостаточна, то X90 не будет достаточно экстремальным. Аналогичный эффект закрепления произойдет при выборе X10, который, предположительно, достигается путем корректировки лучшей оценки в сторону понижения. Следовательно, доверительный интервал между X10 и X90 будет слишком узким, а оцененное распределение вероятностей будет слишком узким. В подтверждение этой интерпретации можно показать, что субъективные вероятности систематически изменяются с помощью процедуры, в которой лучшая оценка не служит якорем.

Субъективное распределение вероятностей для данной величины (среднее по Доу-Джонсу) может быть получено двумя различными способами: (i) путем запроса испытуемого выбрать значения Доу-Джонса, которые соответствуют указанным процентилям его распределения вероятности, и (ii) попросив испытуемого оценить вероятности того, что истинное значение индекса Доу-Джонса превысит некоторые указанные значения. Эти две процедуры формально эквивалентны и должны давать идентичные распределения. Тем не менее, они предлагают разные режимы корректировки от разных якорей. В процедуре (i) естественной отправной точкой является лучшая оценка величины. С другой стороны, в процедуре (ii) испытуемый может быть привязан к значению, указанному в вопросе. В качестве альтернативы он может быть привязан к равным вероятностям или 50-50 шансам, что является естественной отправной точкой в оценке вероятности. В любом случае процедура (ii) должна давать меньше экстремальных шансов, чем процедура (i).

Чтобы сопоставить две процедуры, группа из 24 величин (например, расстояние от Нью-Дели до Пекина) была представлена группе испытуемых, которые оценивали X10 или X90 для каждой из вопросов. Другая группа испытуемых получила медианное суждение первой группы для каждой из 24 величин. Их попросили оценить вероятность того, что каждое из данных значений превысило истинное значение соответствующей величины. При отсутствии какого-либо предубеждения вторая группа должна получить вероятности, указанные для первой группы, то есть 9: 1. Однако если одинаковые вероятности или указанное значение служат в качестве якорей, вероятности второй группы должны быть менее экстремальными, то есть ближе к 1: 1. Действительно, средние шансы, заявленные этой группой, по всем вопросам были 3: 1. Когда суждения двух групп были проверены на поверхностную калибровку, было обнаружено, что испытуемые в первой группе были слишком экстремальными, в соответствии с более ранними исследованиями. События, которые они определили как имеющие вероятность 0,10, фактически получены в 24 процентах случаев. Напротив, испытуемые во второй группе были слишком консервативными. События, которым они присвоили среднюю вероятность 0,34, фактически получены в 26 процентах случаев. Эти результаты иллюстрируют, каким образом степень калибровки зависит от процедуры извлечения.

Обсуждение

Эта статья была связана с когнитивными искажениями, которые проистекают из опоры на преднамеренную эвристику. Эти предубеждения не связаны с мотивационными эффектами, такими как принятие желаемого за действительное или искажение суждений из-за поощрений и штрафов. Действительно, некоторые из серьезных ошибок в суждениях, о которых сообщалось ранее, имели место, несмотря на то, что испытуемые поощрялись быть точными и были вознаграждены за правильные ответы (2, 6).

Опора на эвристики и распространенность искажений не ограничивается непрофессионалами. Опытные исследователи также склонны к тем же искажениям, когда они думают интуитивно. Например, тенденция спрогнозировать результат, который представлен данными, с недостаточным учетом априорной вероятности, наблюдалась в интуитивных суждениях людей, которые прошли обширную подготовку в области статистики (I, 5). Несмотря на то, что статистически опытные избегают элементарных ошибок, таких как ошибка игрока, их интуитивные суждения подвержены аналогичным ошибкам в более сложных и менее прозрачных случаях.

Неудивительно, что полезные эвристики, такие как репрезентативность и доступность, сохраняются, даже если они иногда приводят к ошибкам в прогнозировании или оценке. Что, возможно, удивительно, так это то, что люди на протяжении всей жизни не могли сделать вывод о таких фундаментальных статистических правилах, как регрессия к среднему или влияние размера выборки на изменчивость выборки. Несмотря на то, что каждый человек в ходе обычной жизни подвергается многочисленным примерам, из которых можно было бы вывести эти правила, очень немногие люди открывают принципы выборки и регрессии самостоятельно. Статистические принципы не извлекаются из повседневного опыта, потому что соответствующие случаи не кодируются должным образом. Например, люди не обнаруживают, что последовательные строки в тексте отличаются больше средней длиной слова, чем последовательные страницы, потому что они просто не учитывают среднюю длину слова отдельных строк или страниц. Таким образом, люди не изучают связь между размером выборки и изменчивостью выборки, хотя данных для такого обучения достаточно.

Отсутствие соответствующих принципов также объясняет, почему люди обычно не обнаруживают искажения в своих суждениях о вероятности. Человек может предположить, поверхностно откалиброваны ли его суждения, ведя учет количественного соотношения событий, которые фактически происходят среди тех, которым он приписывает такую же самую вероятность. Однако не следует группировать события по их полагаемой вероятности. При отсутствии такой группировки индивид, например, не сможет обнаружить, что только 50 процентов прогнозов, которым он приписал вероятность 0,9 или выше, действительно сбылись.

Эмпирический анализ когнитивных искажений имеет значение для теоретической и прикладной роли полагаемых вероятностей. Современная теория принятия решений (12, 13) рассматривает субъективную вероятность, как количественное мнение идеализированного человека. В частности, субъективная вероятность определенного события определяется набором ставок на это событие, которое этот человек готов принять. Внутренне непротиворечивая или когерентная субъективная мера вероятности может быть выведена для индивидуума, если его выбор среди ставок удовлетворяет определенным принципам, то есть аксиомам теории. Полученная вероятность субъективна в том смысле, что разные люди могут иметь разные вероятности для одного и того же события. Основным вкладом этого подхода является то, что он обеспечивает строгую субъективную интерпретацию вероятности, которая применима к уникальным событиям и заложена в общую теорию рационального решения.

Возможно, следует отметить, что хотя субъективные вероятности иногда могут быть выведены из предпочтений между ставками, они обычно не формируются таким образом. Человек делает ставку на команду А, а не на команду В, потому что он считает, что команда А с большей вероятностью победит; он не делает вывод об этом убеждении из своих предпочтений в ставках. Таким образом, в действительности субъективные вероятности определяют предпочтения между ставками и не выводятся из них, как в аксиоматической теории рационального решения (12).

По существу, субъективная природа вероятности привела многих учащихся к убеждению, что согласованность или внутренняя согласованность является единственным действительным критерием, по которому следует оценивать полагаемые вероятности. С точки зрения формальной теории субъективной вероятности любой набор внутренне непротиворечивых вероятностных суждений так же хорош, как и любой другой. Этот критерий не является полностью удовлетворительным, поскольку внутренне непротиворечивый набор субъективных вероятностей может быть несовместим с другими убеждениями человека. Рассмотрим человека, чьи субъективные вероятности для всех возможных результатов игры с бросанием монеты отражают заблуждение игрока. То есть его оценка вероятности выпадения «решки» на конкретном броске увеличивается с количеством последовательных «орлов», предшествующих этому броску. Суждения такого человека могут быть внутренне непротиворечивыми и, следовательно, приемлемыми в качестве адекватных субъективных вероятностей согласно критерию формальной теории. Однако эти вероятности несовместимы с общепринятым мнением о том, что у монеты нет памяти и, следовательно, она не способна генерировать последовательные зависимости. Для того, чтобы полагаемые вероятности считались адекватными или рациональными, внутренней согласованности недостаточно. Суждения должны быть совместимы со всей сетью ожиданий, принадлежащих человеку. К сожалению, не может быть простой формальной процедуры оценки совместимости набора вероятностных суждений с общей системой убеждений эксперта. Рациональный эксперт, тем не менее, будет стремиться к совместимости, даже несмотря на то, что внутреннюю последовательность легче достичь и оценить. В частности, он попытается сделать свои вероятностные суждения совместимыми со своими знаниями о предмете, законами вероятности и собственными оценочными эвристиками и предубеждениями.

Резюме

В этой статье описаны три эвристики, которые используются при вынесении суждений в условиях неопределенности: (i) репрезентативность, которая обычно применяется, когда людей просят оценить вероятность того, что объект или событие A принадлежит категории или процессу B; (ii) доступность примеров или сценариев, которые часто используются, когда людей просят оценить частоту категорий или достоверность конкретного развития событий; и (iii) корректировка с закреплением, которая обычно используется в численном прогнозировании, когда доступно соответствующее значение. Эти эвристики очень экономичны и обычно эффективны, но они приводят к систематическим и предсказуемым ошибкам. Лучшее понимание этих эвристик и предубеждений, к которым они приводят, может улучшить суждения и решения в ситуациях неопределенности.
Перевод с английского Юлии Бабинцовой (2019 г.)
Источник: Judgment under Uncertainty: Heuristics and Biases Amos Tversky; Daniel Kahneman Science, New Series, Vol. 185, No. 4157. (Sep. 27, 1974), pp. 1124-1131.
Stable URL: https://www.jstor.org/stable/1738360
Made on
Tilda