Информация

Какой эксперимент в простой задаче принятия решений мы должны провести, чтобы получить миллион испытаний?

Какой эксперимент в простой задаче принятия решений мы должны провести, чтобы получить миллион испытаний?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Контекст: Модели когнитивных процессов требуют подгонки очень больших наборов данных. К сожалению, одной лаборатории сложно добиться этого в одиночку. Я предлагаю работать вместе и сообща над реализацией эксперимента в 1 миллион RT. Эта инициатива описана на моей странице ResearchGate, www.researchgate.net/profile/Denis_Cousineau.

Помимо подгонки модели, такой набор данных будет полезен для других целей. Примеры: параметры, описывающие выступления, обычно распределяются по предметам? Означает ли тренировочный эффект, приводящий к ускорению RT, что все параметры развиваются в одном направлении? Является ли байесовская оценка более подходящей для характеристики параметров, чем метод максимального правдоподобия? Как мы можем оценить время без принятия решения? Какова форма распределения RT и как тренировочный эффект меняет его форму? Опять же, применительно к Байесу: после скольких испытаний априорные значения больше не влияют на оценки? и т.п.

Требования к задаче: Задача должна быть только поведенческой (время отклика и варианты ответа), поскольку невозможно перемещать материал ЭЭГ или фМРТ по всему миру. Используемая конкретная задача не является критическим ограничением, потому что текущие модели познания (модели выборки, такие как LBA или Diffusion) очень гибкие; они нацелены на прогнозирование производительности в самых разных ситуациях.

Предлагаемые задачи будут оцениваться по следующим критериям критериев:

  • небольшое количество вариантов ответа
  • несколько условий
  • низкий уровень ошибок
  • стимулы, которые можно охарактеризовать в целях моделирования
  • возможность расширенного обучения по этой задаче.

Возможные задачи-кандидаты могут включать в себя: повторяющуюся задачу обнаружения цели (Миллер, 1982) или такую ​​же-другую задачу (например, Бамбер, 1969). Эти задачи просты, а точность обычно высока (правильность выше 90%); возможно, они выполняются с использованием некоторой формы параллельной обработки; время отклика обычно значительно меньше 700 мс.

Итак, в итоге:

Какая задача и схема эксперимента были бы наиболее подходящими с учетом вышеуказанных ограничений?

Давайте посмотрим, какие есть возможные задачи, прокомментируем предложения других, и, если вы найдете идеальную задачу, проголосуйте за нее. Пусть ваши коллеги выскажут свои комментарии или предложат новые задачи.


Мне не нравится идея, что в задаче должна быть низкая погрешность, ошибки нужны для выбора моделирования. Мне не нравится случайное движение точек, потому что существует большая индивидуальная разница, из-за которой трудно найти общую точку калибровки среди людей. Я предпочитаю вместо этого суждение о численности, например, более 50% квадратного массива пикселей (обычно большое количество) синие или оранжевые? Вы можете сделать массив достаточно большим, чтобы получить точный контроль сложности, и случайным образом выбрать, какие пиксели должны иметь каждый цвет (или яркость) в каждом кадре, если вы хотите усложнить использование определенных стратегий.


Мне нравится эта идея! Я думаю, что задача должна быть такой, чтобы данные могли использоваться многими аналитическими инструментами. Следовательно, данные будут полезны не только для одного конкретного вопроса, например для оценки параметров, но и для других инструментов, таких как системно-факторная технология (см. Townsend & Nozawa, 1995), которая обеспечивает более глубокое понимание лежащих в основе когнитивных подпроцессов. архитектура и другая интересная информация, такая как производительность процесса.

Я предлагаю, чтобы задача, по крайней мере, уважала двойную факторную парадигму. Этот план очень прост: у вас есть четыре условия в дизайне 2 x 2, где вы меняете две переменные. Это может быть любая переменная, единственное ограничение - вы должны изменять их независимо друг от друга. Другими словами, каждая переменная должна отражать когнитивный подпроцесс. В одном условии обе переменные находятся в сценарии, в котором подпроцесс должен работать очень эффективно (или оптимально). В другом случае обе переменные находятся в сценарии, в котором подпроцесс должен работать менее эффективно (или неоптимально). И в двух оставшихся условиях одна переменная работает оптимально, а другая - неоптимально, и наоборот.

Что касается самых деталей задачи, таких как стимулы, которые будут использоваться, и конкретные переменные, у меня нет предпочтений. Буквами очень легко манипулировать, но они несут семантический (более или менее) смысл. Абстрактные стимулы могут работать. Мы могли поиграть с цветом, формами, сложностью и т. Д. В этом году на Psychonomics было проведено множество экспериментов, в которых использовался этот дизайн.

Ссылка для цитирования: Townsend, J. T. & Nozawa, G. (1995). Пространственно-временные свойства элементарного восприятия исследование параллельных, последовательных и коактивных теорий. Журнал математической психологии, 39 (4), 321-359. DOI: 10.1006 / jmps.1995.1033


Всего несколько комментариев…

Поскольку одним из преимуществ большого набора данных является высокая статистическая мощность, было бы неплохо использовать задачу, в которой ключевой эффект нет были обнаружены в предыдущих исследованиях. Это дало бы гарантированный результат: т. Е. Мощную проверку важного нулевого результата.

Одним из примеров может быть условие всплывающего окна при визуальном поиске (т.е. отсутствие эффекта размера отображения), но это не идеально, поскольку оно ограничивает конец моделирования проекта. То есть было бы не слишком полезно моделировать несколько условий с одинаковой производительностью (или почти такой).

Лучшим примером может быть эксперимент с аддитивным коэффициентом (в некотором роде, предложенный Марком-Андре Гуле). Я бы предложил простой дизайн 2x2, для которого в предыдущих исследованиях сообщалось о теоретически важной аддитивности факторов (то есть о несущественном взаимодействии). Большое исследование предоставит мощный тест нулевого взаимодействия. И пока присутствуют оба основных эффекта, можно моделировать четыре различных условия. Этот дизайн интересен еще и тем, что многое известно об условиях, которым должны удовлетворять RT-распределения в определенных моделях (примеры см. В ссылках ниже).

Заключительный момент: после выбора задачи может быть очень полезно протестировать запланированный анализ на смоделированных данных, которые значительно легче получить, чем реальные данные. Это поможет сделать точные цели проекта более ясными, а также обеспечит достижение целей с использованием предложенного набора данных. Это также может помочь выявить, какие аспекты запланированной задачи / условий были необходимы для получения информативных результатов (например, минимальные размеры эффекта).

использованная литература

Кортезе, Дж. М. и Джафаров, Э. Н. Эмпирическое восстановление правил разложения времени отклика II. Различимость последовательных и параллельных архитектур. Журнал математической психологии, 1996, 40, 203-218

Джафаров Э. Н. и Кортез Дж. М. Эмпирическое восстановление правил декомпозиции времени отклика I. Тесты декомпозиции на уровне выборки. Журнал математической психологии, 1996, 40, 185-202

Джафаров, Э. Н. и Швайкерт, Р. Разложение времени отклика: почти общая теория. Журнал математической психологии, 1995, 39, 285-314

Робертс, С. & Стернберг, С. Значение аддитивных эффектов времени реакции: тесты трех альтернатив. В Meyer, D. E. & Kornblum, S. (Eds.) Внимание и производительность XIV. Синергизм в экспериментальной психологии, искусственном интеллекте и когнитивной нейробиологии., MIT Press, 1992, 611-653


Я согласен с Марком-Андре, выбранные стимулы не должны иметь семантических ассоциаций (или как можно меньше), поэтому я рекомендую использовать геометрические формы, которые различаются по цвету. Кроме того, я считаю, что задача должна быть как можно более простой, чтобы обеспечить общую чистоту данных.

Как вы предположили, одной из таких задач является задача обнаружения цели с избыточным атрибутом (Miller, 1982). В этом задании участников просят помнить о целевых параметрах (например, синем и квадратном), и как только одно из измерений отображается на экране, участники реагируют как можно быстрее и точнее. Результаты обычно бывают быстрыми, точными и слегка искаженными - подходит для этой инициативы! Мы могли бы выбрать несколько цветов и форм (если мы продолжим эту задачу), а также то, какая цветовая гармония должна быть выбрана.

Кроме того, наличие цветов, различающихся по «очевидности», потенциально может дать нам более четкое представление о параметрах в определенных моделях. Например, очевидный синий должен иметь более быстрое RT, чем приглушенный синий, и параметр скорости каждого отдельного канала должен отражать это (при условии, конечно, что параметр скорости вообще связан с "очевидностью"). Меня особенно интересует этот аспект.

Хотя вариант «пойти / нет» был бы отличным решением для этой задачи, я также твердо уверен, что задача 2AFC принесет гораздо более интересные результаты, а инициатива в 1 миллион RT может помочь нам по-настоящему понять «гонку» в «гоночных моделях». Это может быть так же просто, как изменение задачи с решениями «цель присутствует» или «цель отсутствует». Надеемся, что с более четкими тенденциями в RT мы сможем собрать информацию о независимости размеров и о наличии перекрестных помех между детекторами.

Кроме того, наличие таких данных принесет пользу не только подгонке модели, но и более надежному анализу архитектуры. Это, в свою очередь, поможет нам получить более конкретное представление о коактивных архитектурах (архитектура, предложенная Миллером в 1982 г., была задействована в этом типе задач), которые не были так строго определены, как другие архитектуры (как отмечалось Houpt & Таунсенд, 2011).

РЕДАКТИРОВАТЬ:

Хаупт, Дж. У., и Таунсенд, Дж. Т. (2011). Расширение прогнозов SIC на коактивную модель Винера. Журнал математической психологии, 55, 267-270.

Миллер Дж. (1982). Разделенное внимание: свидетельства коактивации с избыточными сигналами. Когнитивная психология, 14,247-279


Я лично заинтересован в получении такого набора данных по задаче «Тот же-другой» (Бамбер, 1969). Ответ двоичный (такой же или другой), точность очень высокая и есть эффект обучения (по крайней мере, краткосрочный). Что касается количества условий, мы могли бы упростить исходную задачу, перейдя с 14 условий до 8, одним из следующих способов:

  • ограничение количества букв до 4 (вместо 1, 2, 3 и 4)
  • использование стимулов из 1, 2 или 4 букв и наличие 1 или 2 несовпадений для стимулов из 2 букв и 2 или 4 несовпадений для стимулов из 4 букв

Второй вариант наиболее близок к оригиналу. Первое, однако, было бы очень информативным относительно условия 4 букв, так как данных о них мало из-за плана эксперимента.


Учитывая, что многие люди (в основном мужчины) имеют аномалии восприятия цвета, вы можете избегать цвета; вам также нужна простая задача с «легкими» стимулами, чтобы обеспечить короткие испытания. Для этого подходят парадигмы визуального поиска. Я повторяю призыв к проекту, в котором экспериментальный план затрагивал бы что-то особенно интересное, и в идеале это было бы трудно решить с помощью «стандартного» дизайна (например, с 10 000 точек данных, а не с 1 000 000). Оценка распределения времени обработки для процесса, выведенного из косвенных измерений, может быть интересной областью проблемы.

Пижама


Я голосую за простую задачу с произвольным перемещением точек. Это дает следующие преимущества: 1. Легкость программирования. Он может быть доставлен через Интернет с помощью javascript, что упрощает выполнение "многих лабораторий". 2. Он очень хорошо изучен и понятен. 3. Легко установить 5-ти кратные уровни когерентности, которые охватят почти весь диапазон точности, от уровня вероятности до 100%. Это важно для различения моделей.


Могу я спросить, задумывались ли вы об использовании существующих больших наборов данных, например, предоставленных Project Implicit? Набор данных.

(к сожалению, похоже, что Project Implicit не сохранил отдельные точки данных, а скорее рассчитал «эффект» для каждого участника).


Могу я предложить собирать данные в Интернете?

Благодаря новейшим технологиям браузера RT чрезвычайно точны, порядка 5 микросекунд (обсуждение). Даже при использовании немного более старых технологий браузера собранные RT могут быть точными (см.).

Есть несколько сайтов, где люди добровольно участвуют в исследованиях (обсуждениях).

Сбор данных на нескольких сайтах, безусловно, проще, если для каждого местоположения есть время на настройку.


Пожалуйста, позвольте мне подвергнуть сомнению вашу настройку:

Ваше утверждение о том, что вам нужен миллион точек данных, чтобы различать модели, поднимает вопрос, занимаетесь ли вы все еще достоверной наукой, я думаю. Вы уверены, что различия между моделями достаточно интересны с научной точки зрения, чтобы оправдать проект-монстр, чтобы попытаться провести различие между ними? Особенно, если все это основано на одной задаче. Уверен, что результатом вашего квеста станет «модель-победитель». Но я не уверен, что это приведет к обобщению научного понимания.


Миллион испытаний - это не так уж и много. Есть множество заданий, где можно собрать 1000 испытаний в час. С тематической панелью из десяти человек, где каждый работает 2 часа в день (10 часов в неделю), вы можете собрать миллион испытаний за 10 недель. Предполагая, что вы платите 15 долларов в час, вы можете собрать все данные за 15 000 долларов, что является небольшим грантом. Чтобы запустить панель из десяти человек, в идеале вам понадобятся 3 испытательные станции и RA для выполнения работы.


Наличные или кредит? Компенсация в психологических исследованиях: вопросы мотивации

Холли Дж. Боуэн, Элизабет А. Кенсингер Деньги или кредит? Компенсация в исследованиях психологии: вопросы мотивации. Collabra: Психология 1 января 2017 г. 3 (1): 12. doi: https://doi.org/10.1525/collabra.77

Исследователи-психологи часто набирают участников из числа студентов бакалавриата. Участники обычно получают компенсацию в виде частичного кредита на курс или денежной выплаты. Текущее исследование показывает, что мотивация к участию в исследовании (наличные деньги по сравнению с зачетным курсом) может быть связана с выполнением поведенческой задачи, связанной с вознаграждением памяти. В эксперименте 1 студенты-бакалавры были наняты и получили компенсацию за свое время либо частичным зачетом курса, либо наличными. Потенциальные денежные вознаграждения, основанные на результатах, были получены во время вознагражденной задачи на память, где правильное распознавание половины стимулов стоило высокой награды, а другая половина - низкой награды. Память для предметов с высокой наградой была лучше, чем для предметов с низкой наградой, но только для денежной группы. Кредитная группа не изменяла свои показатели в зависимости от ценности стимулов. В эксперименте 2 студенты получали частичную компенсацию за свое время и возможность заработать бонусный зачет за успеваемость на тесте памяти. Полученные данные совпадали с результатами кредитной группы Эксперимента 1, предполагая, что модуляция производительности в денежной группе Эксперимента 1 не может быть объяснена соответствием между мотивацией к участию и вознаграждением за выполнение задачи. Результаты, имеющие методологическое значение, указывают на то, что набор и компенсация участникам наличными по сравнению с зачетом курса может повлиять на результаты при выполнении задания на запоминание с вознаграждением. Этот фактор следует учитывать при исследованиях мотивации вознаграждения.


МЕТОДЫ

Участников

Двадцать здоровых добровольцев (средний возраст 10 женщин = 25,45 года, SD = 4,5 года) участвовал в сканирующей части этого исследования. Эти же 20 человек также участвовали в поведенческом сеансе, чтобы определить их право на участие в сканировании. Участники дали информированное согласие перед обеими сессиями. Исследование было одобрено этическим комитетом Гарвардского университета. Участники заработали 35 долларов за сеанс сканирования и 10 долларов за поведенческий сеанс, плюс бонус за результат в обоих случаях.

Кроме того, мы набрали 230 участников с использованием веб-службы Amazon Mechanical Turk. Всем участникам было дано информированное согласие и оплачено их участие. Это исследование также было одобрено этическим комитетом Гарвардского университета.

Дизайн и процедура: эксперимент фМРТ

Ниже описывается задача, которую выполнили участники эксперимента со сканированием. Было два вида испытаний: испытания «принятия решения» и испытания «воображения» (рис. 1). Блок состоял из пяти испытаний принятия решения, за которыми следовало одно испытание воображения с добавлением одного испытания решения в конце, потому что нас особенно интересовали испытания решения сразу после испытания воображения. Прогон состоял из восьми блоков. Участники выполнили пять прогонов на сканере. Большинство участников выполнили все пять пробежек, но у некоторых участников были исключения по количеству пробежек, некоторые участники выполнили меньше пробежек из-за экспериментальных сбоев (два участника: два пробега, один участник: три пробежки, два участника: четыре пробежки) и некоторые начальные пробежки. участники выполняли больше запусков, когда мы впервые проводили эксперимент (три участника: шесть запусков, один участник: восемь запусков).

Экспериментальная дизайн. Здесь показан дизайн исследования фМРТ, который идентичен дизайну поведенческих исследований, за исключением того, что в поведенческих исследованиях время было быстрее (см. Методы), и они использовали непрерывный прогноз вознаграждения, а не бинарное суждение. (A) При испытаниях решений участники пересекали пространство состояний, принимая последовательность из двух решений, за которыми следовало вознаграждение в конечном состоянии. Диаграмма перехода состояний показана справа, цветные стрелки соответствуют доступным действиям в каждом состоянии. (B) Пример последовательности вознаграждения. Каждая строка соответствует конечному состоянию. (C) На испытаниях воображения участники выполнили последовательность действий, необходимых для достижения определенного конечного состояния (показано справа), а затем предсказали, будет ли награда больше или меньше 0 в этом конечном состоянии. В поведенческих исследованиях участники постоянно прогнозировали численное вознаграждение.

Экспериментальная дизайн. Здесь показан дизайн исследования фМРТ, который идентичен дизайну поведенческих исследований, за исключением того, что в поведенческих исследованиях время было быстрее (см. Методы), и они использовали непрерывный прогноз вознаграждения, а не бинарное суждение. (A) При испытаниях решений участники пересекали пространство состояний, принимая последовательность из двух решений, за которыми следовало вознаграждение в конечном состоянии. Диаграмма перехода состояний показана справа, цветные стрелки соответствуют доступным действиям в каждом состоянии. (B) Пример последовательности вознаграждения. Каждая строка соответствует конечному состоянию. (C) На испытаниях воображения участники выполнили последовательность действий, необходимых для достижения определенного конечного состояния (показано справа), а затем предсказали, будет ли награда больше или меньше 0 в этом конечном состоянии. В поведенческих исследованиях участники постоянно прогнозировали численное вознаграждение.

В испытаниях по принятию решений участники принимали два последовательных решения слева или справа и получали обратную связь после каждого решения.Эти левые или правые решения позволяли участнику перемещаться по различным состояниям. Каждое испытание начиналось с одного и того же начального состояния. Было два промежуточных состояния (одно для левого, одно для правого) и четыре конечных состояния (слева или справа от любого из состояний второго уровня). Эти состояния были представлены черно-белыми изображениями предметов или сцен. Переходы между состояниями были детерминированными. Перед началом эксперимента мы показали участникам структуру переходов этих состояний.

Испытания по принятию решения начинались с того, что участник видел первое состояние и получал подсказку для принудительного выбора двух альтернативного (левого или правого) решения. У участников было 1,5 секунды, чтобы принять это решение. Если участникам не удавалось принять решение, им показывали крестик фиксации в течение оставшегося времени, отведенного для испытания (8 секунд от начала первого изображения до конца окончательной обратной связи). После первого решения участникам была предоставлена ​​обратная связь с вознаграждением и показана картинка, связанная с промежуточным состоянием (одно из двух возможных состояний в зависимости от того, выбрали ли они левое или правое). Отзыв о награде после первого решения всегда был 0 и показывался в течение 1,5 секунд. Затем участникам было предложено сделать еще один принудительный выбор влево / вправо. У них было 1,5 секунды, чтобы принять это решение. Опять же, если они не принимали решения, им показывали фиксирующий крест в течение оставшегося времени, отведенного для испытания. После того, как они приняли второе решение, участники получили обратную связь с вознаграждением и показали картинку, связанную с выбранным ими конечным состоянием. Обратная связь длилась 1,5 секунды, после чего участникам показывали крест фиксации на 2–4 секунды дрожания, после чего начиналось следующее испытание.

Основные награды были заранее определены для каждого испытания, независимо от пути, выбранного участником. Основная структура вознаграждения определяет оптимальный путь. Награды генерировались случайным образом во время каждого нового блока. Вознаграждения распределялись симметрично, так что наивысшее и наименьшее вознаграждение находились на одной ветви структуры пути (например, наибольшее и наименьшее могли быть связаны с двумя конечными состояниями, достижимыми из левого промежуточного состояния), а среднее ожидаемое вознаграждение было равным то же самое в обоих промежуточных состояниях. Самая высокая награда была выбрана из равномерного распределения между 15 и 25. Две промежуточные награды были выбраны из равномерного распределения между 0 и 10. Самая низкая награда была выбрана из равномерного распределения между -15 и -5. Награды сбрасываются в среднем каждые 10 испытаний (выбираются одинаково от 8 до 12). Эти награды менялись согласно гауссовскому случайному блужданию (SD = 0,5) до следующего сброса. Мы выбрали это распределение, которое было смещено для получения в среднем положительного вознаграждения, чтобы участники не расстраивались из-за большого количества потерь. Для некоторых участников (п = 39), были сопоставлены средние награды левой и правой ветвей дерева (т.е. сумма самого высокого и самого низкого вознаграждения была примерно равна сумме двух средних наград). Для остальных участников награды были бесподобными. Эти последовательности вознаграждений были качественно похожи, поэтому мы разошлись по разным типам последовательностей.

В испытаниях воображения участникам показывали картинку, представляющую начальное состояние, и картинку, представляющую одно из конечных состояний, со стрелкой, указывающей от начального состояния к конечному состоянию. Конечное состояние было выбрано случайным образом из одного из трех состояний, не предлагавших наивысшего вознаграждения. Участников попросили представить последовательность действий, которые переведут их из начального состояния в указанное конечное состояние, а затем указать соответствующую последовательность левых или правых решений (например, нажатие влево и вправо или влево и влево). У участников было 4 секунды, чтобы указать правильный путь, и 2–4 секунды дрожания следовали после указания воображаемого пути. Крест фиксации не ставился, если участники не принимали решения. Затем участников попросили предсказать, принесет ли воображаемый путь вознаграждение больше или меньше нуля. У них было 2,5 секунды на ответ, а затем им дали 2–4 секунды дрожания перед началом следующего испытания принятия решения.

Сначала мы набрали участников для участия в поведенческой части эксперимента вне сканера. В этом поведенческом сеансе прогон состоял из восьми блоков с добавлением одной попытки принятия решения в конце. Каждый участник выполнил четыре пробега. Перед тем, как приступить к собственно эксперименту, участники отрабатывали это задание за один запуск. После того, как участник завершил поведенческий сеанс, мы предложили им вернуться на этап сканирования, если их данные показали повышенную вероятность выбора воображаемого пути при испытаниях решения сразу после воображаемых испытаний (основа для эффекта в эксперименте 1). У нас было 35 участников, участвовавших в этой поведенческой части задачи, 15 из которых были исключены из сканирования, потому что либо они не показали эффекта, либо отклонили наше приглашение вернуться для сеанса сканирования (8 из 35 участников не проявили эффекта и были исключены из сканирования, соответственно, 7 из 35 участников отклонили приглашение вернуться для сеанса сканирования). Хотя мы отбирали участников для сканирования на основе эффекта воображения, мы все же обнаружили значительный эффект в среднем при анализе всех 35 участников. В целом, поведение выбора, указанное в разделе «Результаты», количественно и качественно не изменилось при включении всех 35 участников.

Индивидуальные испытания исключались из поведенческого анализа и анализа моделей, если участники не могли достичь терминального состояния (т.е.они не принимали двух решений).

Дизайн и процедура: поведенческие эксперименты

В эксперименте 1 использовалась та же экспериментальная парадигма, что и в эксперименте со сканированием, описанном выше, за исключением того, что участники делали непрерывные (численные) прогнозы в испытании воображения. Индивидуальные испытания исключались, если участники делали прогноз с абсолютным значением больше или равным 25. Кроме того, участники должны были указать правильный воображаемый путь перед переходом к следующему испытанию. Например, если сначала была выбрана правильная последовательность решений, а затем справа, им было предложено повторить последовательность решений, пока они не выбрали правильную. Ограничения по времени, описанные в эксперименте со сканированием, в этих экспериментах были ослаблены. Блок состоял из пяти испытаний по принятию решений и одного испытания воображения с добавлением одного испытания по принятию решений в конце. Каждый участник выполнил 31 блок.

Эксперимент 2 был таким же, как Эксперимент 1, описанный выше, за исключением того, что после того, как участники сделали свои прогнозы, они получили достоверную обратную связь о награде, связанной с воображаемым путем.

Эксперимент 3 был таким же, как Эксперимент 1, описанный выше, за исключением того, что участников не просили ни представить себе путь, ни указать последовательность решений, чтобы добраться туда. Они только предсказывали значение данного конечного состояния.

Подгонка и сравнение вычислительной модели

Мы подгоняем четыре вычислительные модели, описанные в разделе результатов, к данным выбора из испытаний принятия решения. Оценки максимального правдоподобия каждого параметра были получены для каждого участника индивидуально с использованием нелинейной оптимизации (функция MATLAB fmincon) с пятью случайными инициализациями, чтобы избежать локальной оптимизации, оценки параметров, достигающие наивысшего правдоподобия при случайных инициализациях, использовались в последующих анализах. Мы установили следующие границы для параметров: обратная температура [0,10], скорость обучения [0,1], кривая пригодности [0,1], бонус воображения [0,20] и распад забывания [1,3]. При подгонке модели к параметрам не применялись никакие преобразования.

Модели сравнивались с использованием случайных эффектов. Сравнение байесовских моделей (Rigoux, Stephan, Friston, & amp Daunizeau, 2014), которое оценивает частоту каждого класса модели в популяции. Входными данными для этой процедуры является свидетельство логарифмической модели для каждого участника, которое мы аппроксимировали с использованием -0,5 × BIC, где BIC - байесовский информационный критерий. Мы использовали вероятность превышения (апостериорная вероятность того, что конкретная модель чаще встречается в совокупности, чем другие рассматриваемые модели) в качестве показателя сравнения моделей.

Сбор данных фМРТ

Данные нейровизуализации были собраны с использованием 3-T Siemens Magnetom Prisma MRI scanner (Siemens Healthcare, Erlangen, Germany) с 32-канальной головной катушкой производителя. Анатомические изображения были собраны с помощью T1-взвешенной мультиэхо-последовательности MPRAGE (время повторения 176 сагиттальных срезов = 2530 мсек, время эхо-сигнала = 1,64, 3,50, 5,36 и 7,22 мсек, угол поворота = 7 °, поле обзора 1 мм 3 вокселей = 256 мм) . Все данные, выделенные жирным шрифтом, были собраны с помощью T2 * -взвешенной импульсной последовательности EPI, в которой использовались многополосные РЧ-импульсы и одновременный многосрезовый (SMS) сбор данных (Xu et al., 2013 Feinberg et al., 2010 Moeller et al., 2010). Для шести прогонов задачи параметры EPI были следующими: 69 чередующихся аксиально-наклонных срезов (25 ° в сторону коронки от совмещения AC-PC), время повторения = 2000 мс, время эха = 35 мс, угол поворота = 80 °, 2,2 -мм 3 вокселя, поле зрения = 207 мм, SMS = 3. Для получения данных SMS-EPI использовалась последовательность импульсов CMRR-MB из Университета Миннесоты.

Предварительная обработка и анализ данных фМРТ

Предварительная обработка данных и статистический анализ выполнялись с использованием SPM12 (Wellcome Department of Imaging Neuroscience, Лондон, Великобритания). Объемы функциональных (EPI) изображений были перестроены для корректировки небольших движений, возникающих между сканированиями. Этот процесс генерировал выровненный набор изображений и среднее изображение для каждого участника. Затем структурная МРТ каждого участника, взвешенная по T1, была сопоставлена ​​со средним значением перестроенных изображений и сегментирована для выделения серого вещества, которое было нормализовано к серому веществу в шаблоне изображения, основанном на эталонном мозге Монреальского неврологического института. Используя параметры этого процесса нормализации, функциональные изображения были нормализованы по шаблону Монреальского неврологического института (размер вокселя после повторной выборки = 2 мм). изотропный) и сглажены 8-миллиметровым гауссовым ядром на полувысоте. Фильтр верхних частот 1/128 Гц использовался для удаления низкочастотного шума, а модель авторегрессии первого порядка использовалась для коррекции временных автокорреляций.

Мы определили две общие линейные модели (GLM) для анализа данных фМРТ. Оба GLM включали стимульные события (сигналы и исходы) в качестве импульсных регрессоров, связанных с канонической функцией гемодинамического ответа (HRF). В GLM1 регрессор товарного вагона был определен на протяжении всей эпохи проб воображения, а затем свёрнут с каноническим HRF. Отдельные коэффициенты регрессии оценивались для проб воображения, за которыми следовал выбор воображаемого пути, и испытаний, за которыми следовал выбор оптимального пути. В GLM2 ошибка прогнозирования временной разницы из модели «воображение + забывание» была введена как параметрический модулятор исходных событий при испытаниях решений, ортогонализирована по отношению к регрессору исходных событий и свернута с канонической HRF.

Результаты на уровне группы были проанализированы с использованием т контрастирует с пороговой обработкой FWE на основе кластеров на уровне всего мозга (п & lt .05) с использованием порога кластерообразования п & lt .001.

Для анализа вентрального полосатого тела мы использовали двустороннюю анатомическую маску, взятую из атласа автоматической анатомической маркировки (Tzourio-Mazoyer et al., 2002).


ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ

Поведенческие данные

RT и частота ошибок в задаче принятия решения показаны на рисунке 2 отдельно для экспериментов 1 и 2. Неправильные ответы и выбросы (RT & gt 2,5 * SD, рассчитывались отдельно для каждого участника и условий эксперимента) были исключены из анализа RT (в среднем было 3,05 [SD = 1,43] и 3,53 [SD = 1,30] выбросов на участника в экспериментах 1 и 2 соответственно). Предполагая, что получение атрибутов является последовательным, TTB предсказывает, что RT увеличиваются в зависимости от количества извлекаемых атрибутов (тогда как компенсационная стратегия не предсказывает такого увеличения, см. Bergert & Nosofsky, 2007 Bröder & amp Gaissmaier, 2007). Как можно видеть, увеличение было ясно видно в обоих экспериментах, что указывает на то, что участники использовали стратегию TTB в соответствии с инструкциями.

RT и частота ошибок (т.е. ответы, отклоняющиеся от правильных ответов в соответствии с эвристикой TTB) в задаче принятия решения, отдельно для экспериментов 1 и 2 (планки ошибок - стандартные отклонения для участников). В соответствии с предсказаниями эвристики TTB, RT увеличивается в зависимости от количества атрибутов, которые должны быть извлечены. Более того, частота ошибок следовала той же схеме, что указывало на то, что чем больше было получено неправильных ответов, тем больше атрибутов нужно было извлечь и сравнить.

RT и частота ошибок (т.е. ответы, отклоняющиеся от правильных ответов в соответствии с эвристикой TTB) в задаче принятия решения, отдельно для экспериментов 1 и 2 (планки ошибок - стандартные отклонения для участников). В соответствии с предсказаниями эвристики TTB, RT увеличивается в зависимости от количества атрибутов, которые должны быть извлечены. Более того, частота ошибок следовала той же схеме, что указывало на то, что чем больше было получено неправильных ответов, тем больше атрибутов нужно было извлечь и сравнить.

Анализ ANOVA с повторными измерениями показал значительные основные эффекты количества извлекаемых атрибутов (за исключением контрольного условия), F(2, 32) = 133.98, п & lt .001 ɛ (по Huynh & amp Feldt, 1976) = 0,624 для эксперимента 1 и F(2, 28) = 69.70, п & lt .001 ɛ = 0,682 для эксперимента 2. Планируется т тесты для зависимых выборок показали, что RT были значительно выше для испытаний, требующих извлечения двух атрибутов, по сравнению с одним атрибутом, а также для испытаний, требующих извлечения трех или четырех атрибутов, по сравнению с двумя атрибутами. Кроме того, RT были больше для испытаний, требующих извлечения одного атрибута, по сравнению с испытаниями в контрольных условиях (п & lt .001 для всех т тесты).

Хотя участников проинструктировали применять TTB при каждом испытании решений, в принципе возможно, что они последовательно узнали об относительном успехе каждой компании и все чаще использовали эти знания для принятия решения. Однако, если бы это было так, величина равномерного увеличения RT с увеличением сравнений должна уменьшаться в прогонах фМРТ фазы поиска. Ни визуальный осмотр данных, ни постэкспериментальные анализы не предоставили никаких доказательств такой возможности (ни в одном из экспериментов). Другими словами, у нас нет причин предполагать, что участники не придерживались стратегии TTB на протяжении всей задачи принятия решения.

Рисунок 2 показывает, что в среднем частота ошибок была довольно низкой. Визуальный осмотр предлагает образец, который аналогичен образцу, полученному для RT. ANOVA показал основные эффекты количества извлекаемых атрибутов, F(2, 28) = 7.27, п = .003 ɛ = 0,929 для эксперимента 1 (на основе данных от 15 участников, поскольку два участника были исключены из-за ошибки кодирования в файлах журнала) и F(2, 28) = 9.97, п = .001 ɛ = 1 для эксперимента 2. Планируется т тесты показали, что частота ошибок была ниже для испытаний, требующих извлечения одного атрибута, по сравнению с двумя атрибутами, в Эксперименте 2 и для испытаний, требующих двух атрибутов, по сравнению с тремя или четырьмя атрибутами, в Эксперименте 1 (п & lt .01 для обоих т тесты). Кроме того, частота ошибок была выше для испытаний, требующих извлечения одного атрибута, по сравнению с испытаниями в контрольных условиях (п & lt .01 для первого и п <0,05 во втором эксперименте). Эти результаты показывают, что чем больше атрибутов необходимо получить и обработать, тем больше ошибок произойдет при использовании TTB.

Данные фМРТ

Процессы префронтального контроля: активация, не зависящая от материала, которая отражает количество атрибутов, которые должны быть извлечены

На основе моделей управления памятью (Badre & amp Wagner, 2007 Buckner & amp Wheeler, 2001) мы ожидали, что процессы управления в задаче принятия решений будут отражаться параметрической активацией в PFC, которая систематически увеличивается с количеством извлекаемых атрибутов. Как можно видеть в верхней части рисунка 3, левая дорсолатеральная PFC (средняя лобная извилина DLPFC, BA 9/46) максимально ответила на возрастающие требования к обработке (то есть на количество подлежащих восстановлению атрибутов). Тесное совпадение этого максимума в обоих экспериментах (которые имели разные иерархии атрибутов, см. Таблицу 1) предполагает, что активация PFC не зависит от конкретного типа атрибута, который должен быть получен и обработан. Другая область (также DLPFC), демонстрирующая однородное усиление сигнала, не зависящее от материала, была обнаружена в верхней теменной коре (см. Рисунок 3). На двух нижних панелях рисунка 3 показаны связанные с событием гемодинамические сигналы (привязанные по времени к представлению пары компаний), извлеченные из областей, которые показали максимальную активацию в двух экспериментах. Как можно видеть, в обоих экспериментах наблюдался равномерный рост сигнала с увеличением числа атрибутов, которые нужно было извлечь. Кроме того, можно видеть, что в контрольном условии - в котором не нужно было извлекать атрибутивную информацию - вообще не было ответа (на самом деле, рисунок 3 предполагает, что в этом состоянии был даже небольшой отрицательный ответ). Может показаться странным, что сигнал, связанный с событием для контрольного условия, дает сильный отклик, начиная примерно через 9 секунд. Обратите внимание, однако, что эта активация отражает (средний) ответ на последующее испытание.

Области мозга, показывающие систематическое увеличение активации с увеличением количества извлекаемых атрибутов. Параметрические контрасты количества извлекаемых атрибутов в обоих экспериментах (пороговое значение установлено на п & lt .005, RFX без коррекции) выявил наиболее сильную параметрическую активацию в левой DLPFC (средняя лобная извилина, BA 9), показывая, что эта область отражает общие требования к обработке, которые не зависят от конкретной иерархии атрибутов, то есть порядка, в котором атрибуты нужно сравнивать. Также левый DLPFC, верхняя теменная кора также продемонстрировали этот эффект, хотя и в меньшей степени. Статистические карты проецировались на реконструкцию слегка раздутой коры одного участника, на которой вогнутая кривизна (т. Е. Борозды) отображается темным цветом, а выпуклая кривизна (т. Е. Извилины) - светло-серым. Ниже показаны графики связанных с событием гемодинамических сигналов (усредненных к презентации пары компаний) из области максимальной активации в каждом эксперименте. Эта площадь была получена путем повышения статистического порога до п & lt .001, что дает близко совпадающие местоположения в двух экспериментах, расположенных в левом DLPFC (см. Таблицу 1).

Области мозга, показывающие систематическое увеличение активации с увеличением количества извлекаемых атрибутов. Параметрические контрасты количества извлекаемых атрибутов в обоих экспериментах (пороговое значение установлено на п & lt .005, RFX без коррекции) выявил наиболее сильную параметрическую активацию в левой DLPFC (средняя лобная извилина, BA 9), показывая, что эта область отражает общие требования к обработке, которые не зависят от конкретной иерархии атрибутов, то есть порядка, в котором атрибуты нужно сравнивать. Также левый DLPFC, верхняя теменная кора также продемонстрировали этот эффект, хотя и в меньшей степени. Статистические карты проецировались на реконструкцию слегка раздутой коры одного участника, на которой вогнутая кривизна (т. Е. Борозды) отображается темным цветом, а выпуклая кривизна (т. Е. Извилины) - светло-серым. Ниже показаны графики связанных с событием гемодинамических сигналов (усредненных к презентации пары компаний) из области максимальной активации в каждом эксперименте. Эта площадь была получена путем повышения статистического порога до п & lt .001, что дает близко совпадающие местоположения в двух экспериментах, расположенных в левом DLPFC (см. Таблицу 1).

Процессы префронтального контроля, участвующие в принятии решений на основе памяти: местоположения (анатомическая метка и область Бродмана), пик т Значения и количество значительно активированных вокселей областей мозга, которые отражают количество подлежащих восстановлению атрибутов

Область . BA . Икс . Y . Z . т . Воксели .
Эксперимент 1
п & lt .005
L средняя лобная извилина 6/9/46 −50 19 34 4.34 1984
L средняя лобная извилина 6 −43 6 39 5.02 1837
L верхняя лобная извилина 6 −48 2 55 3.70 81
L нижняя теменная доля 7/19 −33 68 43 4.18 1055
п & lt .001
L средняя лобная извилина 9 −48 22 35 4.34 85
Эксперимент 2
п & lt .005
L средняя лобная извилина 6/9/46 −47 17 34 4.92 3135
L средняя лобная извилина 6 −41 1 38 4.03 38
L средняя лобная извилина 6 −31 −1 55 4.11 325
L медиальная лобная извилина 6 −8 11 52 3.97 346
L нижняя теменная доля 7/19 −33 −66 42 4.34 1532
п & lt .001
L средняя лобная извилина 9 −47 17 36 4.92 598
Область . BA . Икс . Y . Z . т . Воксели .
Эксперимент 1
п & lt .005
L средняя лобная извилина 6/9/46 −50 19 34 4.34 1984
L средняя лобная извилина 6 −43 6 39 5.02 1837
L верхняя лобная извилина 6 −48 2 55 3.70 81
L нижняя теменная доля 7/19 −33 68 43 4.18 1055
п & lt .001
L средняя лобная извилина 9 −48 22 35 4.34 85
Эксперимент 2
п & lt .005
L средняя лобная извилина 6/9/46 −47 17 34 4.92 3135
L средняя лобная извилина 6 −41 1 38 4.03 38
L средняя лобная извилина 6 −31 −1 55 4.11 325
L медиальная лобная извилина 6 −8 11 52 3.97 346
L нижняя теменная доля 7/19 −33 −66 42 4.34 1532
п & lt .001
L средняя лобная извилина 9 −47 17 36 4.92 598

Активация на более высоком уровне значимости была использована для извлечения зависимых от события кривых гемодинамических сигналов, показанных на рисунке 3. L = слева.

Модулируется ли активация в задних областях, специфичных для материала, последовательными запросами на извлечение TTB?

На первом этапе мы определили области обработки материала в задней части коры головного мозга с помощью сканирования функциональных локализаторов. Эти области были определены как области интереса для активации специфических для материала стимулов, представляющих атрибуты, которые требовались для решения задачи. Как видно на рисунке 4 и в таблице 2, в эксперименте 1 мы смогли идентифицировать ROI для конкретных материалов в левой средней затылочной извилине для местоположений, в правой веретенообразной извилине для лиц и в левой язычной извилине для объектов и в Эксперимент 2 в левой верхней и нижней теменной доле для определения местоположения, в правой веретенообразной извилине для лиц и в левой клинке для объектов. Более того, здания (заменяющие цвета в Эксперименте 2) дали надежный ROI в левой парагиппокампальной коре (часть веретенообразной извилины).

Области интереса, зависящие от материала, в задней части коры головного мозга, идентифицированные сканированием функциональных локализаторов. На основе предположения (подробно описанного в обзоре плана эксперимента), что представления стимулов расположены в тех же областях коры, которые также участвуют в перцепционной обработке информации, эти области были определены как целевые области для представления атрибуты.

Области интереса, зависящие от материала, в задней части коры головного мозга, идентифицированные сканированием функциональных локализаторов. Исходя из предположения (подробно описанного в обзоре плана эксперимента), что представления стимулов расположены в тех же корковых областях, которые также участвуют в перцепционной обработке информации, эти области были определены как целевые области для представления атрибуты.

Зоны обработки в задней части коры головного мозга, зависящие от материала: расположение, пик т Значения и количество значительно активированных вокселей (п & lt .0001, нескорректированный) задних областей для конкретного материала, идентифицированных при сканировании с помощью функционального локализатора

Область . BA . Икс . Y . Z . т . Воксели .
Эксперимент 1
Расположение: L средняя затылочная извилина 18/19 −28 −79 10 7.26 1408
Лица: R веретенообразная извилина. 19 22 −76 −8 10.84 2901
Объекты: Язычная извилина. 18/19 −19 −54 0 10.44 3951
Эксперимент 2
Расположение: L верхняя / нижняя теменная доля 7/40 −37 −45 40 7.02 823
Лица: R веретенообразная извилина. 37 39 −43 −16 7.93 116
Объекты: L cuneus 18 −3 −77 14 10.27 6846
Строения: L веретенообразная извилина 37 −28 −58 −10 11.53 4472
Область . BA . Икс . Y . Z . т . Воксели .
Эксперимент 1
Расположение: L средняя затылочная извилина 18/19 −28 −79 10 7.26 1408
Лица: R веретенообразная извилина. 19 22 −76 −8 10.84 2901
Объекты: Язычная извилина. 18/19 −19 −54 0 10.44 3951
Эксперимент 2
Расположение: L верхняя / нижняя теменная доля 7/40 −37 −45 40 7.02 823
Лица: R веретенообразная извилина. 37 39 −43 −16 7.93 116
Объекты: L cuneus 18 −3 −77 14 10.27 6846
Строения: L веретенообразная извилина 37 −28 −58 −10 11.53 4472

На втором этапе мы извлекли из ROI усредненные гемодинамические ответы во время задачи принятия решения отдельно для разных уровней экспериментального фактора «количество атрибутов, которые необходимо извлечь». Как видно на рисунках 5 и 6, существует монотонно возрастающий отклик во всех областях интереса, то есть максимум активации увеличивается с увеличением количества атрибутов, необходимых для принятия решения. На первый взгляд тот факт, что такое увеличение наблюдается практически для всех ROI, кажется, говорит против контролируемой активации представлений LTM. Вместо этого он предполагает автоматическую активацию всех атрибутов, связанных с компанией, даже если атрибут не имеет отношения к решению. Однако мы утверждаем, что такой вывод необоснован. Например, тот факт, что ROI для конкретного лица активируется даже тогда, когда необходимо получить позиции, может быть просто следствием того факта, что область лица в определенной степени обычно реагирует на позиции. Как показано на рисунке 4, перекрытие кодирования было очевидным во всех областях интереса. Кажется физиологически неправдоподобным предположение, что области реагируют по принципу «все или ничего» только на один конкретный вид визуальных стимулов, но не на другие. Поэтому мы воздерживаемся от вывода о том, что существует автоматический процесс поиска, на основе наблюдения за равномерным увеличением всех ROI. Вместо этого мы спрашиваем, есть ли доказательства систематических отклонений от равномерного увеличения сигнала? Такие отклонения указали бы на существование контролируемой модуляции представлений, даже если часть активации является автоматической.

Избирательная модуляция систематического сигнала увеличивается в областях, специфичных для атрибутов. Области, представляющие второй по важности атрибут, показывают существенное увеличение максимального гемодинамического ответа, когда необходимо восстановить не только самые, но и вторые по важности атрибуты. Однако важно отметить, что, когда необходимо получить три или четыре атрибута, дополнительное увеличение активации довольно невелико. Другими словами, сильное увеличение активации наблюдается только в тех испытаниях, в которых соответствующий атрибут становится релевантным для принятия решения.

Избирательная модуляция систематического сигнала увеличивается в областях, специфичных для атрибутов. Области, представляющие второй по важности атрибут, показывают существенное увеличение максимального гемодинамического ответа, когда необходимо восстановить не только самые, но и вторые по важности атрибуты. Однако важно отметить, что, когда необходимо получить три или четыре атрибута, дополнительное увеличение активации довольно невелико. Другими словами, сильное увеличение активации наблюдается только в тех испытаниях, в которых соответствующий атрибут становится релевантным для принятия решения.

Селективная модуляция систематического сигнала увеличивается в областях, специфичных для атрибутов. Только для тех испытаний, в которых необходимо восстановить до четырех атрибутов, нисходящий фланг гемодинамической реакции в областях, которые представляют наименее важный атрибут (например, объекты в эксперименте 1 и позиции в эксперименте 2), продлевается, а не плавно снижается. к базовой активности после достижения максимума - как и следовало ожидать при строго равномерной модуляции сигнала (см. нижнюю левую и правую карты). Другими словами, атрибуты, которые актуальны относительно поздно в процессе принятия решения (т. Е. Имеющие низкую важность), обычно показывают длительную реакцию во время нисходящей части гемодинамической реакции. Напротив, когда атрибуты имеют высокую важность, это не так (см. Верхнюю левую и правую карты).

Селективная модуляция систематического сигнала увеличивается в областях, специфичных для атрибутов. Только для тех испытаний, в которых необходимо восстановить до четырех атрибутов, нисходящий фланг гемодинамической реакции в областях, которые представляют наименее важный атрибут (например, объекты в эксперименте 1 и позиции в эксперименте 2), продлевается, а не плавно снижается. к базовой активности после достижения максимума - как и следовало ожидать при строго равномерной модуляции сигнала (см. нижнюю левую и правую карты). Другими словами, атрибуты, которые актуальны относительно поздно в процессе принятия решения (т. Е. Имеющие низкую важность), обычно показывают длительную реакцию во время нисходящей части гемодинамической реакции. Напротив, когда атрибуты имеют высокую важность, это не так (см. Верхнюю левую и правую карты).

При более внимательном рассмотрении жирных сигналов, извлеченных из ROI, действительно обнаруживаются такие систематические отклонения. Как утверждается ниже, эти отклонения отражают важность атрибутов для принятия решений. Далее мы сосредотачиваемся на тех экспериментальных условиях, в которых необходимо получить более одного атрибута, мы не рассматриваем условие, при котором должен быть извлечен только один атрибут, потому что возможно, что по сравнению с контрольным условием активация в это условие может просто указывать на получение визуальных стимулов в целом, а не на получение определенного атрибута. Если TTB приводит к контролируемому поиску, должно происходить выборочное усиление активации именно в тех областях интереса, которые представляют атрибуты, релевантные для сравнения.

Давайте сначала обратимся к результатам эксперимента 1. На верхнем левом графике на рисунке 5 показаны отклики ROI, зависящего от лица (который представляет второй по важности атрибут), который должен быть получен только тогда, когда местоположения (наиболее важные атрибут) не различают компании. Как можно видеть, есть некоторая активация в области интереса, зависящей от лица, даже когда TTB требует только извлечения местоположений (светло-зеленая линия, максимум этой активации обозначен синей стрелкой). Однако, когда лица действительно становятся важными для принятия решения (т. Е. Когда необходимо извлечь два атрибута - местоположения и лица, потому что местоположения не различают среднюю зеленую линию), происходит дополнительное увеличение активации в ROI для конкретных лиц, отражая получение этого атрибута (обозначено другой синей стрелкой). Однако важно отметить, что, когда необходимо получить три или четыре атрибута (то есть цвета, цвета и объекты, соответственно, темно-зеленая линия), дополнительное увеличение активации в области интереса для конкретных лиц довольно невелико. Другими словами, наблюдается сильное увеличение активационной рентабельности инвестиций для конкретных лиц только в тех испытаниях, в которых лица имеют отношение к принятию решения.

Чтобы подтвердить это визуальное впечатление статистически, мы извлекли максимальные амплитуды ЖИРНЫХ сигналов в области интереса для конкретных лиц для каждого участника отдельно для различных экспериментальных условий. В соответствии с визуальным впечатлением, зависимый образец т тесты показали значительное увеличение активации, когда необходимо получить два атрибута по сравнению с одним атрибутом, т(16) = 6.89 п & lt .001. Однако, когда необходимо получить три или четыре атрибута по сравнению с двумя, увеличение было довольно небольшим, т(16) = 1.97 п = 0,067. Другой т тест подтвердил, что увеличение с одного до двух атрибутов было значительно больше, чем с двух до трех или четырех атрибутов, т(16) = 4.63 п & lt .001.

Чтобы подтвердить этот вывод, мы затем искали соответствующий образец в эксперименте 2. Важно отметить, что в эксперименте 2 здания, а не лица были вторым по важности атрибутом (различные иерархии важности атрибутов изображены на центральных панелях рисунков. 5 и 6). В тесном соответствии с результатами эксперимента 1, верхний правый график на Рисунке 5 показывает, что наблюдается выраженное увеличение сигнала в ROI для конкретного здания в тех испытаниях, в которых два атрибута (объекты и здания) должны быть извлечены, но без дальнейшего увеличения, когда также необходимо извлечь лица или лица и местоположения (снова обозначены двумя синими стрелками). Как и в эксперименте 1, это визуальное впечатление было подтверждено статистически: в ROI для конкретного здания наблюдалось значительное увеличение, когда нужно было получить два атрибута по сравнению с одним атрибутом, т(14) = 2.74 п = .016, но не тогда, когда нужно получить три или четыре, а не два атрибута, т(14) = 0.31 п = 0,763. Кроме того, увеличение с одного до двух атрибутов было больше, чем с двух до трех или четырех атрибутов, т(14) = 1.90 п = .078.

Подводя итог, можно сказать, что области, представляющие атрибуты с второй по величине важность (лица в Эксперименте 1 и здания в Эксперименте 2) показывают увеличение максимальной ЖИРНОЙ реакции, когда второй по важности атрибут становится актуальным по сравнению с тем, когда уже самый важный атрибут приводит к решению. Однако, когда необходимо получить три или четыре атрибута, дополнительное увеличение областей, представляющих второй по важности атрибут, намного меньше или даже полностью отсутствует. Важно отметить, что в эксперименте 2, в котором лица больше не являются вторым по важности атрибутом (рис. 5, нижний правый график), ROI для конкретных лиц нет показать этот эффект. Эта избирательная модуляция нейронной активации, которая следует порядку извлечения в соответствии с TTB, поддерживает понятие контролируемых процессов извлечения. В целом, максимум ЖИРНОГО ответа в ROI, зависящем от атрибута, кажется, увеличивается только тогда, когда соответствующий атрибут является релевантным для принятия решения.

Если второй по важности атрибут влияет на максимум ЖИРНОГО ответа, то третий по значимости и наименее важный атрибут должен влиять на части сигнала после максимума. Действительно, более пристальный взгляд на правый нижний график на рисунке 5 показывает интересную закономерность во временных изменениях гемодинамической реакции в области интереса для конкретных лиц в эксперименте 2: только для тех испытаний, в которых необходимо получить три или четыре атрибута, нисходящий фланг гемодинамической реакции кажется продолжительным, а не плавно снижается до базовой активности после достижения своего максимума - как можно было бы ожидать при строго однородной модуляции сигнала. Другими словами, атрибуты, которые актуальны относительно поздно в процессе принятия решения (т. Е. Имеющие низкую важность), обычно демонстрируют длительную реакцию во время нисходящей части гемодинамической реакции. Чтобы проиллюстрировать это, рассмотрим атрибуты местоположения и объекта, чьи ранги в иерархии атрибутов точно поменялись местами между экспериментами 1 и 2 (местоположения являются наиболее важным атрибутом в эксперименте 1 и, таким образом, релевантным для каждого испытания, но наименее важным атрибутом в эксперименте 2 - и, следовательно, актуально только тогда, когда для атрибута объекта необходимо получить все четыре атрибута, выполняется обратное). Как видно на рисунке 6 (обозначено синими стрелками на нижних левой и правой картах), как в области интереса, зависящей от местоположения, так и в области исследования объекта, существует продолжительная нисходящая часть гемодинамического ответа, когда атрибуты не имеют большого значения. . Напротив, когда атрибуты имеют высокую важность, это не так (см. Верхнюю левую и правую карты на рисунке 6).

Чтобы подтвердить это наблюдение длительных ответов статистически, нам потребовалась мера, которая могла бы фиксировать отклонения от плавного возврата к исходной активности. Поскольку любое такое отклонение обязательно приводит к возникновению дополнительной точки перегиба. ранее чем можно было бы ожидать при плавно нисходящем сигнале, мы сосредоточились на времени первой точки перегиба после максимума сигнала для различных кривых задних областей интереса. В качестве контрольного анализа мы проанализировали сигналы в PFC (см. Рисунок 3), в которых такие продолжительные отклики должны отсутствовать, как следствие, в PFC точки перегиба должны зависеть только от максимальной амплитуды сигнала и, таким образом, происходит позже, тем больше атрибутов необходимо получить.

Как можно увидеть на рисунке 3, наблюдается равномерное увеличение сигнала в PFC, и первая точка перегиба последовательно задерживается во времени по мере увеличения количества атрибутов, которые должны быть извлечены. Более конкретно, для эксперимента 1 (левый график на рисунке 3) точки перегиба возникали в среднем через 4,13 секунды в условиях управления (то есть, когда не нужно извлекать атрибуты), через 7,87 секунды, когда один атрибут должен быть при получении, за 8,93 секунды, когда необходимо получить два атрибута, и за 9,73 секунды, когда необходимо получить три или четыре атрибута. Для эксперимента 2 (правый график на рисунке 3) точки перегиба произошли в 5,40, 8,00, 9,77 и 11,41 сек соответственно. т тесты, для которых точки перегиба в каждом условии были извлечены для каждого участника, показали, что в эксперименте 1 точка перегиба возникла значительно позже, когда нужно было получить один, а не какой-либо атрибут, т(16) = 5.83 п & lt .001. Более того, точка перегиба произошла значительно позже, когда нужно было получить два атрибута, а не один, т(16) = 5.60 п & lt .001, и когда необходимо получить три или четыре атрибута, а не два, т(16) = 2.67 п = 0,017. Точно так же в эксперименте 2 точка перегиба произошла значительно позже, когда один, а не нет, атрибут т(14) = 6.42 п & lt .001, и когда были получены два атрибута, а не один, т(14) = 2.87 п = 0,012. Увеличение с двух до более чем двух атрибутов было незначительным.

В отличие от этого равномерного увеличения сигнала в PFC, задние области интереса показывают совершенно иную картину. В частности, когда местоположение и объекты являются наименее важными атрибутами (например, эксперименты 2 и 1, соответственно), точки перегиба гемодинамических ответов в соответствующих областях интереса (нижняя левая и правая карты на рисунке 6 для экспериментов 2 и 1, соответственно) происходить ранее (а не позже), чем когда нужно получить только два атрибута: 7,41 против 8,06 сек, т(16) = 2.02, п = 0,060 (эксперимент 1, ROI объекта) и 8,93 против 10,13 с, т(14) = 2.28, п = 0,039 (эксперимент 2, рентабельность инвестиций в локацию).Напротив, когда местоположения и объекты являются наиболее важными атрибутами, точка перегиба в соответствующих областях мозга возникает значительно позже, когда необходимо получить три или четыре, а не два атрибута, 8,71 против 10,29 секунды, т(16) = 7.85 п & lt .001 (эксперимент 1, рентабельность инвестиций в зависимости от местоположения, см. верхний левый график на рисунке 6) и 8,73 против 9,27 с, т(14) = 3.74 п = 0,002 (эксперимент 2, ROI для конкретного объекта см. Верхний правый график на рисунке 6). Это согласуется с тем, что можно было бы ожидать от равномерного увеличения сигнала, наблюдаемого в PFC.

В заключение, хотя в задних областях наблюдались возрастающие паттерны активации по всем областям интереса (что может свидетельствовать о том, что использование TTB связано с автоматической активацией распространения), мы обнаружили доказательства систематической модуляции этой активации, которые отражают порядок извлечения, предписанный иерархией атрибутов. . Эти систематические модуляции согласуются с гипотезой контролируемого поиска релевантной для решения атрибутивной информации.


Эффективное кодирование чисел объясняет смещение решения и шум

Пересмотрено в январе 2021 г.
(с Артуром Прат-Каррабином)
Скачать статью

Абстрактный: Люди по-разному оценивают разные стимулы в задачах усреднения. Это было интерпретировано как отражение смещенного кодирования стимула, но альтернативная гипотеза состоит в том, что стимулы кодируются с шумом, а затем оптимально декодируются. Более того, при эффективном кодировании количество шума должно варьироваться в пространстве стимула и зависеть от статистики стимулов. Мы исследуем эти прогнозы с помощью задачи, в которой участников просят сравнить средние значения двух серий чисел, каждая из которых выбрана из предыдущего распределения, которое различается в разных блоках испытаний. Мы показываем, что испытуемые кодируют числа со смещением и шумом, зависящими от числа. Редко встречающиеся числа кодируются с большим шумом. Модель, сочетающая эффективное кодирование и байесовское декодирование, лучше всего отражает поведение испытуемых. Наши результаты показывают, что «закон человеческого восприятия» Вэя и Стокера, который связывает предвзятость и изменчивость сенсорных оценок, также применим к познанию чисел.


Обсуждение

Человеческие субъекты сильно различаются по способности решать задачи по выбору и решению (Станович и Уэст, 2000 Станович, 2003 Ньюэлл, 2005). Здесь мы использовали простое задание для четырехрукого бандита, в котором испытуемые почти поровну делятся на две группы в зависимости от их выполнения: те, кто учится отдавать предпочтение выбору оптимального действия, и те, кто этого не делает. Чтобы определить нейронную основу этой групповой разницы, мы просканировали обе группы с помощью фМРТ, пока они выполняли задание, и проанализировали свою нейронную активность, используя модель обучения с подкреплением. Мы обнаружили, что эти группы заметно различаются по степени задействования сигналов RL в полосатом теле. В то время как учащиеся демонстрировали надежные сигналы ошибки прогнозирования как в вентральном, так и в дорсальном полосатом теле во время обучения, неученые показали значительно уменьшенный сигнал ошибки прогнозирования. Более того, нейронная активность в области спинного полосатого тела (и только там) была значительно больше коррелирована с сигналами PE у учащихся, чем у неученных. Обратите внимание, что эти результаты не противоречат друг другу, потому что они возникают в результате тестов, в которых задаются разные статистические вопросы. Хотя видимая разница между пороговыми картами для каждой группы в отдельности может указывать на то, что они различаются как в дорсальном, так и в вентральном полосатом теле, при формальном сравнении групп мы можем только отклонить нулевую гипотезу об отсутствии различий в более ограниченной области дорсального полосатого тела.

Эти результаты позволяют предположить, что одним из важнейших факторов, который отличает тех субъектов, которые успешно научились делать выбор при выполнении простых задач по принятию решений, от тех, кто этого не делает, является степень задействования сигналов RL. Эти результаты согласуются с теориями инструментального обучения с подкреплением, согласно которым сигнал ошибки предсказания вознаграждения функционально участвует в поведенчески выраженном обучении. Предполагается, что такие сигналы несут фазовая активность дофаминовых нейронов, которые сильно проецируются как на вентральное, так и на дорсальное полосатое тело (Schultz, 2002). Предыдущие исследования на людях с визуализацией сообщали о сигналах ПЭ в полосатом теле как при классической, так и при инструментальной обработке (O'Doherty, 2004). Также было показано, что модуляция дофамина с помощью системного введения дофаминергических агонистов и антагонистов модулирует активность PE в полосатом теле, а также изменяет поведенческие характеристики (Pessiglione et al., 2006). Настоящее исследование демонстрирует, что даже в естественных условиях, без внешнего введения лекарств, нейронные сигналы PE связаны со спонтанно возникающими различиями в поведенческих характеристиках. Мы также расширили эти результаты, показав градуированную взаимосвязь (в дополнение к групповой разнице) между поведенческими и нейронными показателями. Этот последний вывод помогает исключить возможность того, что наши результаты связаны с нашей процедурой групповой категоризации. Скорее, эти результаты предполагают, что наши результаты отражают более постоянную связь между производительностью и сигнализацией ошибки прогнозирования. Вместе с предыдущими открытиями, эти результаты подтверждают возможность того, что сигналы ошибок в полосатом теле являются ошибочными. причинно связаны с поведенческими характеристиками в связанных с вознаграждением инструментальных задачах принятия решений у людей.

Как обсуждалось выше, в то время как неученые показали отсутствие значимых сигналов ошибки прогноза как в вентральном, так и в дорсальном полосатом теле, мы наблюдали только значительную разницу в активности PE между группами в дорсальном полосатом теле. Эти данные в целом согласуются с ролью дорсального полосатого тела, аналогичной роли «актера» в моделях инструментальной обусловленности «актер / критик» (Joel et al., 2002 Suri, 2002 O'Doherty, 2004), при этом дорсальное полосатое тело, в частности, участвует в реализация выбора действия на основе вознаграждения (O'Doherty et al., 2004 Morris et al., 2006), тогда как вентральное полосатое тело участвует в обучении за вознаграждение в более общем плане. Наше открытие значительной корреляции в обеих группах между индивидуальными характеристиками субъектов и степенью активности ошибок прогноза в спинном полосатом теле указывает на то, что наши результаты являются не просто артефактом конкретных критериев, которые мы использовали для разделения субъектов на группы учащихся и неучащихся, а скорее. даже если испытуемые не разделены на произвольные группы, выполнение задания можно объяснить активностью в спинном полосатом теле. Предыдущее исследование Lohrenz et al. (2007) добавляет дополнительную поддержку утверждению о том, что спинное полосатое тело участвует в реализации выбора действия на основе вознаграждения. В этом исследовании авторы использовали более сложную задачу вознаграждения за принятие решений и обнаружили, что сигналы в тыльном полосатом теле коррелируют с новым сигналом «фиктивной ошибки», который строго предсказывает поведение субъектов при последующих решениях.

Хотя мы показали, что активность ошибок прогнозирования в полосатом теле отличает учащихся от необразованных, в настоящем исследовании не выясняется, почему эти две группы различаются по степени проявления активности ПЭ. Одна банальная возможность состоит в том, что испытуемые в группе необразованных просто были менее мотивированы к тому, чтобы хорошо выполнить задание, и / или не смогли уделить ему внимание. Наши выводы о том, что группы учащихся и неучниоров существенно не различались по времени реакции во время заданий и / или контрольных сессий и, кроме того, не различались по количеству успешно завершенных испытаний, предоставляют относительно веские доказательства против этой интерпретации. Если бы субъекты в одной группе были менее мотивированы или менее вовлечены в задачу, то это должно было отражаться постоянной разницей в количестве времени, необходимом для выбора в каждом испытании, или в количестве пропущенных испытаний. Группы учащихся и неучащихся не различались по возрасту, количеству лет образования или израильскому эквиваленту результатов SAT. Обе группы имели в среднем 15 лет формального образования и составляли прибл. На 1.5 SD выше среднего израильского населения по результатам SAT. Таким образом, неоптимальное выполнение задания людьми, не имеющими образования, вряд ли может быть связано с низким уровнем интеллекта или образования. Кроме того, группы не различались по стандартизированным личностным анкетам, предполагая, что различия в успеваемости, по-видимому, не связаны с обычно измеряемыми личностными чертами.

Было показано, что дофаминергические препараты обладают различным действием у разных людей (Cools and Robbins, 2004), предположительно отражая различия в основной дофаминергической функции. Сходным образом две наши группы могут различаться по степени высвобождения эндогенного дофамина в полосатом теле или по степени чувствительности нейронов полосатого тела к афферентной дофаминергической модуляции. Важным будущим шагом будет измерение поглощения дофамина с использованием лигандных ПЭТ-измерений в этих двух группах, чтобы определить, действительно ли они различаются по основной функции дофамина. Такие функциональные различия могут возникать в результате генетического полиморфизма или же в результате эффектов, зависящих от опыта. Более того, будет полезно определить, сохраняются ли различия в успеваемости между субъектами после многократного выполнения одних и тех же или связанных задач по принятию решений. Если эти группы демонстрируют стабильные и последовательные различия в производительности, это предполагает, что эти группы представляют отдельные субпопуляции с разной способностью генерировать сигналы PE вознаграждения и, таким образом, научиться адаптивно выбирать в простых задачах выбора.

Однако более скупая гипотеза состоит в том, что учащиеся и неученые различаются не дофаминергической физиологией, а, скорее, своим пониманием соответствующих характеристик проблемы принятия решений или с точки зрения обучения с подкреплением: их модели пространства состояний (Daw et al., 2006а). Согласно этому объяснению, сигнал PE вознаграждения задействован в неученых, но реагирует на различные и нерелевантные особенности проблемы принятия решения. Это привело бы к неспособности изучить задачу и неспособности с нашей стороны обнаружить сигналы, потому что мы исследовали их связь с функциями, относящимися к задаче. Если эта гипотеза верна, то испытуемые в группе необразованных смогут успешно выучить задание, если им будут даны соответствующие инструкции относительно соответствующих стимулов и состояний в задаче.

В заключение, в настоящем исследовании мы показываем, что активность ошибок прогнозирования в полосатом теле человека коррелирует с различиями в поведенческих характеристиках при выполнении простой задачи принятия решений на основе выбора. Эти данные предполагают, что использование сигналов PE, вероятно, исходящих от дофаминергических нейронов среднего мозга, может играть решающую роль в облегчении аппетитного инструментального обучения у людей.


Эта работа была поддержана стипендией Совета по медицинским исследованиям (MR / P014097 / 1), младшей исследовательской стипендией Крайст-Черч и грантом исследовательского центра Крайст-Черч компании P.L.L. а также грант Wellcome Trust (106164 / A / 14 / Z) и грант Академии медицинских наук (SBF001 1008) M.J.C. M.C.K.-F. был поддержан стипендией сэра Генри Веллкома (103184 / Z / 13 / Z). Центр интегральной нейровизуализации Wellcome поддерживается за счет основного финансирования Wellcome Trust (203139 / Z / 16 / Z). Мы благодарим госпожу Элоизу Копленд и доктора Хунбо Ю за помощь в сборе данных доктора Марко Виттмана, доктора Питера Смиттенаара, доктора Квентина Хейса, доктора Эльзу Фураньян и доктора Мехди Керамати за помощь в анализе данных и доктора Мэтью Приложения, профессора Натаниэля Доу, профессора Питера Даяна, доктора Воутера Кул, доктора Томаса Акама и г-жи Мэри Монтгомери за полезные обсуждения. Финансирующие организации не играли никакой роли в дизайне исследования, сборе и анализе данных, принятии решения о публикации или подготовке рукописи.

    1 Кому может быть адресована корреспонденция. Электронная почта: p.l.lockwoodbham.ac.uk, miriam.klein-fluggepsy.ox.ac.uk или molly.crockettyale.edu.

↵ 2 P.L.L. и M.C.K.-F. внес равный вклад в эту работу.

Вклад авторов: P.L.L., M.C.K.-F., A.A. и M.J.C. разработанное исследование P.L.L. и А.А. выполнили исследования P.L.L., M.C.K.-F. и M.J.C. проанализировали данные и P.L.L., M.C.K.-F. и M.J.C. написал газету.

Авторы заявляют об отсутствии конкурирующих интересов.

Эта статья представляет собой прямое представление PNAS. F.C. является приглашенным редактором по приглашению редакционной коллегии.

Эта статья в открытом доступе распространяется по лицензии Creative Commons Attribution License 4.0 (CC BY).


Какой эксперимент в простой задаче принятия решений мы должны провести, чтобы получить миллион испытаний? - Психология

На этой странице рассматриваются четыре вещи:

Прочитав этот раздел, вы сможете описать основные этапы решения научных проблем.

Что такое НАУЧНЫЙ МЕТОД?

Наука обычно доставляет удовольствие. Большинству ученых нравится их работа, и, к счастью, она иногда бывает полезной для общества. Поскольку ученые - это люди, а не машины, они ведут себя так же, как и другие люди. Они могут быть вспыльчивыми, упрямыми, завидовать чужому успеху и лгать. Даже в этом случае модель работы, используемой учеными, научный метод, является наиболее мощным инструментом из когда-либо созданных для анализа и решения проблем в мире природы. Этот метод можно применять как к повседневным ситуациям, так и к обычным «научным» проблемам. Мир мог бы стать даже более счастливым, если бы больше людей пытались решать свои проблемы «научным» способом.

Решение научных проблем имеет несколько узнаваемых этапов:

Наблюдение за явлением, которое в некотором роде интересно или загадочно.

Догадываемся относительно объяснения явления.

Разработка теста, чтобы показать, насколько вероятно это объяснение истинно или ложно.

Проведение теста и, на основе результатов, решение, является ли объяснение хорошим или нет. В последнем случае новое объяснение (если повезет) «придет в голову» в результате первого теста.

Наука зависит от оригинального мышления по нескольким причинам. Один из них - когда мы делаем исходное «предположение», обычно называемое гипотеза. Другой - когда мы разрабатываем тест или эксперимент чтобы показать, насколько вероятно, что гипотеза верна. Хороший ученый полагается на «вдохновение» так же, как хороший художник. [Некоторые учителя обеспокоены тем, что в современном естественнонаучном образовании этот момент в значительной степени игнорируется.]

НАУЧНЫЙ МЕТОД на практике - два повседневных примера

Примеры представляют собой рассказ, который вы могли бы прочитать в газете. Мы постараемся проанализировать эти истории с точки зрения НАУЧНОГО МЕТОДА. Общей чертой является отсутствие строгой тестовой ситуации в оригинальных рассказах. Сила НАУЧНОГО МЕТОДА в значительной степени заключается в разработке тестов, которые способны различать разные гипотезы.

1. Собака, понимающая французский язык.

Мистер Смит из Морнингсайда научил своего пса Ровер понимать французский язык. Мистер Смит заметил, что каждый вечер, после обеда, когда он подходил к двери в пальто и говорил "Прогулки", Ровер сразу понимал и прибегал. Мистер Смит собирался на лето во Францию ​​и, в качестве эксперимента по международному взаимопониманию, решил научить Rover французскому языку. Он начал говорить «Аллоны» вместо «Прогулки». К его радости, Ровер очень быстро все понял и прибежал.

Собака, по-видимому, откликается на зов «аллонов».

Какова гипотеза мистера Смита?

Собака понимает это слово как «прогулки».

Это единственное объяснение?

Нет. Собака может реагировать на общую ситуацию (после обеда, подход к двери, надевание пальто, крик), из которой то, что на самом деле называется, является лишь небольшой частью. Изменение голоса может не иметь большого значения для собаки.

Можем ли мы разработать тест, чтобы различать эти возможности?

Есть несколько. Например:

(а) Вызовите «Аллон» собаке в другой ситуации: например, утром, когда она обычно не выходит на прогулку.

(б) Подойдите к двери обычным способом (в пальто, после обеда), ничего не называя.

(c) Сделайте то же самое и назовите что-нибудь глупое, например "Ревень".

Результаты этих и подобных тестов должны показать, реагирует ли ровер конкретно на слово «галлоны» или (что более вероятно) на общую ситуацию, к которой он хорошо привык.

Обратите внимание, что эти тесты ничего не говорят нам о способности собаки учить французские слова. Их интересует только конкретный случай ответа на одно французское слово. Позже мы увидим, что экстраполяция от частного к общему очень важна в научной методологии.

2. Долгосрочный успех предсказателя будущего

Институт психических исследований провел исследование действий известных гадалок. Наиболее положительные результаты связаны с Арнольдом Вудчаком, который в начале каждого года делает серию из десяти прогнозов на предстоящий год в национальной бульварной газете. Институт обнаружил, что мистер Вудчак неизменно прав примерно в 80% своих прогнозов. Например, на 1995 год он предсказал политический кризис в Европе (бывшая Югославия?), Крупную человеческую катастрофу в Африке (Руанда?), Спор по поводу оплаты труда в государственном секторе (медсестры?) И кончину известного футбольного менеджера (г-на Грэм?). К сожалению, он ошибся, предсказав, что Англия выиграет чемпионат мира по регби. Представитель института был «оптимистичен» в отношении будущих исследований г-на Вудчака.

Очевидное наблюдение состоит в том, что мистер Вудчак получил больше верных прогнозов, чем можно было бы ожидать случайно. Гипотеза Института будет заключаться в том, что мистер Вудчак обладает какими-то «экстрасенсорными способностями». Можем ли мы придумать альтернативную гипотезу?

Здесь мы имеем дело с вероятностью. Если мы подбрасываем беспристрастную монету, мы получаем в среднем такое же количество орлов, как и решек. Если бы мы попросили кого-нибудь предсказать исход жеребьевки, мы не были бы сильно удивлены, если бы из небольшого количества испытаний он получил 4 правильных результата из 5. Но если бы он продолжал достигать 80% успеха в длительной серии, мы бы начали подозревать: (1) предвзятую монету (2) обман (3) экстрасенсорные способности.

Мистер Вудчак регулярно получает 80%. Его «монета» пристрастна, он жульничает или обладает экстрасенсорными способностями? Наиболее вероятным объяснением является «предвзятая монета», т. Е. То, что события, которые он предсказывает, не имеют вероятности 1: 1, но, возможно, имеют вероятность, близкую к 4 или 5: 1, другими словами, очень высокую вероятность того, что они произойдут. происходить.

Таким образом, у нас есть два вида тестов:

Анализ реальных вероятностей прогнозируемых событий.

Например, почти всегда каждый год происходит по крайней мере один «политический кризис» в Европе и «крупная человеческая катастрофа» в Африке. Точно так же у футбольных менеджеров короткий срок годности. Работники государственного сектора (такие как медсестры, железнодорожники или преподаватели университетов) в течение многих лет считали, что им недоплачивают, в то время как их хозяева либо не могут, либо не будут отвечать должным образом.Напротив, шансы Англии на победу в чемпионате мира по регби были завышены в английской прессе - и это предсказание не оправдалось.

Анализ того, как мистер Вудчак правильно предсказывал события, которые действительно имеют низкую вероятность.

Опять же, результаты этого расследования будут ограниченными. Они, вероятно, покажут, что объяснение «необъективной монеты» является наиболее вероятным. Они не показали бы (а) есть ли у мистера Вудчака какие-то психические способности или (б) возможны ли психические способности.

Также обратите внимание, что даже большое отклонение от ожидаемого результата может произойти случайно в небольшой выборке (например, получение 4 из 5 правильных догадок по подбрасыванию монеты). Это очень важно в биологии и является основой использования статистических методов в биологическом анализе.

Прочитав этот раздел, вы сможете отличить хороший экспериментальный план от плохого.

Планирование подходящего эксперимента для проверки гипотезы часто требует некоторой изобретательности и подозрительности. В современной биологии эксперимент может включать очень сложное оборудование. Но есть ряд черт, общих для всех хороших экспериментов (и часто отсутствующих у плохих), которые существуют независимо от технических деталей. В итоге это:

Дискриминация

Эксперименты должны уметь четко различать разные гипотезы. Часто оказывается, что две или более гипотез дают неразличимые результаты при проверке плохо спланированными экспериментами.

Репликация и универсальность

Живой материал, как известно, изменчив. Обычно эксперименты необходимо повторять достаточное количество раз, чтобы результаты можно было проанализировать статистически. Точно так же, из-за биологической изменчивости, мы должны с осторожностью обобщать наши результаты, полученные от отдельных существ на других, принадлежащих к тому же виду, или к другим видам. Например, если наша гипотеза касается млекопитающих, недостаточно просто проводить наши эксперименты на лабораторных крысах. Точно так же опасно экстраполировать от здоровых студентов на высококлассных спортсменов.

Органы управления

Эксперимент должен хорошо контролироваться. Мы должны с помощью надлежащих проверок исключить возможность того, что другие факторы в общей тестовой ситуации производят наблюдаемый нами эффект, а не фактор, который нас интересует.

Пример: Гормон роста секретируется в ответ на действие ряда агентов, включая аминокислоту аргинин. Это было показано путем введения добровольцам аргинина. В качестве контроля исследователи вводили добровольцам физиологический раствор. К их удивлению, снова был выделен гормон роста. Затем исследователи помахали шприцем и иглой перед своими добровольцами и обнаружили, что это тоже вызывает секрецию гормона роста. В настоящее время известно, что гормон роста секретируется в ответ на стресс (как и аргинин).

На более техническом уровне мы должны быть уверены, что наш метод измерения воспроизводится изо дня в день, между операторами в одной лаборатории или между лабораториями. Хотя мы можем быть уверены в весах или линейке, можем ли мы быть уверены, скажем, в методе измерения гемоглобина? Дают ли две группы студентов, измеряющие одни и те же образцы одними и теми же методами, одинаковые результаты? Контроль качества здесь помогает.

«Слепые» конструкции

Исследователи могут подсознательно «фальсифицировать» свои данные, если они знают, какой результат они хотят получить. Ответ заключается в том, чтобы провести эксперимент «вслепую», чтобы исследователи (и испытуемые, если изучаются люди) не знали, эффект какого лечения они наблюдают. Это может усложнить логистику проведения эксперимента: например, при определении концентрации гемоглобина у учащихся мужского и женского пола.

Есть история о профессоре, который изобрел лабиринт для измерения интеллекта крыс. Однажды он дал своим техникам, которые фактически проводили измерения, три группы крыс. Он сказал им, что одна группа была специально выведена для интеллекта, другая - для глупости, а третья была средней. Техники оценили интеллект крыс и подтвердили, что «умная» группа показала лучшие результаты, а «глупая» - худшая. Дело, конечно, в том, что профессор произвольно разделил животных на три группы. Они не отличались интеллектом.

Измерение

Хорошие эксперименты часто, хотя и не всегда, включают в себя измерение чего-то, скажем, веса. При проведении измерений важно знать, как точность и точность вашей измерительной системы. Эти два термина не являются синонимами: «точность» означает способность метода давать в среднем объективный ответ, тогда как «точность» - это показатель воспроизводимости метода. В идеале ваш метод должен быть как точным (т. Е. Давать истинное среднее значение), так и точным (т. Е. Иметь низкое стандартное отклонение). Иногда одно важнее другого. Например, если вы искали небольшие изменения со временем в каком-либо количестве (например, концентрации гемоглобина у спортсмена), вам потребуется его точное измерение, а не точное.

Точность и точность вместе помогут вам оценить надежность ваших данных. Они также помогут вам определить, сколько значимые фигуры вы должны процитировать свои результаты. Например, если вы используете показания весов с точностью до грамма, вы должны приводить результаты с точностью до грамма, а не, скажем, с точностью до десятых долей грамма.

Некоторые эксперименты очень сложно провести, потому что неясно, что можно измерить. Это реальная проблема поведения животных: например, не существует очевидной единицы или меры для «эмоционального состояния». Обычно необходимо выделить измеримые компоненты поведения. Таким образом, скорость, с которой тигр ходит вверх и вниз по клетке, может дать некоторое представление о внутреннем состоянии животного, но никогда не может дать его полной картины.

Многие из этих моментов довольно абстрактны, но они станут яснее, если вы обдумаете следующие примеры.

Пример 1: выделяют ли растения водяной пар?

Сорок бобовых растений, растущих в горшках, однажды днем ​​накрыли отдельными стеклянными контейнерами и оставили в лаборатории на ночь. На следующее утро внутренняя часть крышки каждого контейнера была покрыта каплями жидкости, которая оказалась водой.

Растения обычно выделяют водяной пар.

Вода могла поступать из растений, почвы, горшков или воздуха в кувшине. Для проверки этих возможностей следовало поставить контрольные эксперименты.

2. Заключение содержит некоторые моменты, которые не соответствуют действительности.

(а) Эксперимент проводился в течение ночи и поэтому ничего не может сказать нам о поведении растений в другое время дня, слово «в целом» неоправданно.

(б) Он был проведен с достаточным количеством бобовых растений, но ничего не может сказать нам о других видах растений, поэтому следует использовать слово «растения».

(c) В эксперименте нет доказательств того, что вода выделяется в виде пара.

Пример 2. Является ли «собственная марка» стирального порошка в вашем супермаркете такой же хорошей, как и рекламируемая на национальном уровне?

Эрик Тритон оплакивал тот факт, что его жена Ариэль настояла на том, чтобы стирать его одежду порошком собственной марки местного супермаркета. Он был уверен, что известная марка, которую он видел, творит чудеса по телевизору почти каждый вечер, будет лучше. Поэтому он намеревался доказать это.

Г-н Тритон решил сравнить эффективность этих двух продуктов на том, что его жена назвала «сложной» грязью: пятнами от травы на белых льняных носовых платках. Он купил 4 кг порошка известного бренда по цене 5,17 фунта стерлингов в их супермаркете и отметил, что такой же вес порошка собственной марки стоил бы 4,47 фунта стерлингов. Он точно следовал инструкциям на упаковках, отвешивая такое же количество порошка и используя программу их стиральной машины для белого постельного белья. Г-н Тритон осознавал необходимость индекса «чистоты» и поэтому разработал субъективную шкалу от 10 («белее белого») до 0 (начальный уровень загрязнения).

Вера г-на Тритона в значительной степени подтвердилась. Он набрал впечатляющие 8 баллов за носовой платок, очищенный национальным брендом, в то время как порошок собственного бренда - только на 7. Триумфально он сообщил о результатах своей жене. Миссис Тритон, однако, не впечатлила. Она указала мужу, что в его эксперименте было несколько недостатков, и убедила его, что результат «не доказан».

- Как вы думаете, какие недостатки могла обнаружить миссис Тритон?

Как мистеру Тритону следовало провести эксперимент?

Дальнейшее чтение: Барнард С., Гилберт Ф. и МакГрегор П. (1993) Задавая вопросы по биологии, Лонгманс.

Есть история о выдающемся профессоре из Кембриджа, который выступил с докладом на научном собрании, и собеседник спросил его: «Какой статистический тест вы использовали для проверки своих результатов?» Профессор объяснил, что он использовал свой собственный статистический тест:

«В нашем отделении есть длинный коридор с доской объявлений на одном конце. Я рисую гистограмму своих результатов, прикрепляю ее к доске объявлений, а затем иду в другой конец коридора. Если я все еще вижу разницу между методами лечения, значит, разница значительна & quot;

Актуальность этой истории заключается в том, что она не сказать! Если эксперимент спланирован и проведен должным образом - чего можно ожидать от выдающегося ученого, - результаты часто говорят сами за себя. Например, это может быть верно в отношении экспериментов, в которых мутанты генерируются (или вставляются гены) в организм, что дает явное изменение поведения, такое как устойчивость к антибиотику или проявление нового признака. Такие эффекты «все или ничего» редко нуждаются в подтверждении статистическими тестами, но они все же нуждаются в хорошем экспериментальном дизайне.

Однако во многих областях биологии мы работаем с различными эффектами - различиями в скорости роста организмов, количественными различиями в устойчивости к антибиотикам, размером или скоростью биохимических реакций и т. Д. Тогда нам нужны не только статистические тесты для анализа этих различий, но и нам также нужен хороший экспериментальный план, чтобы убедиться, что мы не искажаем наши результаты каким-либо образом, не осознавая этого.

Хороший экспериментальный план - ключ к хорошей науке. Но это не так просто, как может показаться.

Во многих случаях хороший экспериментальный план предполагает четкое представление о том, как мы будем анализировать результаты, когда мы их получим. Вот почему статистики часто советуют нам подумайте о статистических тестах, которые мы будем использовать, прежде чем начинать эксперимент.

Три важных шага в хорошем экспериментальном дизайне

1. Определите цели. Запишите (т.е. запишите) именно то, что вы хотите проверить в эксперименте.

2. Разработайте стратегию. Запишите точно, как вы можете достичь цели. Это включает в себя размышления о размере и структуре эксперимента - сколько процедур? сколько реплик? как будут анализироваться результаты?

3. Запишите все операционные детали. Как будет проходить эксперимент на практике? В каком порядке все будет делаться? Должны ли методы лечения быть рандомизированными или следовать установленной структуре? Можно ли провести эксперимент за день? Будет время на обед? и т.п.

Если все это звучит банально или очевидно, читайте дальше. Это не так просто, как вы думаете!

Пример 1. Эксперименты, которые не дают полезных результатов, потому что мы не собрали достаточно данных

Предположим, мы хотим проверить результаты менделевского генетического скрещивания. Начнем с 2 родителей генотипа AABB а также aabb (куда А а также а представляют доминантные и рецессивные аллели одного гена, и B а также б представляют доминантный и рецессивный аллели другого гена).

Мы знаем, что все F1 поколение (потомство первого поколения этих родителей) будет иметь генотип AaBb, и что их фенотип будет отображать оба доминантных аллеля (например, у плодовых мушек все F1 у поколения будут красные глаза, а не белые, и нормальные крылья, а не короткие).

Это F1 поколение будет производить 4 типа гамет (AB, Ab, aB и ab), и когда мы самостоятельно пересекаем F1 поколения мы получим множество F2 генотипы (см. таблицу ниже).

Все эти генотипы делятся на 4 фенотипа, показанных цветом в таблице: двойной доминантный, одинарный доминантный A, одиночный доминантный B и двойной рецессивный. А мы знаем, что в классической менделевской генетике соотношение этих фенотипов составляет 9: 3: 3: 1.

Большинство людей также знают, что мы используем критерий хи в квадрате для анализа результатов генетических скрещиваний: делаем свой эксперимент, подсчитываем количество F2 потомков, которые попадают в разные категории, и проверьте, соответствуют ли наши результаты ожиданиям. В этом случае ожидается, что результаты будут соответствовать соотношению 9: 3: 3: 1.

Но что вы можете не знать, так это то, что критерий хи-квадрат будет действителен только в том случае, если каждая ожидаемая категория в этом случае равна 5 или более (не имеет значения, каково фактическое количество в каждой категории, но ожидал количество должно быть 5 или больше). Другими словами, у нас ДОЛЖНО быть не менее 80 F.2 потомство, чтобы использовать критерий хи-квадрат в этом эксперименте, потому что тогда в самой маленькой категории - двойном рецессивном - будет 5 ожидаемых особей (одна шестнадцатая из 80 равна 5). [Более полное объяснение этого дается в тесте хи-квадрат.]

Аналогичным образом, для сравнения двух подсчетов (например, подсчетов на чашках с разведением бактерий) с помощью распределения Пуассона вам нужно будет подсчитать около 30 колоний при выбранном уровне разведения. [Принципы, лежащие в основе распределения Пуассона, не действуют для отсчетов ниже этого]

В качестве другого примера в том же духе, мы могли бы захотеть сравнить биомассу, произведенную культурой каллуса растений в колбах, содержащих различные питательные растворы. Мы знаем, что нам нужно более одной колбы каждого питательного раствора (т.е. нам нужны копии), и мы будем использовать Студенты т-тестовое задание для сравнения среднего роста в каждом растворе. [По сути, t-критерий сравнивает разницу между двумя средними значениями в отношении количества вариаций в рамках лечения. Другими словами, мы получаем значительный результат, если разница между средними значениями велика и / или разница между повторностями мала].

Итак, сколько реплик мы должны использовать? Это вопрос суждения (и доступных ресурсов), но если мы посмотрим на t-таблицу, мы сможем принять некоторые рациональные решения. Если мы будем использовать 2 колбы для каждой обработки (всего 4 колбы), у нас будет 2 степени свободы. Этот термин объясняется в другом месте, но пока мы можем отметить, что количество степеней свободы для каждого лечения на единицу меньше количества повторов. Другими словами, при 2 обработках по 2 колбы в каждой мы имеем 2 степени свободы. При 2 обработках по 10 флаконов в каждой мы получаем 18 степеней свободы.

Когда мы анализируем наши результаты по студенческим т-теста, рассчитываем т значение и сравните его с т значение для вероятности 0,05 в т-стол. Наши методы лечения значительно различаются, если рассчитанное значение t больше табличного значения.

Посмотрите на табличные т значение (4.30) для 2 степеней свободы. Это довольно много, и мы сможем найти значительную разницу между нашими методами лечения только в том случае, если у нас будет довольно большая разница между средними и небольшими вариациями в наших повторностях. Но если бы мы использовали 4 повтора каждого лечения (6 степеней свободы), у нас было бы намного больше шансов найти значительную разницу (т значение 2,45) между теми же средними значениями. Но посмотрите еще дальше т-таблица - например, вниз от 10 степеней свободы (т-value 2.23) - и мы видим, что мы очень мало выиграем, если будем использовать больше реплик. Мы будем в сфере убывающей отдачи, получая очень мало за все дополнительное время и ресурсы.

Вывод из этих примеров заключается в том, что знание статистического теста, который мы будем использовать, помогает нам правильно спланировать наш эксперимент.

Пример 2 . Эксперименты, которые вроде бы дают полезные результаты, но наши процедуры нас подвели!

Под этим заголовком мы имеем дело с фактическим процессом проведения эксперимента - задачей со множеством скрытых подводных камней.

Предположим, мы решили сравнить 4 обработки с 4 повторами для каждой - всего 16 флаконов с бактериями, 16 горшечных растений, 16 биохимических реакций для измерения с помощью спектрофотометра и т. Д. Мы проводим эксперимент, получаем хорошие результаты, анализируем их (подходящие тест будет называться дисперсионным анализом) и выявить существенные различия между методами лечения. Мы записываем результаты, получаем Нобелевскую премию или хорошую оценку, или что-то еще. Конец истории.

Либо это? Ответ на этот вопрос зависит от того, как мы проводили эксперимент. Например, могла быть хорошая «практическая» (то есть удобная) причина для настройки всех повторений лечения 1, затем (например) замены пипетки и настройки всех повторений лечения 2 и так далее. Проблема заключается в следующем: как мы можем быть уверены, что разница, которую мы обнаружили между видами лечения, была связана с методами лечения, а не порядком, в котором мы их устанавливали? Даже если мы ДЕЙСТВИТЕЛЬНО чувствуем уверенность, наш эксперимент по своей сути предвзят, и никто не поверит результатам, если мы расскажем, как мы это сделали! [Существует почти бесконечное количество причин, по которым условия могут измениться за время, необходимое для постановки эксперимента. Например, мы можем становиться все более эффективными или более уставать. Температура водяной бани (или чего-то еще) может немного измениться за это время. Каждая пипетка будет немного отличаться от следующей и т. Д., И т. Д.]

Итак, как насчет того, чтобы сделать один повтор лечения 1, затем один сеанс лечения 2, затем 3, затем 4, а затем выполнить второй повтор лечения 1, второй сеанс лечения 2 и так далее? По правде говоря, это устранило бы только часть врожденной предвзятости - в среднем, лечение 1 все еще настраивается до лечения 2 и т. д.

Единственный способ преодолеть это - заранее спланировать ситуацию. У нас есть два основных варианта.

  • Мы могли бы рандомизировать порядок, в котором настраивается каждый тест, так что это полностью вопрос случая, будет ли «лечение 1, реплика 1» выполняться первым или последним или где-то посередине.
  • Мы могли бы структурировать настройку (или выборку эксперимента) так, чтобы сначала выполнялась одна реплика каждой обработки (в случайном порядке), затем выполнялась следующая реплика каждой обработки (снова в случайном порядке) и так далее. Это было бы разумно, если бы мы знали (или подозревали), что условия могут измениться во время постановки эксперимента, потому что дисперсионный анализ (статистический тест, который мы будем использовать для наших результатов) мог бы выделить эффект «установки времени» от воздействия & quot; лечения & quot. Такой экспериментальный дизайн называется рандомизированный блок дизайн.Это проиллюстрировано в таблице ниже, где строки представляют блоки, а порядок обработки (A, B, C и D) внутри блоков определяется случайным образом. [Но обратите внимание, что приведенная ниже сетка идеальна - вы редко можете получить ее, если случайным образом разместите процедуры внутри блоков. Сетка такого типа называется Латинский квадрат, и для некоторых целей это, вероятно, лучше, чем рандомизированный блок]

И последний пункт - те же принципы следует применять к другим практическим аспектам эксперимента. Например, вы когда-нибудь тестировали температурный градиент в лабораторном инкубаторе или (что еще хуже) в комнате для выращивания? Датчик температуры может регистрировать «30 ° C», но, вероятно, будет иметь место вертикальный (или боковой) температурный градиент 2–3 ° C или более. Так что никогда не объединяйте все копии одного лечения. Перемешайте их.

Для большинства экспериментов мы просто рандомизировали методы лечения и повторения. Для этого есть важная статистическая причина, потому что все статистические процедуры основаны на фундаментальном предположении, что вариация является случайной: другими словами, она определяется только случайностью. Но «блокирование» становится полезным или даже необходимым, если мы знаем (или сильно подозреваем), что «факультативные» факторы внесут изменения, не имеющие отношения к эффектам, которые мы хотим проверить, и которые могут маскировать эффекты наших методов лечения. Вот два примера, и вы можете придумать еще много подобных.

  1. Предположим, мы хотим проверить влияние обработки удобрением (или обработки пестицидами и т. Д.) На урожай. Мы организовали полевые испытания с участками, которые будут обрабатываться по-разному. Всем известно, что условия на поле могут быть разными - верхний слой почвы в некоторых местах может быть тоньше или суше, чем в других, что приводит к различиям в росте сельскохозяйственных культур. Мы не можем контролировать это, поэтому было бы разумно выделить 3 (или более) блока и иметь графики (рандомизированные обработки) внутри этих блоков. Затем с помощью анализа дисперсии мы сможем отделить вариацию, вызванную нашими обработками, от вариации, вызванной факторами почвы или участка (которые не имеют отношения к вопросу, который мы пытаемся задать).
  2. Предположим, что эксперимент требует много времени для установки или отбора проб, и мы не можем быть уверены, что условия останутся постоянными в течение этого времени - лаборатория может нагреться, влажность повысится и так далее. Тогда разумно разделить эксперимент на периоды времени - до кофе, после кофе, после обеда. Конечно, это не идеально. Но эксперименты проводятся в реальном мире.

Предположим, мы измеряем размер клеток, высоту деревьев, биомассу микробных культур, количество яиц в гнездах или что-то еще. То, что мы измеряем или записываем (например, размер ячейки, высоту растения и т. Д.), Называется Переменная.

Каждое записываемое нами измерение (например, размер каждой ячейки) представляет собой ценить или наблюдение.

Мы получаем ряд значений (например, 100 для ячеек), и это наш образец.

Образец (например, 100 ячеек) является частью численность населения. В этом случае популяция (с биологической точки зрения) - это все клетки в культуре (или все деревья в лесу и т. Д.). Теоретически мы могли бы измерить каждую ячейку или дерево, чтобы получить точную оценку этой популяции. Но часто мы хотим иметь возможность сказать больше, чем это - что-то общее, основанное на нашей выборке. Например, если бы кто-нибудь измерил клетки этого организма, он бы нашел определенное среднее значение и определенный диапазон вариации. Вот 3 типа вещей, которые вы, возможно, захотите сказать.

  • Оптимальная температура для роста бактерии кишечная палочка составляет 37 o C, тогда как оптимальная температура для Bacillus cereus составляет 30 o C.
  • Средний рост взрослых мужчин в Великобритании составляет 175 см, тогда как средний рост женщин - 162 см.
  • У крыс LD50 препарата «Заппит» составляет 3 мг / кг массы тела. [LD50 рассчитанная (летальная) доза, убивающая 50% пролеченных лиц]

Подобные общие утверждения всегда будут основаны на выборке, потому что мы никогда не сможем проверить все возможные штаммы Кишечная палочка, ни измерить всех возможных взрослых особей, ни проверить всех возможных крыс, которые когда-либо могли жить. Таким образом, в этих и во многих других случаях популяция может считаться бесконечной. В этом смысле статистики используют термин «популяция» - для всех возможных измерений или событий (то есть всех возможных значений переменной) определенного типа, которые когда-либо могли быть.

В статистике мы используем ОБРАЗЦЫ для ОЦЕНКИ ПАРАМЕТРОВ НАСЕЛЕНИЯ.

Статистические процедуры основаны на довольно сложной математике. Но нас это совсем не должно волновать, потому что на самом деле процедуры очень просты в применении. В основном из наших образец мы рассчитываем:

  • Среднее или иметь в виду. Обозначение для выборочного среднего значения (произносится как «X bar»).
  • Некоторая мера разброса (диапазона вариации) данных вокруг выборочного среднего. Для этого мы используем отклонение (обозначение S2 ) и отсюда среднеквадратичное отклонение (S).

Получив эти значения, мы используем их для оценки Средняя численность населения и дисперсия населения. Чтобы различать то, что мы измеряем (выборки), и то, что мы хотим оценить (популяции) на основе выборок, многие статистики используют греческие буквы для обозначения Средняя численность населения (который обозначается м (мю) вместо выборочного среднего) и дисперсия населения (который обозначается s 2 (сигма в квадрате) вместо S 2 для выборочной дисперсии).

Мы охватываем эти вопросы в разделе «Описательная статистика». Но прежде чем мы перейдем к этому, мы должны кратко рассмотреть, как вариация распределяется с точки зрения статистики.

Если бы мы измеряли клетки, людей, растения или биохимические реакции (как значения оптической плотности в спектрофотометре) и т. Д., Мы бы обнаружили ряд вариаций. По мере того, как мы проводим все больше и больше измерений этого типа, они будут отображать непрерывный диапазон вариаций. Если бы мы поместили эти измерения в соответствующие категории или классы интервалы (например, все измерения, которые находятся между 1,0 и менее 2,0, все между 2,0 и менее 3,0 и т. д.), а затем нанесите числа в каждой категории в виде гистограммы, это будет выглядеть следующим образом:

При достаточном количестве измерений (и достаточно малых интервалах классов) это было бы полностью симметричный, колоколообразная кривая. Такие данные называются нормально распределенный. Большинство наших измерений (точек данных) будут близки к среднему, и все меньшее количество будет значительно отклоняться от среднего.

Большинство статистических тестов, которые мы рассматриваем на этом сайте, предназначены для нормально распределенных данных.

Но есть и другие виды раздачи. Например, если мы измерим рост мужчин и женщин как единой популяции, они могут образовать бимодальное распределение - два горба с провалом между ними, потому что женщины в среднем ниже мужчин. Тогда мы должны относиться к ним как к двум популяциям, а не как к одной. Другие типы данных, такие как количество, естественно попадают в категории & quot; цитировать / или & quot. К ним относятся по-разному, некоторые из которых будут объяснены позже.

Перед применением статистического теста экспериментатор должен проверить, какой тип распределения применим к данным. Часто для этого достаточно логики, простой наблюдательности и прошлого опыта.

СТАТИСТИЧЕСКИЕ ИСПЫТАНИЯ:
Студенты т-тестовое задание для сравнения средних двух образцов
Тест парных выборок. (как т-test, но используется, когда данные могут быть спарены)
Дисперсионный анализ для сравнения средств трех и более образцов:


Материалы и методы

В этой работе приняли участие 48 взрослых, в основном студенты и аспиранты. Участники были разделены на две группы: 24 участника, 12 мужчин и 12 женщин (средний возраст: 22,96 года, стандартное отклонение: 1,92 года), получивших версию AACC, и 24 участника, 12 мужчин и 12 женщин (средний возраст: 23,04 года). , SD: 2.33 года) получил версию BBDD. Каждый участник выполнил только один набор сбалансированных позиций карты (например, AACC, ACCA, ACAC, CCAA, CAAC и CACA), чтобы предотвратить эффект позиции, то есть каждое расположение позиций (см. Рисунок 1) было выполнено четырьмя участниками (2 самцов и 2 самок). Кроме того, каждый участник дважды проводил игру, и их предпочтения на первом и втором этапах отслеживались. После завершения первого этапа каждый участник сразу заполнил анкету, чтобы указать свои предпочтения. В двухэтапном дизайне участники были проинформированы о том, что они могут свободно выбирать колоды и что для игры нет ограничений по времени. Второй прогон участники выполнили сразу после завершения первой сессии игры и анкетирования. Кроме того, участников проинформировали, что во второй игре были те же внутренние правила, что и в первой игре.

Уравновешивание положения деки в упрощенной IGT. На рисунке показана блок-схема создания версий AACC и BBDD из исходного IGT и их перегруппировка для создания шести композиций в версиях AACC и BBDD, чтобы уравновесить эффект положения. Каждую композицию исполняли двое взрослых мужчин и две женщины, чтобы контролировать гендерный эффект.


Использованная литература

Андерсон, К., и Бердал, Дж. Л. (2002). Опыт власти: изучение влияния власти на тенденции приближения и сдерживания. Журнал личности и социальной психологии, 83, 1362–1377.

Андерсон, К., и Галински, А. Д. (2006). Власть, оптимизм и риск. Европейский журнал социальной психологии, 36, 511–536.

Аволио, Б. Дж., И Яммарино, Ф. Дж. (2003). Трансформационное и харизматическое лидерство: путь вперед. Оксфорд, Великобритания: Elsevier Press.

Айман Р., Чемерс М. М. и Фидлер Ф. (1995). Модель непредвиденных обстоятельств эффективности лидерства: ее уровень анализа. Leadership Quarterly, 6(2), 147–167.

Бейер, Дж. М. (1999). Укрощение и продвижение харизмы для изменения организаций. Leadership Quarterly, 10(2), 307–330.

Бласс, Т. (1999). Парадигма Милгрэма через 35 лет: кое-что, что мы теперь знаем о подчинении властям. Журнал прикладной социальной психологии, 29, 955–978.

Борге, К. (2007). Основные инстинкты: наука о зле. Получено с http://a.abcnews.com/Primetime/Story?id=2765416&page=1.

Чемерс, М. М. (2001). Эффективность лидерства: комплексный обзор. В M. A. Hogg & amp R. S. Tindale (Eds.), Справочник Блэквелла по социальной психологии: Групповые процессы (стр. 376–399). Оксфорд, Великобритания: Блэквелл.

Чен, С., Ли-Чай, А. Ю., и Барг, Дж. А. (2001). Ориентация на отношения как модератор эффектов социальной власти. Журнал личности и социальной психологии, 80(2), 173–187.

Конгер, Дж. А. и Канунго, Р. Н. (1998). Харизматическое лидерство в организациях. Таузенд-Оукс, Калифорния: Сейдж.

Кроншоу, С.Ф., и Лорд, Р.Г. (1987). Влияние процессов категоризации, атрибуции и кодирования на восприятие лидерства. Журнал прикладной психологии, 72, 97–106.

Депре Э. и Фиске С. Т. (1999). Восприятие сильных: интригующие личности против угрожающих групп. Журнал экспериментальной социальной психологии, 35(5), 461–480.

Диркс, К. Т., и Феррин, Д. Л. (2002). Доверие к лидерству: метааналитические выводы и последствия для исследований и практики. Журнал прикладной психологии, 87, 611–628.

Дрифус, К. (3 апреля 2007 г.). Обретение надежды в познании универсальной способности зла. Нью Йорк Таймс.

Фиске, С. Т. (1993). Контроль над другими людьми: влияние власти на стереотипы. Американский психолог, 48 лет., 621–628.

Френч, Дж. Р. П. и Равен, Б. Х. (1959). Основы социальной власти. В Д. Картрайте (ред.), Исследования в области социальной власти (стр. 150–167). Анн-Арбор, Мичиган: Институт социальных исследований.

Галинский А. Д., Грюнфельд Д. Х и Маги Дж. С. (2003). От силы к действию. Журнал личности и социальной психологии, 85, 453–466.

Хит, Т. Б., Маккарти, М. С., и Мазерсбо, Д. Л. (1994). Пресс-секретарь известности и яркости эффекты в контексте проблемно-релевантного мышления: сдерживающая роль конкурентной среды. Журнал потребительских исследований, 20, 520–534.

Генрих Дж. И Гил-Уайт Ф. (2001). Эволюция престижа: свободно присваиваемый статус как механизм увеличения благ культурной трансмиссии. Эволюция и поведение человека, 22, 1–32.

Хогг, М.А. (2001). Теория социальной идентичности лидерства. Обзор личности и социальной психологии, 5,184–200.

Хогг, М.А. (2010). Влияние и лидерство. В S. F. Fiske, D. T. Gilbert, & amp G. Lindzey (Eds.), Справочник по социальной психологии (Том 2, с. 1166–1207). Нью-Йорк, штат Нью-Йорк: Wiley.

Хогг, М.А., и ван Книппенберг, Д. (2003). Социальная идентичность и процессы лидерства в группах. Успехи экспериментальной социальной психологии, 35, 1–52.

Судья Т., Боно Дж., Илиес Р. и Герхардт М. (2002). Личность и лидерство: качественный и количественный обзор, Журнал прикладной психологии, 87, 765–780.

Каминс, А. М. (1989). Знаменитость и не знаменитость в двустороннем контексте. Журнал рекламных исследований, 29, 34–42.

Кельман, Х. (1961). Процессы изменения мнения. Общественное мнение Ежеквартально, 25, 57–78.

Келтнер Д., Грюнфельд Д. Х. и Андерсон К. (2003). Власть, подход и сдерживание. Психологическое обозрение, 110(2), 265–284.

Кенни, Д. А., и Заккаро, С. Дж. (1983). Оценка дисперсии из-за лидерских качеств. Журнал прикладной психологии, 68, 678–685.

Килхэм, В., и Манн, Л. (1974). Уровень деструктивного послушания как функция ролей передатчика и исполнителя в парадигме послушания Милгрэма. Журнал личности и социальной психологии, 29, 692–702.

Кипнис, Д. (1972). Власть развращает? Журнал личности и социальной психологии, 24, 33–41.

Meeus, W.H., & amp; Raaijmakers, Q.A. (1986). Административное подчинение: выполнение приказов о применении психологического и административного насилия. Европейский журнал социальной психологии, 16, 311–324.

Милграм, С. (1974). Подчинение авторитету: экспериментальный взгляд. Нью-Йорк, штат Нью-Йорк: Harper & amp Row.

Молм, Л. Д. (1997). Принудительная сила в социальном обмене. Нью-Йорк, Нью-Йорк: Издательство Кембриджского университета.

Платов, М. Дж., И Ван Книппенберг, Д. (2001). Анализ социальной идентичности поддержки лидерства: эффекты прототипичности лидера в группе и распределительной межгрупповой справедливости. Бюллетень личности и социальной психологии, 27, 1508–1519.

Подсакофф П. М., Маккензи С. Б., Мурман Р. Х. и Феттер Р. (1990). Трансформационное поведение лидера и его влияние на доверие последователей к лидеру, удовлетворенность и гражданское поведение в организации. Руководство Ежеквартально, 1, 107–142.

Рэйвен, Б. Х. (1992). Модель межличностного влияния власти / взаимодействия: Френч и Рэйвен тридцать лет спустя. Журнал социального поведения и личности, 7(2), 217–244.

Райхер, С. Д., и Хопкинс, Н. (2003). О науке об искусстве лидерства. В Д. ван Книппенберге и М. А. Хогге (ред.), Лидерство и власть: процессы идентификации в группах и организациях (стр. 197–209). Лондон, Великобритания: Sage.

Райхер, С., и Хаслам, С.А. (2006). Переосмысление психологии тирании: тюремное исследование BBC. Британский журнал социальной психологии, 45(1), 1–40.

Саймонтон, Д. К. (1988). Президентский стиль: личность, биография, исполнение. Журнал личности и социальной психологии, 55, 928–936.

Саймонтон, Д. К. (1994). Величие: кто творит историю и почему. Нью-Йорк, Нью-Йорк: Guilford Press.

Саймонтон, Д. К. (1995). Личность и интеллектуальные предикторы лидерства. В D. H. Saklofske et al. (Ред.), Международный справочник личности и интеллекта. Перспективы индивидуальных различий (стр. 739–757). Нью-Йорк, Нью-Йорк: Пленум.

Соррентино, Р. М., и Бутилье, Р. Г. (1975). Влияние количества и качества вербального взаимодействия на рейтинги лидерских способностей. Журнал экспериментальной социальной психологии, 11, 403–411.

Стэнфордский тюремный эксперимент. Получено с http://www.prisonexp.org/links.htm.

Теппер, Б. Дж., Карр, Дж. К., Бро, Д. М., Гейдер, С., Ху, К., и Хуа, В. (2009). Злоупотребление надзором, намерение уволиться и отклонение от рабочего места сотрудников: анализ власти / зависимости. Организационное поведение и процессы принятия решений, 109(2), 156–167.

ван Клиф, Г. А., Овейс, К., ван дер Лёве, И., Луокоган, А., Гетц, Дж., и Келтнер, Д. (2008). Сила, горе и сострадание: закрывать глаза на страдания других. Психологические науки, 19(12), 1315–1322.

Wilson, E.J., & amp. Шеррелл Д. Л. (1993). Исходные эффекты в общении и убеждении: метаанализ размера эффекта. Журнал Академии маркетинговых наук, 21, 101–112.

Юкл, Г. А. (2002). Лидерство в организациях. Река Аппер Сэдл, штат Нью-Джерси: Prentice Hall.

Заккаро, С. Дж. (2007). Перспективы лидерства, основанные на чертах характера. Американский психолог, 62 года., 6–16.


Смотреть видео: smartLAB. ELEKTROSTATYKA część 1. Eksperymenty z balonami (July 2022).


Комментарии:

  1. Cedd

    Я считаю, что Вы не правы. Я уверен. Я могу это доказать. Напишите мне в личку, мы поговорим.

  2. Gusho

    В уверенности, попробуйте найти ответ на ваш вопрос на Google.com

  3. Arashirr

    Интересно и информативно, но будет ли что -то еще на этой теме?

  4. Leo

    Blizzard Let на целый год,

  5. Tauzuru

    Удивительно, как вы, с достаточно спокойным стилем в плане оформления блога, смогли так грамотно все скомпоновать. Здесь и текст, и оглавление, и ссылки, и навигация классные. Я два раза начинал заниматься дизайном, но так и не смог придумать идею. Если вы когда-нибудь решите заняться благотворительностью и выложите свой шаблон в свободный доступ, то я буду первым, кто его скачает, только теги пока не в моде. видел счаз крутится уже. До встречи в блогосфере



Напишите сообщение