Информация

Экспериментальный план с двумя группами, измерение до и после лечения и лечение всех

Экспериментальный план с двумя группами, измерение до и после лечения и лечение всех


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Я разрабатываю исследование, в котором проходит лечение большое количество людей. Я не могу повлиять на лечение (например, отсроченное лечение). Я умею проводить до и после лечения пациентов. Лечение оказывает множество эффектов на испытуемых. У меня есть скринер, который, как я полагаю, определит субъектов, которые предскажут, у кого улучшится показатель А.

Предлагаемый экспериментальный план предназначен для определения двух групп на основе скринингового теста (скрининговый тест может проводиться до или после лечения). Обе группы будут подвергнуты одинаковому обращению. До и после лечения обе группы будут протестированы по показателям A и B. Гипотеза состоит в том, что лечение будет влиять на группы по-разному по показателю A, но не по показателю B. Есть ли термин для этого плана? Это действующий дизайн?


Я бы назвал это квазиэкспериментом до и после операции, хотя вы оцениваете вмешательство в двух разных ранее существовавших группах.

С точки зрения оценки эффекта вмешательства, существует больше угроз для причинно-следственного вывода, когда у вас нет контрольной группы (т.е. той, где у вас есть предварительные и последующие меры, но без вмешательства или контрольного вмешательства). То есть, помимо эффекта от лечения, есть много других объяснений любых изменений, наблюдаемых до поста. Например, обучение, взросление, переутомление и так далее. Базовые знания могут помочь вам в оценке того, какие из них могут быть значительными.

Затем у вас есть две наблюдаемые группы. Этот аспект больше похож на наблюдательное исследование. Вы оцениваете взаимодействие между группой и лечением. Поскольку группа - это наблюдаемая переменная, вам следует постараться приписать причинные объяснения любым различиям между группами в влиянии лечения на принадлежность к группе. Тем не менее, часто в этом контексте интерес больше связан с пониманием того, насколько хорошо лечение распространяется на разные группы населения.

Таким образом, было бы лучше, если бы была контрольная группа. В идеале у вас должен быть полностью перекрестный дизайн. То есть группа (A и B) по контролю (лечение и контроль), где участников случайным образом распределяли для лечения или контроля. Но если это невозможно, данные все равно будут интересными; вам нужно будет тщательно подумать об эффектах переноса.


Что такое план противовесов?

Простейший тип плана уравновешенных мер используется, когда есть два возможных условия, A и B. Как и в случае стандартного плана повторных измерений, исследователи хотят протестировать каждого субъекта для обоих условий. Они делят субъектов на две группы, и одна группа лечится с условием A, за которым следует условие B, а другая испытывается с условием B, за которым следует условие A.

Три условия

Если у вас есть три условия, процесс будет точно таким же, и вы разделите испытуемых на 6 групп, которые будут рассматриваться как приказы ABC, ACB, BAC, BCA, CAB и CBA.

/>

Четыре условия

Проблема с полным уравновешиванием состоит в том, что для сложных экспериментов с множеством условий перестановки быстро умножаются, и исследовательский проект становится чрезвычайно громоздким. Например, для четырех возможных состояний требуется 24 порядка лечения (4x3x2x1), а количество участников должно быть кратным 24, так как вам нужно равное количество в каждой группе.

/>

Более четырех условий

С 5 условиями вам нужно кратное 120 (5x4x3x2x1), с 7 вам нужно 5040! Поэтому для всех, кроме самых крупных исследовательских проектов с огромными бюджетами, это непрактично и необходим компромисс.


Определение экспериментальной группы

Экспериментальная группа в научном эксперименте - это группа, на которой проводится экспериментальная процедура. Независимая переменная изменяется для группы, и регистрируется ответ или изменение зависимой переменной. Напротив, группа, которая не получает лечения или в которой независимая переменная остается постоянной, называется контрольной группой.

Цель экспериментальной и контрольной групп - получить достаточно данных, чтобы быть разумно уверенным, что связь между независимой и зависимой переменной не является случайной. Если вы проводите эксперимент только с одним субъектом (с лечением и без него) или с одним экспериментальным субъектом и одним контрольным субъектом, у вас ограниченная уверенность в результате. Чем больше размер выборки, тем более вероятно, что результаты представляют реальную корреляцию.


Анализ согласованных пар / t-тест согласованных пар

T-критерий согласованной пары используется для проверки наличия разницы в средних значениях между двумя согласованными / связанными парами. T-критерий согласованной пары также называется t-критерием парных выборок зависимого t-критерия. Тест представляет собой параметрический тест, допущения которого

  1. Зависимая переменная должна быть непрерывной.
  2. Наблюдения должны быть независимыми друг от друга.
  3. Зависимая переменная должна быть примерно нормальной.
  4. В зависимой переменной не должно быть выбросов.

Статистика t-критерия согласованной пары рассчитывается, как показано ниже.

Рассчитанное значение сравнивается с табличным значением с n-1 степенями свободы.


Пример дисперсионного анализа с повторными измерениями

Давайте представим, что мы использовали план повторных измерений для изучения нашего гипотетического препарата памяти. Для нашего исследования мы набрали пять человек и протестировали четыре препарата для улучшения памяти. Все участники исследования пробовали все четыре препарата и после каждого проверяли память. Получим данные ниже. Вы также можете скачать CSV-файл для Repeated_measures_data.

В наборе данных вы можете видеть, что у каждого субъекта есть идентификационный номер, поэтому мы можем связать каждого человека со всеми его оценками. Мы также знаем, какое лекарство они принимали для каждой оценки. Вместе это позволяет модели разработать базовый уровень для каждого субъекта, а затем сравнить баллы по конкретному препарату с этим исходным уровнем.

Как мы подходим к этой модели? В предпочтительном для вас пакете статистического программного обеспечения вам необходимо подогнать модель ANOVA следующим образом:

  • Оценка - это переменная ответа.
  • Субъект и лекарство - факторы,
  • Тема должна быть случайным фактором.

Субъект - это случайный фактор, потому что мы случайным образом выбрали субъектов из совокупности, и мы хотим, чтобы они представляли всю совокупность. Если бы мы включили субъект в качестве фиксированного фактора, результаты были бы применимы только к этим пяти людям и не были бы распространены на большую популяцию.

Наркотики - это фиксированный фактор, потому что мы выбрали эти препараты намеренно и хотим особенно оценить эффекты этих четырех препаратов.


Экспериментальный план с двумя группами, до и после измерения, и где все проходят лечение - Психология

Планы экспериментов с одним субъектом - также называемые экспериментальными планами внутри субъекта или с одним случаем - являются одними из наиболее распространенных планов, используемых в исследованиях лечения CSD. Эти схемы обеспечивают основу для количественного, научно обоснованного подхода, при котором каждый участник обеспечивает свой собственный экспериментальный контроль.

Обзор дизайна эксперимента с одним субъектом

Что такое однотонный дизайн?

Стенограмма видео Q & ampA с Джули Вамбау.

Суть индивидуального дизайна заключается в использовании повторных измерений, чтобы действительно понять индивидуальную изменчивость, чтобы мы могли использовать наше понимание этой изменчивости, чтобы определить, каковы эффекты нашего лечения.

Для меня одним из первых шагов в разработке лечения является понимание того, что делает человек. Итак, если бы я проводил исследование группового лечения, я не обязательно смог бы увидеть или понять, что происходит с каждым отдельным пациентом, чтобы я мог внести изменения в свое лечение и понять все детали того, что происходит в сроки воздействия моего лечения. Для меня это естественный первый шаг в развитии лечения.

Кроме того, с расстройствами, с которыми мы имеем дело, очень сложно получить необходимое количество участников для золотого стандарта рандомизированного контролируемого исследования. Использование однопредметных планов помогает обойти возможный ограничивающий фактор - недостаточное количество предметов в определенной области обучения.

Моим наставником была д-р Синтия Томпсон, которую обучила Лейя Макрейнольдс из Канзасского университета, где зародилось много одноблочных дизайнов в нашей области, и поэтому мне посчастливилось быть на переднем крае реализации этого. в нашей науке еще в конце & # 821770-х - начале & # 821780-х. Я думаю, что мы увидели прекрасную революцию в плане внимания к этим типам дизайнов, отдавая должное типу данных, которые можно было получить из этих типов дизайнов, и расцвет этих дизайнов на протяжении 1980-х - 1990-х годов и в 2000-е гг. Но я думаю, что я разговаривал с другими исследователями дизайна одного предмета, и теперь мы видим, может быть, небольшую потерю внимания и снова недостаток подготовки среди наших молодых людей. Может быть, люди думают, что люди понимают фундамент, но на самом деле они этого не делают. И все больше проблем возникает с наукой. Я считаю, что нам нужно восстановить основы наших молодых ученых. И этот проект, я думаю, станет большим плюсом на пути нас в этом направлении.

Какова роль однотонного дизайна?

Стенограмма видео Q & ampA с Ральфом Шлоссером.

То, что произошло недавно, связано с появлением практики, основанной на фактах, и принятием общей иерархии доказательств с точки зрения дизайна. Как вы отметили, рандомизированное контролируемое исследование и метаанализ рандомизированных контролируемых исследований находятся на вершине общей иерархии. И это нормально. Но это не значит, что отдельная тема не может сыграть роль.

Например, индивидуальный дизайн может быть реализован до проведения рандомизированного контролируемого исследования, чтобы лучше понять величину эффектов, действие активных ингредиентов и все такое. Это очень хорошо подготовить до разработки рандомизированного контролируемого исследования.

После того, как вы внедрили рандомизированное контролируемое испытание, а затем вы захотите применить вмешательство в более естественной обстановке, становится очень трудно сделать это в рандомизированной форме или на групповом уровне. Итак, опять же, однобъектный дизайн поддается более практической реализации.

Так что я считаю это одной из важнейших методологий среди нескольких. Что мы можем сделать, чтобы продвигать то, для чего хорош однотонный дизайн, - это высказаться. Важно, чтобы его признавали за то, что он может и чего не может.

Основные характеристики и компоненты индивидуальных экспериментальных проектов

Определение функций
Односубъектные дизайны характеризуются следующими особенностями:

  • Индивидуальный «случай» - это единица вмешательства и единица анализа данных.
  • Случай обеспечивает собственный контроль для целей сравнения. Например, ряд переменных результата случая измеряется до вмешательства и сравнивается с измерениями, проведенными во время (и после) вмешательства.
  • Переменная результата многократно измеряется в разных условиях или на разных уровнях независимой переменной.

См. Kratochwill, et al. (2010)

Структура и этапы дизайна
Индивидуальные планы обычно описываются в соответствии с расположением исходной фазы и фазы лечения.

Условиям в экспериментальном исследовании с одним субъектом часто присваиваются буквы, такие как фаза A и фаза B, где A - исходная фаза или фаза отсутствия лечения, а B - экспериментальная фаза или фаза лечения. (Другие буквы иногда используются для обозначения других экспериментальных фаз.)

Как правило, фаза A служит периодом времени, в течение которого интересующее поведение или поведение подсчитываются или оцениваются до начала лечения.

В фазе B одинаковое поведение человека подсчитывается с течением времени в экспериментальных условиях, пока проводится лечение.

Решения относительно эффекта лечения затем принимаются путем сравнения индивидуальных показателей во время лечения, фазы B и отсутствия лечения.

Макрейнольдс и Томпсон (1986)

Основные компоненты
Важные основные компоненты исследования с одним предметом включают следующее:

  • Участник - это единица анализа, где участником может быть отдельное лицо или единица, например класс или школа.
  • Описания участников и условий предоставлены достаточно подробными, чтобы другой исследователь мог набрать аналогичных участников в аналогичных условиях.
  • Зависимые переменные: (а) определены оперативно и (б) повторно измерены.
  • Активно манипулируют независимой переменной с документированием точности реализации.
  • Исходное состояние демонстрирует предсказуемую картину, которую можно сравнить с условиями вмешательства.
  • Экспериментальный контроль достигается за счет введения и изъятия / отмены, поэтапного введения или итеративного манипулирования независимой переменной.
  • Визуальный анализ используется для интерпретации уровня, тенденции и изменчивости данных внутри и между фазами.
  • Внешняя достоверность результатов достигается за счет воспроизведения эффектов.
  • Социальная значимость устанавливается путем документирования того, что вмешательства функционально связаны с изменением социально значимых результатов.

Распространенные заблуждения

Планы экспериментов с одним субъектом в сравнении с тематическими исследованиями

Стенограмма видео Q & ampA с Джули Вамбау.

Одна из самых больших ошибок, которая представляет собой огромную проблему, - это неправильное понимание того, что тематическое исследование не является экспериментальным планом с одним субъектом. Есть элементы управления, которые необходимо реализовать, и тематическое исследование не приравнивается к дизайну эксперимента с одним субъектом.

Люди неправильно понимают или неверно истолковывают термин & # 8220множественная базовая линия & # 8221, который означает, что поскольку вы измеряете несколько вещей, это дает вам экспериментальный контроль. Вместо этого вы должны продемонстрировать, что вы измерили несколько типов поведения и что вы воспроизвели эффект лечения в этих нескольких вариантах поведения. Таким образом, одного экземпляра одного лечения, применяемого с одним поведением, недостаточно, даже если вы измерили другие вещи. Это очень частая ошибка, которую я вижу.

Существует план & # 8212 план ABA & # 8212, который & # 8217 представляет собой очень сильный экспериментальный план, в котором вы измеряете поведение, вы проводите лечение, а затем, чтобы получить экспериментальный контроль, необходимо увидеть, что лечение возвращается к исходному уровню, чтобы у вас были доказательства экспериментального контроля. Такое поведение сложно реализовать в нашей области, потому что мы хотим, чтобы наше поведение оставалось неизменным! Мы не хотим, чтобы они вернулись к исходному состоянию.

Часто люди говорят, что сделали ABA. Но на самом деле все, что они делали, было AB. Они измеряли, проводили лечение, и поведение изменилось, потому что лечение было успешным. Это не дает вам экспериментального контроля. Они думают, что создали экспериментально обоснованный план, но поскольку поведение не соответствует тому, что требует дизайн для получения экспериментального контроля, они действительно не имеют экспериментального контроля над своим дизайном.

Однопредметные исследования не следует путать с тематическими исследованиями или другими неэкспериментальными проектами.

В отчетах о тематических исследованиях процедуры, используемые при лечении поведения конкретного клиента, документируются с максимально возможной тщательностью, а также сообщается о прогрессе клиента в направлении абилитации или реабилитации. Эти исследования дают полезные описания. . . Однако демонстрация эффективности лечения требует экспериментального исследования.

Лучшая роль для тематических исследований - это описание и идентификация потенциальных переменных, которые должны быть оценены в экспериментальных исследованиях. Прекрасное обсуждение этого вопроса можно найти в письмах к редактору Худина (1986) [Статья] и Рубова и Свифта (1986) [Статья].

Макрейнольдс и Томпсон (1986)

Другие мифы на одну тему

  • Очевидно, для этого нужен только один предмет, один участник. Но неверно думать, что один субъект - это всего лишь один участник. У вас может быть от двадцати до тридцати.
  • Я думаю, что многие студенты в клинике привыкли к измерению одного предварительного теста и одного заключительного теста из-за того, как сформулированы цели, и, возможно, не хватает времени для непрерывного сбора данных. экспериментальные конструкции требуют постоянного сбора данных. Возникает ошибочное представление о том, что достаточно одной исходной точки данных. Но для одноразового экспериментального дизайна вы хотите видеть как минимум три точки данных, потому что это позволяет вам увидеть тенденцию в данных. Так что существует миф о количестве необходимых точек данных. Чем больше у нас точек данных, тем лучше.
  • Однопредметный дизайн имеет свою методологическую традицию. Это кажется очень простым, когда вы читаете об одном дизайне. Но есть много вещей, которые нужно учитывать, и многое может пойти не так, что требует некоторой подготовки. Требуется как минимум один курс с тремя кредитами, который вы занимаетесь в течение всего семестра.

Дополнительная литература: компоненты однобъектных дизайнов

Хорнер, Р. Х., Карр, Э. Г., Холли, Дж., Макги, Г., Одом, С., и Вулери, М. (2005). Использование одного предметного исследования для выявления научно обоснованной практики в специальном образовании. Исключительные дети, 71,165–179. [Статья]

Краточвилл, Т. Р., Хичкок, Дж., Хорнер, Р. Х., Левин, Дж. Р., Одом, С. Л., Риндскопф, Д. М. и Шадиш, В. Р. (2010). Техническая документация на единичные конструкции. Из Информационного центра What Works. http://ies.ed.gov/ncee/wwc/documentsum.aspx?sid=229

Макрейнольдс, Л. В. и Томпсон, К. К. (1986). Гибкость однопредметных экспериментальных проектов. Часть I: обзор основ однотонных дизайнов. Журнал нарушений речи и слуха, 51, 194-203. [Статья] [PubMed]

Дополнительная литература: учебники по дизайну с одним предметом

Каздин, А. Э. (2011). Дизайн исследования единичного случая: методы для клинических и прикладных условий. Издательство Оксфордского университета.

Макрейнольдс, Л. В. и Кернс, К. (1983). Однопредметные экспериментальные проекты при коммуникативных расстройствах. Балтимор: University Park Press.

Дополнительная литература: основные статьи

Баер Д. М., Вольф М. М. и Рисли Т. Р. (1968). Некоторые текущие аспекты прикладного анализа поведения. Журнал прикладного анализа поведения, 1, 91-97. [Статья] [PubMed]

Баер Д. М., Вольф М. М. и Рисли Т. Р. (1987). Некоторые все еще актуальные аспекты прикладного анализа поведения. Журнал прикладного анализа поведения, 20, 313-327. [Статья] [PubMed]

Джули Вамбау
Университет Юты

Ральф Шлоссер
Северо-Восточный университет

Содержание этой страницы основано на выбранных клипах из видеоинтервью, проведенных в Национальном офисе ASHA.

Дополнительные переработанные ресурсы и ссылки для дальнейшего чтения были отобраны и реализованы сотрудниками библиотеки CREd.


Выбор и назначение участников эксперимента

Теперь, когда наше исследование разработано, нам нужно получить выборку людей для включения в наш эксперимент. В нашем исследовании участвуют люди, поэтому нам нужно определить, кого включить. Участников являются объектами психологических исследований, и, как следует из названия, лица, вовлеченные в психологические исследования, активно участвуют в этом процессе. Часто в проектах психологических исследований участвуют студенты колледжей. Фактически, подавляющее большинство исследований в подобластях психологии исторически вовлекали студентов в качестве участников (Sears, 1986, Arnett, 2008). Но действительно ли студенты колледжей представляют собой население в целом? Студенты колледжей, как правило, моложе, более образованы, более либеральны и менее разнообразны, чем население в целом. Хотя использование студентов в качестве испытуемых является общепринятой практикой, полагаться на такой ограниченный круг участников исследования может быть проблематично, поскольку трудно обобщить результаты на более широкую популяцию.

В нашем гипотетическом эксперименте участвуют дети, и сначала мы должны создать выборку детей-участников. Выборки используются, потому что популяции обычно слишком велики, чтобы разумно вовлечь каждого члена в наш конкретный эксперимент (рис. 4). Если возможно, мы должны использовать случайный пример (есть и другие типы выборок, но в этом разделе мы остановимся на случайных выборках). Случайная выборка - это подмножество более крупной совокупности, в которой каждый член совокупности имеет равные шансы быть выбранным. Случайные выборки предпочтительнее, потому что, если выборка достаточно велика, мы можем быть разумно уверены, что участвующие люди являются репрезентативными для большей популяции. Это означает, что процентное соотношение характеристик в выборке - пол, этническая принадлежность, социально-экономический уровень и любые другие характеристики, которые могут повлиять на результаты, - близки к процентному содержанию в большей популяции.

В нашем примере предположим, что мы решили, что нас интересуют четвероклассники. Но все четвероклассники - это очень большая популяция, поэтому мы должны быть более конкретными, вместо этого мы можем сказать, что нас интересуют все четвероклассники в определенном городе. Мы должны включать студентов из разных категорий доходов, семейного положения, расы, этнической принадлежности, религии и географических районов города. Имея это более управляемое население, мы можем работать с местными школами над случайной выборкой из примерно 200 четвероклассников, которых мы хотим принять участие в нашем эксперименте.

Таким образом, поскольку мы не можем протестировать всех четвероклассников в городе, мы хотим найти группу из примерно 200 человек, которая отражает состав этого города. Имея репрезентативную группу, мы можем обобщить наши результаты на более широкую популяцию, не опасаясь того, что наша выборка будет каким-либо образом предвзята.

Рисунок 4. Исследователи могут работать с (а) большой популяцией или (б) группой выборки, которая является подмножеством большей популяции. (кредит «толпа»: модификация работы Джеймса Кридленда, кредит «студенты»: модификация работы Лори Салливан)

Теперь, когда у нас есть образец, следующим шагом экспериментального процесса является разделение участников на экспериментальную и контрольную группы путем случайного распределения. С участием случайное присвоение, все участники имеют равные шансы попасть в любую группу. Существует статистическая программа, которая случайным образом распределяет каждого четвероклассника из выборки в экспериментальную или контрольную группу.

Случайное назначение имеет решающее значение для звука Экспериментальная дизайн. При достаточно больших выборках случайное распределение делает маловероятным наличие систематических различий между группами. Так, например, очень маловероятно, что мы получим одну группу, состоящую исключительно из мужчин, определенной этнической принадлежности или данной религиозной идеологии. Это важно, потому что, если бы группы были систематически разными до начала эксперимента, мы не знали бы происхождения каких-либо различий, которые мы обнаруживаем между группами: были ли различия существующими ранее или они были вызваны манипуляциями с независимой переменной? Случайное распределение позволяет предположить, что любые различия, наблюдаемые между экспериментальной и контрольной группами, являются результатом манипулирования независимой переменной.

Попытайся


Разница между контрольной группой и экспериментальной группой

В эксперименте данные экспериментальной группы сравнивают с данными контрольной группы. Эти две группы должны быть идентичны во всех отношениях, кроме одной: разница между контрольной группой и экспериментальной группой состоит в том, что независимая переменная изменяется для экспериментальной группы, но остается постоянной в контрольной группе.

Ключевые выводы: контрольная и экспериментальная группа

  • Контрольную группу и экспериментальную группу сравнивают друг с другом в эксперименте. Единственное различие между двумя группами состоит в том, что в экспериментальной группе изменена независимая переменная. Независимая переменная в контрольной группе «контролируется» или остается постоянной.
  • Один эксперимент может включать несколько экспериментальных групп, которые все можно сравнивать с контрольной группой.
  • Цель контроля - исключить другие факторы, которые могут повлиять на результаты эксперимента. Не все эксперименты включают контрольную группу, но те, которые есть, называются «контролируемыми экспериментами».
  • В эксперименте также можно использовать плацебо. Плацебо не заменяет контрольную группу, потому что субъекты, подвергшиеся воздействию плацебо, могут испытывать эффекты от веры в то, что они проходят тестирование.

Текст ресурса

Считается, что интервенционные исследования предоставляют наиболее надежные доказательства в эпидемиологических исследованиях. Интервенционные исследования обычно можно рассматривать как профилактические или терапевтические [1].

Терапевтические испытания проводятся среди людей с определенным заболеванием для оценки эффективности агента или процедуры для уменьшения симптомов, предотвращения рецидивов или снижения смертности от заболевания.

Профилактические испытания проводятся для оценки того, снижает ли агент или процедура риск развития определенного заболевания у лиц, не страдающих этим заболеванием, в начале испытания, например, испытания вакцины. Профилактические испытания могут проводиться среди отдельных лиц или среди целых сообществ.

Типы экспериментальных вмешательств могут включать:

    - Лечебные средства
    - Профилактические средства
    - Диагностические средства
    - Хирургические процедуры
    - Стратегии медицинского обслуживания

Характеристики интервенционного исследования

* Отличительной особенностью интервенционного исследования является то, что исследуемое вмешательство (профилактическая или терапевтическая мера) распределяется исследователем на группу из двух или более субъектов исследования (отдельные лица, домохозяйства, сообщества).
* За субъектами проспективно наблюдают для сравнения вмешательства с контролем (стандартное лечение, отсутствие лечения или плацебо).

Основным дизайном интервенционного исследования является рандомизированное контролируемое исследование (РКИ).

Доклиническое испытание / перекрестное испытание - это испытание, в котором субъектов сначала распределяют в группу лечения и после короткого интервала для прекращения остаточного действия лекарственного средства переводят в группу плацебо / альтернативную группу. Таким образом, в конце исследования испытуемые действуют в качестве своего контроля. Однако такие исследования невозможны, если есть летальность или если болезнь легко излечивается одним из вмешательств.

Рандомизированные контролируемые испытания

Рандомизированное контролируемое исследование считается наиболее строгим методом определения наличия причинно-следственной связи между вмешательством и результатом [2]. Сила РКИ заключается в процессе рандомизации, который уникален для этого типа эпидемиологического исследования.

Как правило, в рандомизированном контролируемом исследовании участников случайным образом распределяют в одну из двух групп: экспериментальную группу, получающую тестируемое вмешательство, и группу сравнения (контрольную), которая получает обычное лечение или плацебо. Затем эти группы прослеживаются проспективно, чтобы оценить эффективность вмешательства по сравнению со стандартным лечением или лечением плацебо.

Случайное распределение субъектов используется для гарантии того, что группа вмешательства и контрольная группа схожи во всех отношениях (распределение потенциальных мешающих факторов), за исключением тестируемых терапевтических или профилактических мер. Выбор лечения для сравнения может включать существующее стандартное лечение или плацебо (лечение, которое во всех отношениях напоминает интервенционное лечение, за исключением того, что оно не содержит активных ингредиентов).

Обратите внимание, что этические ограничения ограничивают выбор методов сравнения.

Рисунок 1. Общая схема двухстороннего рандомизированного контролируемого исследования.

Базовая схема дизайна рандомизированного контролируемого исследования

1. Разработка комплексного протокола исследования. Протокол исследования будет включать:

    - Цель и обоснование судебного разбирательства
    - Предлагаемая методология / сбор данных
    - Определение гипотезы
    - Этические соображения
    - Справочная информация / обзор опубликованной литературы
    - Гарантия качества и безопасности
    - График лечения, дозировка, данные о токсичности и т. Д.

2. Формулировка гипотезы.

3. Задачи исследования.

4. Расчеты размера выборки.

5. Определите контрольную совокупность.

6. Выбор сравнительного лечения - плацебо или лучшее лечение, доступное в настоящее время.

7. Выбор интервенционных и контрольных групп, включая источник, критерии включения и исключения, а также методы набора.

8. Процедуры информированного согласия.

9. Сбор исходных измерений, включая все переменные, которые считаются или известны как влияющие на интересующий результат.

10. Случайное распределение участников исследования по лечебным группам (стандартные или плацебо по сравнению с новыми).

11. Последующее наблюдение за всеми группами лечения с непрерывной или периодической оценкой результатов.

12. Следите за соблюдением требований и потерями для последующего наблюдения.

14. Анализ - сравнение групп лечения.

15. Интерпретация (оцените силу эффекта, альтернативные объяснения, такие как вариация выборки, систематическая ошибка).

Цель рандомизации - убедиться, что любые наблюдаемые различия между группами лечения связаны только с различиями в лечении, а не с эффектами искажения (известного или неизвестного) или систематической ошибки. То есть группы похожи во всех отношениях, за исключением исследуемой интервенции.

Методы случайного распределения используются для обеспечения того, чтобы у всех участников исследования были одинаковые шансы быть отнесенными к исследуемой или контрольной группе, и чтобы вероятность получения вмешательства была одинаковой, независимо от того, когда участник вошел в исследование. Следовательно, вероятность того, что какой-либо участник получит вмешательство или стандартное лечение / плацебо, не зависит от любого другого участника, которому назначено это лечение.

Распределение субъектов исследования для каждого вмешательства определяется формальным случайным процессом и не может быть предсказано исследователем или участником или на него не может повлиять. В хорошо спроектированном РКИ случайное распределение определяется заранее.

Методы рандомизации - распределение субъектов в группы вмешательства и контрольные группы.

1. Простая рандомизация

Например, компьютерные таблицы случайных чисел. Простая рандомизация используется редко.

2. Блокировать рандомизацию

Блочная рандомизация - это метод, используемый для обеспечения равномерного распределения числа участников, назначенных в каждую группу, и обычно используется в небольших исследованиях.

3. Стратифицированная рандомизация

Стратифицированная рандомизация используется для обеспечения того, чтобы важные исходные переменные (потенциальные мешающие факторы) более равномерно распределялись между группами, чем может гарантировать только случай. Однако существует ограниченное количество исходных переменных, которые можно уравновесить стратификацией из-за возможности небольшого числа субъектов в каждой страте.

4. Минимальная рандомизация

Этот метод можно использовать, когда исследование достаточно небольшое и простая рандомизация не приведет к созданию сбалансированных групп.
Обратите внимание, что детерминированные методы распределения, такие как по дате рождения или альтернативное назначение в каждую группу, не считаются случайными.

Преимущества рандомизации

  • Устраняет путаницу - имеет тенденцию создавать группы, сопоставимые по всем факторам, влияющим на результат, известным, неизвестным или трудным для измерения. Следовательно, единственной разницей между группами должно быть вмешательство.
  • Eliminates selection bias.
  • Gives validity in statistical tests based on probability theory.
  • Any baseline differences that exist between study groups are attributable to chance rather than bias. Though this should still be considered as a potential concern.

Disadvantages of randomisation

Does not guarantee comparable groups as differences in confounding variables may arise by chance.

Blinding in randomised controlled trials

Blinding is a process where the critical information on allocation of treatment is hidden either from the patients, or from observer or the evaluator in the study. The method of blinding in RCT is used to ensure that there are no differences in the way in which each group is assessed or managed, and therefore minimize bias. Bias may be introduced, for example, if the investigator is aware of which treatment a subject is receiving, as this may influence (intentionally or unintentionally) the way in which outcome data is measured or interpreted. Similarly, a subject's knowledge of treatment assignment may influence their response to a specific treatment.

Blinding also involves ensuring that the intervention and standard or placebo treatment appears the same.

Double blinding is when neither the investigator nor the study participant is aware of treatment assignments. However, this design is not always possible.

A single blind RCT is when the investigator but not the study participants know which treatment has been allocated.

Strengths of a randomised controlled trial

  • A well designed randomised control trial provides the strongest evidence of any epidemiological study design that a given intervention has a postulated effectiveness and is safe.
  • A RCT provides the best type of epidemiological study from which to draw conclusions on causality.
  • Randomisation provides a powerful tool for controlling for confounding, even by factors that may be unknown or difficult to measure. Therefore, if well designed and conducted, a RCT minimizes the possibility that any observed association is due to confounding.
  • Clear temporal sequence - exposure clearly precedes outcome.
  • Provides a strong basis for statistical inference.
  • Enables blinding and therefore minimizes bias.
  • Can measure disease incidence and multiple outcomes.

Weaknesses of a randomised controlled trial

  • Ethical constraints - for example, it is not always possible or ethical to manipulate exposure at random.
  • Expensive and time consuming.
  • Requires complex design and analysis if unit of allocation is not the individual.
  • Inefficient for rare diseases or diseases with a delayed outcome.
  • Generalisability - subjects in a RCT may be more willing to comply with the treatment regimen and therefore may not be representative of all individuals who might be given the treatment.

1. Hennekens CH, Buring JE. Epidemiology in Medicine, Lippincott Williams & Wilkins, 1987.
2. Kendall JM. Designing a research project: Randomised Controlled trials and their principles, Emerg Med J. 2003, March20(2)164-168.
3. Hollis S, Campbell F, What is meant by intention to treat analysis? Survey of published randomised controlled trials. BMJ 1999 319670-74.

1. Pocock SJ. Clinical Trials: A practical approach, Chichester, Wiley, 1984.
2. Sibbald B, Roland M, Understanding controlled trials: Why are randomised controlled trials important?, BMJ 1998, 316:201.
3. Altman DG, Randomisation. BMJ 19913021481-2.


Pretest-Posttest Nonequivalent Groups Design

Another way to improve upon the posttest only nonequivalent groups design is to add a pretest. в pretest-posttest nonequivalent groups design t here is a treatment group that is given a pretest, receives a treatment, and then is given a posttest. But at the same time there is a nonequivalent control group that is given a pretest, does not receive the treatment, and then is given a posttest. The question, then, is not simply whether participants who receive the treatment improve, but whether they improve более than participants who do not receive the treatment.

Imagine, for example, that students in one school are given a pretest on their attitudes toward drugs, then are exposed to an anti-drug program, and finally, are given a posttest. Students in a similar school are given the pretest, not exposed to an anti-drug program, and finally, are given a posttest. Again, if students in the treatment condition become more negative toward drugs, this change in attitude could be an effect of the treatment, but it could also be a matter of history or maturation. If it really is an effect of the treatment, then students in the treatment condition should become more negative than students in the control condition. But if it is a matter of history (e.g., news of a celebrity drug overdose) or maturation (e.g., improved reasoning), then students in the two conditions would be likely to show similar amounts of change. This type of design does not completely eliminate the possibility of confounding variables, however. Something could occur at one of the schools but not the other (e.g., a student drug overdose), so students at the first school would be affected by it while students at the other school would not.

Returning to the example of evaluating a new measure of teaching third graders, this study could be improved by adding a pretest of students’ knowledge of fractions. The changes in scores from pretest to posttest would then be evaluated and compared across conditions to determine whether one group demonstrated a bigger improvement in knowledge of fractions than another. Of course, the teachers’ styles, and even the classroom environments might still be very different and might cause different levels of achievement or motivation among the students that are independent of the teaching intervention. Once again, differential history also represents a potential threat to internal validity. If asbestos is found in one of the schools causing it to be shut down for a month then this interruption in teaching could produce a difference across groups on posttest scores.

If participants in this kind of design are randomly assigned to conditions, it becomes a true between-groups experiment rather than a quasi-experiment. In fact, it is the kind of experiment that Eysenck called for—and that has now been conducted many times—to demonstrate the effectiveness of psychotherapy.


Evaluation Approaches: Observed Variables vs. Latent Variables

Broadly speaking, approaches to intervention evaluation can be distinguished into two categories: (1) approaches using observed variables and (2) approaches using latent variables. The first category includes widely used parametric tests such as Student's т, repeated measures analysis of variance (RM-ANOVA), analysis of covariance (ANCOVA), and ordinary least-squares regression (see Tabachnick and Fidell, 2013). However, despite their broad use, observed variable approaches suffer from several limitations, many of them ingenerated by the strong underlying statistical assumptions that must be satisfied. A first series of assumption underlying classic parametric tests is that the data being analyzed are normally distributed and have equal population variances (also called homogeneity of variance or homoscedasticity assumption). Normality assumption is not always met in real data, especially when the variables targeted by the treatment program are infrequent behaviors (i.e., externalizing conducts) or clinical syndromes (Micceri, 1989). Likewise, homoschedasticy assumption is rarely met in randomized control trial as a result of the experimental variable causing differences in variability between groups (Grissom and Kim, 2012). Violation of normality and homoscedasticity assumptions can compromise the results of classic parametric tests, in particular on rates of Type-I (Tabachnick and Fidell, 2013) and Type-II error (Wilcox, 1998). Furthermore, the inability to deal with measurement error can also lower the accuracy of inferences based on regression and ANOVA-family techniques which assume that the variables are measured without errors. However, the presence of some degree of measurement error is a common situation in psychological research where the focus is often on not directly observable constructs such as depression, self-esteem, or intelligence. Finally, observed variable approaches assume (without testing it) that the measurement structure of the construct under investigation is invariant across groups and/or time (Meredith and Teresi, 2006 Millsap, 2011). Thus, lack of satisfied statistical assumptions and/or uncontrolled unreliability can lead to the under or overestimation of the true relations among the constructs analyzed (for a detailed discussion of these issues, see Cole and Preacher, 2014).

On the other side, latent variable approaches refer to the class of techniques termed under the label structural equation modeling (SEM Bollen, 1989) such as confirmatory factor analysis (CFA Brown, 2015) and mean and covariance structures analysis (MACS Little, 1997). Although a complete overview of the benefits of SEM is beyond the scope of the present work (for a thorough discussion, see Little, 2013 Kline, 2016), it is worthwhile mentioning here those advantages that directly relate to the evaluation of intervention programs. First, SEM can easily accommodate the lack of normality in the data. Indeed, several estimation methods with standard errors robust to non-normal data are available and easy-to-use in many popular statistical programs (e.g., MLM, MLR, WLSMV, etc. in Mплюс Muthén and Muthén, 1998�). Second, SEM explicitly accounts for measurement error by separating the common variance among the indicators of a given construct (i.e., the latent variable) from their residual variances (which include both measurement error and unique sources of variability). Third, if multiple items from a scale are used to assess a construct, SEM allows the researcher to evaluate to what extent the measurement structure (i.e., factor loadings, item intercepts, residual variances, etc.) of such scale is equivalent across groups (e.g., intervention group vs. control group) and/or over time (i.e., pretest and posttest) this issue is known as measurement invariance (MI) and, despite its crucial importance for properly interpreting psychological findings, is rarely tested in psychological research (for an overview see Millsap, 2011 Brown, 2015). Finally, different competitive SEMs can be evaluated and compared according to their goodness of fit (Kline, 2016). Many SEM programs, indeed, print in their output a series of fit indexes that help the researcher assess whether the hypothesized model is consistent with the data or not. In sum, when multiple indicators of the constructs of interest are available (e.g., multiple items from one scale, different informants, multiple methods, etc.), latent variables approaches offer many advantages and, therefore, they should be preferred over manifest variable approaches (Little et al., 2009). Moreover, when a construct is measured using a single psychometric measure, there are still ways to incorporate the individuals' scores in the analyses as latent variables, and thus reduce the impact of measurement unreliability (Cole and Preacher, 2014).