Информация

Переход к шкале Лайкерта

Переход к шкале Лайкерта


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Шкала Лайкерта широко используется более 80 лет (опубликована в 1932 году). Однако его ограничения хорошо известны:

  • Расстояние между каждым выбором, возможно, не равноудалено.
  • Люди продолжают поддерживать среднюю точку шкалы и избегают выбора «крайних» вариантов шкалы, даже если крайний выбор будет наиболее точным.
  • Отношение населения к одному конкретному предмету на самом деле существует в огромном многомерном континууме. Однако шкала Лайкерта одномерна и дает только 5-7 вариантов выбора.
  • На ответы людей будут влиять предыдущие вопросы

Какая последняя разработка в области психометрии? Есть ли какие-нибудь многообещающие и многообещающие замены или улучшения шкале Лайкерта?


Визуально-аналоговая шкала (ВАШ) использовалась в некоторых исследованиях. Для прямого сравнения в одном исследовании см. Викерс, который сравнивал ВАШ с 7-балльной шкалой Лайкерта.

Интересно, что Викер обнаружил эффект, аналогичный эффекту, обнаруженному в широко цитируемой статье Дауэса о 5/7-балльном Лайкерте против 10-балльного Лайкерта, а именно, что большее количество баллов по шкале приводит к более низкому среднему баллу ... несмотря на то, что данные, измеренные в этих двух исследованиях, были совершенно разными: болезненность мышц и, соответственно, удовлетворенность клиентов. Что ж, вероятность этого совпадения составляет 50%, но я не смог найти ни одного метаанализа этого типа исследования.

Еще одна проблема со шкалами Лайкерта (и другими порядковыми) заключается в том, что некоторые исследователи используют неверную статистику, например те, которые предполагают нормальное распределение, ср. Бишоп и Херрон, которые также обсуждают некоторые тонкости.

Ссылки (прописано):

  • AJ Vickers, Сравнение порядкового и непрерывного показателей оценки мышечной болезненности, Int J Technology Assess Health Care. 1999; 15 (04): 709-716.
  • Дж. Доус, «Изменяются ли характеристики данных в зависимости от количества использованных шкал? Эксперимент с использованием 5-балльной, 7-балльной и 10-балльной шкал», Int J Market Res. 2008; 51 (1)
  • П.А. Бишоп и Р.Л. Херрон, Использование и неправильное использование ответов элемента Лайкерта и других порядковых мер, Int J Exerc Sci. 2015; 8 (3): 297-302.

Вопросы по шкале Лайкерта предлагают респондентам широкий выбор вариантов ответа из любого конца спектра. С годами они стали фаворитами среди составителей опросов, поскольку они получали определенные мнения, впечатления и подходы от респондентов.

Названный в честь ее основателя, психолога Ренсиса Лайкерта, вопрос по шкале Лайкерта используется для понимания уровня согласия респондентов с тем или иным утверждением. Диапазон, представленный в этой шкале, используется для понимания чувств и мнений респондентов. Согласованность, частота, вероятность, качество или важность могут быть измерены с помощью шкалы Лайкерта с соответствующими привязками. Весы могут быть либо униполярной шкалой Лайкерта, либо биполярной шкалой Лайкерта.

Примеры шкалы Лайкерта:

Эта шкала приобрела огромную популярность в онлайн-опросах и используется во всех исследованиях, таких как удовлетворенность клиентов, вовлеченность сотрудников или удовлетворенность сотрудников. Шкалу Лайкерта можно разделить на два типа: нечетная шкала Лайкерта и четная шкала Лайкерта.

Решите с умом, какой тип шкалы Лайкерта даст наилучшие результаты. Анализ целевой аудитории, оценка цели опросного исследования имеет решающее значение при определении типа вопроса по шкале Лайкерта. В зависимости от того, хотите ли вы побудить респондентов дать ответы, которые вы хотите, или хотите предоставить нейтральный вариант, респонденты могут выбрать, если у них нет предвзятости в отношении других ответов. Странный вопрос по шкале Лайкерта предлагает респондентам центральную точку для выбора, если они нейтральны. У ровных вопросов по шкале Лайкерта есть варианты без средней точки, из-за чего респонденты будут вынуждены выбирать из предложенных вариантов ответа. Средняя точка шкалы нечетного Лайкерта будет по-разному интерпретироваться разными респондентами, но она никогда не будет полностью предвзятой.

Примеры нечетной шкалы Лайкерта:

Нечетные шкалы Лайкерта используются, когда создатель опроса намеревается предоставить респондентам свободу выбора типа обратной связи, которую они предоставляют.

  1. Пример 3-балльной шкалы Лайкерта для согласования: Шкала Лайкерта, которая предлагает соглашаться и не соглашаться относительно самых дальних точек вместе с нейтральным вариантом.
  2. Пример 5-балльной шкалы Лайкерта для согласования: Эта шкала будет состоять из 5 вариантов ответов, которые будут содержать полюса и нейтральный вариант, связанный с промежуточными вариантами ответов.
  3. Пример 7-балльной шкалы Лайкерта для согласования: Эта шкала предлагает семь различных вариантов ответа, связанных с соглашением, которые были бы достаточно отчетливыми, чтобы респонденты могли ответить, не запутавшись.
  4. Пример 5-балльной шкалы Лайкерта для оценки удовлетворенности: Эта шкала измерения удовлетворенности предложит пять вариантов ответа: доволен и неудовлетворен как полюса, и нейтральный вариант в середине. Эти варианты взаимосвязаны с другими вариантами, которые могут предоставить респондентам варианты, которые они ищут.
  5. Пример 7-балльной шкалы Лайкерта для оценки удовлетворенности: Эта шкала измерения удовлетворенности предложит семь вариантов ответа, например, доволен и неудовлетворен, как полюса, и нейтральный вариант в середине. Остальные варианты должны быть различны и должны повышать ценность шкалы, чтобы респонденты могли предоставить точную обратную связь без каких-либо препятствий.

Исследователи могут аналогичным образом использовать эти шкалы для измерения вероятности, важности, частоты и многих других факторов.

Даже примеры шкалы Лайкерта:

Эта шкала Лайкерта используется в ситуациях, связанных с осознанием или пониманием, или в подобных ситуациях, когда нейтральный вариант не нужен. Даже вопросы по шкале Лайкерта используются там, где от респондентов ожидается предвзятая обратная связь.

  1. Пример 2-балльной шкалы Лайкерта для согласия: этот вопрос представляет собой простейший пример вопроса по шкале Лайкерта, в котором будет всего два варианта, например, согласен и не согласен как два полюса шкалы.
  2. Пример 4-балльной шкалы Лайкерта для согласия: у этого вопроса будут два полюса, связанных с вариантами ответов промежуточного согласия. Эти вопросы используются для измерения удовлетворенности клиентов, а также удовлетворенности сотрудников.
  3. Пример оценки удовлетворенности по 4-балльной шкале Лайкерта: Поляки относительно удовлетворенности, такие как удовлетворение и неудовлетворенность, будут связаны с другими вариантами ответа без нейтрального варианта ответа.
  4. Пример 4-балльной шкалы Лайкерта для частоты: Для измерения частоты маркетологам не обязательно нужна средняя точка, поэтому они могут использовать вопрос по ровной шкале Лайкерта.
  5. Пример 4-балльной шкалы Лайкерта для вероятности: Понимание вероятности того, что бренд будет делиться информацией, не требует центральной точки. Вопроса даже по шкале Лайкерта может быть достаточно для понимания того, как делиться брендом.

Чешуя Терстона

Шкала Терстона, созданная Луи Терстоуном, предназначена для разработки формата для создания групп показателей переменной, которые имеют эмпирическую структуру среди них. Например, если вы изучали дискриминацию, вы должны составить список пунктов (например, 10), а затем попросить респондентов присвоить каждому пункту оценку от 1 до 10. По сути, респонденты ранжируют пункты в порядке от самого слабого индикатора дискриминации до самого сильного.

После того, как респонденты выставили оценки по пунктам, исследователь изучает оценки, присвоенные каждому пункту всеми респондентами, чтобы определить, с какими пунктами респонденты согласились больше всего. Если бы элементы шкалы были должным образом разработаны и оценены, то появилась бы экономия и эффективность сокращения данных, присутствующих в шкале социальной дистанции Богардуса.


Полностью согласен: количество вариантов ответа имеет значение при использовании шкалы Лайкерта

Вы, наверное, видели шкалу Лайкерта, даже если не знаете названия широко распространенного инструмента измерения. В традиционной форме исследователь представляет утверждение, за которым следуют пять вариантов ответа с разной интенсивностью и отношением. Например: «Я доволен надежностью своего интернет-провайдера (ISP)». Вы категорически не согласны, не согласны, ни согласны, ни не согласны, согласны или полностью согласны?

Шкалы Лайкерта появляются в психологическом контексте и в других исследованиях в области социальных наук, в бизнесе, на собеседованиях, политических опросах, в образовании и часто при закрытии розничной онлайн-покупки или обмена информацией в справочной службе. Они повсюду и чрезвычайно эластичны, иногда предлагая респондентам до 11 определенных вариантов, а в некоторых приложениях - бесконечный выбор, реализуемый с помощью ползунка «щелкни и перетащи» вдоль континуума.

Несмотря на тематический и вариативный подход к реализации, до публикации нового исследования исследователем из Университета Буффало никто не тестировал тест оптимальным образом, часто расширяя и уточняя шкалу с небольшим эмпирическим обоснованием количества вариантов ответа. Нет убедительных доказательств того, что даже Ренсис Лайкерт, социальный психолог, разработавший свою одноименную шкалу в 1932 году, проводил какое-либо тестирование перед тем, как использовать ее в своей докторской диссертации.

«Количество вариантов имеет значение, особенно для показателей личностных конструктов, подобных тем, которые мы оценивали в нашем исследовании», - говорит Леонард Симмс, доцент кафедры психологии UB и ведущий автор нового исследования, опубликованного в журнале. Психологическая оценка.

«Мы тратим много времени на размышления о том, что нам следует задать в нашем исследовании, но мы почти никогда не собираем данные о вариантах ответа», - говорит Симмс. "Мы во многом основывались на знаниях, но эти решения нельзя принимать как должное.

«Если вы собираетесь отклониться от того, что предлагает эта статья, тогда это решение следует сначала проверить».

Что предлагают газеты? Вернемся к заявлению о вашем интернет-провайдере. Может ли удвоение количества вариантов ответа повысить точность? Как насчет предоставления меньшего количества вариантов?

«Шесть кажется волшебным числом», - говорит Симмс. «В шести нет ничего идеального, но я сомневаюсь, что есть доказательства того, что ответы после шести были бы настолько полезны».

Частью полезности шести ответов, а не пяти или, в более общем смысле, четного числа вариантов, а не нечетного, является устранение среднего выбора, который часто выглядит как остров апатии, давая респондентам непреднамеренную передышку, которая дает исследователям с небольшим количеством полезных данных.

По пятибалльной шкале предположительно «три» должно означать что-то большее, чем «два», и меньшее, чем «четыре». Но Симмс говорит, что некоторые респонденты используют среднее число по причинам, не относящимся к измеряемой характеристике.

«Моя точка зрения заключалась в том, что четное число лучше, чем нечетное, и данные нашего исследования, похоже, подтверждают это», - говорит Симмс, эксперт по прикладной и базовой психологической оценке. «Респонденты часто не знают, что сказать, или они не уверены, что они чувствуют, или они не хотят говорить, что они чувствуют, или они могут быть ленивы. Чтобы покончить с этим, они выбирают среднее число.

«Это добавляет к исследованию шум, а не сигнал».

В некоторых анкетах используется визуальный аналог, который требует перемещения ползунка по континууму, а не выбора пронумерованного ответа, но Симмс говорит, что люди на самом деле не думают столь детально.

«Есть предел тому, что люди могут различить по этим конструкциям, которые мы пытаемся измерить», - говорит он. «Наличие точной шкалы не означает, что люди могут делать точные оценки».

Тот же недостаток присутствует и у весов, которые выходят за рамки шести вариантов.

«По девятибалльной шкале разница между« полностью согласен »и« полностью согласен »выходит за рамки наших познавательных способностей», - говорит Симмс. «Как и в случае с ползунком, здесь есть видимость точности, но различия, которые делают люди, не так точны».

Симмс и его исследовательская группа, состоящая из Керри Желязни, Тревора Уильямса, аспирантов UB, и Ли Бернстайна, студента, набрали более 1300 участников, разделенных на группы, которые тестировали вариант ответа с четным и нечетным номерами в парах, которые постепенно перемещались в группы. двух тестов, начиная с группы с двумя и тремя ответами. Шестая группа дважды тестировала визуальную аналоговую шкалу. Каждый участник заполнил «Опросник большой пятерки» - шкалу из 44 пунктов, по которой оцениваются невротизм, экстраверсия, добросовестность, покладистость и открытость.

«Благодаря этому исследованию мы видим, что эти варианты и особенности реагирования влияют на показатели и надежность мер», - говорит Симмс. "Это важно."


Метод

Порядок разработки анкеты

Процедура разработки анкеты состояла из четырех этапов. Во-первых, на основе контент-анализа был предложен набор пунктов для каждой подшкалы для каждой целевой группы. Во-вторых, качество шкал оценивалось в пилотном исследовании. Затем анкеты были адаптированы по результатам исследования. Наконец, исправленная версия была изучена в основном исследовании. Теперь четыре шага будут описаны более подробно.

Концептуальная основа анкеты

Было проведено три обзорных исследования, чтобы выяснить, какое отношение учителя, родители и ученики придерживаются к включению детей с особыми потребностями. Отобранные для обзоров исследования были получены в результате электронного поиска в EBSCOhost Complete. Выбор был основан на следующих критериях: Исследование было опубликовано в период с 1998 по 2008 год и было сосредоточено на отношении учителей обычных начальных школ, родителей или учащихся к включению детей с особыми потребностями в обычные начальные школы.

Общее количество исследований, включенных в три обзорных исследования, составило 58. Для описания результатов исследований они были сгруппированы по трем целевым группам (т.е. учителям, родителям и ученикам) и по трем компонентам отношения. . Эта группировка была основана на анализе компонентов, измеренных по (под) шкалам. В некоторых случаях можно было классифицировать (под) шкалы как принадлежащие к одному из трех компонентов. В других случаях только тщательный анализ типа вопросов или утверждений, использованных в анкетах, показал, на каком компоненте (компонентах) отношения была сосредоточена анкета. Этот анализ показал, что только несколько исследований использовали трехкомпонентную теорию в качестве основы и определили свои анкеты с точки зрения когнитивных, аффективных или поведенческих аспектов (Alderfer et al. 2001 Beck et al. 2006 Nowicki 2006).

Несколько исследований, в которых (под) шкалы использовались для определенного компонента, дали представление о взглядах разработчиков шкалы на содержание конкретного компонента отношения. Например, шкалы для учителей, разработанные для измерения когнитивного компонента, в основном включали пункты, отражающие общие убеждения о философии включения, убеждения в отношении прав детей на образование и знания об ограниченных возможностях. Для этой группы аффективный компонент включал элементы, отражающие такие чувства, как компетентность, уверенность, разочарование и раздражение, в то время как элементы, относящиеся к поведенческому компоненту, отражали готовность учителей осуществить изменения в образовании (например, изменить учебную программу).

Шкалы для измерения когнитивного компонента родителей включали в основном вопросы, касающиеся общих убеждений в отношении философии включения, образовательных прав детей с особыми потребностями и знаний об ограниченных возможностях. Аффективный компонент часто измерялся элементами, отражающими озабоченность, опасения и одобрение (например, позволяя ребенку играть с ребенком-инвалидом), в то время как поведенческий компонент измерялся элементами их готовности взаимодействовать и поддерживать (например, лично встать для ребенка-инвалида, над которым издеваются).

Когнитивный компонент в шкалах учащихся часто сосредоточен на элементах, отражающих их знания о поведении детей с ограниченными возможностями. Чувства страха, стыда и радости измерялись элементами, относящимися к аффективному компоненту. Поведенческий компонент часто измерялся с помощью элементов, отражающих готовность учащихся к взаимодействию и поддержке в отношении школы и свободного времени.

В результате контент-анализа (под) шкал был составлен список понятий, предназначенных для использования в анкетах учителя, родителей и учеников. Цель состояла в том, чтобы найти существующие шкалы учителей, родителей и учеников, предпочтительно включающие все три компонента отношения и каждый с хорошо задокументированным психометрическим качеством. В случае, если это было невозможно, существующие субшкалы или части субшкал использовались для построения новых весов, измеряющих все компоненты. Затем новые шкалы были переведены на голландский язык и адаптированы к голландской ситуации.

Выбор (под) шкал

Выбор частей (под) шкал был основан на следующих критериях:

Отражение соответствующих конструкций когнитивного, аффективного и поведенческого компонентов

Сообщалось, что надежность исходных шкал в соответствующей популяции составляла & gt0,80, что считается подходящим для исследовательских целей (Drenth and Sijtsma 2006).

Анкета учителя

Когнитивный компонент был основан на 12 пунктах подшкалы «основные точки зрения» из анкеты «Мои мысли о включении» (MTAI, разработанная Штойбером и др., 1998 г.). Для аффективного компонента были выбраны четыре пункта «Шкалы многомерного отношения к инклюзивному образованию» (MATIES, разработанная Махатом в 2008 г.) для измерения чувства разочарования и раздражения. Поскольку эти вопросы отражали только негативные чувства, были добавлены восемь пунктов из анкеты «Навыки» (разработанной Аврамидисом и др., 2000). Это отражало положительные эмоции, такие как компетентность и уверенность. Подшкала, измеряющая поведенческий компонент, была основана на шести пунктах MATIES (Mahat 2008), отражающих готовность учителей взаимодействовать и поддерживать.

Всего для анкеты учителей было отобрано 30 пунктов (см. Таблицу 1). Эти пункты относились к трем компонентам, из которых соответственно 12, 12 и шесть пунктов измеряли когнитивную, аффективную и поведенческую области. Респонденты могли оценивать пункты по 5-балльной шкале Лайкерта (1 = полностью не согласен, 5 = полностью согласен).

Анкета для родителей

Опросник «Отношение родителей к детям-инвалидам» (PATHC, разработанный Розенбаумом и др., 1987) использовался в качестве «донорской» шкалы. Анкета состоит из вопросов, отражающих все три компонента отношения, но понятие «убеждения родителей в отношении инклюзии» освещено недостаточно. Таким образом, были добавлены восемь пунктов подшкалы «Основные точки зрения» из вопросника «Мои мысли о включении» (Stoiber et al. 1998).

Всего было выбрано 38 пунктов анкеты родителей (см. Таблицу 1), относящихся к трем компонентам: 19 (когнитивные), 11 (аффективные) и восемь (поведение) пунктов, соответственно. Респонденты могли оценивать пункты по 5-балльной шкале Лайкерта (1 = полностью не согласен, 5 = полностью согласен).

Анкета студента

«Отношение Чедока-Макмастера к детям с ограниченными возможностями» (CATCH, разработанное Розенбаумом и др. 1986) включало все три компонента и соответствовало нашим критериям отбора. Поэтому было решено выбрать эту анкету для измерения отношения студентов. Анкета состояла из 36 пунктов, по 12 пунктов на каждый компонент (см. Таблицу 1).

В исходной анкете CATCH использовался термин «ребенок-инвалид». Вполне вероятно, что студенты в возрасте 8–12 лет интерпретируют это по-разному. Чтобы этого избежать, в начале анкеты были представлены виньетки. Эти виньетки изображали гипотетического ребенка, демонстрирующего характеристики определенного типа инвалидности, но без использования таких терминов, как инвалид, инвалидность, нарушение или особые потребности (см. Приложение 1). Студентам было предложено прочитать этот рассказ, прежде чем отвечать на вопросы анкеты. Формулировка пунктов анкеты учащегося была связана с содержанием виньетки. Были составлены три различных виньетки с описанием детей, которые могли посещать обычную или специальную голландскую школу. Рассказы были составлены первым автором и проверены педагогом-психологом.

Анкета студентов состояла из виньетки и 36 утверждений, каждый компонент оценивался по 12 пунктам. Анкета для студентов была представлена ​​в трех версиях, каждая из которых имела свою виньетку. Респонденты могли оценивать пункты по 5-балльной шкале Лайкерта (1 = полностью не согласен, 5 = полностью согласен).

Порядок перевода

Отобранные задания по трем шкалам были переведены, чтобы оценить отношение голландских учителей, родителей и учеников: два человека (первый автор и аспирант) перевели задания независимо друг от друга. Затем оба перевода сравнили, и оба переводчика обсудили, какой перевод будет наиболее точным.

После перевода предметов они были протестированы на небольшой удобной выборке. Это позволило выявить трудности в формулировке пунктов. Из каждой целевой группы небольшую группу (семь учителей, двое родителей и четыре студента) попросили заполнить анкету в присутствии аспиранта или первого автора. Были изучены все замечания учителей, родителей и учеников по поводу постановки заданий. Впоследствии формулировки трудно или нечетко сформулированных пунктов были изменены.

Порядок оценки анкеты

Психометрические свойства и конструктная валидность анкет были протестированы в двухэтапном процессе, первый этап включал составление трех независимых выборок учителей (N = 58), родители (N = 58) и студенты (N = 1,157). Эти данные были использованы для первого анализа психометрических свойств шкал и разделимости трех компонентов отношения в каждой шкале. На основании результатов этого первого анализа анкеты могут быть адаптированы и улучшены. Второй этап был создан для изучения психометрических свойств и возможной разделимости компонентов отношения трех заключительных шкал.

Анализ психометрических свойств

Анализ психометрических свойств был основан на модели теории ответов на вопросы. Для анализа качества пунктов каждого вопросника использовался анализ по шкале Mokken (MSA). В MSA изучается взаимосвязь между наблюдаемыми ответами на предмет и скрытым признаком. Предполагается, что скрытая черта относится к измеряемому понятию (например, отношениям). На основе MSA можно оценить качество отдельных элементов. В частности, использовалась модель однородности монотонности (MHM Mokken 1971 Sijtsma and Molenaar 2002), основанная на следующих трех предположениях:

Одномерность предметов: одна скрытая черта лежит в основе ответов на вопросы.

Местная независимость: на оценки по предыдущему пункту не должны влиять оценки по другим пунктам шкалы.

Монотонность: все функции ответа элемента (IRF), которые выражают взаимосвязь между скрытым признаком и оценками элемента, являются монотонными, не уменьшаются.

Когда эти три допущения выполняются для набора элементов, важным выводом является то, что сумма баллов отдельных элементов по элементам обеспечивает их упорядочение по скрытому признаку.

Программа «Анализ шкалы Mokken для политомических заданий» (Molenaar and Sijtsma 2000) использовалась для анализа соответствия MHM для каждой подшкалы (то есть компонента отношения). Таким образом, можно определить, действительно ли сумма баллов по пунктам указывает на порядок людей, например, по когнитивному компоненту, или элементы должны быть адаптированы или удалены из шкалы, прежде чем шкала сможет разумно использовать для упорядочивания людей. . Чтобы оценить, соответствует ли элемент i MHM, коэффициент масштабируемости элемента (ЧАС я) каждого пункта. Если MHM держится, ЧАС я находится между 0 и 1 на уровне популяции. В ЧАС я значения, кроме того, указывают на степень способности различения предметов по индивидуумам, с более низкими значениями, указывающими на более низкую способность различения. Моленаар и Сийтсма (2000) предполагают, что предметы, связанные с ЧАС я значения & lt 0,30 считаются имеющими слабую способность распознавания. Таким образом ЧАС я Значение элемента i выражает качество элемента с учетом других элементов шкалы. Качество (суб) шкалы обозначается значком ЧАС значение, указывающее на его прочность, при 0,30 ≤ ЧАС ≤ 0,40 считается слабой шкалой, 0,40 ≤ ЧАС ≤ 0,50 умеренный масштаб, а ЧАС & gt 0.50 сильная шкала.

Помимо коэффициентов масштабируемости, использовались другие средства диагностики, чтобы оценить, выполняется ли предположение о монотонности для каждого элемента. Диагностика суммируется в так называемые значения критериев, где значение ≥80 настоятельно указывает на нарушение предположения, значения от 40 до 80 сомнительны, а значения ≤40 являются удовлетворительными (Sijtsma and Molenaar 2002). Основываясь на результатах анализа и содержании вопросов, мы решили, будут ли подозрительные элементы удалены или сохранены в анкете с изменением формулировки.

Наряду с анализом с помощью MHM, мы исследовали, можно ли найти доказательства дифференциального функционирования элементов (DIF) в каждом вопроснике для каждой целевой группы. DIF может возникнуть, когда IRF конкретного элемента различается в двух соответствующих подгруппах (например, мужчины / мальчики и женщины / девочки). Для каждой целевой группы DIF был исследован среди трех переменных подгруппы: пол, опыт включения / наличия ребенка с SEN и тип виньетки.

Для каждой подшкалы использовалась следующая процедура анализа:

Оценка ЧАС я коэффициенты и значения критериев, чтобы проверить, выполняются ли предположения MHM

Проверка подозрительных предметов из (1) на основе ЧАС я и содержание

Удаление пунктов из субшкалы / адаптация содержания пункта

Оценка диагностики дифференциального функционирования элементов в подгруппах

Определение ЧАС значение итоговой шкалы (таким образом, исключая подозрительные предметы) и коэффициенты надежности.

Анализ разделимости субшкал

Чтобы определить, можно ли рассматривать компоненты отношения как отдельные субшкалы в анкете отношения, мы использовали автоматическую пошаговую процедуру элемента (AISP) MSA. Эту процедуру можно использовать для выбора кластера элементов из большего набора, где каждый кластер состоит из элементов, которые измеряют одну и ту же скрытую черту с достаточной силой различения. AISP можно рассматривать как альтернативу факторному анализу и очень хорошо подходит для вопросов из вопросников, которые оцениваются политомически. AISP требует выборки не менее 100 респондентов (Sijtsma and Molenaar 2002). AISP направлен на поиск шкал из набора элементов, так чтобы каждая шкала удовлетворяла минимальному, заранее заданному уровню качества, как показано шкалой ЧАС коэффициент - и содержит как можно больше элементов, указывающих на ту же скрытую черту. AISP использовался в соответствии с рекомендациями Sijtsma and Molenaar (2002, стр. 80–82), в которых мы использовали восходящую стратегию с нижними границами в диапазоне от c = 0,30 до c = 0,60. Предполагалось, что AISP будет выполняться для всех элементов с использованием различных граничных уровней (c = От 0,30 до c = 0,60, уменьшая каждый шаг на 0,10). С увеличением граничных уровней возникает типичная закономерность появления указанных шкал. Небольшое граничное значение приводит к тому, что большинство элементов находится в одной шкале. Заметная разница между одной шкалой и несколькими субшкалами возникает при увеличении граничных значений: появление одной меньшей шкалы указывает на то, что одной шкалы достаточно, где две или более шкалы указывают на необходимость субшкал.


Полученные результаты

Всего в исследовании приняли участие 202 пациента. Средний возраст составлял 42,5 года, и большинство участников составляли мужчины. Первичные диагнозы, основанные на Международной статистической классификации болезней и проблем, связанных со здоровьем, 10-го пересмотра (МКБ-10): 30,7% (62) депрессия, 29,2% (59) шизофрения, 12,9% (26) мания, 10,4% (21) расстройство личности , 8,4% (17) Употребление алкоголя, 4,0% (8) Беспокойство и расстройство, связанное со стрессом, 2,5% (5) Поведенческие синдромы, связанные с физиологическими нарушениями, и 2,0% (4) Употребление наркотиков. Только 16,3% (33) участников были женаты, остальные были холостыми, разведенными, проживающими отдельно или овдовевшими. Почти 70% (141) участников родились в Швейцарии, и все они были носителями французского языка или свободно говорили по-французски.

Внутренняя валидность

На основе четырех отдельных однофакторных моделей было отброшено шесть пунктов на фактор (Поддержка стереотипов пункты 1, 9, 49, 53, 5 и 13 Праведный гнев пункты 66, 30, 58, 42, 62 и 2 Отставка пункты 71, 67, 7, 19, 11 и 3 Не-раскрытие пункты 20, 60, 28, 36, 56 и 64). Поскольку Поддержка стереотипов а также Отставка факторы сильно коррелировали (р = 0,847), соответствующие 24 элемента были объединены и выбраны для создания 12-элементного Поддержка стереотипов фактор. Следующие предметы были выброшены: Отставка пункты 23, 39, 47, 27, 31 и 51 и Поддержка стереотипов пункты 21, 25, 65, 57, 29 и 61. На основе трехфакторного ОДВ четыре пункта на каждый фактор были отброшены из-за перекрестных нагрузок на другие факторы (Поддержка стереотипов пункты 59, 37, 55 и 41 Праведный гнев пункты 10, 26, 70 и 18 Не-раскрытие пункты 72, 52, 44 и 40). Последние 24 пункта представлены в Таблице 1, а ее перевод на английский язык доступен в Приложении 1: Таблица 5.

Окончательное соответствие трехфакторной модели из 24 пунктов было удовлетворительным (таблица 2). χ2 = 416.229 df = 249, п <0,001, RMSEA = 0,082, CFI = 0,936, TLI = 0,929). Все предметы значительно загружены по своим факторам. Подгонка однофакторной модели была плохой (χ2 = 963,118 df = 252, п <0,001, RMSEA = 0,167, CFI = 0,728, TLI = 0,702). Прямое сравнение двух моделей показало, что трехфакторное решение предпочтительнее однофакторного варианта (Δχ2 = 145,130 Δdf = 3 п & lt .001).

На выборке для перекрестной проверки соответствие трехфакторной модели можно считать приемлемым (χ2 = 379,037 df = 249, п <0,001, RMSEA = 0,072, CFI = 0,894, TLI = 0,883). Все предметы значительно загружены по своим факторам. Опять же, однофакторная модель была неудовлетворительной (χ2 = 809,874 df = 252, п & lt .001, RMSEA = 0,148, CFI = 0,547, TLI = 0,504), и трехфакторное решение было предпочтительнее однофакторного варианта (Δχ2 = 111,816 Δdf = 3 п & lt .001).

На всей выборке соответствие трехфакторной модели было удовлетворительным (χ2 = 480,489 df = 249, п & lt .001, RMSEA = 0,068, CFI = 0,939, TLI = 0,932). Однако однофакторная модель оставалась плохой (χ2 = 1579,617 df = 252, п & lt .001, RMSEA = 0,161, CFI = 0,649, TLI = 0,616) и уступает трехфакторному решению (Δχ2 = 238,534 Δdf = 3 п & lt .001). Нагрузки окончательной модели представлены на рис. 1. Эти три фактора были положительно коррелированы.

Факторные нагрузки ПаСС-24

Надежность

Оценки внутренней согласованности (таблица 3) были хорошими или превосходными. Оценки надежности повторного тестирования также были хорошими. Сравнение результатов первой и второй оценок выявило одно существенное изменение. В Праведный гнев оценка была значительно выше во время второй оценки (разница = + 2,04 балла, t (50) = -3,938, п & lt .001).

Конвергентная действительность

Корреляция между тремя факторами PaSS-24 и другими шкалами представлена ​​в таблице 4. Большинство коэффициентов корреляции были существенными, значимыми и в ожидаемом направлении. Корреляции между Праведный гнев score and other scales were typically lower or, in a few instances, not statistically significant.

Finally, to facilitate clinical use, normative data on the total sample are presented in Appendix 2: Table 6.


Likert Scale Examples

In addition to the granularity they bring over to survey research, Likert scales are useful as they provide a number of pre-written answer options that are applicable to a wide range of scenarios, from customer satisfaction to public opinion research. For example, the ‘disagree to agree’ Likert scale as shown below can be applied to nearly any topic by asking respondents to rate their level of agreement with a statement regarding brand affinity, political beliefs, and more. Some of the most useful Likert scale question examples include:

Agree to Disagree Likert Scale

  • Категорически не согласен
  • Не согласен
  • Ни согласен, ни несогласен
  • Agree
  • Полностью согласен

Satisfaction Likert Scale

  • Very dissatisfied
  • Somewhat dissatisfied
  • Neither dissatisfied or satisfied
  • Somewhat satisfied
  • Very satisfied

Likelihood Likert Scale

  • Very unlikely
  • Somewhat unlikely
  • Neither likely nor unlikely
  • Somewhat likely
  • Very likely

Good to bad Likert Scale

Frequency Likert Scale

Usage of Likert Scale Questions

A major benefit of Likert-type questions is their flexibility, as the above questions can be used to gather information regarding sentiment towards a wide range of topics. By using Likert-type questions or a full Likert scale in conjunction with simple yes/no questions, open-ended questions, and other question types, a researcher can form a complete picture of views towards:

  • A product or brand: How likely are you to buy this ice cream brand again?
  • Customer satisfaction levels: How satisfied are you with the service being provided to you?
  • Political beliefs: Rate your level of agreement with the new government tax policy from strongly disagree to strongly agree
  • Actions of individuals or companies: Do you strongly approve, somewhat approve, somewhat disapprove, or strongly disapprove of Company X’s recent decision?

To write a good Likert scale or Likert-type questions, researchers should ensure that the statement or statements being evaluated is clear, the answer options are distinct from each other (as demonstrated in the above pre-written choices), and the scale encompasses all possible options, rather than assuming an experience was satisfactory or that a respondent will positively react to a statement.

At GeoPoll we have a range of experience in developing Likert scales and Likert-type questions for multiple methodologies, including SMS surveys, voice call surveys through Computer Assisted Telephone interviewing, and link-based surveys. To learn more about our capabilities or speak to a member of our team about an upcoming project, please contact us.


4. Theoretical or face validation

After the reference table’s development, it is time to move on to the second step, called theoretical or face validation. A clear distinction is required here between the theoretical and the empirical validation, as the latter is performed through statistics procedures and will be explained later in this paper.

In this step, the researcher developing the measurement scale should ask the experts or specialists (preferably other researchers, PhD level, who have experience in the construct domain of the scale) to evaluate the items and their relationship to the measured construct.

The quantity of these specialists is varied. Lawshe (1975) proposed an approach called content validity ratio (CVR), Lynn (1986) further explored the index of content validity and Ayre and Scally (2014) reproduced Lawshe’s CVR to build a critical CVR values’ table, which is very useful as a guide to the freshman researcher. The crucial point here is: does the researcher have enough time to completely and correctly evaluate the proposed construct? Often the answer is no, unfortunately.

So the rule of thumb is – “the more, the merrier” – but researchers do not have infinite time or money to perform this activity. Something around four to six experts should solve the problem.

The warning here is: pay attention to the quality of expert responses. Beware of experts who suggest little changes in the scale, or indicate the scale is perfect, which may not be the case, or the expert did not pay much attention when reviewing the constructs.

Is the wording of the items correct for the respondent audience (sample)?

Should some item(s) be removed that do not apply to the construct domain?

The reason for this deletion could be a tiny detail or something that, in practice, is not performed by the respondent. For example, a measurement scale was developed to evaluate the crowding effect on shopping in street markets and open markets, and there were two items out of context: (a) one affirmed that the lighting was adequate, and (b) another if the ambient music motivates purchases or not. In street markets with street vendors, neither of these items are relevant. This is an example of overlooking the fact that the situation this scale would be applied in would not consider these two dimensions.

Are there other items missing from the scale?

Are there (technical or specific) terms that can be misunderstood by the respondents?

If the researcher already has a factor model (the constructs with your items), the experts should evaluate if each group of items belongs to each construct.

A second warning: most of the experts have many tasks to do, and performing a proper analysis takes much time, which can cause a delay in the research project.


Фон

In recent years, medical educators have focused on the acquisition of professional identity, or professional identity formation (PIF), as a medical doctor [1,2,3,4,5] as the ultimate goal of medical education [6]. Most medical educators try to teach and assess medical trainees’ measurable behaviors under the framework of competency-based medical education [7]. Jarvis-Selinger described identity formation as an adaptive, developmental process that happens simultaneously at the individual and collective levels and involves psychological development and socialization of the person into appropriate roles and forms of participation in the community’s work [7]. Socialization in the community of practice and acceptance of professional values [8, 9] could be indispensable core features of PIF in medical education. However, medical students and residents face various experiences and difficulties in the process of PIF [4, 10,11,12,13,14,15,16], and it is important for medical educators to understand the PIF of learners in order to help them develop as medical professionals.

Previous research on medical students’ and residents’ values and attitudes used qualitative analysis of reflective writing and interviews. If medical educators intend to follow-up on an individual’s or group’s PIF, compare different groups, or evaluate medical educational programs from the standpoint of PIF, a quantitative assessment tool would be preferable and would broaden research possibilities.

A previous study indicated that Kegan’s human developmental model [17] could apply to medical professions and manifestation in a medical context was discussed [4, 7, 15]. Kegan’s model, which was based on Piaget [18] and other developmental theories [19, 20], indicates a framework for the longitudinal psychological development of the self into a moral and meaning-making entity. Kegan proposed six stages from childhood stage 0 to adult life stage 5, and this life-span development is the process of PIF from self-centered identity to a moral identity characterized by the expectation of a profession [1]. Previous research suggests that medical students and young trainees could be between Kegan’s stages 2 to 4. People at stage 4 understand relationships in terms of different values and expectations, become self-reflective, incorporate external professional values as internal values, and demonstrate reason in full control over emotions. Not all people reach stage 5, and those at stage 5 do not perceive themselves as having a single identity and are open to other influences. An evaluation scale could be developed using items on well-developed (stage 4 and higher) professional attributes as indicators.

The purpose of this study was to develop an instrument to evaluate the degree of maturation, socialization, and acceptance of professional values, which comprise the core features of PIF, and that can be applied to a large group of medical trainees.


Likert Scale Response Anchors

Named after its inventor, Rensis Likert (pronounced "lick-urt"), a Likert scale is commonly used in survey research. In fact, it it the most widely-used approach to scale responses. When responding to a Likert questionnaire item, respondents indicate their level of agreement or disagreement on a symmetric agree-disagree scale for a series of statements. The range captures the intensity of their feelings for a particular item. A scale can be created as the simple sum of questionnaire responses over the full range of the scale. In so doing, Likert scaling assumes that distances on each item are equal if they are not, then the values cannot be treated as interval data.

Below are some popular Likert-type scales that you can use in your Sawtooth Software CiW (general interviewing) questionnaires.

Level of Acceptability
  1. Totally unacceptable
  2. Неприемлемо
  3. Slightly unacceptable
  4. Нейтральный
  5. Slightly acceptable
  6. Приемлемо
  7. Perfectly Acceptable
Level of Appropriateness
  1. Absolutely inappropriate
  2. Неприличный
  3. Slightly inappropriate
  4. Нейтральный
  5. Slightly appropriate
  6. Подходящее
  7. Absolutely appropriate
Level of Importance
  1. Not at all important
  2. Low importance
  3. Slightly important
  4. Нейтральный
  5. Moderately important
  6. Very important
  7. Extremely important
Level of Agreement
  1. Категорически не согласен
  2. Не согласен
  3. Не много не согласен
  4. Neither agree or disagree
  5. Отчасти согласны
  6. Agree
  7. Полностью согласен
Knowledge of Action
  1. Never true
  2. Rarely true
  3. Sometimes but infrequently true
  4. Нейтральный
  5. Sometimes true
  6. Usually true
  7. Always true
Reflect Me?
  1. Very untrue of me
  2. Untrue of me
  3. Somewhat untrue of me
  4. Нейтральный
  5. Somewhat true of me
  6. True of me
  7. Very true of me
My beliefs
  1. Very untrue of what I believe
  2. Untrue of what I believe
  3. Somewhat untrue of what I believe
  4. Нейтральный
  5. Somewhat true of what I believe
  6. True of what I believe
  7. Very true of what I believe
Priority:
  1. Not a priority
  2. Low priority
  3. Somewhat priority
  4. Нейтральный
  5. Moderate priority
  6. High priority
  7. Essential priority
Level of Concern
  1. Not at all concerned
  2. Slightly concerned
  3. Somewhat concerned
  4. Moderately concerned
  5. Extremely concerned
Priority Level
  1. Not a priority
  2. Low priority
  3. Medium priority
  4. High priority
  5. Существенный
Level of Problem
  1. Not at all a problem
  2. Minor problem
  3. Moderate problem
  4. Serious problem
Effect on X
  1. No effect
  2. Minor effect
  3. Нейтральный
  4. Moderate effect
  5. Major effect
Level of Consideration
Level of Support/Opposition
  1. Strongly oppose
  2. Somewhat oppose
  3. Нейтральный
  4. Somewhat favor
  5. Strongly favor
Level of Probability
  1. Not probable
  2. Somewhat improbable
  3. Нейтральный
  4. Somewhat probable
  5. Very probable
Level of Agreement
  1. Категорически не согласен
  2. Не согласен
  3. Neither agree or disagree
  4. Agree
  5. Полностью согласен
Level of Desirability
  1. Very undesirable
  2. Undesirable
  3. Нейтральный
  4. Desirable
  5. Very desirable
Level of Participation
Frequency – 5 point
Частота
Частота использования
  1. Никогда
  2. Больше никогда
  3. Occasionally/Sometimes
  4. Almost every time
  5. Каждый раз
Frequency – 7 point
  1. Никогда
  2. Rarely, in less than 10% of the chances when I could have
  3. Occasionally, in about 30% of the chances when I could have
  4. Sometimes, in about 50% of the chances when I could have
  5. Frequently, in about 70% of the chances when I could have
  6. Usually, in about 90% of the chances I could have.
  7. Каждый раз
Amount of Use
  1. Никогда не использовать
  2. Больше никогда
  3. Occasionally/Sometimes
  4. Almost every time
  5. Frequently use
Level of Familiarity
  1. Not at all familiar
  2. Slightly familiar
  3. Somewhat familiar
  4. Moderately familiar
  5. Extremely familiar
Level of Awareness
  1. Not at all aware
  2. Slightly aware
  3. Somewhat aware
  4. Moderately aware
  5. Extremely aware
Level of Difficulty
Вероятность
  1. Extremely unlikely
  2. Unlikely
  3. Нейтральный
  4. Likely
  5. Extremely likely
Level of Detraction
Good / Bad
Барьеры
  1. Not a barrier
  2. Somewhat of a barrier
  3. Moderate barrier
  4. Extreme barrier
Level of Satisfaction – 5 point
  1. Very dissatisfied
  2. Dissatisfied
  3. Unsure
  4. Satisfied
  5. Very satisfied
Level of Satisfaction – 5 point
  1. Not at all satisfied
  2. Slightly satisfied
  3. Moderately satisfied
  4. Very satisfied
  5. Extremely satisfied
Level of Satisfaction – 7 point
  1. Completely dissatisfied
  2. Mostly dissatisfied
  3. Somewhat dissatisfied
  4. Neither satisfied or dissatisfied
  5. Somewhat satisfied
  6. Mostly satisfied
  7. Completely satisfied
Level of Quality – 5 point
Comparison of Two Products
  1. Much worse
  2. Somewhat worse
  3. About the same
  4. Somewhat better
  5. Much better
Level of Responsibility
  1. Not at all responsible
  2. Somewhat responsible
  3. Mostly responsible
  4. Completely responsible
Level of Influence
  1. Not at all influential
  2. Slightly influential
  3. Somewhat influential
  4. Very influential
  5. Extremely influential

Vagias, Wade M. (2006). Likert-type scale response anchors. Clemson International Institute for Tourism & Research Development, Department of Parks, Recreation and Tourism Management. Clemson University.


Смотреть видео: Análise Exploratória para Dados com Escala Likert (May 2022).