Приложение 3. Стандартизованные шкалы в психологии. Шкала стенов


Измерительные шкалы

Существует 4 основных типа измерительных шкал.

Номинативная шкала - это шкала, классифицирующая по названию: потеп (лат.) - имя, название. Название же не измеряется количественно, оно лишь позволяет отличить один объект от другого или одного субъекта от другого. Номинативная шкала - это способ классификации объектов или субъектов, распределения их по ячейкам классификации.

Простейший случай номинативной шкалы - дихотомическая шкала, состоящая всего лишь из двух ячеек, например: "имеет братьев и сестер - единственный ребенок в семье"; "иностранец - соотечественник"; "проголосовал "за" - проголосовал "против"" и т.п.

Признак, который измеряется по дихотомической шкале наименований, называется альтернативным. Он может принимать всего два значения. При этом исследователь зачастую заинтересован в одном из них, и тогда он говорит, что признак "проявился", если тот принял интересующее его значение, и что признак "не проявился", если он принял противоположное значение. Например: "Признак леворукости проявился у 8 испытуемых из 20". В принципе номинативная шкала может состоять из ячеек "признак проявился - признак не проявился".

Более сложный вариант номинативной шкалы - классификация из трех и более ячеек, например: "экстрапунитивные - интрапунитивные - импунитивные реакции" или "выбор кандидатуры А - кандидатуры Б - кандидатуры В - кандидатуры Г" или "старший - средний - младший -единственный ребенок в семье" и др.

Расклассифицировав все объекты, реакции или всех испытуемых по ячейкам классификации, мы получаем возможность от наименований перейти к числам, подсчитав количество наблюдений в каждой из ячеек.

Как уже указывалось, наблюдение - это одна зарегистрированная реакция, один совершенный выбор, одно осуществленное действие или результат одного испытуемого.

Допустим, мы определим, что кандидатуру А выбрали 7 испытуемых, кандидатуру Б - 11, кандидатуру В - 28, а кандидатуру Г - всего 1. Теперь мы можем оперировать этими числами, представляющими собой частоты встречаемости разных наименований, то есть частоты принятия признаком "выбор" каждого из 4 возможных значении. Далее мы можем сопоставить полученное распределение частот с равномерным или каким-то иным распределением.

Таким образом, номинативная шкала позволяет нам подсчитывать частоты встречаемости разных "наименований", или значений признака, и затем работать с этими частотами с помощью математических методов.

Единица измерения, которой мы при этом оперируем - количество наблюдений (испытуемых, реакций, выборов и т. п.), или частота. Точнее, единица измерения - это одно наблюдение. Такие данные могут быть обработаны с помощью метода χ2, биномиального критерия m и углового преобразования Фишера φ*.

Порядковая шкала (ранговая)- это шкала, классифицирующая по принципу "больше - меньше". Если в шкале наименований было безразлично, в каком порядке мы расположим классификационные ячейки, то в порядковой шкале они образуют последовательность от ячейки "самое малое значение" к ячейке "самое большое значение" (или наоборот). Ячейки теперь уместнее называть классами, поскольку по отношению к классам употребимы определения "низкий", "средний" и "высокий" класс, или 1-й, 2-й, 3-й класс, и т.д.

В порядковой шкале должно быть не менее трех классов, например "положительная реакция - нейтральная реакция - отрицательная реакция" или "подходит для занятия вакантной должности - подходит с оговорками - не подходит" и т. п.

В порядковой шкале мы не знаем истинного расстояния между классами, а знаем лишь, что они образуют последовательность. Например, классы "подходит для занятия вакантной должности" и "подходит с оговорками" могут быть реально ближе друг к другу, чем класс подходит с оговорками" к классу "не подходит".

От классов легко перейти к числам, если мы условимся считать, что низший класс получает ранг 1, средний класс - ранг 2, а высший класс - ранг 3, или наоборот. Чем больше классов в шкале, тем больше. У нас возможностей для математической обработки полученных данных и проверки статистических гипотез.

Например, мы можем оценить различия между двумя выборками испытуемых по преобладанию у них более высоких или более низких рангов или подсчитать коэффициент ранговой корреляции между двумя переменными, измеренными в порядковой шкале, допустим, между оценками профессиональной компетентности руководителя, данными ему разными экспертами.

Все психологические методы, использующие ранжирование, построены на применении шкалы порядка. Если испытуемому предлагается упорядочить 18 ценностей по степени их значимости для него, проранжировать список личностных качеств социального работника или 10 претендентов на эту должность по степени их профессиональной пригодности, то во всех этих случаях испытуемый совершает так называемое принудительное ранжирование, при котором количество рангов соответствует количеству ранжируемых субъектов или объектов (ценностей, качеств и т.п.).

Независимо от того, приписываем ли мы каждому качеству или испытуемому один из 3-4 рангов или совершаем процедуру принудительного ранжирования, мы получаем в обоих случаях ряды значении, измеренные по порядковой шкале. Правда, если у нас всего 3 возможных класса и, следовательно, 3 ранга, и при этом, скажем, 20 ранжируемых испытуемых, то некоторые из них неизбежно получат одинаковые ранги. Все многообразие жизни не может уместиться в 3 градации, поэтому в один и тот же класс могут попасть люди, достаточно серьезно различающиеся между собой. С другой стороны, принудительное ранжирование, то есть образование последовательности из многих испытуемых, может искусственно преувеличивать различия между людьми. Кроме того, данные, полученные в разных группах, могут оказаться несопоставимыми, так как группы могут изначально различаться по уровню развития исследуемого качества, и испытуемый, получивший в одной группе высший ранг, в другой получил бы всего лишь средний, и т.п.

Выход из положения может быть найден, если задавать достаточно дробную классификационную систему, скажем, из 10 классов, или градаций, признака. В сущности, подавляющее большинство психологических методик, использующих экспертную оценку, построено на измерении одним и тем же "аршином" из 10, 20 или даже 100 градаций разных испытуемых в разных выборках.

Итак, единица измерения в шкале порядка - расстояние в 1 класс или в 1 ранг, при этом расстояние между классами и рангами может быть разным (оно нам неизвестно). К данным, полученным по порядковой шкале, применимы все описанные в данной книге критерии и методы.

Интервальная шкала - это шкала, классифицирующая по принципу "больше на определенное количество единиц - меньше на определенное количество единиц". Каждое из возможных значений признака отстоит от другого на равном расстоянии.

Можно предположить, что если мы измеряем время решения задачи в секундах, то это уже явно шкала интервалов. Однако на самом деле это не так, поскольку психологически различие в 20 секунд между испытуемым А и Б может быть отнюдь не равно различию в 20 секунд между испытуемыми Б и Г, если испытуемый А решил задачу за 2 секунды, Б - за 22, В - за 222, а Г - за 242.

Аналогичным образом, каждая секунда после истечения полутора минут в опыте с измерением мышечного волевого усилия на динамометре с подвижной стрелкой, по "цене", может быть, равна 10 или даже более секундам в первые полминуты опыта. "Одна секунда за год идет" - так сформулировал это однажды один испытуемый.

Попытки измерять психологические явления в физических единицах - волю в секундах, способности в сантиметрах, а ощущение собственной недостаточности - в миллиметрах и т. п., конечно, понятны, ведь все-таки это измерения в единицах "объективно" существующего времени и пространства. Однако ни один опытный исследователь при этом не обольщает себя мыслью, что он совершает измерения по психологической интервальной шкале. Эти измерения принадлежат по-прежнему к шкале порядка, нравится нам это или нет.

Можно с определенной долей уверенности утверждать лишь, что испытуемый А решил задачу быстрее Б, Б быстрее В, а В быстрее Г.

Аналогичным образом, значения, полученные испытуемыми в баллах по любой нестандартизованной методике, оказываются измеренными лишь по шкале порядка. На самом деле равно интервальными можно считать лишь шкалы в единицах стандартного отклонения и процентильные шкалы, и то лишь при условии, что распределение значений в стандартизующей выборке было нормальным.

Принцип построения большинства интервальных шкал построен на известном правиле "трех сигм": примерно 97,7-97,8% всех значений признака при нормальном его распределении укладываются в диапазоне М±3δ. Можно построить шкалу в единицах долей стандартного отклонения, которая будет охватывать весь возможный диапазон изменения признака, если крайний слева и крайний справа интервалы оставить открытыми (подробнее об этом будет сказано позже).

Р.Б. Кеттелл предложил, например, шкалу стенов - "стандартной десятки". Среднее арифметическое значение в "сырых" баллах принимается за точку отсчета. Вправо и влево отмеряются интервалы, равные 1/2 стандартного отклонения. На Рис. 2 представлена схема вычисления стандартных оценок и перевода "сырых" баллов в стены по шкале N 16-факторного личностного опросника Р. Б. Кеттелла.

Рис. 2. Схема вычисления стандартных оценок (стенов) по фактору N 16- факторного личностного опросника Р. Б. Кеттелла; снизу указаны интервалы в единицах 1/2 стандартного отклонения

Справа от среднего значения будут располагаться интервалы, равные 6, 7, 8, 9 и 10 стенам, причем последний из этих интервалов открыт. Слева от среднего значения будут располагаться интервалы, равные 5, 4, 3, 2 и 1 стенам, и крайний интервал также открыт. Теперь мы поднимаемся вверх, к оси "сырых баллов", и размечаем границы интервалов в единицах "сырых" баллов. Поскольку М=10,2; δ=2,4, вправо мы откладываем 1/2δ т.е. 1,2 "сырых" балла. Таким образом, граница интервала составит: (10,2 + 1,2) = 11,4 "сырых" балла. Итак, границы интервала, соответствующего 6 стенам, будут простираться от 10,2 до 11,4 баллов. В сущности, в него попадает только одно "сырое" значение - 11 баллов. Влево от средней мы откладываем 1/2δ и получаем границу интервала: 10,2-1,2=9. Таким образом, границы интервала, соответствующие 9 стенам, простираются от 9 до 10,2. В этот интервал попадают уже два "сырых" значения - 9 и 10. Если испытуемый получил 9 "сырых" баллов, ему начисляется теперь 5 стенов; если он получил 11 "сырых" баллов - 6 стенов, и т. д.

Мы видим, что в шкале стенов иногда за разное количество "сырых" баллов будет начисляться одинаковое количество стенов. Например, за 16, 17, 18, 19 и 20 баллов будет начисляться 10 стенов, а за 14 и 15 - 9 стенов и т. д.

В принципе, шкалу стенов можно построить по любым данным, измеренным по крайней мере в порядковой шкале, при объеме выборки п>200 и нормальном распределении признака2.

Другой способ построения равно интервальной шкалы - группировка интервалов по принципу равенства накопленных частот. При нормальном распределении признака в окрестности среднего значения группируется большая часть всех наблюдений, поэтому в этой области среднего значения интервалы оказываются меньше, уже, а по мере удаления от центра распределения они увеличиваются, (см. Рис. 3). Следовательно, такая процентильная шкала является равно интервальной только относительно накопленной частоты.

Рис. 3. Процентильная шкала; сверху для сравнения указаны интервалы в единицах стандартного отклонения

Построение шкал равных интервалов по данным, полученным по шкале порядка, напоминает трюк с веревочной лестницей, на который ссылался С. Стивенс. Мы сначала поднимаемся по лестнице, которая ни на чем не закреплена, и добираемся до лестницы, которая закреплена. Однако каким путем мы оказались на ней? Измерили некую психологическую переменную по шкале порядка, подсчитали средние и стандартные отклонения, а затем получили, наконец, интервальную шкалу. Как отмечал Стивенс "Такому нелегальному использованию статистики может быть дано известное прагматическое оправдание; во многих случаях оно приводит к плодотворным результатам".

Многие исследователи не проверяют степень совпадения полученного ими эмпирического распределения с нормальным распределением, и тем более не переводят получаемые значения в единицы долей стандартного отклонения или процентили, предпочитая пользоваться "сырыми" данными. "Сырые" же данные часто дают скошенное, срезанное по краям или двухвершинное распределение. На Рис. 4 представлено распределение показателя мышечного волевого усилия на выборке из 102 испытуемых. Распределение с удовлетворительной точностью можно считать нормальным (χ2=12,7 при v=9, М=89,75, δ= 25,1).

Рис. 4 Гистограмма и плавная кривая распределения показателя мышечного волевого усилия (n=102)

На Рис. 5 представлено распределение показателя самооценки по шкале методики Дж. Менестера - Р.Корзини "Уровень успеха, которого я должен был достичь уже сейчас" (n=356). Распределение значимо отличается от нормального

(χ2 =58,8, при v=7; p<0,01; М=80,64; δ=16,86).

Рис. 5. Гистограмма и плавная кривая распределения показателя должного успеха (n=356).

С такими "ненормальными" распределениями приходится встречаться очень часто, чаще, может быть, чем с классическими нормальными. И дело здесь не в каком-то изъяне, а в самой специфике психологических признаков. По некоторым методикам от 10 до 20% испытуемых получают оценку "ноль" - например, в их рассказах не встречается ни одной словесной формулировки, которая отражала бы мотив "надежда на успех" или "боязнь неудачи" (методика Хекхаузена). То, что испытуемый получил оценку "ноль", нормально, но распределение таких оценок не может быть нормальным, как бы мы ни увеличивали объем выборки

Шкала отношений

Шкалу отношений называют также шкалой равных отношений. Особенностью этой шкалы является наличие твердо фиксированного нуля, который означает полное отсутствие какого-либо свойства или признака Шкала отношений является наиболее информативной шкалой, допускающей любые математические операции и использование разнообразных статистических методов.

Шкала отношений по сути очень близка интервальной, поскольку если строго фиксировать начало отсчета, то любая интервальная шкала превращается в шкалу отношений

Именно в шкале отношений производятся точные и сверхточные измерения в таких науках, как физика, химия, микробиология и др. Измерение по шкале отношений производятся и в близких к психологии науках, таких, как психофизика, психофизиология, психогенетика.

Очевидно, что все измерения должны проводиться на определенном материале. И здесь следует остановиться на основных определениях, относящихся к понятию Выборка.

Генеральная совокупность — это все множество объектов, в отношении которого формулируется исследовательская гипотеза.

Выборка — это ограниченная по численности группа объектов (в психологии — испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств. Соответственно, изучение на выборке свойств генеральной совокупности называется выборочным исследованием. Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

Репрезентативность выборки — иными словами, ее представительность — это способность выборки представлять изучаемые явления достаточно полно—с точки зрения их изменчивости в генеральной совокупности.

Стратифицированная выборка, или отбор по свойствам генеральной совокупности (разделение выборки на «страты». Он предполагает предварительное определение тех качеств, которые могут влиять на изменчивость изучаемого свойства (это может быть пол, уровень дохода или образования и т. д.).

Статистическая достоверность, или статистическая значимость, результатов исследования определяется при помощи методов статистического вывода, которые предъявляют определенные требования к численности, или объему выборки.

studfiles.net

16 Стандартизация шкалы измерений

Стандартизация шкалы - линейное преобразование масштаба нормальной шкалы в стандартную шкалу, позволяющую сравнивать между собой показатели разных тестов (субшкал одного теста) в едином масштабе. Стандартные шкалы основаны на модели нормального распределения и описываются двумя параметрами значением среднего и стандартного отклонения. Неполный перечень основных СШ:

Шкала стенов: среднее=5.5; станд.откл=2; пример теста - 16PFКеттела

Т-шкала: среднее=50; станд.откл=10; пример теста - MMPI

IQ: среднее=100; станд.откл=15; пример теста - IQ Айзенка

Наряду с определением места индиви­дуального результата в стандартном распределении групповых данных введение стандартной шкалы направлено и на достижение другой важнейшей цели — обеспечение сопоставимости количественных результатов раз­личных тестов, выраженных в стандарт­ных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе.

Применение стандартных шкал позволяет использовать более грубые, приближенные способы проверки типа распределения тесто­вых баллов

Применение стандартных шкал необходимо для соотнесения ре­зультатов по разным тестам, для построения «диагностических про­филей» по батарее тестов и тому подобных целей.

17. Репрез-ть как крит качества теста и правила её обесп-я при реконстр-ии и адапт тестов Репрезентативность (соотв-е нормам тестирования) - свойство выборочной совок людей, т.е. группы или ряда групп, на основе анализе качеств которых разраб тест, представлять ГС всех лиц, облад подобными типологич хар-ми.

Тест репрез тогда, когда исп-ная при его разраб выборка обоснована и присущ ей хар-ки достат равномерно распред в ГС. Репрез-ть позвол классиф-ть резулты тестирования (напр, выдел высок, сред и низк Ур-ни соц компетентности). Если тест нерепрез-н, то предлаг им оценки выраж-ти свойств будут непримен за пределами выборки.

Репрез-ть отраж в норме теста, предст собой "сред ур-нь разв большой совок людей, похожих на данного исп-го по ряду соц-демогр хар-к". С репрез-ю теста связ его адаптированность. Если репрез-ть хар-т равномерность распредя исследх качеств и усредн-ть оценок тестирования, учит показатели во всей «большой», ГС, то адаптир-ть означ учет национальных (в т.ч. соц) и региональных особенностей при исп-ии тестов, их критич переосмысление в свете этих особенностей. При исп-ии тестов, разраб в иной соц-культ среде, в проверке и переоценке нуждаются нормы, валидность и надежность тестов и даже их применимость в целом. Проблема адапт-ти тестов особенно остро встала в послед годы в связи с широк заимствованием западных тестовых методик и попытками их прямого (без внесения необх корректив) исп-я. Неадапт-ое, без внесения сущ-ных поправок, исп-ние подобных тестов в соврем усл-х явно неправомерно.

18.Наиболее распространённые стандартные шкалы измерений в психодиагностике

Психодиагностическая шкала – количественная модель измеряемого диагностического свойства. Для сравнения между собой показателей одного и того же испытуемого по разным шкалам используют стандартные тестовые шкалы (шкала стенов, Т-шкала, IQ).

Шкальное значение отражает истинное значение лишь с определенной точностью. Диагностические шкалы подразделяют по типам, предусмотренным в математической теории измерения: шкала наименований (номинальная шкала), шкала порядка, шкала интервалов.

В психодиагностике используются несколько типов стандартных шкал, позволяющих сравнивать между собой показатели разных тестов(субшкал одного теста) в едином масштабе. Как правило, стандартные шкалы основаны на модели нормального распределения и описываются двумя параметрами значением среднего и стандартного (или среднеквадратического) отклонения. Перевод в стандартную шкалу проводится путем процедуры стандартизации.

Под стандартизацией шкалы понимают линейное преобразование масштаба нормальной (или искусственно нормализованной) шкалы.

К основным стандартным шкалам относятся:

1)     Т-шкала: М = 50 и σ = 10. Пример использования – тест MMPI  и его русскоязычные адаптации (стандартная шкала со следующими параметрами: среднее = 50, стандартное отклонение = 10.

2)     Шкала  IQ: М = 100 и σ = 15. Пример использования - IQ Айзенка.

3)     Шкала стенов: М = 5,5 и σ = 2. Пример использования – 16-факторный опросник Кетелла.Стандартная шкалаот 1 до 10 со следующими параметрами: среднее = 5,5, стандартное отклонение = 2. Сокращение от английского «стандартная десятка» (standardten).

Применение стандартных шкал необходимо для соотнесения ре­зультатов по разным тестам, для построения «диагностических про­филей» по батарее тестов и тому подобных целей.

studfiles.net

Приложение 3. Стандартизованные шкалы в психологии

Стандартизация данных, полученных с помощью той или иной психологической методики — это процесс создания стандартных тестовых шкал или стандартизованных шкал. Основные цели стандартизации: а) сравнение результатов полученных по одной и той же методике в разных условиях и/или разными исследователями; б) сравнение результатов данного испытуемого с выборкой стандартизации. Выборка стандартизации — это группа испытуемых, на которой собираются статистические данные по методике. Эта выборка не должна быть малого объема (рекомендуется не менее 200 человек) и обязательно должна быть репрезентативна генеральной совокупности, то есть должна отражать ее основные характеристики. В результате стандартизации и создаются тестовые нормы. Впоследствии при тестировании предполагается, что выборка стандартизации и тестируемый принадлежат одной и той же генеральной совокупности.

При условии нормального распределения первичных данных приведение различных методик к единой шкале осуществляется путем построения шкалы стандартных значений или стандартизованной шкалы. Стандартизованная шкала отражает место любого значения признака хiв общей совокупности данных, измеряя его отклонение от среднего арифметического значенияв единицах стандартного отклонения. Для этого осуществляетсяZ-преобразование первичных данных по следующей формуле:

где zi— стандартизованная величина дляxi

xi— первичный результат

— среднее арифметическое значение первичных результатов

σх— стандартное отклонение первичных результатов

Для стандартизованных величин в любых шкалах всегда среднее арифметическое значение =0 стандартное отклонение σz=1.Z-шкала относится к интервальным шкалам: единицей измерения в этой шкале является стандартное отклонение. В такую шкалу можно преобразовать любые первичные данные.

Недостатком стандартизованных Z-шкал является наличие в них отрицательных значений. Этот недостаток преодолевается переходом к другим, более удобным в обращении шкалам, которые строятся путем преобразования стандартизованных данных.

Для интервальных шкал допустимо преобразование следующего типа: z'=az+b, где всегдаa>0. В этом уравнении а иb— любые действительные числа, выбор которых определяется исключительно лишь удобством работы со шкалой. Такие шкалы называютсяпреобразованными стандартизованнымиилинормализованными шкалами. В психодиагностических методиках в качестве этих констант часто выбирают желательные параметры распределений в нормализованных шкалах (в качествеbподставляют стандартное отклонение, в качестве а — среднее арифметическое значение нормализованных данных).

Приведем примеры таких шкал в психодиагностических методиках.

Тест Векслера

Тест Амтхауэра

Шкала стенов Кеттелла(например, опросники 16PFКеттелла, МИС. УСК и т. п.)

Шкала стенайнов Гилфорда

Шкала Т-баллов(например, опросникиMMPI,CPI, САТ, ГТ и т. п.)

В руководстве по конструированию тестов, принятом Американской психологической ассоциацией, указывается, что типичным преобразованием ненормализованных стандартных показателе (то есть z-показателей) должно быть их приведение к шкале со следующими параметрами: среднее арифметическое 50 (это будет константаb) и стандартное отклонение 10 (константа а).

На рисунке показано соотношение кривой нормального распределения и наиболее распространенных в методиках нормализованных шкал.

Рис. Кривая нормального распределения и тестовые показатели.

Распределение оценок многих стандартизированных педагоги­ческих и психологических тестов апроксимируется формой нормальной кривой, показанной в верхней части этого рисунка. Ниже представлены некоторые шкалы, разработанные для упрощения интерпретации оценок путем преобразования их в числа, кото­рые указывают относительное положение тестируемых в группе стандартизации (выборка испытуемых, на которой проводится исследование с целью сбора статистического материала и определения статистической нормы).

Нуль (0) в центре базовой линии показывает положение средней арифметической первичных («сырых») оценок теста, а символ σ (сигма) размечает шкалу «сырых» оценок в единицах стандартного отклонения.

Накопленные проценты являются основой шкалы «процентильный эквивалент».

Некоторые шкалы основаны на единице стандартного отклонения. Среди этих шкал — стандартная z-оценка, Т-оценка, стены (10-балльная шкала) и стенайны (9-балльная шкала), оценка уровня развития интеллекта IQ — представляют собой шкалы, применяющиеся во множестве тестов.

Таблицы норм, либо в виде процентилей, либо в форме стан­дартной оценки, имеют значение только для конкретного теста, при­мененного к определенной выборке стандартизации. Диаграмма не позволяет сде­лать вывод о том, например, что процентильный ранг 84 по одному тесту обязательно эквивалентен z-оценке +1,0 для другого теста, это справедливо лишь в том случае, когда каждый тест непременно имеет нормальное распределение оценок и когда обе шкалы осно­ваны на идентичных или очень похожих группах людей.

studfiles.net

Определение: шкала стенов | Distanz.ru – сетевая система обучения

Все лекции по предмету

Подпишитесь на бесплатную рассылку видео-курсов:

Текст лекции

2. Во втором случае (два индивидуальных профиля), ранжируются индивидуальные значения, полученные каждым из 2-х испытуемым по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Например, невозможно проранжировать показатели по личностному опроснику Кеттелла (16PF), если они выражены в "сырых" баллах, поскольку по разным факторам диапазоны значений различны: от 0 до 13, от 0 до 20 и от 0 до 26. Мы не можем сказать, какой из факторов будет занимать первое место по выраженности, пока не приведем все значения к единой шкале (чаще всего это шкала стенов). Если индивидуальные иерархии двух испытуемых связаны положительно, то признаки, имеющие низкие ранги у одного из них, будут иметь низкие ранги и у другого, и наоборот. Например, если у одного испытуемого фактор E (доминантность) имеет самый низкий ранг, то и у другого испытуемого он должен иметь низкий ранг, если у одного испытуемого фактор C (эмоциональная устойчивость) имеет высший ранг, то и другой испытуемый должен иметь по этому фактору высокий ранг и т.д.3. В третьем случае (два групповых профиля), ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. В дальнейшем линия рассуждений такая же, как и в предыдущих двух случаях.4. В четвертом случае (индивидуальный и групповой профили), ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого. Он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили.Вычисление коэффициента ранговой корреляции Спирмена. Коэффициент ранговой корреляции Спирмена находится по формуле где di – разность рангов для каждой i–пары из N наблюдений.

www.distanz.ru

Нелинейная стандартизация

Применяется в том случае, если линейная нормализация либо затруднительна, либо невозможна. В этом случае, перевод «сырых» оценок в стандартные, производится через нахождение процентильных границ групп в исходном «сыром» распределении, соответствующих процентильным границам групп в нормальном распределении стандартной шкалы. Каждому интервалу стандартной шкалы ставится в соответствие такой интервал шкалы «сырых» оценок, который содержит ту же процентную долю выборки стандартизации. Величины долей определяются по площади под нормальной кривой, заключенной между соответствующими данному интервалу стандартной шкалы z - оценками.

Пример:

  1. Шкала стенов.

Шкала стенов имеет выраженность от 1 до 10 баллов, с =5,5, =2.

Если стоит задача определения того, какой «сырой» балл соответствует стену 10, необходимо вначале выяснить, какому z – значению соответствует этот стен.

 
 

 

1 5,5 10

Рисунок 1: шкала стенов.

 

Расстояние между Хср и стеном 10 составляет 2×σ (Хср+2×σ=5,5+2×2=9,5)

 

 
 

-4 0 +4

Рисунок 2: шкала z – преобразования, где Хср=0, σ=1.

Тогда, для определения z – значения, соответствующего стену 10 мы определяем расстояние между Хср и z – значением, по формуле : z = Хср+2×σ. Если для шкалы z – преобразования Хср=0, а σ=1, то формула высчитывается следующим образом:

Z=Хср+2×σ=о+2×1=2.

 
 

 

 

-4 -2 0 +2 +4

Рисунок 3: шкала z – преобразования.

Затем по таблице приложения 1 определяем, какому значению соответствует найденная z. z =0,0228.

 
 

1,00 (100%)

 

 
 

 

0,0233

0,0228 Z

-4 -2 0 +1,99 +2 +4

Рисунок 4: кривая нормального распределения с соответствующими z - оценками.

Затем, по таблице приложения 1, определяем, какая процентная доля площади под кривой нормального распределения находится правее найденного z – значения (0,0228). Эта процентная доля находится путем нахождения z – значения, меньшего найденного (2). Это z – значение равно 1,99. Соответствующая процентная доля равна 0,023 или 2,3%. Затем мы выстраиваем «сырые» значения от наименьшего до наибольшего и находим «сырое» значение, которое разграничивает 2,3% наибольших «сырых» значений выборки испытуемых. Найденное значение и будет соответствовать границе между 9 и 10 стеном.

  1. Шкала стенайнов.

Шкала стенайнов отражает процентные доли распределения испытуемых, получивших баллы по какой – либо методике.

Таблица 1

Шкала стенайнов

 

Для построения шкалы стенайнов, вначале, все «сырые» значения испытуемых выстраиваются от наименьшего до наибольшего. Сперва, выбирается 4% испытуемых, которые получили наименьшее количество баллов по методике. Тот балл, который является самым высоким среди всех значений 4% испытуемых становится границей между 4% и 7% выборки, и приобретает 1 стенайн. Затем, из оставшейся выборки мы берем 7% испытуемых с наименьшими значениями по методике. Максимальный балл среди этих испытуемых становится границей между 7% и 12% выборки, и приобретает 2 стенайн. И так далее.

 

 

studopedya.ru

Стандартизация данных и стандартизованные шкалы в психологии

Стандартизация данных, полученных с помощью той или иной психологической методики — это процесс создания стандартных тестовых шкал или стандартизованных шкал. Основные цели стандартизации: а) сравнение результатов полученных по одной и той же методике в разных условиях и/или разными исследователями; б) сравнение результатов данного испытуемого с выборкой стандартизации. Выборка стандартизации — это группа испытуемых, на которой собираются статистические данные по методике. Эта выборка не должна быть малого объема (рекомендуется не менее 200 человек) и обязательно должна быть репрезентативна генеральной совокупности, то есть должна отражать ее основные характеристики. В результате стандартизации и создаются тестовые нормы. Впоследствии при тестировании предполагается, что выборка стандартизации и тестируемый принадлежат одной и той же генеральной совокупности.

При условии нормального распределения первичных данных приведение различных методик к единой шкале осуществляется путем построения шкалы стандартных значений или стандартизованной шкалы. Стандартизованная шкала отражает место любого значения признака хiв общей совокупности данных, измеряя его отклонение от среднего арифметического значенияв единицах стандартного отклонения. Для этого осуществляетсяZ-преобразование первичных данных по следующей формуле:

где zi— стандартизованная величина дляxi

xi— первичный результат

—среднее арифметическое значение первичных результатов

σх— стандартное отклонение первичных результатов

Для стандартизованных величин в любых шкалах всегда среднее арифметическое значение =0 стандартное отклонение σz=1.Z-шкала относится к интервальным шкалам: единицей измерения в этой шкале является стандартное отклонение. В такую шкалу можно преобразовать любые первичные данные.

Недостатком стандартизованных Z-шкал является наличие в них отрицательных значений. Этот недостаток преодолевается переходом к другим, более удобным в обращении шкалам, которые строятся путем преобразования стандартизованных данных.

Для интервальных шкал допустимо преобразование следующего типа: z'=az+b, где всегдаa>0. В этом уравнении а иb— любые действительные числа, выбор которых определяется исключительно лишь удобством работы со шкалой. Такие шкалы называютсяпреобразованными стандартизованнымиилинормализованными шкалами. В психодиагностических методиках в качестве этих констант часто выбирают желательные параметры распределений в нормализованных шкалах (в качествеbподставляют стандартное отклонение, в качестве а — среднее арифметическое значение нормализованных данных).

Приведем примеры таких шкал в психодиагностических методиках.

Тест Векслера

Тест Амтхауэра

Шкала стенов Кеттелла(например, опросники 16PFКеттелла, МИС. УСК и т. п.)

Шкала стенайнов Гилфорда

Шкала Т-баллов(например, опросникиMMPI,CPI, САТ, ГТ и т. п.)

В руководстве по конструированию тестов, принятом Американской психологической ассоциацией, указывается, что типичным преобразованием ненормализованных стандартных показателе (то есть z-показателей) должно быть их приведение к шкале со следующими параметрами: среднее арифметическое 50 (это будет константаb) и стандартное отклонение 10 (константа а).

На рисунке 7 показано соотношение кривой нормального распределения и наиболее распространенных в методиках нормализованных шкал.

Рис. 16. Кривая нормального распределения и тестовые показатели.

Распределение оценок многих стандартизированных педагоги­ческих и психологических тестов апроксимируется формой нормальной кривой, показанной в верхней части этого рисунка. Ниже представлены некоторые шкалы, разработанные для упрощения интерпретации оценок путем преобразования их в числа, кото­рые указывают относительное положение тестируемых в группе стандартизации (выборка испытуемых, на которой проводится исследование с целью сбора статистического материала и определения статистической нормы).

Нуль (0) в центре базовой линии показывает положение средней арифметической первичных («сырых») оценок теста, а символ σ (сигма) размечает шкалу «сырых» оценок в единицах стандартного отклонения.

Накопленные проценты являются основой шкалы «процентильный эквивалент».

Некоторые шкалы основаны на единице стандартного отклонения. Среди этих шкал — стандартная z-оценка, Т-оценка, стены (10-балльная шкала) и стенайны (9-балльная шкала), оценка уровня развития интеллекта IQ — представляют собой шкалы, применяющиеся во множестве тестов.

Таблицы норм, либо в виде процентилей, либо в форме стан­дартной оценки, имеют значение только для конкретного теста, при­мененного к определенной выборке стандартизации. Диаграмма не позволяет сде­лать вывод о том, например, что процентильный ранг 84 по одному тесту обязательно эквивалентен z-оценке +1,0 для другого теста, это справедливо лишь в том случае, когда каждый тест непременно имеет нормальное распределение оценок и когда обе шкалы осно­ваны на идентичных или очень похожих группах людей.

Контрольные вопросы:

1. О чем свидетельствует такой параметр как мода?

2. Методика КОТ (Краткий отборочный тест) позволяет оценить интеллектуальный потенциал человека и принять решение, например, о приеме на работу. В методических указаниях рекомендуется пользоваться медианными нормами. Максимально возможный диапазон значений интеллектуального потенциала в методике от 0 до 50 баллов. О чем свидетельствует значение испытуемого, равное 35, если медиана равна 29?

3. Тест Равенна позволяет получить оценку невербального интеллекта человека как общую сумму баллов по методике (количество правильных ответов по всем сериям). Для интерпретации результата испытуемого в детском варианте методики рекомендуется пользоваться квартилями, полученными на выборке стандартизации (таблицы 10 и 11).

Таблица 10

studfiles.net

Метод линейной стандартизации.

Этот метод обычно используется в тех случаях, когда распределение сырых баллов соответствует нормальному. Напомним из курса математической статистики, что нормальное распределение является хорошим приближением распределения большого числа наблюдений, которые зависят от множества независимых факторов. Поскольку многие психические свойства в своих проявлениях действительно зависят от множества независимых факторов, закон нормального распределения широко применяется в психологических исследованиях.

Нормальное распределение обладает многими преимуществами, в частности оно позволяет заранее рассчитать, сколько случаев будет расположено в определенном удалении от средней арифметической ( ) при использовании для определения удаленности стандартного отклонения (σ). Для этого имеются специальные таблицы. Из них видно, что в пределах ±σ находится 68% изучаемых случаев. За этими пределами находится 32% случаев, а так как распределение симметрично, то по 16% с каждой стороны. В диапазон ±3σ попадает более 99% наблюдений. Известная из закона нормального распределения связь значний признака с его частотой (или вероятностью) используется в нелинейной стандартизации тестов. Линейная стандартизация выполняется ещё проще с использованием элементарных линейных преобразований исходной шкалы сырых баллов. Эти преобразования всего лишь меняют точку начала отсчета и масштаб шкалы.

Эти преобразования можно разбить на два этапа. Сначала осуществляется переход от сырых баллов к стандартизованным оценкам (выраженным в масштабе единичного нормального распределения со средним M = 0 и стандартным отклонением σ = 1) по формуле:

,

В этой формуле zi– стандартизованная оценка для i-того испытуемого, xi– оценка того же испытуемого в сырых баллах, – среднее шкалы сырых баллов в выборке стандартизации , Sx– стандартное отклонение шкалы сырых баллов.

Стандартизованные оценки удобны тем, что от них легко можно перейти к любой стандартной шкале распространенной в психологической диагностике: шкале стэнов, шкале станайнов, шкале Т-оценок и т.д. Поэтому на втором этапе осуществляется переход к произвольной шкале (с тем средним и стандартным отклонением, которые желает получить психолог) с помощью формулы:

,

где yi– оценка i-того испытуемого в некоторой стандартной шкале (например, шкале стэнов), zi– стандартизованная оценка для i-того испытуемого, M – среднее значение выбранной стандартной шкалы, s – стандартное отклонение данной шкалы.

Из последней формулы ясно, что всего две величины – среднее значение M и стандартное отклонение s – задают стандартную шкалу, определяя точку начала отсчета и её масштаб. Эти величины могут быть выбраны произвольно, однако чаще всего используется одна из традиционных шкал с привычными для психологов значениями M и s. К их числу можно отнести следующие стандартные шкалы:

1. Шкала IQ (М = 100, s = 15). Пример: тест Векслера.

2. Т-шкала Маккола (М = 50, s = 10). Эта шкала представляет собой стандарт Американской психологической ассоциации. Пример: Миннесотский многоаспектный личностный опросник (MMPI).

3. Шкала стенов (М = 5,5; s = 2). Пример: Шестнадцатифакторный личностный опросник Кэттелла (16PF).

4. Шкала станайнов (М = 5, s = 2). Пример: Фрайбургский личностный опросник (FPI).

Так, например, в русской адаптации теста MMPI, которая называется стандартизированный многофакторный метод исследования личности (СМИЛ) используется Т-шкала Маккола. Соответственно, переход от сырых баллов к стандартным оценкам для каждой шкалы СМИЛ осуществляется по формуле:

.

Здесь xi– сырые баллы полученные испытуемым по некоторой шкале, – среднее значение по данной шкале, полученное на выборке стандартизации и приведенное в руководстве к тесту, S - стандартное отклонение по данной шкале, полученное на выборке стандартизации, 50 – среднее значение Т-шкалы, 10 – стандартное отклонение Т-шкалы. Чтобы воспользоваться этой формулой для перевода сырых баллов в стандартные достаточно знать (среднее шкалы сырых баллов в выборке стандартизации) и S (стандартное отклонение шкалы сырых баллов в выборке стандартизации), которые должны быть приведены в руководстве к тесту.

Таким образом, в простейшем случае, для осуществления линейной стандартизации теста достаточно провести тест на выборке стандартизации, рассчитать средние значения и стандартные отклонения для разных половозрастных групп, выбрать стандартную шкалу с общепринятыми значениями М и s и привести все эти данные в руководстве к тесту. Если это выполнено, то психолог, использующий тест сможет самостоятельно перейти от сырых баллов испытуемых к стандартным. Однако, ввиду сложности вычислений для упрощения перевода сырых баллов в шкальные оценки разрабатываются так называемые конверсионные таблицы.

Конверсионные таблицы составляются для разных половозрастных групп и показывают соответствие сырых баллов стандартным. Если предполагается разработка конверсионной таблицы, то разумно выбрать такую стандартную шкалу, размах которой значительно меньше размаха сырых баллов. По этой причине, на практике чаще всего выбирают шкалу стэнов и шкалу станайнов.

Рассмотрим разработку конверсионной таблицы методом линейной стандартизации на примере. Предположим, что некоторый новый опросник опросник из 20 вопросов был проведен на выборке из 80 испытуемых юношей 18-22 лет. Составим конверсионную таблицу, позволяющую перейти от сырых баллов к стэнам. В ходе обработки результатов диагностики было установлено, что среднее значение в шкале сырых баллов = 10; стандартное отклонение S = 5,5. Запишем в первый столбец таблицы все возможные значения в шкале сырых баллов (см. табл. 1).

Таблица 1

Сырые баллы xi - Zi 2´Zi 5,5+2´Zi Стэн
-10 -1,82 -3,64 1,86
-9 -1,64 -3,27 2,23
-8 -1,45 -2,91 2,59
-7 -1,27 -2,55 2,95
-6 -1,09 -2,18 3,32
-5 -0,91 -1,82 3,68
-4 -0,73 -1,45 4,05
-3 -0,55 -1,09 4,41
-2 -0,36 -0,73 4,77
-1 -0,18 -0,36 5,14
0,00 0,00 5,50
0,18 0,36 5,86
0,36 0,73 6,23
0,55 1,09 6,59
0,73 1,45 6,95
0,91 1,82 7,32
1,09 2,18 7,68
1,27 2,55 8,05
1,45 2,91 8,41
1,64 3,27 8,77
1,82 3,64 9,14

Для каждого значения рассчитаем разность xi- (второй столбец) и, чтобы получить Ziразделим полученные разности на S (третий столбец). Чтобы перейти к стэнам умножим каждое значение ziна стандартное отклонение в шкале стэнов, т.е. на 2 (четвертый столбец). Прибавив к полученным значениям 5,5 (среднее в шкале стэнов) и округлив до целых, мы перейдем стэнам. Для удобства значения сырых баллов соответствующие одному и тому же стэну следует сгруппировать. Итоговая конверсионная таблица представлена в табл. 2.

 

Таблица 2

Сырые баллы Стэн
0 - 1
2 - 4
5 - 7
8 - 9
10 - 12
13 - 15
16 - 18
19 - 20

 

Описанный выше способ стандартизации является универсальным, т.е. применимым для любых стандартных шкал. В том случае, если в качестве стандартной шкалы выбрана шкала стэнов процедуру составления конверсионной таблицы можно упростить. Известно, что один стэн охватывает интервал соответствующий половине стандартного отклонения (т.е. 0,5S), а нижняя граница шестого стэна (равная 5,5) соответствует среднему выборочному значению в шкале сырых баллов. Это значит, что для определения нижней границы седьмого стэна (и, одновременно, верхней границы шестого) необходимо к среднему прибавить половину стандартного отклонения. Для предыдущего примера она составит 10 + 0,5´5,5 = 12,75. Это значит, что в шестой стэн попадают значения от 10 и до 12,75. В этот интервал попадает три возможных значения шкалы сырых баллов: 10, 11 и 12.

Верхняя граница седьмого стэна (и нижняя граница восьмого стэна) вычисляется прибавлением к его нижней границе 0,5S, т.е., в нашем случае, 12,75 + 0,5´5,5 = 15,5. Это значит, что в седьмой стэн попадут значения 13, 14 и 15. Верхняя граница восьмого стэна равна 15,5 + 0,5´5,5 = 18,25, т.е. в него попадают значения 16, 17 и 18. Верхняя граница девятого стэна равна 18,25 + 0,5´5,5 = 21 и в него попадают значения 19 и 20.

Определить нижнюю границу пятого, четвертого и др. стэнов можно путем вычитания 0,5S от границы следующего по величине стэна. Рассчитаем эти границы для нашего примера. Для пятого стэна она равна 10-0,5´5,5 = 7,25, т.е. в него попадают значения 8 и 9. Для четвёртого – 7,25-0,5´5,5 = 4,5, в него попадают значения 5, 6 и 7. Для третьего стэна – 4,5-0,5´5,5 = 1,75. В этот стэн попадают значения 2, 3, 4. Второй стэн имеет нижнюю границу, равную 1,75-0,5´5,5 = -1. В него попадают два значения сырых баллов – 0 и 1.

Таким образом, мы рассчитали границы каждого стэна, которые можно было бы свести в общую таблицу. Эта таблица окажется полностью идентичной таблице 2, которую мы получили применяя другой способ линейной стандартизации.

Дата добавления: 2015-07-10; просмотров: 516 | Нарушение авторских прав

Требования к организации диагностики | Этические нормы психодиагностической деятельности | Понятие о дифференциальной психометрии | Основы классической эмпирико-статистической теории теста | Основы стохастической теории тестов (IRT) | Надежность теста | Надежность по внутренней согласованности. | Ретестовая надежность. | Дискриминативность | Валидность |mybiblioteka.su - 2015-2018 год. (0.06 сек.)

mybiblioteka.su