Надежность как одна из основных характеристик теста. Виды надежности

11.10.2023

Надежность и валидность

Прежде чем психодиагностические методики могут быть использованы для практических целей, они должны пройти проверку по ряду формальных критериев, доказывающих их высокое качество и эффективность. Эти требования в психодиагностике складывались годами в процессе работы над тестами и над их совершенствованием. К числу основных критериев оценки психодиагностических методик относятся надежность и валидностъ. Большой вклад в разработку этих понятий внесли зарубежные психологи (А. Анастази, Е. Гизелли, Дж. Гилфорд, Л, Кронбах, Р. Торндайк, Е, Хаген и др.). Ими были разработаны как формально-логический, так и математико-статнетический аппарат (прежде всего, корреляционные метод и факторный анализ) обоснования степени соответствия методик отмеченным критериям

В традиционной тестологии термин надежность означает относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Повторное применение надежных методик дает сходные оценки. При этом в определенной мере могут совпадать как сами результаты, так и порядковое место (ранг), занимаемое испытуемым в группе. И в том, и в другом случае при повторении опыта возможны некоторые расхождения, но важно, чтобы они были незначительными, в пределах одной группы. Таким образом, можно сказать, что надежность методики - это такой критерий, который говорит о точности психологических измерений, т.е. позволяет судить о том, насколько внушают доверие полученные результаты.

Степень надежности методик зависит от многих причин. Поэтому важной проблемой практической диагностики является выяснение факторов, снижающих точность измерений. Среди них наиболее часто называются следующие:

1) нестабильность диагностируемого свойства;

2) несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечетко сформулированы указания по предъявлению методики испытуемым и т.д.);

3) меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т.д.);

4) различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т.д.);

5) колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом - утомление и т.д.);

6) элементы субъективности в способах оценки и интерпретации результатов (при протоколировании ответов испытуемых, при оценивании ответов по степени полноты, оригинальности и т.п.).

Одним из важнейших средств повышения надежности психодиагностической методики является единообразие процедуры обследования, его строгая регламентация: одинаковые для обследуемой выборки испытуемых обстановка и условия работы, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с испытуемыми, порядок предъявления заданий и т.д. При такой стандартизации процедуры исследования можно существенно уменьшить влияние посторонних случайных факторов на результаты теста и таким образом повысить их надежность.

На характеристику надежности методик большое влияние оказывает исследуемая выборка. Она может как снижать, так и завышать этот показатель. Например, надежность может быть искусственно завышена, если в выборке небольшой разброс результатов, т.е. если результа-ты по своим значениям близки друг к другу. В этом случае при повторном обследовании новые результаты также расположатся тесной группой. Возможные изменения ранговых мест испытуемых будут незначительными, и, следовательно, надежность методики будет высокой. Такое же неоправданное завышение надежности может возникнуть при анализе результатов выборки, состоящей из группы, имеющей очень высокие результаты, и из группы с очень низкими оценками по тесту. Тогда эти далеко отстоящие друг от друга результаты не будут перекрываться, даже если и вмешаются в условия эксперимента случайные факторы. Поэтому в руководстве обычно делается описание выборки, на которой определялась надежность методики. В настоящее время надежность все чаще определяется на наиболее однородных выборках, т.е. на выборках, схожих по полу, возрасту, уровню образования, профессиональной подготовке и т.п. Для каждой такой выборки приводятся свои коэффициенты надежности. Приводимый показатель надежности применим только к группам, подобным тем, на которых он определялся. Если методика применяется к выборке, отличающейся от той, на которой проверялась ее надежность, то эта процедура должна быть проведена заново.

Разновидностей надежности методик так же много, как и условий, влияющих на результаты диагностических испытаний. Однако практическое применение находят лишь несколько видов надежности.

Так как все виды надежности отражают степень согласованности двух независимо полученных рядов показателей, то математико-статистический прием, с помощью которого устанавливается надежность методики, - это корреляции (по Пирсону или Спирмену). На-дежность тем выше, чем ближе полученный коэффициент корреляции подходит к единице, и наоборот.

К.М. Гуревич предложил толковать надежность как:

1) надежность самого измерительного инструмента;

2) стабильность изучаемого признака;

3)константность, т.е. относительную независимость результатов от личности экспериментатора.

Показатель, характеризующий измерительный инструмент, предлагается называть коэффициентом надежности; показатель, характеризующий стабильность измеряемого свойства, - коэффициентом стабильности; а показатель оценки влияния личности экспериментатора - коэффициентом константности.

Именно в таком порядке рекомендуется осуществлять проверку методики: целесообразно сначала проверить инструмент измерения; если полученные данные удовлетворительны, то можно переходить к установлению меры стабильности измеряемого свойства; после этого, при необходимости, можно заняться критерием константности.

Определение надежности измерительного инструмента. От того, как составлена методика, насколько правильно подобраны задания с точки зрения их взаимосогласованности, насколько она однородна, зависят точность, объективность любого психологического измере-ния. Внутренняя однородность методики показывает, что ее задания актуализируют одно и то же свойство, признак.

Для проверки надежности измерительного инструмента, говорящего о его однородности (или гомогенности), используется так называемый метод расщепления. Обычно задания делятся на четные и нечетные, обрабатываются отдельно, а затем результаты двух полученных рядов коррелируются между собой. Для применения этого способа нужно поставить испытуемых в такие условия, чтобы они смогли успеть решить (или попытаться решить) все задания. Если методика однородна, то большой разницы в успешности решения по таким половинкам не будет, и, следовательно, коэффициент корреляции будет достаточно высоким.

Можно делить задания и другим путем. Например, можно сопоставить первую половину теста со второй, первую и третью четверть со второй и четвертой и т.п. Однако расщепление на четные и нечетные задания представляется самым целесообразным, поскольку именно этот способ наиболее независим от влияния таких факторов, как врабатываемость, тренировка, утомление и пр.

Методика признается надежной, когда полученный коэффициент не ниже 0,75-0,85. Лучшие по надежности тесты дают коэффициенты порядка 0,90 и более.

Но на начальном этапе разработки диагностической методики можно получить невысокие коэффициенты надежности, например, порядка 0,46-0,50. Это означает, что в разрабатываемой методике присутствует некоторое число заданий, которые в силу своей специ-фичности ведут к снижению коэффициента корреляции. Такие задания необходимо специально проанализировать и либо переделать их, либо вообще изъять.

Чтобы легче было установить, за счет каких заданий снижаются коэффициенты корреляции, необходимо проанализировать таблицы с выписанными данными, подготовленными для корреляций. Следует отметить, что любые изменения в содержании методики - изъятие заданий, их перестановка, переформулировка вопросов или ответов - требуют заново высчитывать коэффициенты надежности.

При ознакомлении с коэффициентами надежности не следует забывать, что они зависят не только от правильного подбора заданий с точки зрения их взаимосогласованности, но и от социально-психологической однородности той выборки, на которой проверялась надежность измерительного инструмента.

В заданиях могут встретиться понятия, малоизвестные одной части испытуемых, но хорошо известные другой части. От того, как много в методике таких понятий, будет зависеть и коэффициент надежности; задания с такими понятиями могут случайно расположиться и в четной, и в нечетной половине теста. Очевидно, показатель надежности не следует приписывать только методике как таковой, и нельзя уповать на то, что он будет неизменным, с какой бы вы-боркой ни проводилось тестирование.

Определение стабильности изучаемого признака. Определить надежность самой методики - это не значит решить все вопросы, связанные с ее применением. Нужно еще установить, насколько устойчив, стабилен признак, который исследователь намерен измерять. Было бы методологической ошибкой рассчитывать на абсолютную стабильность психологических признаков. В том, что измеряемый признак со временем меняется, нет ничего опасного для надежности. Все дело в том, в каких пределах варьируются результаты от опыта к опыту у одного и того же испытуемого, не приводят ли эти колебания к тому, что испытуемый по непонятным причинам оказывается то в начале, то в середине, то в конце выборки. Сделать какие-то конкретные выводы об уровне представленности измеряемого признака у такого испытуемого нельзя. Таким образом, колебания признака не должны иметь непредсказуемый характер. Если не ясны причины, по которым происходит резкое колебание, то такой признак не может быть использован в диагностических целях.

Для проверки стабильности диагностируемого признака, свойства используется прием, известный под названием тест-ретест. Он заключается в повторном обследовании испытуемых с помощью той же методики. О стабильности признака судят по коэффициенту корреляции между результатами первого и второго обследования. Он будет свидетельствовать о сохранении или не сохранении каждым испытуемым своего порядкового номера в выборке.

На степень устойчивости, стабильности диагностируемого свойства влияют разнообразные факторы. Число их достаточно велико. Важно соблюдать требования единооб-разия процедуры проведения эксперимента. Так, например, если первое тестирование проводилось в утренние часы, то и повторное должно быть проведено утром; если первый опыт сопровождался предварительным показом заданий, то и при повторном испытании это условие также должно быть соблюдено и т.д.

При определении стабильности признака большое значение имеет промежуток времени между первым и вторым обследованием. Чем короче срок от первого до второго испытания, тем (при прочих равных условиях) больше шансов, что диагностируемый признак сохранит уровень первого испытания. С увеличением временного интервала стабильность признака имеет тенденцию снижаться, так как возрастает число посторонних факторов, влияющих на нее. Следовательно, напрашивается вывод, что целесообразно проводить повторное тестирование через короткий срок после первого. Однако тут есть свои сложности: если срок между первым и вторым опытом небольшой, то некоторые испытуемые могут воспроизвести свои прежние ответы по памяти и, таким образом, отойдут от смысла выполнения заданий. В этом случае результаты двух предъявлений методики уже нельзя рассматривать как независимые.

Трудно четко ответить на вопрос, какой срок можно считать оптимальным для повторного эксперимента. Только исследователь, исходя из психологической сущности методики, условий, в которых она проводится, особенностей выборки испытуемых, может определить этот срок. При этом такой выбор должен быть научно обоснован. В тестологической литературе наиболее часто называются временные интервалы в несколько месяцев (но не более полугода). Важно помнить, что коэффициент стабильности не следует рассматривать только с его узко формальной стороны, по его абсолютным значениям. Если методика исследует свойство, которое в период диагностирования находится в процессе интенсивного развития (например умение проводить обобщения), то коэффициент стабильности может оказаться невысоким, но это не следует истолковывать как недостаток методики. Такой коэффициент стабильности должен интерпретироваться как показатель определенных изменений, развития исследуемого свойства. Совсем другое требование предъявляется к коэффициенту стабильности, если автор методики считает, что измеряемое свойство уже сформировано и должно быть достаточно устойчивым. Коэффициент стабильности в этом случае должен быть достаточно высоким (не ниже 0,80).

Таким образом, вопрос о стабильности измеряемого свойства решается не всегда однозначно. Решение зависит от сущности самого диагностируемого свойства.

Определение константности, т.е. относительной независимости результатов от личности экспериментатора. Коэффициент константности определяется путем корреляции результатов двух опытов, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными экспериментаторами. Коэффициент корреляции не должен быть ниже 0,80.

Превращение психодиагностических процедур и техник в надежный инструмент науки и практики зависит от усилий многих специалистов по психометрической отладке, конструированию тестов, удовлетворяющих основным психометрическим требовованиям: надежности, валидности, стандартизации. Основные принципы проверки и определения надежности, конструирования и валидизации психодиагностических методик освещены в ряде специальных работ по психодиагностике (А. Анастази, А. Бодалси, В. Столин, А. Шмелев, К. Гуревич, В. Мельников и др.). В данном учебном пособии мы опишем базовые понятия и принципы проведения психодиагностического обследования, знание которые является непременным условием профессиональной квалификации практического психолога.

Психодиагностика как научная дисциплина включает три области психологического знания:

предметную область психологии, изучающую данные психические явления;

психометрику – науку об измерении индивидуальных различий и диагностируемых переменных;

практическое использование психологического знания в целях адекватного психологического воздействия и оказания помощи людям в решении их проблем.

Методологической основой психодиагностики выступает психометрика. Именно эта наука разрабатывает технологию создании конкретных психодиагностических методик и определяет методологию обеспечения научных требований к ним:

надежности – внутренней согласованности частей теста и воспроизводимости результатов при повторном тестировании;

валидности – отражения в результатах теста именно того свойства, для диагностики которого он предназначен;

достоверности – защищенности теста от влияния на результаты стремления испытуемого изменить их в желательную сторону;

репрезентативности – наличия норм результатов массового обследования в популяции, на которую рассчитан тест, позволяющих оценить степень отклонения от средних значений любого индивидуального показателя.

Эти психометрические требования относятся к разным группам тестов, при этом в наибольшей степени – к объективным тестам и личностным опросникам, в наименьшей – к проективным техникам.

Оъективная оценка психологических методик и тестов означает определение их надежности. В психометрии термин «надежность» всегда означает согласованность показателей, полученных у тех же самых испытуемых.

Насколько пригоден данный тест? Действительно ли он выполняет свои функции? Эти вопросы могут вызывать и иногда вызывают длительные бесплодные дискуссии. Предубеждения, субъективные выводы, личные пристрастия приводят, как считает А. Анастази, с одной стороны, к переоценке возможностей конкретного теста, а с другой – к упорному его неприятию. Единственный способ ответить на подобные вопросы – эмпирическая проверка. Объективная оценка психологических тестов прежде всего означает определение их надежности и валидности в конкретных ситуациях.

Надежность теста есть согласованность показателей, полученных у тех же самых испытуемых при повторном тестировании тем же самым тестом или эквивалентной его формой.

Если у ребенка IQ в понедельник равен 110, а в пятницу – 80, то очевидно, что к такому показателю вряд ли можно отнестись с доверием. Аналогично, если индивид в ряду из 50 слов правильно определил 40, а в другом считающемся эквивалентным ряду – 20, то ни один из этих показателей не может рассматривается в качестве меры его вербального понимания. Разумеется, в обоих примерах возможно, что ошибочным является только один из двух показателей, но это может подтвердить лишь последующее тестирование; из приведенных данных следует только то, что вместе показатели не могут быть правильными.

Прежде чем психологический тест станет общим достоянием, необходимо провести тщательную объективную проверку его надежности. Надежность может проверяться относительно временных изменений, выбора конкретных заданий или тестовой выборки индивидуальности экспериментатора или специалиста по обработке тестовых показателей и других аспектов тестирования. Очень важно точно указать тип надежности и способ ее определения, поскольку один и тот же тест может изменяться в различных аспектах. Желательно также иметь сведения о численности и особенностями индивидов, на которых проверялась надежность теста.

Такая информация позволит пользующемуся тестом решить, насколько надежен этот тест для той группы, к которой он собирается его применить.

Наиболее полное объяснение надежности тестовых методик дает А. Анастази. Под надежностью понимается согласованность результатов теста, получаемых при повторном его применении к тем же испытуемым в различные моменты времени, с использованием разных наборов эквивалентных заданий или при изменении других условий обследования. На надежности основывается вычисление ошибки измерения, которая служит для указания вероятных пределов колебаний измеряемой величины, возникающих под действием посторонних случайных факторов. В самом широком смысле надежность показывает, в какой степени индивидуальные различия в тестовых результатах оказываются «истинными», а в какой могут быть приписаны случайным ошибкам. Если перевести это на язык специальных терминов, то измерение надежности теста позволяет оценить величину общей дисперсии тестовых показателей, являющуюся дисперсией ошибки. Вопрос, однако, состоит в том, что считать дисперсией ошибки. Одни и те же факторы, которые применительно к одним задачам являются посторонними, при решении других проблем уже считаются источниками «истинных» различий. Например, если нас интересуют колебания настроения, то происходящие день ото дня изменения в результатах теста эмоционального состояния могли относиться к цели тестирования и, следовательно, к истинной дисперсии результатов. Но если тест предназначен для измерения более стабильных характеристик личности, то те же ежедневные колебания можно отнести к дисперсии ошибки.

Существенно то, что любые изменения условий, в которых проводится тест, если они не имеют отношения к его цели, увеличивают дисперсию ошибки. Поэтому, придерживаясь единых условий тестирования (контролируя общую обстановку, временные ограничения, инструктирование испытуемого, контакт с ним и другие аналогичные факторы), экспериментатор уменьшает дисперсию ошибки и повышает надежность теста. Но и в оптимальных условия ни один тест не является абсолютно надежным инструментом. По этому стандартный набор данных о тесте должен включать в себя и меру надежности. Такая мера характеризует тест, когда он применяется в стандартных условиях и проводится с испытуемыми, похожими на тех, кто участвовал в нормативной выборке. Следовательно, необходимо также приводить сведения об этой выборке.

К. М. Гуревич определяет надежность как «крайне сложное и многоплановое понятие, одна из основных функций которого – оценить постоянство показателей тестовых испытаний» [Гуревич, 1981].

В принципе можно сказать, что надежность должна обосновывать ошибку измерения – она должна показывать, какая часть изменчивости показателей ошибочна. Известно несколько основных факторов, определяющих уровень надежности. Так, надежность всегда будет иметь тенденцию к увеличению, если соблюдается постоянство условий проведения процедуры тестирования, так как это снижает ошибку вариабельности измеряемого параметра. В то время многочисленность целей, сложность проблемы, изменчивость ситуаций, как правило, увеличивают ошибку измерения, уменьшая тем самым надежность.

Разновидностей надежности теста так же много, как и условий, влияющих на результаты теста, поэтому любые такие условия могут оказаться посторонними по отношению к цели, и тогда

обусловленная ими дисперсия должна войти в дисперсию ошибки. Однако практическое применение находит лишь несколько типов надежности. Поскольку все типы надежности отражают степень последовательности или согласованности двух независимо полученных серий показателей, то в качестве их меры может выступать коффециент корреляции. Более специальное обсуждение корреляции с подробным описанием вычислительных процедур приводится в учебниках по статистике для педагогов и психологов (В. Аванесов, А. Гусев, Ч. Измайлов, М. Михалевская и др.).

Hа практике используются три основных метода оценкинадежности тестов:

1) повторное тестирование;

2) параллельное тестирование;

3) метод расщепления.

Рассмотрим каждый из них в отдельности.

Повторное тестирование Является одним из основных методов измерения надежности. Повторное

тестирование выборки испытуемых проводится одним и тем же тестом через определенный интервал времени при одинаковых условиях. Повторное тестирование обычно называют ретестом, а надежность, измеренную таким способом, – ретестовой надежности. Схема оценки ретестовой надежности имеет вид:

В этом случае за индекс надежности принимается коэффициент корреляции между результатами двух тестирований.

Метод повторного тестирования обладает как достоинствами, так и недостатками. К числу достоинств относятся естественность и простота определения коэффициента надежности. К недостаткам следует отнести неопределенность в выборе интервала между двумя измерениями. Возникновение временной неопределенности связано с тем, что повторное тестирование отличается от первичного. Испытуемые уже знакомы с содержанием теста, помнят свои первоначальные ответы и ориентируются на них при повторном выполнении теста. Поэтому при повторном тестировании нередко наблюдается или «подгонка» под первоначальные результаты, или как следствие негативизма демонстрация «новых» результатов. Во избежание этого, приводя в руководстве к тесту его ретестовую надежность, следует указывать, какому интервалу времени она соответствует. В связи с тем что ретестовая надежность уменьшается с ростом временного интервала, наиболее доверительными являются высокие коэффициенты надежности, полученные при явно больших интервалах между тестированиями. Недостаточно высокие коэффициенты надежности могут быть следствием неоптимального определения временных интервалов.

Параллельное тестирование В этом случае многократность измерения организуется с помощью параллельных, или эквивалентных, тестов. Параллельными называются тесты, которые с одинаковой ошибкой измеряют одно и то же свойство психики. В этом случае одни и те же лица выполняют несколько вариантов одного и того же теста или эквивалентные тесты. Как правило, практическое использование данного типа надежности связано со значительными затруднениями, поскольку крайне сложно построить несколько вариантов одного теста таким образом, чтобы испытуемый не мог обнаружить их психологическую однородность. Да и искажающее влияние тренировки в этом случае не полностью снято. Кроме того, возникает вопрос: являются ли альтернативные типы надежности характеристиками именно надежности теста, а не параметрами эквивалентности испытаний? Ведь если две формы испытания проводятся при однотипных константных условиях, то, вероятнее всего, исследуются показатели эквивалентности двух форм тестирования, а не показатели надежности самих тестов. Ошибка измерения в этом случае определяется флюктуациями выполнения теста, а не флюктуациями структуры теста.

Схема использования параллельных тестов для измерения на дежности имеет вид:

Рассчитанный между двумя тестами коэффициент корреляции называется эквивалентной надежностью.

Метод расщепления Он является развитием метода параллельного тестирования и базируется на допущении о параллельности не только отдельных форм теста, но и отдельных заданий внутри одного теста. Это одна из наиболее простых проверок теста, когда вычисляется коэффициент корреляции между его половинами. Каким же образом поделить тест на две половины, чтобы иметь возможность выровнять обе половины по тому или иному конкретному основанию? Чаще всего задачи теста делят на чет-нечет, что позволяет в какой-то мере устранить возможные недостатки. Главное достоинство этого типа надежности состоит в независимости результатов тестирования от таких элементов деятельности, как врабатывание, тренировка, практика, утомление и т.д. При разделении теста на две части индекс надежности вычисляется по формуле Спирмена-Брауна, предложивших ее независимо друг от друга. Их статьи были опубликованы в одном и том же номере психологического журнала с выводами и формулами [Аванесов, 1982]. В их формуле

R (х, 0=2 RJ\ + R, у

где R – коэффициент корреляции двух половин теста. В качестве коэффициента индекса надежности рассматривается средний модуль коэффициента корреляции всех заданий теста или средний коэфициент детерминации.

Итак, мы рассмотрели три эмпирических метода оценки надежности тестов: повторное тестирование одним и тем же тестом, повторное тестирование параллельной формой теста и расщепление теста.

Какой из этих методов дает истинную оценку надежности теста? Каким из методов следует пользоваться? Ответ на этот вопрос зависит от личной симпатии и целей исследования.

При использовании метода повторного тестирования получаем оценку степени устойчивости результатов во времени и в зависимости от условий тестирования. Поэтому ретестовый коэффициент надежности называют также коэффициентом устойчивости или стабильности теста. При использовании метода параллельных форм и метода расщепления оценивается степень взаимной согласованности частей теста. Поэтому коэффициенты надежности, полученные этими двумя методами, интерпретируются как покачен и гомогенности, однородности тестов.

Помимо показателей устойчивости и гомогенности, Р. Б. Кэттелл считает необходимым рассматривать показатель переносимосmu (transferability). Он представляет собой оценку способности тес та сохранять точность измерения в разных выборках, субкультурах и популяциях. Совместно устойчивость, гомогенность и переносимость образуют комплексную характеристику надежности, которую Р. Б. Кэттелл называет постоянством (consistency) и определяет как «степень, в которой тест продолжает предсказывать то, что он однажды предсказал, несмотря на изменения (в определенных пределах): а) объема, в котором тест применялся; б) условий, в которых он применялся; в) состава выборки, в которой он применяется».

Наконец, существует тип надежности, непосредственно имеющий отношение к надежности лица, проводящего тестовое испытание. Оценка надежности лица, проводящего тест, получается с помощью независимого моделирования испытания двумя различными экспериментаторами.

Надежность результатов тестирования зависит не только от надежности самого теста и процедуры его проведения. Важным фактором, влияющим на результаты интерпретации данных, является специфика конкретной выборки. Наиболее существенными характеристиками выборки, с этой точки зрения, следует признать социально-психологическую однородность по разным параметрам; учитываются также возраст и пол.

Последовательность действий при проверке надежности А. Г. Шмелев предлагает провести следующим образом [Общая психодиагностика, 1987]:

1. Узнать, существуют ли данные о надежности теста, предлагаемого к использованию, на какой популяции и в какой диагностической ситуации проводилась проверка. Если проверки не было или признаки новой популяции и ситуаций явно специфичны, провести заново проверку надежности с учетом указанных ниже возможностей.

2. Если позволяют возможности, то произвести повторное тестирование на всей выборке стандартизации и подсчитать все коэффициенты, приведенные как для целого теста, так и для отдельных пунктов. Анализ полученных коэффициентов поможет понять, насколько пренебрежима ошибка измерения.

3. Если возможности ограничены, произвести повторное тестирование только на части выборки (не менее 30 испытуемых), подсчитать вручную ранговую корреляцию для оценки внутренней

согласованности (методом расщепления) и стабильности целого теста.

Безусловно, рассмотренные понятия психодиагностики – ее важнейшие атрибуты. Однако высокие показатели надежности сами по себе не определяют практическую ценность теста. Ведущий фактор, который позволяет измерить целевые результаты психологического тестирования, – валидность.

Надёжность как устойчивость

Устойчивость результатов теста или ретестовая надежность (англ - test-retest reliability) – возможность получения одинаковых результатов у испытуемых в различных случаях.

Устойчивость определяется с помощью повторного тестирования (ретеста) :

В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,5. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Еще один недостаток повторного тестирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

В связи с выше сказанным применяется исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. При этом испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

Надёжность как внутренняя согласованность

Внутренняя согласованность (англ. - internal consistency) определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты, разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.

Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно "узкую" переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.

Для проверки внутренней согласованности применяются:

Метод расщепления или метод автономных частей
Метод эквивалентных бланков

Метод расщепления (Split-half reliability)

Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.

Метод эквивалентных бланков

МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине) Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.

Альфа Кронбаха

В этом методе, предложенном Ли Кронбахом , сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же общего основания. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.

Вычисление Кронбаха

Кронбаха определяется как

где - число элементов в шкале, - дисперсия общего тестового балла, и - дисперсия элемента .

Альтернативный способ вычисления выглядит следующим способом:

где N - число элементов в шкале, - средняя дисперсия для выборки, - среднее значение для всех ковариаций между компонентами выборки.

В настоящее время Кронбаха считают при помощи SPSS , STATISTICA и других современных статистических пакетов, возможно и при помощи Microsoft Excel

Значение Кронбаха

Альфа Кронбаха в целом будет возрастать по мере увеличения взаимных корреляций переменных, и, поэтому, считается маркёром внутренней согласованности оценки достоверности результатов тестов. Так как максимальное взаимные корреляции между переменными по всем пунктам присутствуют, если измеряется одно и то же, альфа Кронбаха косвенно указывает на степень того, насколько все пункты измеряют одно и то же. Таким образом, альфа наиболее целесообразно использовать, когда все пункты направлены на измерение одного и того же явления, свойства, феномена. Однако, следует заметить, что высокое значение коэффициента указывает на наличие общего основания у набора вопросов, но не говорит о том, что за ними стоит один единственный фактор - одномерность шкалы следует подтверждать дополнительными методами Когда измеряют гетерогенную структуру, альфа Кронбаха часто будет низким. Таким образом, альфа не подходит для оценки надежности умышленно гетерогенной инструментов (например, для оригинала MMPI , в данном случае имеет смысл проводить отдельные измерения для каждой шкалы).

Считается, что профессионально разработанные тесты должны иметь внутреннюю согласованность на уровне не менее 0.90.

Коэффициент альфа может применяться и для решения другого типа задач. Так, с его помощью можно измерять степень согласованности экспертов, оценивающих тот или иной объект, стабильность данных при многократных измерениях и т.д

Теоретическое основание Кронбаха

Альфа Кронбаха может быть рассмотрено как расширение Кьюдера-Ричардсона-20 , которая является эквивалентом для работы с дихотомиями или переменными, принимающих только два значения (например, ответы истинно/ложно).

Α Кронбаха теоретически связана с формулой прогнозирования Спирмана-Брауна . И обе эти формулы вытекают из классической теорией теста , заключающийся в том, что достоверность результатов тестирования может быть выражена как отношение дисперсий истинной и общей оценок (ошибки и истинной оценки).

См. также

Помимо надежности тестов, есть так же надежность наблюдения – межнаблюдательская надежность. МН – это процент совпадения результатов наблюдения экспертов друг с другом.

Надежность и валидность

Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.

Литература

Пол Клайн. "Справочное руководство по конструированию тестов", Киев, 1994.

Ссылки

Надёжность тестов в книге В.С.Кима "Тестирование учебных достижений"

Wikimedia Foundation . 2010 .

Необходимыми материальными и техническими средствами обеспечения эффективного усвоения студентами дисциплин являются :

А) типовое учебное помещение (комната, кабинет, аудитория), укомплектованное стандартной учебной мебелью (партами и стульями), имеющее типовое, функционально необходимое электрическое освещение, имеющее стандартную меловую или типовую «маркеровую» учебную доску и обычное мультимедийное проекционное оборудование;

Б) библиографические источники из списка основной литературы по дисциплинам, в стандартно-типовом количестве и качестве наименований на одного студента (как минимум – три наименования разноплановых библиографических источников, с минимальным расчётом – один экземпляр одного наименования на трёх студентов);

В) копировальная и множительная техника (принтер, сканер, ксерокс) с целью сканирования и тиражирования в бумажном (печатном) виде бланков, заданий и стимульных материалов к используемым тестовым психодиагностическим методикам.

Специальное (особое) материально-техническое обеспечение для успешного освоения студентами данных учебных дисциплин не требуется.

ПРИЛОЖЕНИЯ К НАСТОЯЩЕМУ ПОСОБИЮ

ПРИЛОЖЕНИЕ № 1.

«ТЕСТОВЫЕ ПРОВЕРОЧНЫЕ КОНТРОЛЬНЫЕ ВОПРОСЫ

ПО ДИСЦИПЛИНАМ ″ПСИХОДИАГНОСТИКА″ И ″ПРАКТИКУМ ПО ПСИХОДИАГНОСТИКЕ″»

1. Наука, разрабатывающая методы выявления и измерения индивидуально-психологических особенностей человека, наука и практика постановки психологического диагноза (выбор единственно правильного ответа): а) социология;б) медицина;в) педагогика;г) психодиагностика.

2. Психодиагностика – это (выбор двух правильных ответов):а) наука, изучающая индивидуально-психологические особенности человека;б) наука о принципах и способах организации научного познания человека;в) комплексная дисциплина, изучающая человека в конкретных условиях его деятельности;г) наука о закономерностях психического развития человека;д) наука, разрабатывающая методы измерения индивидуально-психологических особенностей человека.

3. Когда завершилось формирование психологической диагностики в самостоятельную область исследований(выбор единственно правильного ответа):а) 20-е гг. ХХ века;б) 40-е гг. ХХ века;в) 60-е гг. ХХ века;г) 80-е гг. ХХ века.

4. Сколько этапов выделяют в развитии отечественной психодиагностики (выбор единственно правильного ответа): а) два;б) один;в) три;г) четыре.

5. Что явилось первым диагностическим тестовым методом по форме проведения теста (выбор единственно правильного ответа):а) тесты-опросники;б) тесты-задания;в) проективные техники;г) психофизиологические методики.

6. Кто впервые использовал психодиагностические тесты-опросники (выбор единственно правильного ответа):а) Ф. Гальтон;б) Т. Рибо;в) Р. Вудвортс;г) Д. Юм.

7. Какие тесты, по содержанию, по направленности теста, первыми стали применяться в психодиагностике(выбор единственно правильного ответа):а) тесты интеллекта;б) тесты достижений;в) тесты креативности;г) личностные тесты.

8. В какого рода методиках от испытуемого требуется получить верный ответ (выбор единственно правильного ответа):а) тесты;б) анкеты;в) психофизиологические методики;г) проективные методики.

9. Единообразие проведения и обработки теста, независимость результатов теста от внутренних и внешних раздражителей, называется (выбор двух правильных ответов):а) надёжность теста;б) валидность теста;в) адаптация теста;г) стандартизация теста.

10. К проективным методикам относятся (выбор двух правильных ответов): а) тест «Прогрессивные матрицы Дж. Равенна»;б) Тематический апперцептивный тест (ТАТ) Г. Меррея и К. Моргана;в) Тест «Моторная проба К. Шварцландера»;г) Рисуночные тесты.

11. Как можно установить надёжность частей теста (выбор единственно правильного ответа):а) предложить испытуемому выполнить две равноценные части теста и сравнить результаты;б) повторно обследовать испытуемых с помощью одного и того же теста и сравнить результаты;в) предложить разным группам испытуемых разные части теста и сравнить результаты;г) предложить испытуемым выполнить основной набор заданий, а затем дополнительный набор заданий и сравнить полученные результаты.

12. Что такое статистический критерий (выбор единственно правильного ответа):а) правило принятия истинной гипотезы;б) метод расчета количества испытуемых;в) показатель наличия причинно-следственной связи между переменными;г) показатель влияния переменных на изменчивость изучаемого признака.

13. Какая измерительная шкала имеет фиксированное начало отсчета(выбор единственно правильного ответа):а) шкала отношений;б) шкала интервалов;в) шкала порядка;г) шкала наименований.

14. Какая из контрольных шкал направлена на анализ тенденции к ухудшению результатов обследования (выбор единственно правильного ответа):а) шкала валидности;б) шкала коррекции;в) шкала лжи;г) шкала вопросов.

15. Что такое выборка стандартизации (выбор единственно правильного ответа):а) группа людей, которые реально (непосредственно) подвергаются тестированию;б) группа, состоящая из людей, обладающих стандартным набором качеств;в) группа людей, к которой применяются формализованные методики;г) большая совокупность людей, относительно которой психологи-тестологи собираются делать выводы.

16. Что означает понятие «репрезентативность выборки» (выбор единственно правильного ответа):а) вероятностные свойства (конкретные параметры) данной выборки очень близки к свойствам генеральной совокупности респондентов;б) выборка ориентирована на широкую популяцию;в) выборка состоит из людей, пожелавших принять участие в исследовании;г) использование одной и той же выборки для двух разных исследований.

17. В чём, прежде всего, заключается надёжность психодиагностической тестовой методики (выбор единственно правильного ответа):а) в точности и достоверности имеющихся психологических измерений;б) в теоретической обоснованности методики;в) в единообразии проведения и оценки результатов методики;г) во внутренней однородности методики.

18. Кто автор теста интеллекта "Прогрессивные матрицы …", направленного на изучение невербального (геометрического, пространственного, графического) интеллекта (выбор единственно правильного ответа):а) Дж. Равенн;б) Дж. Гилфорд;в) Ж. Пиаже;г) К. Левин.

19. Каких субтестов нет в тесте Р. Амтхауэра, направленном на диагностику разнообразных видов интеллекта (выбор единственно правильного ответа):а) моторных (двигательных) субтестов;б) пространственных субтестов;в) числовых субтестов;г) вербальных субтестов.

20. На что направлен тест «кубиков Коса» (выбор единственно правильного ответа):а) на оценку способности к синтезу целого из частей;б) на оценку способности к формированию понятий;в) на исследование оперативной памяти;г) на оценку способности выделять существенные детали

21. Для чего применяется диагностический обучающий эксперимент (выбор единственно правильного ответа):а) для оценки интеллектуального развития;б) для оценки развития памяти;в) для оценки развития внимания;г) для оценки развития творческих способностей.

22. Кто создал первые тесты креативности (выбор единственно правильного ответа):а) Дж. Гилфорд;б) Е.П. Торранс;в) Р. Кеттелл;г) Д. Векслер.

23. Для каких сфер наиболее актуальна диагностика моторных (двигательных) способностей (выбор двух правильных ответов):а) спорт;б) профотбор;в) возрастная психология;г) медицинская психология.

24. Где, в основном, применяются тесты сенсорных способностей (выбор двух правильных ответов):а) в промышленности;б) в военном деле;в) в спорте;г) в образовании.

25. Что из названного является сущностной характеристикой эпилептоидного типа личности (выбор единственно правильного ответа):а) склонность к периодическому возникновению т.н. злобно-тоскливого настроения;б) устойчивая ориентация на нормы и ценности ближайшего окружения;в) повышенная тревожность, мнительность, склонность к сомнениям;г) повышенная впечатлительность и чувство неполноценности

26. Сколько цветов используется в тесте цветовых предпочтений (выбор единственно правильного ответа):а) восемь;б) пять;в) десять;г) двенадцать.

27. Какие личностные черты называются генерализованными, генирализированными (выбор единственно правильного ответа):а) те черты, которые характеризуются безусловным постоянством их проявлений;б) те черты, которые характеризуются эпизодичностью проявления;в) те черты, которые являются социально значимыми;г) те черты, проявление которых находится под сознательным контролем человека.

30. С какого возраста применяется тест цветовых предпочтений (выбор единственно правильного ответа):а) с 3-4 лет;б) с 1-2 лет;в) с 6-7 лет;г) с 11-12 лет.

31. Какой из способов косвенной оценки межличностных отношений не касается "личностного пространства" (выбор единственно правильного ответа):а) паралингвистические средства;б) методики наблюдения реальной ситуации;в) методики символического моделирования реальной ситуации;г) проективные средства (методики).

32. В чём состоят аутосоциометрические методики (выбор единственно правильного ответа):а) испытуемые сами "измеряют" взаимные отношения людей друг к другу и к себе;б) испытуемые сравнивают реальное и желаемое отношение людей к себе;в) испытуемые "измеряют" взаимоотношения людей с точки зрения другого человека;г) испытуемые "измеряют" свои отношения с другими людьми с точки зрения другого человека.

33. Какая сфера общения рассматривается в методике «социометрия» (выбор единственно правильного ответа):а) все сферы;б) труд;в) досуг;г) учёба.

34. Каково минимальное количество членов малой группы (выбор единственно правильного ответа):а) 2-3 человека;б) 5-6 человек;в) 8 человек;г) 10 человек.

36. В чём состоят рефрактивные (рефрактерные) техники (выбор единственно правильного ответа):а) люди оценивают свои атрибуты, не осознавая, что оценивают свою личность;б) люди оценивают свои атрибуты с точки зрения малознакомого человека;в) люди оценивают свои атрибуты с точки зрения друга;г) люди оценивают свои атрибуты с точки зрения человека, с которым он находится в неприязненных отношениях.

37. О чём говорит выбор человеком, в основном (как правило), каких-либо средних значений в разнообразных тестах-опросниках самоотношений, самооценки личностных качеств (выбор единственно правильного ответа):а) о значительном включении психозащитных процессов;б) об оптимальном уровне самопринятия;в) о низком уровне самопознания;г) о действии психологического механизма социальной желательности.

38. Какое минимальное количество альтернатив предлагается при выборе ответа в тестах-опросниках самоотношения (выбор единственно правильного ответа): а) одна;б) две;в) три;г) четыре.

39. Что такое страх, чем страх отличается от тревоги (выбор единственно правильного ответа):а) страх – это, в большинстве случаев, реакция на конкретную угрозу;б) страх - это реакция на угрозу представления о себе;в) страх - это реакция на угрозу базовым ценностям;г) страх - это ожидание неудач в социальном взаимодействии.

40. Что не относится к т.н. кратким функциональным пробам (выбор единственно правильного ответа):а) тесты-опросники;б) корректурная проба;в) таблицы Шульте;г) метод парных ассоциаций.

41. Каких психодиагностических тестов нет среди средств диагностики психических состояний личности, имеющих место «здесь и сейчас» (выбор единственно правильного ответа):а) личностные тесты;б) психофизиологические тесты;в) поведенческие тесты;г) т.н. субъективные тесты.

42. Что характерно для людей со слабой нервной системой (выбор единственно правильного ответа):а) обстоятельное выполнение заданий в строгой очередности, без перескакивания с одной операции на другую;б) умение собраться, сконцентрироваться в ответственных ситуациях;в) в шумной обстановке эффективность умственной работы не снижается;г) неудачи в деятельности мало отражаются на дальнейшей работе.

43. Что относится к формально-динамическим особенностям психического склада человека (выбор единственно правильного ответа):а) чувствительность органов чувств;б) убеждения;в) знания;г) интересы.

44. Что относится к физиологическим показателям сдвигов в функциональном состоянии человека (выбор единственно правильного ответа):а) частота сердечных сокращений;б) количество выполняемых операций за единицу времени;в) качество работы;г) скорость работы.

45. Для чего предназначена доска форм Сегена (выбор единственно правильного ответа):а) для исследования уровня умственного развития детей;б) для исследования памяти у детей;в) для исследования внимания у детей;г) для исследования пространственного восприятия у детей.

46. Что позволяет определить методика Д.Б. Эльконина "Графический диктант" (выбор единственно правильного ответа):а) умение ребенка выполнять задания взрослого, предлагаемые в устной форме;б) уровень ориентировки ребенка на заданную систему требований;в) уровень саморегуляции ребенка в интеллектуальной деятельности;г) готовность ребенка к коллективной учебной деятельности.

47. В чём состоит методика Н.И. Гуткиной по определению доминирования познавательной или игровой мотивации у ребенка (выбор единственно правильного ответа):а) ребёнка ставят в реальную ситуацию выбора - поиграть с игрушками или дослушать незнакомую сказку;б) ребёнку предлагают рассказать о его предпочтениях - игрушки или сказки;в) сравнивают время, которое ребенок по собственной инициативе играл с игрушками и слушал новую сказку;г) сравнивают, как часто ребенок обращается к игрушкам и к новым сказкам.

48. Когда проводится диагностика психологической готовности детей к школе (выбор единственно правильного ответа):а) за 3-4 месяца до поступления в школу;б) за 1 год до поступления в школу;в) за 1 месяц до поступления в школу;г) в первый месяц обучения в школе.

49. Как диагностируется степень тревожности у детей в возрасте 3,5 - 7 лет (выбор единственно правильного ответа):а) выбор ребёнком веселого или печального детского лица среди рисунков типичных для ребенка ситуаций;б) придумывание продолжения сказок с различным сюжетом;в) систематическое наблюдение за поведением ребенка в различных обстановках;г) рассказ ребенка о его обычных состояниях.

50. На какой возраст рассчитаны таблицы развития Гезелла (выбор единственно правильного ответа):а) от 4 недель до 6 лет;б) от 6 месяцев до 3 лет;в) от 5 до 10 лет;г) от 0 до 1 года.

51. По какому типу построено большинство тестов для раннего возраста, – 1 год – 3 года (выбор единственно правильного ответа):а) по типу шкал;б) по типу игровых методик;в) по типу проективных методик;г) по типу формирующего эксперимента.

52. В чём состоит отличие отечественных методик диагностики детей раннего возраста от западных (выбор единственно правильного ответа):а) в комплексном подходе к диагностике психического развития;б) в подробной диагностике отдельных сфер психики;в) в акценте на познавательной сфере ребенка;г) в акценте на двигательной активности ребёнка.

53. На какой возраст рассчитана проективная методика "Дом-дерево-человек" (выбор единственно правильного ответа):а) на все возраста;б) на детей;в) на подростков;г) на взрослых.

54. Что не является причиной различия в развитии познавательных процессов у представителей разных культур (выбор единственно правильного ответа):а) специфика самих познавательных процессов у разных народов;б) характер деятельности представителей разных сообществ;в) характер обучения у разных сообществ;г) участие в социальном взаимодействии с представителями более высокого уровня развития.

55. С чем связан запрет на свободное распространение психодиагностических методик (выбор двух правильных ответов):а) гласность в отношении содержания методики делает недейственным ее применение в будущем;б) предупреждение неправильного применения методики;в) защита авторских прав создателя методики;г) регулирование финансовых отношений в области психологической диагностики.

56. В каких источниках содержится описание методик, обеспечивающее их адекватное использование (выбор двух правильных ответов):а) инструктивные документы;б) научные сообщения (доклады, тезисы);в) справочно-методические издания;г) популярные издания.

57. Как можно устранить влияние фактора культуры на тестовые результаты (выбор единственно правильного ответа):а) полностью устранить влияние фактора культуры нельзя;б) тест должен проводить представитель той же культуры, что и испытуемые;в) проверить надежность методики в новых социокультурных условиях;г) проверить валидность методики в новых социокультурных условиях.

58. Чего нельзя сделать посредством традиционных интеллектуальных тестов (выбор единственно правильного ответа):а) произвести коррекцию интеллектуальной сферы;б) определить успешность ученика;в) классифицировать группу учащихся по уровню умственного развития;г) отобрать учеников в школы с усложненными программами.

59. Какие погрешности процедуры тестирования нельзя устранить с помощью компьютера (выбор единственно правильного ответа):а) отсутствие оптимальной мотивации испытуемых;б) несоблюдение временных стандартов выполнения тестовых заданий;в) нарушения правил инструктирования испытуемых;г) установки на определенные ответы испытуемых.

60. В какой области психологического тестирования применение компьютера не целесообразно (выбор единственно правильного ответа):а) сообщение результатов обследования;б) предъявление заданий испытуемым;в) обработка результатов;г) интерпретация результатов.

ПРИЛОЖЕНИЕ № 2.

«ПРИМЕРНЫЙ ПЕРЕЧЕНЬ КОНТРОЛЬНЫХ ВОПРОСОВ К ЗАЧЁТУ И К ДИФФЕРЕНЦИРОВАННОМУ ЗАЧЁТУ ПО ДИСЦИПЛИНАМ ″ПСИХОДИАГНОСТИКА″ И ″ПРАКТИКУМ ПО ПСИХОДИАГНОСТИКЕ″»

1. Определение, цели, задачи и предмет психодиагностики. Области практического использования результатов психодиагностической работы.

2. История развития психодиагностики на Западе.

3. Развитие психодиагностики в России. Критика тестов в отечественной психологии.

4. Классификация методов психодиагностики.

5. Требования к диагностическим методикам.

6. Методологические принципы в работе психолога-диагноста.

7. Понятие теста в психодиагностике. Объективные тесты и тесты-опросники.

8. Диагностика умственного развития. Тесты интеллекта. Примеры тестов.

9. Тесты интеллекта. Правила проведения тестирования и обработки результатов.

10. Тесты интеллекта. Тест структуры интеллекта Р. Амтхауэра.

11. Тесты интеллекта. Тест «Прогрессивные матрицы» Дж. Равенна.

12. Тесты интеллекта. Тест Д. Векслера.

13. Диагностика личности. Личностные опросники.

14. Конструирование личностных опросников как инструмента психодиагностики.

15. Требования, предъявляемые к личностным опросникам.

16. Личностные опросники Г. Айзенка, теоретические позиции автора.

17. Факторные технологии создания личностных опросников. Опросник 16-PF Кеттелла Р.

18. Тестовые методики на изучение эмоциональной сферы личности.

19. Тестовые методики изучения психологических защит личности.

20. Проективные методики, их классификация. Достоинства и недостатки проективной техники.

21.

22. Проективные методики. Цветовой тест предпочтений М. Люшера.

23. Проективные методики. Тематический апперцептивный тест (ТАТ) Г. Меррея и К. Моргана.

24. Проективные методики. Рисованный апперцептивный тест Л.Н. Собчик (РАТ).

25. Проективные методики. Тест фрустрации С. Розенцвейга.

26. Проективные методики. «Тест руки» («Hand test»). Тест «Пятна Г. Роршаха».

27. Проективные методики. Тест «Пятна Г. Роршаха».

28. Назначение и взаимосвязь основных методов исследования личности: наблюдения, беседы, тестирования.

29. Надёжность тестов. Основные методы оценки надёжности тестов.

30. Понятие валидности. Необходимость валидизации психодиагностических методик.

31. Понятие валидности. Виды валидности. Содержательная валидность.

32. Конструктивная валидность. Понятие конструкта. Технологии оценки конструктивной валидности.

33. Понятие валидности. Виды валидности. Критериальная валидность. Понятие внешнего критерия. Технологии оценки критериальной валидности.

34. Методы оценки критериальной валидности. Метод контрастных групп.

35. Психометрические процедуры стандартизации на этапе обработки диагностических данных.

36. Стандартизация психодиагностических методик. Статистическая норма. Первичные и вторичные показатели (стены, IQ, Т-баллы и др.)

37. Стандартизованные и нестандартизованные личностные опросники. Сравнительная оценка и примеры.

38. Тесты достижений. Диагностика учебных и профессиональных достижений. Школьный тест умственного развития (ШТУР), Групповой интеллектуальный тест (ГИТ).

39. Диагностика креативности. Тесты Е.П. Торранса.

40. Тестовые методики на мотивацию достижений и избегания неудач.

41. История развития психодиагностики в России: этапы и периоды.

42. Диагностика особенностей личности. «Тест руки – Hand test».

43. Предмет и задачи психодиагностики. Области практического использования результатов диагностики.

44. Классификация психодиагностических методов (Б.Г. Ананьев, А.А. Бодалёв, К.М. Гуревич, В.В. Столин и др.).

45. Тесты интеллекта (зарубежные и отечественные). Диагностика умственного развития.

46. Диагностика особенностей личности. Детский апперцептивный тест Л. Беллак. Рисуночный апперцептивный тест (РАТ) Л.Н. Собчик.

47. Проблема нормы в психодиагностике.

48. Тест как предмет исследования. Виды тестов. Правила проведения, обработки и интерпретации результатов тестирования.

49. Диагностика интеллектуального развития. Тест структуры интеллекта Р. Амтхауэера.

50. История возникновения и становления психодиагностики. Дифференциальная психология.

51. Возникновение и развитие тестирования. Тестовый бум в 20-е – 30-е годы XX-го века (В. Вундт, Т. Эббингауз, Р. Кеттелл, А. Бине и др.). Критика тестов.

52. Диагностика особенностей личности детей и взрослых. Тест фрустрации С. Розенцвейга.

53. Диагностика креативности. «Познавательное» и «личностное» направления в изучении креативности. Методика Е.П. Торранса и др.

54. Проективные техники как средство диагностики личности.

55. Тесты интеллекта, тесты достижений, тесты способностей. Сравнительный анализ.

56. Процедура получения вторичных показателей.

57. Рисуночные тесты как метод психодиагностического исследования.

58. Диагностика интеллекта. Прогрессивные матрицы Дж. Равенна.

59. Профессионально-этические принципы в психодиагностике. Этические стандарты психологов (1963, 1965, 1972).

60. Диагностика учебных и профессиональных достижений. Стенфордский тест достижений. Критериально-ориентированные и ориентированные на норму тесты достижений.

61. Требования к построению и проверке методик. Качественная и количественная интерпретация результатов обследования. Связь интерпретации с позициями исследования.

62. ГИТ (групповой интеллектуальный тест), ШТУР (школьный тест умственного развития).

63. Проективные методики. Их классификация (Л.К. Франк, Д. Линдсей). Достоинства и недостатки проективной техники, проектные оценки.

64. Психометрическое сопровождение создания тестов. Валидизация, стандартизация, проверка надёжности.

65. Диагностика интеллекта. Тест интеллекта Д. Векслера.

66. Тест как предмет исследования. Проблема адаптации и стандартизации тестов. Критика тестов.

67. Тесты способностей. Диагностика общих и специальных способностей (сенсорные, моторные, технические, профессионализированные).

68. Малоформализованные методы в психодиагностике: наблюдение, беседа, интервью и анализ продуктов деятельности, экспертные оценки.

69. Диагностика потребностно-мотивационной сферы личности.

70. Диагностика интеллекта. Тест структуры интеллекта Р. Амтхауэра, тест интеллекта Д. Векслера. Сравнительный анализ.

71. Метод тестов как предмет исследований. Виды тестов: по цели проведения и по форме проведения.

72. Диагностика особенностей личности. Цветовой тест отношений М. Люшера. Тест чернильных пятен Г. Роршаха.

73. Рисуночные методики как средство исследования личности.

74. Современное состояние психодиагностики. Критика теста как метода диагностики в отечественной и иностранной психологии.

75. История становления психодиагностики. Возникновение и развитие тестирования.

76. Диагностика особенностей личности. Проективные методики: «Несуществующее животное», «Дом-дерево-человек», «Завершение предложений», «Автопортрет».

77. Диагностика личности. Опросники и их виды. Факторные опросники. Теория черт личности Р. Кеттелла. Опросник 16 PF Кеттелла Р.

78. Особенности проведения психодиагностики с целью профориентации и профотбора.

79. Требования к психодиагностическим методикам. Валидность, виды валидности. Проверка теста на критериальную валидность методом контрастных групп.

80. Диагностика особенностей личности. Тематический апперцептивный тест (ТАТ) Г. Меррея и К. Моргана. РАТ (рисуночный апперцептивный тест).

ПРИЛОЖЕНИЕ № 3.

«МАЛОФОРМАЛИЗОВАННЫЙ ПСИХОДИАГНОСТИЧЕСКИЙ МЕТОД ″НАБЛЮДЕНИЕ″»

Методическое указание . Наблюдение осуществляется в процессе организованной специально, или имеющей место быть по факту трудовой профессиональной деятельности испытуемых, активности испытуемых в поведении, деятельности, общении, решении совместных деятельностных задач.

По форме проведения исследования, мы осуществляем прямое исследовательское наблюдение, применяем его в качестве практического психологического метода накопления данных.

Цель наблюдения: изучение поведения и деятельности испытуемого в естественных условиях (как правило – в естественных условиях), выявление эмоциональных реакций субъекта, выяснение его чувственных отношений к действительности и т.д.

Вид (параметры) наблюдения: внешнее; стандартизированное; включённое; систематическое.

Инструкция. Наблюдение профессионально желательно осуществлять несколько раз (2–4 раза) подряд. Наблюдение осуществляется с фиксированными перерывами (промежутками) в течение полного дня жизнедеятельности субъекта или в течение нескольких часов (2–3 часа), находясь с ним в постоянном взаимодействии в процессе выполнения разнообразной деятельности. Наблюдателем должен являться только сам психолог, от лица которого и составляется протокол стандартизированного наблюдения. Протокол наблюдения, разработанный нами на основе многолетнего опыта, мы приводим в нижеследующей таблице.

«Протокол ведения стандартизированного систематического наблюдения за психологическими и ″деятельностными″ реакциями субъекта (субъектов)» (Автор-составитель Д.А. Донцов).