ua ru

IAPT

Главная » Уроки и тесты » Надежность тестирований

Надежность тестирований

Надежность тестирований

Надежность теста - это характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. При этом надежность бывает нескольких видов: ре-тестовая надежность - когда рассматриваются показатели при повторном исследовании испытуемых с помощью одного и того же теста со временем; надежность частей теста - получается путем анализа устойчивости результатов отдельных совокупность тестовых задач или отдельных частей теста. Когда тест не может принести тот же самый результат для некоторого испытуемого (при условии, что этот испытуемый не изменился) в различных условиях, - значит, не все в порядке. Способ измерения ре-тестовой надежности очень прост. Вычисляется корреляция показателей для выборки испытуемых, протестированных в двух случаях.

Удовлетворительным наименьшим значением для ре-тестовой надежности является 0,7. Указанный предельный коэффициент надежности в известной мере условно. Для проектных и некоторых других тестов лица показатель ре-тестовой надежности может быть ниже, при этом диагностическая ценность методики не снижается. При низком значении использования теста становится едва ли целесообразным, поскольку стандартная погрешность получаемых по нему показателей будет настолько велика, что интерпретация показателей станет сомнительной. Коэффициент надежности: средняя величина корреляции одного теста или задания со всем тестами или заданиями из генеральной совокупности называется коэффициентом надежности. Квадратный корень из коэффициента надежности является корреляцией данного теста или задания с истинным показателем.

Однако на практике невозможно точно вычислить это теоретическое значение надежности, потому что количество разработанных нами заданий и тестов не является бесконечным. Это означает, что надежность некоторого теста можно оценить лишь приблизительно. Таким образом, на практике коэффициенты надежности основаны на корреляции одного теста с другими, и эта оценка может быть не очень точной. Это означает, что имеющая более существенное значение корреляция теста или задания с истинным показателем тоже может быть оценена неточно. Таким образом, надежность возрастает с величиной теста. С точки зрения разработчика тестов важной является скорость роста надежности с ростом количества задач. Всегда трудно разработать большое количество валидных заданий (например, таких, которые принадлежат именно нужной генеральной совокупности); следовательно, если мы хотим продемонстрировать, скажем, надежность двадцати пяти заданий (с заданной средней корреляцией) является высокой, то достижение этой цели будет иметь смысл.