Надежность теста является одним из критериев качества теста и показывает, насколько точно измеряет данный тест изучаемое явление. Следовательно, термин «надежность» имеет два значения: во-первых, если тест надежный, он при повторном выполнении дает близкие результаты; во-вторых, он обеспечивает высокую точность измерений.
Стандартный набор данных о тесте, предназначенных для широкого употребления, обязательно должен включать сведения о мере ее надежности.
Исследования В.С. Аванесова, Дж. Гласcа, А.Н. Майорова, Е.А. Михайлычева, М.Б. Челышковой, Н.М. Розенберга и ряда других авторов приводят к выводу о том, что надежность теста является характеристикой того, в какой степени полученные в результате тестирования различия между испытуемыми является отражением различий в свойствах испытуемых и в какой мере являются отображением случайных ошибок. Н. Гронлуд отмечает: «Если балл, полученный учеником в результате теста по оценке результатов, будет соответствовать той оценке, которую они получили бы при повторном прохождении того же теста или идентичного с ним по форме, то данная оценка считается высоко надежной… Чем длиннее тест, тем более надежными и адекватными будут результаты» .
Вторым важным показателем качества теста является валидность (от англ. valid – пригодный). «Проблема валидности возникает в процессе разработок и практического применения теста, когда ставится задача установить соответствие между степенью выраженности интересующего свойства личности и методам его измерения. Чем валиднее тест, тем лучше отображается в нем то качество (свойство), ради измерения которого он создавался».
Для определения подходов к процессу валидизации теста и валидности в трудах ученых используется большое количество терминов. Одним из наиболее распространенных терминов является «содержательная валидность», необходимость которой не отрицают вышеназванные тестологи и определяют ее как характеристику репрезентативного содержания теста по отношению к запланированным для проверки знаний и умений. По мнению И.А. Анастази, сфера распространения валидности по содержанию – это тесты учебных достижений, особенно критериально-ориентированные тесты по усвоению материала и навыков. Если тест позволяет проверить все то, что авторами было задумано в спецификации, он считается валидным относительно контролируемого содержания курса. Полнота выходит на первый план именно при создании критериально-ориентированных тестов. Помимо этого, повышению содержательной валидности способствует независимая экспертиза.
Анализ трудов теоретиков-тестологов позволяет сделать следующие выводы:
- тесты отличаются от других средств контроля (контрольных работ, диктантов и др.) тем, что проходят процесс научного обоснования качества, который предполагает оценку соответствия характеристик тестов двум важнейшим критериям: надежности и валидности;
- при оценке надежности и валидности не следует полагаться на единственную формулу, а надо пользоваться совокупностью методов, ориентированных на особенности разрабатываемого теста;
- любые оценки надежности и валидности выступают не как истина в последней инстанции, а лишь как правдоподобные утверждения, имеющие ту или иную степень достоверности;
Материалы по педагогике:
Сценарий праздника «День смеха» первого
апреля для школьников
В зале на стене висят плакаты, на которых написаны пословицы и поговорки, афоризмы. Эмблема — улыбка. 1. Кто людей веселит, за того и свет стоит. 2. Кто умеет веселиться, тот и горя не боится. 3. Смех — великий лекарь. 4. Поспешишь — людей насмешишь. 5. Интересны все жанры, кроме скучного. 6. Продо ...
Общие
рекомендации по проверке работ учеников 8 класса ВЗМШ
В данном параграфе мы постараемся дать общие рекомендации по написанию указаний к наиболее часто встречающимся видам ошибок. Опираясь на анализ работ учеников 8 класса заочной школы ВЗМШ, проведенный во втором параграфе, можно выделить следующие группы типичных ошибок: 1) Необоснованное обобщение. ...
Способы и приемы развития связной речи у детей старшего
дошкольного возраста в семье
Семья - это единственная социальная группа, приспособившаяся к многочисленным сменяющим друг друга событиям в такой небольшой временной промежуток и в таком небольшом жизненном пространстве. По определению В.В. Столина, семья - это "открытая система, подверженная внешним и внутренним воздейств ...