скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты

скачать рефератыДипломная работа: Особенности статистической оценки качества теста диагностики индивидуального прогресса учащихся общеобразовательной школы

В учебно-методической литературе появилось большое количество разнообразных тестов, причем не всегда хорошего качества. Как утверждает Шкерина [21], как правило, это является результатом некачественной обработки тестовых заданий. Поэтому в такой ситуации для создателей теста (тестовых заданий) необходимо владеть методами статистической обработки для оценки качества тестовых заданий.

Оценка качества тестовых заданий заключается в расчете таких характеристик, как валидность, надежность, дифференцирующая способность. Рассмотрим эти понятия подробнее.

Валидность одна из важнейших характеристик теста, которая означает соответствие формы и содержания теста тому, что он должен оценивать или измерять по замыслу его создателей. Для различных видов валидности могут быть использованы одни и те же методы определения и, наоборот, одни и те же данные могут быть интерпретированы с точки зрения разных типов валидности [14].

Надежность теста характеризует степень устойчивости результатов тестирования каждого испытуемого. Фактически коэффициент надежности показывает корреляционную связь между результатами измерений, проведенных в одинаковых условиях. При определении надежности исходят из того, что в каждом измерении присутствуют истинный (Т) и искажающий (Е) компоненты. Определение надежности заключается в оценке соотношения этих компонентов в данных проведенного тестирования [21].

Дифференцирующая способность (ДС) - способность тестового задания дифференцировать (различать) сильных (способных) от слабых. Майоров поясняет это понятие на примере. Представим себе, что мы провели тестирование группы учащихся. В составе этой группы были отличники, хорошисты и двоечники. Логично предположить, что отличники справятся с тестом лучше, чем двоечники. Но выясняется, что с одним из заданий и двоечники, и отличники справились одинаково успешно или неуспешно. Оказывается, такое случается, если задание обладает существенными недостатками. Типичными недостатками низкодискриминативных заданий являются: излишняя сложность, запутанность формулировки; очевидность решения; абсурдность, нереальность вариантов ответов; появление двух и более правильных ответов, не оговоренных в условии. Действительно, в том случае, если задания обладают перечисленными недостатками, вероятность того, что с ними одинаково справятся (не справятся) и отличники, и двоечники довольно высока [14].

Существуют различные подходы к описанию и расчету этих характеристик. Все они основаны на статистической теории измерения. Но для расчета этих характеристик необходимо сначала подсчитать и проанализировать различные статистические показатели, которые описаны в классической теории тестирования.

Далее мы рассмотрим основные понятия статистики, для того чтобы при анализе методов оценки качества педагогического теста нам было легче понимать, в чем они заключаются.

2.1.2 Основные понятия статистики

Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности. Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов [7].

Многие авторы [4,14,17,20,21] используют разные обозначения статистических понятий. В этом параграфе мы соотнесем и систематизируем основные понятия статистики, которые мы будем использовать при анализе методов обработки педагогического теста (тестовых заданий).

Исходным понятием статистики является понятие случайной величины. Случайной называют величину, которая в результате испытания примет одно и только одно возможное значение, наперед неизвестное и зависящее от случайных причин, которые заранее не могут быть учтены [7]. При статистической обработке тестов (тестовых заданий) мы используем две случайные величины:

1.  первая случайная величина характеризует испытуемых;

2.  вторая случайная величина характеризует задания.

Далее рассмотрим следующие основные понятия статистики. К ним относятся:

1.  Среднее значение – сумма всех значений, деленная на их количество

;

2.  Дисперсия – среднее значение квадрата отклонения

;

3.  Среднее квадратическое отклонение – квадратный корень из дисперсии

;

4.  Коэффициент корреляции – отношение корреляционного момента к произведению средних отклонений этих величин

 [7].

Мы рассмотрели основные понятия статистической теории измерения, которые мы будем использовать далее при анализе методов статистической обработки качества заданий теста. В следующем пункте рассмотрим первичные и вторичные статистические показатели.

2.1.3 Первичные и вторичные статистические показатели

Условно статистические показатели, описанные в классической теории тестирования, мы можем разделить на две группы: первичные (базовые) и вторичные. К первичным относятся те показатели, которые используются в различных статистических методах оценки качества теста. Вторичные показатели – те, которые вычисляются с помощью первичных. Рассмотрим подробнее первичные и вторичные показатели, и разберем на примере, как они вычисляются. Представим результаты выполнения теста ЕГЭ в виде таблицы (таблица 1).

Первичные:

1.  Общий тестовый балл . Получается сложением всех единиц соответствующей строки;

2.  Средний тестовый балл группы . Вычисляется как частное суммы всех тестовых баллов и количества испытуемых в группе.

,

где  - количество испытуемых. В рассматриваемом примере ;

3.  Достижение -го испытуемого . Находится как частное количества правильно выполненных заданий и общего числа заданий.

 ,

где  - количество правильно выполненных заданий,  - общее число заданий.

4.  Среднее достижение группы  - частное от суммы всех достижений группы на общее число испытуемых.

,

в нашем примере .

5.  Отклонение достижения каждого учащегося от достижения группы  - разность среднего достижения группы и достижения -го испытуемого.

Также первичные показатели характеризуют достижения испытуемых, на основании которых делаются выводы об уровне усвоения материала и качестве его усвоения на этом уровне.

Далее рассмотрим вторичные показатели:

1.  Среднее отклонение достижений испытуемых . Вычисляется по формуле


,

в нашем примере .

Таблица 1. Вычисление первичных и вторичных показателей.

Испы-

туемые

Задания Общий тестовый балл Х

Достижение

Отклонение

1 2 3 4 5 6 7 8 9 10
1 1 1 0 1 0 0 0 1 1 0 5 0,5 0,06
2 1 1 0 0 0 1 0 0 0 1 4 0,4 0,16
3 0 1 0 1 0 1 0 0 1 1 5 0,5 0,06
4 1 1 1 0 0 1 1 1 1 1 8 0,8 0,24
5 0 0 0 1 1 1 0 0 0 1 4 0,4 0,16
6 1 1 1 1 0 0 1 0 1 1 7 0,7 0,14
7 1 1 1 0 0 0 1 0 1 1 6 0,6 0,04
8 1 1 1 1 1 1 0 0 1 1 8 0,8 0,24
9 1 0 0 0 1 0 1 0 1 0 4 0,4 0,16
10 0 0 1 0 1 0 1 0 1 1 5 0,5 0,06
11 1 0 0 0 1 1 1 1 0 0 5 0,5 0,06
12 1 1 1 1 1 0 0 1 0 0 6 0,6 0,04
Промежуточные вычисления

Расчет первичных показателей

Расчет вторичных показателей

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

© 2010.