Избранное сообщение

Фетісов В. С. Комп’ютерні технології в тестуванні. Навчально-методичний посібник. 2-ге видання, перероблене та доповнене / Мои публикации

В 10-х годах я принимал участие в программе Европейского Союза Tempus "Освітні вимірювання, адаптовані до стандартів ЄС". В рамк...

Благодаря Интернету количество писателей и поэтов увеличивается в геометрической прогрессии. Поголовье читателей начинает заметно отставать.

воскресенье, 28 мая 2017 г.

Статистичний аналіз тесту в MOODLE / Мои публикации

25-26 травня в Києві відбулася міжнародна наукова-практична конференція
«Сучасні проблеми фізико-математичної освіти і науки», в який я брав участь.

Початок конференції у залі засідань
 
Апробація та аналіз результатів тестування є чи не найважливішим етапом при розробці тестових завдань, адже дозволяє виявити не валідні та погано складені завдання. Moodle має вбудовані засоби (звіти), які дозволяють провести статистичний аналіз тесту як в цілому, так і окремих його тестових завдань.
Дістатися до результатів тестування можна у блоці “Керування”, де у групі “Керування тестом” слід натиснути гіперпосилання “Результати”. Система запропонує визначити параметри перегляду та що саме потрібно включати до звіту, наприклад, спроби зарахованих учасників тестування. Після цього слід натиснути кнопку «Показати звіт». Слід зауважити, що дістатися до результатів тестування не можуть відвідувачі з роллю “Студент” – вони взагалі не будуть мати вищезгаданих пунктів у блоці.
Результати тестування Moodle відбиваються у кількох звітах, серед яких є “Статистика”. Цей звіт надає інформацію про тест у цілому, в тому числі основні описові статистичні показники, такі як середня оцінка, стандартне відхилення і т. ін. Окрім того для кожного тестового завдання також розраховується кілька статистичних показників. На сторінці «Статистика» під заголовком “Загальна інформація про тест” відображатимуться загальні відомості про тест, у тому числі:

1. Кількість перших повністю оцінених спроб.
2. Загальна кількість повністю оцінених спроб.
3. Середня оцінка по перших спробах.
4. Середня оцінка по всіх спробах (у випадках, коли на проходження тесту надається кілька спроб, обчислюється середня оцінка за використаними спробами).
5. Медіана оцінок – значення оцінки, яке поділяє учасників тестування, впорядкованих за зростанням або спаданням оцінки, на дві рівні частини.
6. Стандартне відхилення або середнє квадратичне відхилення – показує розсіювання оцінок за тест, тобто на яку кількість балів в середньому відрізняються відповіді учасників тестування від середнього вибіркового.
7. Значення коефіцієнта асиметрії застосовується для перевірки гіпотези на нормальність розподілу оцінок (набраних балів) в тесті. Відомо, що він дає уявлення про напрям асиметрії і міру скошеності в середині розподілу. При конструюванні тесту потрібно намагатися, щоб значення асиметрії було близьким до нуля, тоді розподіл оцінок буде близьким до нормального. А це, в свою чергу, вказує на те, що високих і низьких оцінок буде порівну. Якщо значення коефіцієнта асиметрії є від’ємним, то це вказує на те, що низьких оцінок більш ніж високих, тобто тест є складним, а якщо додатнім, то кількість високих оцінок перевищує кількість низьких, тобто тест є простим.
8. Значення ексцесу розподілу – коефіцієнт ексцесу характеризує “крутизну”, тобто, гостровершиність кривої розподілу оцінок порівняно з кривою нормального розподілу. При конструюванні тесту потрібно намагатися, щоб значення ексцесу було близьким до нуля. Тоді розподіл оцінок буде близьким до нормального. Якщо значення ексцесу додатне, то тест погано розподіляє учасників тестування на сильних і слабких, тобто має дуже багато середніх оцінок, а – через це – низьку диференційну здатність; якщо ж це значення від’ємне – то навпаки, тест занадто сильно диференціює учасників тестування (тобто низьких, середніх і високих оцінок майже однакова кількість, що суперечить нормальному закону).
9. Коефіцієнт внутрішньої узгодженості. Внутрішня узгодженість тесту – характеристика тесту, яка вказує на ступінь однорідності завдань тесту. Вимірюється як коефіцієнт кореляції між результатами відповідей випробовуваних на парні і непарні питання одного і того ж тесту. Внутрішня узгодженість є істотним елементом конструктивної валідності тесту і характеризує, якою мірою завдання спрямовані на вимірювання потрібної ознаки. Максимальна валідність тесту досягається за рахунок підбору таких завдань, які, володіючи значущою кореляцією з результатом тесту, в той же час мінімально корелюють між собою. Коефіцієнт, що дорівнює 70 % показує, що 70 % дисперсії результатів тесту залежить від загальної дисперсії для вимірюваній ознаці, а 30 % – від дисперсії помилки. Дисперсія помилки включає неоднорідність завдань тесту, тимчасові показники, зміну стану випробовуваних, вплив тренування та інші фактори.
10. Стандартна помилка – оцінює фактор “везіння” і вказує границю похибки для оцінки студента за тест. Так наприклад, якщо стандартна помилка 12 % і студент відповів на 70 % завдань тесту правильно, тоді його справжня оцінка буде розташовуватися в інтервалі від 58 % до 82 %.

Вважається, що в хорошому тесті середній арифметичний бал дорівнює медіанному значенню оцінок, а крива розподілу оцінок має нормальний розподіл. Це ознака добре підібраного рівня складності тесту та адекватної підготовки учасників тестування.

Смотри также:


 

Комментариев нет:

Отправить комментарий