ЗАЩО ТЕСТОВЕ НЕ ПРЕДВИДАТ НИЩО,
ИЛИ КАКВО Е ВАЛИДНОСТТА?

(от цикъла "Критерии за наука в тестологията")

КАКВО МЕРИМ?

Ако е необходимо да се измерват такива физически параметри като височината или теглото на човек, тогава не се съмняваме, че ръстомерът измерва точно височината, а везните определят теглото. Но в ситуация с психологически измервания често се получава объркване.
Да предположим, че неопитен психолог избира тест за интелигентност, който е твърде лесен за субектите му (например за надарени деца). И какво е мислил да направи тогава? Взех и намалих времето за попълване на теста, наивно вярвайки, че това ще удвои двойно. Но какво всъщност се случва? В много научни трудове е показано, че в този случай успешното преминаване на теста в по-голяма степен изразява не толкова нивото на интелигентност на субекта, колкото нивото на неговата устойчивост на стрес - неговата готовност да концентрира вниманието и да действа точно с течение на времето условия на налягане. Психологът иска да измери едно психично свойство (интелигентност), но всъщност измерва друго (устойчивост на стрес). Това означава намаляване на валидността на теста поради нарушаване на правилата за неговото провеждане.

ХВАНИ РИБА.

Психичните свойства, за разлика от физическите, са латентни, директно ненаблюдаеми. Например, височината и теглото могат да бъдат доста точно оценени „на око“, а интелигентността и устойчивостта на стрес по този начин е много трудно да се определят. Това, с което се занимаваме в теста, не са самите психични свойства, а само техните прояви или, както се казва в тестологията, „емпирични показатели“.
Тук е подходяща метафората за „риболов“. Психични свойства - това е риба, която тестовият риболовец не вижда, тъй като плува в дълбините. Риболовецът може да наблюдава само плувките. Когато поплавъкът се потрепва, той не знае точно коя риба хапе. Но според стръвта можете да предположите: е малко вероятно малките рибки да погълнат лъжицата. Рибар изважда риба до брега с въдица, но умственото свойство не може да бъде „измъкнато на брега“ и.
Ненаблюдаемите, косвено измерени психични свойства в тестологията се наричат ​​„латентни променливи“. Кои са „латентните променливи“, които дърпат „куките“ на нашите въдици? Това е въпросът за валидността, описан на езика на риболовната метафора.

КАКВО СЕ СКРИ В ДЪЛБОЧИНАТА

Помислете за диаграма, която обяснява за какво говорим (вижте фиг. 1).

Фигура: 1. Връзка между свойствата и тестовите показатели

Тази диаграма илюстрира разликата между наблюдаемите тестови индикатори (отговори на тестови елементи) и измеримите психични свойства (латентни променливи). След като разгледахме схемата, можем да отбележим друга важна характеристика на психологическите измервания: няма строго индивидуално съответствие между измерените свойства и показатели, а само вероятностна зависимост.
В крайна сметка се случва щука да ухапе кървави червеи, въпреки че това е изключително малко вероятно събитие. Така че в психодиагностиката - потенциалните (макар и по-малко вероятни) връзки между тестовите индикатори и „извънземните“ психични свойства остават. Тези връзки са източници на грешки и ниска валидност.
Ето защо в анотацията към теста (в „техническия паспорт“ за методологията) не забравяйте да потърсите информация за това как разработчикът на теста е проверил неговата валидност. Ако няма такава информация, тогава няма причина този тест да се счита за научно обоснован или, с други думи, за валиден.

НУЖНА КОРЕЛАЦИЯ

Как се извършва проверката на валидността? Най-сериозните тестове се проверяват с няколко метода, тъй като всеки от тях има определени недостатъци, а единият метод допълва другия.
Най-простият метод е експертна оценка на задачите, така наречената проверка на експертното съдържание. В този случай експертите в областта, в която е създаден тестът, заключават дали тази „въдица“ е добра или не.
Но този метод не винаги е подходящ. Подходящо е, когато се занимаваме например с тестове за измерване на образователните постижения. Разбира се, най-правилно е да започнем проверката на валидността на теста за знания по география с оценка на задачите от квалифициран методист-географ.
Но експертната преценка не е достатъчна, за да обоснове валидността на каквито и да било тестове (дори образователни). Той трябва да бъде проверен, като се използва статистическа процедура за корелация.
Проверката на корелацията е подобна в много отношения (макар и не напълно идентична) на процедурата, която обсъдихме миналия път - валидиране на ключ. На езика на риболовната метафора, ключът към тестото е дължината на линията, която минава от плувката до куката (и до целевата риба). Колкото по-силна е тази връзка, толкова по-вероятно е да направим заключение за психично свойство въз основа на тестовия индикатор (индикатор). Ако при графичния тест многократно коригираната контурна линия на рисунката се тълкува като знак за неувереност в себе си, то това означава, че появата на този външен знак в рисунката трябва статистически значително да корелира с посочената личностна черта на детето.

ГЛЕДАЩЕ ПОВЕДЕНИЕ

Най-ценен тест за валидиране: Обективно наблюдение на действителното поведение на субектите, последвано от статистическо сравнение на резултатите от теста с резултатите от наблюдението и изчисляване на коефициента на корелация. Този метод се нарича метод "група на ръба" (или методът "контрастна група").
Например децата в играта трябва да се редуват да вземат важни решения. Някои деца го правят без колебание, бързо (група уверени хора), други го правят бавно и колебливо, трудно преодолявайки срамежливостта и колебанието (група несигурни). Така се избират две „екстремни групи“. След това изследователят (разработчик на теста) провежда своя тест с тях. В резултат на такова изследване се създава таблица.