Per essere affidabile uno strumento deve fornire una misurazione stabile che non risenta di fattori contingenti presenti nelle diverse applicazioni: stabilità: il punteggio ottenuto da un bambino rimane stabile nel tempo; consistenza interna: la misura ottenuta differenzia gli individui l’uno dall’altro relativamente al costrutto esaminato; due o più persone che usano lo strumento con lo stesso bambino ottengono risultati simili. Gli indici di affidabilità sono ricavati dal confronto di punteggi ottenuti in due diverse somministrazioni del test (test-retest) oppure tra due parti dello stesso test (split-half) oppure tra due forme equivalenti dello stesso test, oppure tra due osservatori che effettuano la stessa rilevazione (criterio dell’accordo).
Ogni rilevazione contiene una parte di errore dovuta alla procedura di rilevazione stessa, nell’osservazione si possono verificare distorsioni a carico dei soggetti osservati, dell’osservatore, dello strumento: le persone si comportano diversamente quando sanno di essere osservate (effetto Hawthorne), accentuando i comportamenti che ritengono positivi e riducendo quelli negativi, questo effetto è detto reattività dei soggetti e un possibile correttivo potrebbe essere la familiarizzazione. Il rischio maggiore è dato dall’effetto Rosenthal, secondo cui l’osservatore si crea delle aspettative rispetto a ciò che osserva, tali attese creano una distorsione nelle capacità di giudizio dell’osservatore portandolo spesso a individuare comportamenti o atteggiamenti che in realtà non si verificano.