Doğrulama türleri nelerdir? Ne olduğunu? Bu ve diğer soruların cevaplarını makalede bulacaksınız. Geçerlilik, doğası gereği, bir yandan teknolojinin ne için geliştirildiğini ölçmek için uygun olup olmadığına ve diğer yandan etkinliğinin, pratik kullanışlılığının, verimliliğinin ne olduğuna ilişkin verileri içeren tek bir özelliktir. Bir teknolojinin geçerliliğini kontrol etmeye doğrulama denir. Aşağıda daha ayrıntılı olarak ele alacağız.
Görüntüleme
Birçok kişi soruyor: "Doğrulama nedir?" Rafine zihnin sınırları olmadığı söylenir. Metodologlar, kimin daha fazla geçerlilik türü ve türü keşfedeceği veya icat edeceği konusunda birbirleriyle rekabet ediyor gibi görünüyor. Son zamanlarda sadece isimler ortaya çıkmadı! Görünüşe göre:
- dış ve iç geçerlilik;
- yakınsak;
- ayrımcı;
- bariz;
- faktöriyel;
- öngörülü;
- yapıcı;
- kriter;
- anlamlı vb.
Anlamanın ve hatta bir varyasyonu diğerinden mantıklı bir şekilde ayırt etmenin bir yolu yoktur. Tanımlar ve sınıflandırmalardaki karışıklık, farklı yazarların onu geliştirmenin tamamen farklı yollarını aynı geçerlilik biçimine atfetmelerine yol açar.
Dış kriterler
Metodolojinin pragmatik doğrulamasını gerçekleştirmek, yani pratik önemini, etkililiğini, verimliliğini değerlendirmek için genellikle harici bir bağımsız kriter kullanılır - günlük yaşamda incelenen kaliteyi göstermenin bir göstergesi. Böyle bir kriter, hem üretim başarıları (profesyonel yönelim teknolojileri için) hem de akademik performans (zeka testleri, başarılar veya öğrenme yetenekleri için) ve gerçek faaliyetlerin etkinliği - modelleme, çizim vb. (testler için) olabilir. özel beceriler), kişisel değerlendirmeler (kimlik doğrulaması için).
Harici doğrulama kriteri türleri aşağıdaki gibidir:
- performans ölçümleri (bunlar, uygulanan iş miktarı, eğitime harcanan zaman, akademik performans, niteliklerin büyüme oranı ve benzerlerini içerebilir);
- fizyolojik işaretler (çevrenin ve diğer durumsal değişkenlerin insan ruhu ve bedeni üzerindeki etkisini incelerken kullanılır);
- kan basıncı, nabız hızı, yorgunluk belirtileri, cildin elektriksel direnci vb. ölçülürsonraki;
- öznel önlemler (bir kişinin birine veya bir şeye karşı tutumunu, görüşlerini, görüşlerini, tercihlerini yansıtan çeşitli yanıt türlerini içerir; kural olarak, bu tür önlemler anketler, anketler, görüşmeler kullanılarak elde edilir);
- kaza işaretleri (çalışmanın amacı, örneğin, iş için kazalara daha az eğilimli insanları seçme sorunuyla ilgili olduğunda kullanılır).
Ampirik geçerlilik. Ne hakkında?
Az sayıda insan ampirik doğrulamanın ne olduğunu biliyor. Kapsam geçerliliği durumunda, test uzmanlar tarafından değerlendirilir (test görevlerinin ölçüm nesnesinin içeriğine uygunluğunu belirlemek). Ve ampirik olan her zaman istatistiksel korelasyon kullanılarak ölçülür: iki tür değerin korelasyonu hesaplanır - güvenilirlik kriteri olarak seçilen harici bir parametre için test puanları ve endeksler.
Yapıcı
Herkes doğrulama yöntemi türlerini bilmiyor. Yapı geçerliliği nedir? Teorik yapının kendisiyle ilgilidir ve test performansı davranışını açıklayan faktörleri aramaktan oluşur.
Belirli bir tür olarak, yapı geçerliliği Mil ve Cronbach (1955) tarafından yazılan bir makalede meşrulaştırılmıştır. Yazarlar, bu geçerlilik formunu kullanarak, doğrudan bazı önemli kriterleri tahmin etmeyi amaçlamayan tüm test anketlerini değerlendirdi. Araştırma, psikolojik yapılar hakkında bilgi içeriyordu.
İçerik Geçerliliği
Hala sen"Doğrulama - nedir?" diye soruyorsunuz. İçerik geçerliliğini düşünün. Belirli bir alana ait her problemin, sorunun veya görevin test öğesi olma şansının aynı olmasını gerektirir.
Content Validity, test varlığının ölçülen davranış alanına uygunluğunu değerlendirir. İki geliştirici grubu tarafından oluşturulan doğrulamalar, kontrol edilenlerin bir örneği üzerinde gerçekleştirilir. Testlerin güvenilirliği, soruları iki bölgeye ayırarak hesaplanır ve içerik geçerliliği indeksi elde edilir.
Öngörülü
Doğrulama yöntemlerini değerlendirmeye devam ediyoruz. Tahmine dayalı geçerlilik ayrıca dışsal, oldukça güvenilir bir kriter tarafından belirlenir. Ancak doğrulamadan bir süre sonra onunla ilgili bilgiler toplanır.
Dış kıstas genellikle bir kişinin, teşhis testlerinin sonuçlarına göre seçildiği meslek türü için herhangi bir değerlendirmede gösterilen mesleğidir.
Bu yöntem, teşhis araçlarının görevi için en uygun olmasına rağmen - gelecekteki başarının tahmini, uygulanması çok zordur. Tahminin doğruluğu, böyle bir tahmin için atanan zamana ters olarak bağlıdır. Ölçümden sonra ne kadar çok zaman geçerse, teknolojinin tahmin değerini değerlendirirken o kadar çok faktörün hesaba katılması gerekir. Ancak, tahmini etkileyen tüm faktörleri hesaba katmak neredeyse imkansızdır.
Geriye dönük
Kabul ediyorum, doğrulama çok karmaşık bir süreçtir. Geriye dönük geçerliliğin ölçüt bazında ortaya konduğu bilinmektedir,geçmişte bir kalite veya olayın durumunu yansıtan. Tahmine dayalı teknoloji kaynaklarını anında elde etmek için kullanılabilir. Bu nedenle, bir beceri testinin iyi sonuçlarının hızlı öğrenmeye ne ölçüde karşılık geldiğini gözden geçirmek için, şu anda düşük ve yüksek tanısal endekslere sahip bireylerde önceki uzman görüşleri, performans değerlendirmeleri vb. karşılaştırılabilir.
Ayırt edici ve yakınsak
Onaylama türleri birçok kişinin ilgisini çeker. Diskriminant ve yakınsak geçerliliğin ne olduğunu bulalım. Yerleşik öğeleri teste sokma stratejisi, psikoloğun tanısal yapıyı nasıl ortaya çıkardığına bağlıdır. Eysenck, "nevrotiklik" niteliğini içe dönüklük-dışadönüklükten bağımsız olarak tanımlarsa, bu, anketinin nevrotik dışa dönükler ve içe dönükler tarafından onaylanacak konumları eşit olarak temsil etmesi gerektiği anlamına gelir.
Pratikte, "içe dönüklük-nevrotiklik" çeyreğindeki maddelerin görevde geçerli olacağı ortaya çıkarsa, o zaman Eysenck'in teorisinin konumundan, bu, "nevrotiklik" göstergesinin alakasız bir gösterge ile yüklendiği anlamına gelir. - "içe dönüklük". Örnekte bir yanlılık olduğunda - aynı dışadönüklerden daha fazla nevrotik içe dönükler varsa - aynı etki ortaya çıkar.
Bu tür karmaşıklıklardan kaçınmak için, psikologlar yalnızca tek bir faktör hakkında bilgi veren deneysel öğelerle uğraşmaya isteklidir. Ancak gerçekte bu gereklilik hiçbir zaman karşılanmaz: her ampirik indeksin belirlenmediği ortaya çıkar.sadece ihtiyaç duyduğumuz faktörle değil, aynı zamanda başkaları tarafından da - ölçüm sorunuyla alakasız.
Böylece, kavramsal olarak ölçülene dik olarak tanımlanan faktörler için (tüm kombinasyonlarda onunla birlikte oluşur), testi oluşturan kişi, öğeleri seçerken orijinal olmayan dengeleme stratejisini kullanmak zorundadır.
Noktaların ölçülen göstergeye uygunluğu, testin yakınsak geçerliliğini garanti eder. Maddelerin alakasız kaynaklara göre tutarlı olması, ayırt edici geçerlilik sağlar. Ampirik olarak, kavramsal olarak benzersiz kaliteyi ölçen testle önemli bir korelasyonun yokluğunda kendini gösterir.
Araç kiti
Genel doğrulama yöntemleri kümesinde, yazarlar genellikle şunları içerir:
- resmi olmayan (anketteki alternatifler listesini dikkatlice gözden geçirmeye kadar basit numaralardan teorik adım adım analiz için daha karmaşık prosedürlere kadar);
- formalize, matematiksel istatistik prosedürlerini ve teknolojilerini içerir: istatistiksel hipotezlerin test edilmesi, tahminlerin hesaplanması, korelasyon analizi, güven aralıklarının oluşturulması, değişkenler arasındaki ilişkilerin değerlendirilmesi, dağılım, faktöriyel, regresyon ve yapısal analizler vb. on.
Oluşturma araçları
Yine de, doğrulama nedir? Gelişmiş doğrulama araçları ilk olarak psikologlar tarafından oluşturuldu. 1959'da, D. Fiske ve D. Campbell (ABD) tarafından özel bir teknik geliştirildi. İngilizce için tamamen doğal, ancak çevrilemez bir not aldı.bizim dilimiz, isim: çoklu-yöntem-çoklu-lanet matris (MTMM). Bu matris bir korelasyon tablosuydu. Biri yakınsak gerçeği ortaya çıkarmayı, diğeri ise ayırt edici gerçeği ortaya çıkarmayı amaçlayan çok çekici iki icattan oluşuyordu.
Yazarları, aşağıdaki durumlarda herkesin dahili kabul edilebilirliği kanıtlayabileceğini savundu:
- Aralarında yüksek düzeyde teorik bağlantı olduğu varsayılan değerler, ampirik (yakınsama) içinde aynı düzeyi bulacaktır;
- Teorik olarak ilişkisiz olan değerler, testin yürütülmesinden sonra (ayrımcılık) ampirik olarak ilişkisiz hale gelecektir.
Kabaca söylemek gerekirse, yakınsak geçerlilik, işgücü piyasasında şanslar açısından, örneğin inşaat işçileri ve montaj hattı işçileri gibi iki çalışan ekibi arasında mal sahipleri ve çalışanlar arasında olduğundan çok daha fazla benzerlik olduğunu belirtmelidir. Teorik olarak amaçlanan ilişki ampirik olarak bulunursa, örneğiniz geçerlidir.
Ayırt edici geçerlilik, çeşitli fenomenlerin tanımlanma derecesini gösterir. Aynı işgücü piyasası örneğini ele alacak olursak, iyi biçimlendirilmiş bir teorinin, kendi araçlarıyla, iş gücü piyasasında mal sahiplerinin ve çalışanların fırsatlarını ayırt edebilmesi beklenebilir. Onları karıştıramazsınız ve teoriniz onları ayırt edebilir.
Matematiksel yetenekleri ölçen bir ölçek oluşturduysanız, o zaman yakınsak matematiksel yetenek endekslerinin geçerliliği durumunda, teorik düzeyde böyle bir ilişki varsa, bir kişinin genel becerileri ile iyi bir şekilde ilişkili olmalıdır. Bir insandan sayma becerilerinden tamamen farklı yetenekler gerektiren estetik yetenekler var ve kötü bir şekilde, tabii ki teoriniz tarafından düşük bir korelasyon ilan ediliyorsa.
Türler
Doğrulama, oluşturulan psikodiagnostik yöntemleri geliştirerek ayarlama işlemidir. Temel görevi, teknolojinin geliştiricinin tam olarak neye ihtiyacı olduğunu teşhis etmesini sağlamaktır. Teorik ve pragmatik doğrulama arasında bir ayrım yapılır.
İlk tür için, temel sorun, zihinsel fenomenler ve bu fenomenlerin yardımıyla bu fenomenlerin bilinmeye çalışıldığı göstergeleri arasındaki ilişkidir. Metodolojinin sonuçlarının ve yazarın soyut niyetinin aynı olduğunu gösterir.
Soyut geçerliliği sağlamak için metodoloji dışında bağımsız bir kriter bulmak çok zordur. Bu nedenle, erken aşamalardaki psikodiyagnostik tarihinde, güven, testin ölçtüğü içgüdüsel konsepte dayanıyordu:
- Bir yöntem basitçe "bariz" ise geçerli kabul edildi.
- Geçerlilik kanıtı, arayıcının teknolojisinin "testeni anlayabileceğine" olan inancına dayanıyordu.
- Plan yalnızca teknolojinin arkasındaki teori "oldukça iyi" olduğu için geçerli kabul edildi.
Sonraki bilim tarafından gerekçelendirilen kanıtları aramaya başladı. Burada, halihazırda kanıtlanmış ve bilinen bir teknoloji cephaneliğinin algılanamayan birikiminin olduğu belirtilmelidir.geçerlilik. Bir psikodiagnostik uzmanı bir kaliteyi değerlendirmek için bir şema oluşturursa ve diğer geçerli teknolojilerin aynı değerlendirmeyi amaçladığı biliniyorsa, korelasyonu inceleyebilir, sonuçları başka birinin ve kendi yönteminize göre karşılaştırabilirsiniz.
Korelasyon katsayısı çok yüksekse, oluşturulan şema etkileyici bir soyut geçerliliğe sahiptir. Bir teknolojinin tam olarak neyi değerlendirdiği konusunda şüpheniz varsa, bunun sonuçlarını, komşu (şüpheli) özellikleri tanıyan başka birinin geçerli şemalarının sonuçlarıyla karşılaştırın. Korelasyon değerleri beklenmedik şekilde büyük çıkarsa, yöntemin bekleneni tahmin etmediği sonucuna varılabilir.
Böylece, tam olarak aynı normları veya ilgili olanları ölçmeyi amaçlayan başka şemalar zaten varsa, ayırt edici ve yakınsak geçerliliği belirleyebiliriz.
Nüanslar
Peki, doğrulama nedir? Basit bir deyişle, bu, beyan edilen özelliklerle nasıl eşleştiğini görmek için ürünün bir revizyonudur. Yani, o zamana kadar herhangi bir akıllı telefon doğrulaması geçmeyecek. Müşteriler, ödemeye hazır oldukları kamera ve depolama alanına sahip olduğundan emin olana kadar.
Doğrulama kriteri, doğrulanan testten bağımsız ve doğrudan olan ve psikodiagnostik şemanın hedeflediği zihinsel kalitenin bir ölçüsüdür.
Mevcut geçerlilik - testin bir özelliği, bu testte çalışmanın konusu olan bir tanısal özellik temelinde özneleri ayırt etme yeteneğini yansıtır.yöntem.
Rekabet geçerliliği, oluşturulan testin, ölçülen parametreye göre geçerliliği belirlenen diğer testlerle korelasyonu ile tahmin edilir. Diferansiyel geçerlilik, faiz testleri örneği ile açıklanabilir.