litceymos.ru 1

Джон Равен


ПРОГРЕССИВНЫЕ МАТРИЦЫ РАВЕНА: ИЗМЕНЕНИЕ И СТАБИЛЬНОСТЬ В ЗАВИСИМОСТИ ОТ МЕСТА И ВРЕМЕНИ

В статье представляются данные о стабильности и вариативности норм теста прогрессивных матриц Равена в группах различных культур, этнической принадлежности и социоэкономического статуса в различных странах мира, а также внутри отдельных стран. Затем обсуждается изменение показателей теста с течением времени. Предлагается объяснение вариативности норм, происходящих во времени, и при сравнении групп с различной этнической принадлежностью в пределах стран.


ПРОГРЕССИВНЫЕ МАТРИЦЫ РАВЕНА И CЛОВАРНЫЕ ШКАЛЫ МИЛЛ ХИЛЛ


Прогрессивные матрицы Равена и Словарные шкалы Милл Хилл были разработаны с целью оценки как можно более прямым путем двух компонентов фактора g (общего интеллекта - ОИ), выделенных К.Спирманом (C.Spearman, 1927) в 1923 г.: (1) продуктивной способности, т.е. способности делать выводы, извлекать смысл из хаотического материала, схематизировать, обычно на невербальном уровне, и создавать концепции, позволяющие легко оперировать сложными понятиями; (2) репродуктивной способности способности усваивать и воспроизводить вербальную информацию.


Многочисленные исследования (из наиболее современных можно назвать работы, авторами которых являются Дж.Д.Матараццо (J.D.Matarazzo, 1990) и М.Дж.Ри, Дж.А.Эрлс и М.С.Тичаут (M.J.Ree, J.A.Earles & M.S.Teachout, 1994) подтвердили правильность формулировок К.Спирмана. Как следует из публикации Матараццо, попытки извлечь из данных мультифакторных тестов интеллекта более чем эти два значения неправомерны. Ри и соавт. показали, что присовокупление значений этих специфических факторов к оценке ОИ лишь в редких случаях улучшает точность предсказания будущего профессионального успеха.

Имеются также свидетельства, что предложенные Дж.Равеном методики измерения упомянутых выше способностей успешно выполняют свое назначение. Соответствующие данные подробно анализируются в работах Дж.Равена, Дж.К.Равена и Дж.Г.Корта (J.Raven, J.C.Raven & J.H.Court, 1994, 1995). Здесь достаточно будет отметить, что:



1. Д.Эндрич и И.Стайлс (D.Andrich & I.Styles, 1993) показали, что так называемые стадии Пиаже просто являются определенными точками на шкале развития способностей, необходимых для решения заданий из прогрессивных матриц Равена.

2. И.Дж.Дири (I.J.Deary, 1993) и другие исследователи обнаружили, что оценки по прогрессивным матрицам Равена связаны с показателями времени рассматривания (показатель когнитивного функционирования при неограниченном времени тестирования).

3. По данным многих исследователей тесты прогрессивных матриц представляют собой одни из самых достоверных среди существующих методов измерения ОИ. С другой стороны, результаты Словарные тестов Милл Хилл, на выполнение которых требуется всего несколько минут, совпадают (с коэффициентом корреляции, равным 0.9) с результатами громоздких многофакторных тестов интеллекта. Правда, внутри возрастных групп оценки по прогрессивным матрицам Равена и Словарным шкалам Милл Хилл имеют коэффициент корреляции всего 0.5. Таким образом, как обнаружил К.Спирман, репродуктивная и продуктивная способности, вероятно, являются независимыми друг от друга: с репродуктивной способностью (измеренной при помощи Словарной шкалы Милл Хилл) связано лишь 25% дисперсии продуктивной способности (измеренной при помощи прогрессивных матриц Равена), хотя оба теста имеют высокую корреляцию с тестами разной предметной ориентации, предсказывающими различные типы повседневного поведения.

К.Спирман также отмечал, что, несмотря на различную психологическую природу (одна не является "кристаллизованной" формой другой), репродуктивная и продуктивная способности оказываются взаимопроникающими и взаимодействующими и имеют кумулятивное влияние на жизненный успех индивида. С другой стороны, те виды деятельности, которые хорошо выполняются лицами с относительно высоким уровнем продуктивной способности, весьма отличаются от тех, для которых требуется выраженная репродуктивная способность. Эти наблюдения подтверждаются данными исследований, которые рассмотрены в упомянутых выше работах. Однако эти свидетельства не получили должного внимания со стороны образовательных учреждений, которые обычно отдают предпочтение учащимся с высокой репродуктивной способностью, а не тем, кто способен к ясному восприятию и мышлению (см. J.Raven, 1994; J.Raven, J.Johnstone & T.Varley, 1985; K.Hope, 1984). В результате использование данных об успеваемости для профессионального отбора оказывается совершенно непродуктивным.



Тесты прогрессивных матриц Равена (ПМР) существуют в трех формах: цветной (ЦПМ), предназначенной для нижних 20% популяции, стандартной (СПМ), предназначенной для использования во всей популяции любых возрастов, и продвинутой (ППМ), предназначенной для верхних 20% популяции. Словарная шкала существует в двух версиях: Словарная шкала Крайтон для детей и Словарная шкала Милл Хилл для определения способностей на полной выборке. Словарная шкала Милл Хилл (СШМХ) в свою очередь имеет варианты для старших и младших испытуемых. Оба набора тестов на протяжении последних 50 лет периодически модифицировались.


Стандартизация среди молодых испытуемых


Тесты ПМР использовались более чем в 2000 исследованиях, результаты которых опубликованы (обзоры см. J.H.Court & J.Raven, 1995; J.H.Court, 1994), и широко применяются практическими психологами.

Стандартная методика прогрессивных матриц (СПМ) впервые прошла полную стандартизацию в 1938 г. на 1407 детях в Ипсвиче, Англия (J.C.Raven, 1941). В последующие годы было выполнено еще несколько нормативных исследований. Первое из них было осуществлено самим Равеном, стандартизовавшим СШМХ в Колчестере, Англия, в 19431944 г. (J.Raven & J.B.Walshaw, 1944). Стандарты для СПМ, полученные в этом исследовании, были достоверно на два пункта ниже при "сырой" оценке, чем в Ипсвиче. В 1952 г. Э.А.Адамс (E.A.Adams) опубликовал результаты, полученные при обследовании 11621 ребенка 12 лет в Суррее, Англия. Эти данные (в пределах ошибки для такой выборки) оказались очень близки к цифрам, сообщаемым Равеном. Р.Д.Тадденхем с соавт. (R.D.Tuddenham et al, 1958) осуществили одну из немногих работ, в которых исследовалась применимость полученных в Англии стандартов для Соединенных Штатов: были обследованы школьники из нескольких классов школ в Калифорнии. Вывод из полученных данных заключался в том, что английские стандарты могут применяться и в США. В 19631965 гг. 4017 детей в возрасте от 9,5 до 14 лет были протестированы Г.Р.Скейнсом (G.R.Skanes) в Ст.Джонсе, Ньюфаундленд; результаты оказались поразительно сходны с полученными в 1938 г. в Ипсвиче (J.Raven, 1981). В 1967 г. Г.Р.Скейнс также обследовал все население 2097 человек Корнер Брука, Ньюфаундленд. Были получены данные, достоверно более низкие, чем в Ипсвиче. В 1972 г. Э.Бирт и Э.П.Гилл (E.Byrt & E.P.Gill, 1973) совместно с автором настоящей статьи собрали данные о национальной репрезентативной выборке школьников Ирландии 3464 детях в возрасте 5,5 11,5 лет. Для городских детей стандарты совпали с ипсвичскими нормами 1938 г., хотя для деревенских детей они оказались ниже (J.Raven, 1981). Таким образом, полученные до 1979 г. свидетельства никак не предвещали того, что последовало.



Однако с 1979 г. ситуация начала меняться. Х.Кратцмейер и Р.Хорн (H.Kratzmeier & R.Horn, 1979) сообщили о результатах, полученных на большой немецкой выборке, значительно превосходящих английские данные 1938 г. Сходными оказались и результаты для Восточной Германии, опубликованные Х.Г.Мелхорном (H.G.Mehlhorn, 1980). Данные, полученные в это же время в Англии (J.Raven, 1981), в целом сходны с полученными в двух немецких исследованиях. Как сообщает Б.Дж.Холмс (B.J.Holmes, 1980), в Британской Колумбии (Канада) цифры также оказались близкими, хотя и слегка более низкими. Новозеландский совет по исследованиям в образовании в 1984, а Австралийский совет по исследованиям в образовании в 1981 г. также приводят близко совпадающие с этим данные. Й.Ферженчик (J.Ferjencik, 1985), использовавший цветные прогрессивные матрицы в Чехословакии, опубликовал результаты, сходные с данными проведенного незадолго до этого английского исследования. Программа, осуществленная в США Дж.Равеном с соавт. (J.Raven et al., 1990), показала, что хотя американские нормы в целом ниже вышеупомянутых интернациональных, для белых американцев они находятся на том же уровне. Х.Ц.Чанг и К.П.Ванг (H.C.Zhang & X.P.Wang, 1989) опубликовали цифры, полученные на репрезентативных выборках городских жителей материкового Китая, которые показывают, что, несмотря на тенденцию, выявленную исследованием Дж.Чена (J.Chan, 1981, 1989) в Гонконге, нормы в Китае близко совпадают с таковыми во всем мире. Еще более недавние результаты, подтверждающие то, что может быть названо "интернациональными нормами для обществ, в которых распространена грамотность", получены в Польше (A.Jaworowska & T.Szustrowa, 1991; J.C.Raven et al., 1994, 1996), Испании (J.C.Raven et al., 1995), Швейцарии (L.Martinoli, 1990) и некоторых районах США.

Единственный случай достоверного превышения этих цифр отмечен на Тайване (E.S.Y.Miao & W.Huang, 1990; E.S.Y.Miao, 1993). При поиске объяснения данного факта выяснилось не только то, что ПМР играют существенную роль в жесткой школьной системе оценки успеваемости на Тайване, но и то, что тесты распространяются среди учителей и их применение для подготовки учащихся поощряется. Таким образом, полученные результаты говорят скорее не о выдающемся развитии у тайваньцев продуктивной способности, а о влиянии на результаты измерения высокой мотивации и тренировки.



Как уже отмечалось, для сельских и изолированных общин нормы обычно оказываются более низкими, чем для других. Полученные в Ирландии и на Ньюфаундленде данные подтверждают это. Низкие значения, полученные на репрезентативных выборках релевантных популяций, имеют место также в Бразилии (A.L.Angelini et al., 1988), Турции (N.Sahin & E.Duzen, 1994), Малайзии (H.K.Chiam, 1994, 1995a&b), Пуэрто Рико (H.Kahn, J.Spears & L.Rivera, 1977; J.Raven & J.H.Court, 1989) и отдаленных горных районах Перу.


Как подчеркивалось Дж.Равеном (J.Raven, 1989), "низкие" нормы, полученные в большинстве упомянутых исследований (за исключением отдаленных горных районов Перу), должны рассматриваться в должном контексте: большая часть оценок превосходят английские цифры 1938 года, а факторы, ответственные за такой рост, могут быть обусловлены различиями между культурными группами. Английская стандартизация 1979 г.


Рассмотрим несколько более подробно английскую стандартизацию 1979 г. В ее основу легли данные, полученные на нацио нальной репрезентативной выборке 3250 детей в возрасте 616 лет. Коэффициент корреляции значений СПМ и района страны был равен 0.16, а при учете влияния социоэкономического фактора (СЭФ) уменьшался до 0.07; для СПМ и СЭФ он составлял 0.22. Однако следует учитывать, что 46% различий были связаны с возрастом, а СЭФ ответствен за 8.9% дисперсии, с возрастом не связанной; таким образом, внутри возрастной группы коэффициент корреляции СПМ и СЭФ оказывается равен 0.30.

Коэффициент корреляции СПМ с возрастом составлял 0.68, т.е. более чем половину различий нельзя объяснить возрастом. Одним из следствий этого оказывается тот факт, что верхние 10% группы детей 7.5 лет показывают лучшие результаты, чем нижние 10% группы 15.5летних. Хотя такие особенности первичного обследования знакомы каждому, кто занимается измерением способностей, они противоречат широко распространенному мнению, что подобные тесты просто измеряют "интеллектуальную зрелость", а потому часто игнорируются образовательной системой. Как и в исследовании 1938 г., анализ характеристических кривых отдельных заданий, основанный на Теории выбора ответов, или модели Раша, был проведен отдельно для каждой возрастной и социоэкономической группы Во всех случаях задания располагались на шкале практически одинаково. Поэтому трудно согласиться с тем, что тест "чудж образу мышления детей из определенных социальных групп", хотя это и не значит, что оценки, полученные конкретным ребенком, будут абсолютно достоверными.



Американские данные


Между 1983 и 1989 гг. в школьных округах различных районов Соединенных Штатов было проведено около 50 нормативных исследований (J.Raven et al., 1990; J.Raven, 1989). В каждом случае выборка была репрезентативной для округа; это является необычным, поскольку в большинстве программ стандартизации местные выборки делаются с целью внесения определенного вклада в общенациональную картину и не могут использоваться для получения данных местного значения. В ходе этих исследований было протестировано более 60 000 учащихся 518 лет. Полученные при этом результаты заметно различались как между округами, так и в пределах одного округа в зависимости от социоэкономической и этнической принадлежности испытуемых. И этническая принадлежность, и социоэкономический статус вносили независимый вклад в дисперсию данных. Различия в нормах в зависимости от типа школ, предназначенных для белых учащихся с различным социоэконосическим статусом, были так же велики, как и между школьными округами с разным этническим составом жителей. Этнические различия часто коррелировали с весом ребенка при рождении, детской смертностью, частотой тяжелых детских заболеваний (United States Government, Bureau of the Census, 1984). Анализ заданий был выполнен раздельно для разных этнических групп. Его результаты показали, что трудность заданий для каждой из групп варьировала от 0.98 до 1.00; отсюда следует, что тест работает одинаково и измеряет одно и то же в каждой группе. В добавление к этому можно заметить, что, как сообщает Х.В.Хоффман (H.V.Hoffman, 1983, 1990), кривые регрессии достижений для ПМР в разных этнических группах параллельны, хотя и расположены на различной высоте. Таким образом, хотя оценки по тесту достижений и по тестам прогрессивных матриц находятся на разном уровне, ПМР имеет одинаковую прогностическую ценность внутри каждой группы.


СЛОВАРНАЯ ШКАЛА МИЛЛ ХИЛЛ

При проведенной в Англии в 1979 стандартизации Словарной шкалы Милл Хилл (СШМХ), как и в случае СПМ, не было выявлено различий между регионами после того, как нивелировалось влияние социоэкономического фактора. СЭФ объяснял 16.2% не связанной с возрастом дисперсии данных. Оценки СШМХ, таким образом, более связаны с социоэкономическим статусом семьи, чем СПМ. Возраст определял 58% дисперсии СШМХ. Значения СШМХ, в отличие от СПМ, не образовывали плато, и плавный прирост составлял примерно 1.5 слова за интервал в 6 месяцев до возраста в 15.5 лет. Верхние 10% в группе девятилетних показывали лучшие результаты, чем нижние 10% в группе 15.5летних.



Раздельный анализ заданий был проведен для восьми групп с различным СЭФ. Воспроизводимость свойств шкалы в группе составила в среднем 0.97. Порядок, в котором дети усваивают значение слов, таким образом, не в большей (и не в меньшей) мере зависит от СЭФ, чем способность выполнять задания СПМ.


Представляется неправомерным за ключение, что дети из разных социальных групп усваивают различные наборы слов. Нормы, полученные для США в целом по СШМХ, как и по ПМР, оказались несколько ниже интернациональных, но для белых американцев они были близки к данным других кросскультурных исследований. Результаты тестов были сходными для англоговорящих учащихся из разных социоэкономических групп: представители одних усваивали не так уж много слов, неизвестных представителям других.


По данным Ж.Ж.Дельтур (J.J.Deltour, 1993), СШМХ может быть переведена на французский язык с незначительными изменениями и с такой же процедурой оценки;получаемые при этом результаты сходны с английскими. Подводя итоги, можно сказать, что этот быстрый и простой метод измерения репродуктивной способности оказался замечательно результативным; полученная с его помощью информация вполне может конкурировать с заключениями как психологов, так и неспециалистов.


СТАБИЛЬНОСТЬ И ИЗМЕНЕНИЯ С ТЕЧЕНИЕМ ВРЕМЕНИ


Рассмотренные выше данные показывают, что результаты применения ПМР были сходными для детей из разных социоэкономических групп в английских исследованиях 1938 и 1979 гг., для разных этнических групп в американском исследовании 1986 г., для представителей различных культур. К тому же построенные в 1979 г. при помощи компьютера характеристические кривые заданий (J.Raven, 1981) очень сходны с построенными вручную в 1938 г. (J.C.Raven, 1941).

Если можно доверять ранним данным (а имеется достаточно доказательств, что они верны), то получается, что к 1979 молодежь стала овладевать измеряемыми ПМР умениями в более раннем возрасте, и что набранные баллы особенно для добившихся меньшего успеха образуют плато на более высоком уровне. Имеет место заметная акселерация и рост общих тестовых результатов.



Недавние исследования во Фрибурге, Швейцария, проведенные Л.Мартиноли (L.Martinoli, 1990) с помощью ЦПМ и С.Шпихер (S.Spicher, 1993) с помощью СПМ показали аналогичные изменения с течением времени.


Однако эти данные ничего не говорят о том, были ли изменения постепенными и накапливающимися или, может быть, они присущи лишь последним десятилетиям. Опубликованные в 1987 г. данные (J.R.Flinn) вызвали пристальный интерес ученых: сопоставление результатов призывников примерно 18летнего возраста из многих западных стран показывает, что количество баллов, набираемых молодежью, увеличивается примерно на величину стандартного отклонения за поколение на протяжении последних пятидесяти лет.


Сообщение Дж.Р.Флинн послужило кульминацией целой серии работ: Р.Л.Торндайк (R.L.Thorndike, 1975, 1977), Р.Гарфинкель и Р.Л.Торндайк (R.Garfinkel & R.Thorndike, 1976), К.В.Шайе (K.W.Schaie, 1983), Дж.Р.Флинн (J.R.Flinn, 1984). Надо заметить, что данные, послужившие основой для заключения, согласно которому результаты ПРМ и других тестов интеллекта быстро повышаются с течением времени (а также что индивидуальные показатели интеллекта снижаются после достижения двадцатилетнего возраста, вероятно, не так быстро, как считалось ранее), были почерпнуты в основном из обследований селективных выборок (учащихся школ или призывников) по причине трудности обследования неселективных репрезентативных выборок.

С тех пор удалось получить материалы о выборке примерно из 650 взрослых, представителей различных возрастных групп, проживающих в двух городах английском и американском. Эти города были выбраны по соображениям совпадения их демографических характеристик с общенациональными; поэтому предполагалось, что стандарты, полученные на выборке, окажутся такими же, как если бы было обследовано все население. Это допущение получило подтверждение при проведении в 1979 английской и в 19841986 гг. американской стандартизации среди молодежи. Процедура обследования, частоты ответов на предложение ринять участие в обследовании и другие данные подробно описаны в работах Дж.К.Равена и соавт. (J.C.Raven et al., 1994, 1996).



Как видно из таблиц 1 и 2, нормы для ПМР и для СШМХ, полученные как в шотландском городе Дамфрис, так и в американском Де Мойнс, штат Айова, очень близки.


Сравнение средних величин и разброса результатов для лиц, родившихся в 1922 г. и протестированных при призыве в армию в 1942 г., когда им было двадцать лет, и для выборки из тех же лиц в Дамфрисе в 1992


Таблица 1 Применение варианта 2 ПМР (без учета времени). Данные, полученные в 1993 г. в США, по сравнению с английскими данными 1992 г. Возраст в годах 20 25 30 35 40 45 50 55 60 65 70 18 23 28 33 38 43 48 53 58 63 63+ to to to to to to to to to to to 22 27 32 37 42 47 52 57 62 67 Процентиль UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US 95 33 32 33 32 33 32 33 32 32 32 32 32 31 31 31 30 31 29 30 27 26 25 90 31 30 31 30 31 30 31 30 30 30 30 30 29 29 28 28 27 27 26 25 22 23 75 27 27 27 27 27 27 27 26 26 26 25 26 24 26 23 25 22 24 21 22 18 19 50 22 20 22 20 22 20 21 19 20 19 19 19 18 19 17 18 16 16 15 14 13 12 25 17 15 17 15 17 15 16 15 15 15 14 14 13 14 12 13 11 12 10 10 7 8 10 12 10 12 10 12 10 11 10 10 10 10 10 9 9 8 8 7 7 6 6 4 4 5 9 7 9 7 9 7 8 7 7 7 6 7 5 6 4 5 4 4 3 3 2 1 n 58 28 71 53 84 72 69 77 54 121 67 69 54 33 39 36 46 27 43 33 44 54


Примечание: данные для США основаны на стандартизации СПМ и ППМ в Де Мойнсе, Айова; данные для Англии основаны на стандартизации СПМ и ППМ в Дамфрисе, Шотландия. В обоих случаях тесты выполнялись "на досуге".

Таблица 2 Применение СШМХ, варианты 1 и 2 (без учета времени) Данные, полученные в 1993 г. в США, по сравнению с английскими данными 1992 г. Возраст в годах 20 25 30 35 40 45 50 55 60 65 70 18 23 28 33 38 43 48 53 58 63 63+ to to to to to to to to to to to 22 27 32 37 42 47 52 57 62 67 Процентиль UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US 95 67 69 69 70 71 71 73 72 75 73 77 74 79 75 81 76 83 77 85 78 86 77 90 64 63 66 65 68 66 70 67 72 68 74 69 76 70 78 72 80 73 82 73 82 72 75 59 56 61 57 63 58 65 59 67 61 68 63 70 65 71 66 73 68 75 68 74 67 50 53 51 55 52 57 53 58 54 60 55 61 57 62 58 63 60 64 62 65 62 63 61 25 46 44 48 46 50 47 52 48 54 50 55 51 56 52 56 53 56 53 56 53 53 52 10 38 36 42 38 44 40 47 42 49 44 49 46 49 46 49 46 49 46 45 46 36 45 5 28 23 32 25 36 27 40 31 43 33 43 35 43 37 43 38 41 38 33 38 24 36 n 56 26 69 53 81 70 69 75 53 118 60 68 49 31 38 35 44 29 41 32 38 56



Примечание: данные для США основаны на стандартизации СПМ и ППМ в Де Мойнсе, Айова; данные для Англии основаны на стандартизации СПМ и ППМ в Дамфрисе, Шотландия. В обоих случаях тесты выполнялись "на досуге". (когда им было по семьдесят) показывает их большое сходство. Полученные материалы также говорят о непрерывном равномерном росте показателей для родившихся позднее: как и предсказывал Дж.Р.Флинн, рост составил пять стандартных отклонений за столетие.


Непрерывность кривых, построенных для двух выборок, протестированных при различных обстоятельствах и в разных местах, подтверждает достоверность данных обоих исследований.


Результаты двух исследований взрослой популяции, разделенных полстолетием, показывают очень небольшие изменения показателей репродуктивной способности (измеренной при помощи СШМХ), подтверждая тем самым заключения К.В.Шайе (K.W.Schaie, 1983), Р.Л.Торндайка (R.L.Thorndike, 1977) и Ю.Бувье (U.Bouvier, 1969): именно компоненты интеллекта, связанные с рассуждениями, измеренные вербальными или невербальными тестами характеризуются наиболее быстрым и постоянным ростом.


ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ


Следует отметить, вопервых, роль, которую прогрессивные матрицы Равена и Словарные шкалы Милл Хилл сыграли в нашем понимании генетических и средовых детерминант способности делать выводы и репродуктивной способности. Возможно потому, что Дж.Равен создал свои тесты, проводя изучение причин психических отклонений, те ученые, которые их использовали, сумели больше добавить к знаниям в этой важной и противоречивой области, чем использовавшие другие тесты. Однако, несмотря на огромный вклад ПМР и СШМХ в развивающие программы, мы остаемся почти столь же несведущими в основополагающих интеллектуальных процессах, как и в тридцатые годы.

Никакие данные, рассмотренные выше, не подтверждают высказанное Флинном (J.R.Flinn, 1987) мнение, что "тесты IQ измеряют не интеллект, а некоторый коррелят, имеющий с ним слабую причинноследственную связь". Помимо того, что Флинн, повидимому, придерживался концепции несколь ко овеществленного и недифференцированного интеллекта, такой вывод по большей части основывается на представлении, что, стоит лишь правильно измерить интеллект, как результаты станут устойчивыми. Однако ни тот факт, что мы физически на головувыше наших бабушек и дедушек, ни то обстоятельство, что существуют различия в росте между представителями разных полов и разных этнических групп, не означает, что ростомеры ненадежные средства измерения.Не означает увеличение роста современного человека и того, что наши деды были пигмеями или что рост пигмеев был характерен и для всех остальных. Дж.Р.Флинн подкрепляет свои выводы следующим рассуждением: если бы способность делать выводы действительно увеличилась, должно бы вырасти и число выданных патентов, а этого не наблюдается. Но ведь никто не будет ожидать, что с увеличением роста среднего представителя населения число золотых олимпийских медалей за прыжки в высоту также увеличится. (Кстати, не окажется ли число опубликованных книг и статей более показательным как мера продуктивной способности? Я хочу сказать: не имеет ли этот фактор даже более сильной причинноследственной связи с интеллектом, нежели число выданных патентов? Число публикаций очень выросло с течением времени.) Мой собственный взгляд заключается в следующем: чем высказывать довольно пренебрежительное суждение, процитированное выше, Флинн мог бы с большим основанием сказать: "Благодарю тебя, господи, за теоретически обоснованную и пригодную для интерпретации шкалу измерения продуктивной способности, которая без особых изменений пригодна для представителей различных культур и которая остается относительно неизменной с течением времени". Несмотря на сравнительно небольшой прогресс в понимании вопроса, данные, рассмотренные выше, все же проливают новый свет на проблему "смещения тестовых оценок", которая преследует всех занимающихся тестированием особенно в Америке последние десятилетия. Поскольку результаты ПМР и СШМХ относительно недвусмысленны, оказалось возможно по крайней мере обсуждать все изложенное выше, не утопая в аргументах в пользу отсутствия "тестовых смещений". Однако для формулирования образовательной политики, основанной на научных достижениях, жизненно необходимо проводить фундаментальные исследования, которые позволили бы измерять более широкий спектр человеческих склонностей и талантов. Огорчительно, что за последние 50 лет прогресс в создании адекватных инструментов измерения мотивов и талантов оказался даже меньше, чем в понимании природы различий между продуктивной и репродук тивной способностью. Мы все еще пытаемся построить систему образования, базирующуюся на представлениях и тестах, предложенных Бине в начале века. Как это видно на примере ошибочных и неадекватных выводов, к которым пришли Г.В.Барретт и Р.Л.Депине (G.V.Barrett & R.L.Depinet, 1991) и Р.Дж.Хернштейн и К.Меррей (R.J.Herrnstein & C.Murray, 1994), основная проблема, стоящая перед нами, переоценка важности "интеллекта" и неудача в поиске методов измерения других компонентов интеллекта и, что еще важнее, других компонентов компетентности. Обсуждение этого выходит за рамки данной статьи, но читателю можно предложить ознакомиться со следующими работами: J.Raven, 1984, 1991; J.C.Raven et al., 1994; J.Raven et al., 1996.



Нельзя закончить данную статью без указания на важность несколько более технической проблемы серьезных ошибок, которые могут возникнуть в случае использования устаревших критериев. Например, результат, по которому пятидесятилетний испытуемый был бы отнесен к 95 процентилю в 1942 г., теперь позволил бы отнести его лишь к 25 процентилю. Такие огромные расхождения говорят о недопустимости использования устаревших норм: оно деморализует испытуемых, производит плохое впечатление на организации, где они работают, и в результате вредно для общества в целом.


Связана с этим и еще одна проблема: эффективность образовательных развивающих программ обычно оценивается путем сравнения баллов, набранных экспериментальной группой, с опубликованными стандартами. Если эти стандарты устарели, программа начинает казаться гораздо более эффективной, чем является на самом деле.


Результаты, рассмотренные в настоящей статье, с одной стороны, подтверждают надежность данных, полученных при применении прогрессивных матриц Равена и Словарных шкал Милл Хилл в западных странах в каждый данный момент времени. Это верно как для статистики заданий, так и для средних баллов и дисперсии. С другой стороны, отмечен рост результатов с течением времени, хотя различия между социоэкономическими и этническими группами сохраняются. Возможно, объяснение этих различий может быть найдено при анализе переменных, отвечающих за сходство и различие в росте, весе при рождении, уровне младенческой смертности; остаются возможными и психологические объяснения.


Полученные результаты имеют большую практическую ценность как с точки зрения интерпретации данных тестирования, так и тем, что подчеркивают важность расширения спектра оцениваемых качеств людям необходимо развивать в себе больше разнообразных талантов.

Перевод с английского А.Александровой Таблица 1 Применение варианта 2 ПМР (без учета времени). Данные, полученные в 1993 г. в США, по сравнению с английскими данными 1992 г. Возраст в годах 20 25 30 35 40 45 50 55 60 65 70 18 23 28 33 38 43 48 53 58 63 63+ to to to to to to to to to to to 22 27 32 37 42 47 52 57 62 67 Процентиль UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US 95 33 32 33 32 33 32 33 32 32 32 32 32 31 31 31 30 31 29 30 27 26 25 90 31 30 31 30 31 30 31 30 30 30 30 30 29 29 28 28 27 27 26 25 22 23 75 27 27 27 27 27 27 27 26 26 26 25 26 24 26 23 25 22 24 21 22 18 19 50 22 20 22 20 22 20 21 19 20 19 19 19 18 19 17 18 16 16 15 14 13 12 25 17 15 17 15 17 15 16 15 15 15 14 14 13 14 12 13 11 12 10 10 7 8 10 12 10 12 10 12 10 11 10 10 10 10 10 9 9 8 8 7 7 6 6 4 4 5 9 7 9 7 9 7 8 7 7 7 6 7 5 6 4 5 4 4 3 3 2 1 n 58 28 71 53 84 72 69 77 54 121 67 69 54 33 39 36 46 27 43 33 44 54



Примечание: данные для США основаны на стандартизации СПМ и ППМ в Де Мойнсе, Айова; данные для Англии основаны на стандартизации СПМ и ППМ в Дамфрисе, Шотландия. В обоих случаях тесты выполнялись "на досуге".


Таблица 2 Применение СШМХ, варианты 1 и 2 (без учета времени) Данные, полученные в 1993 г. в США, по сравнению с английскими данными 1992 г. Возраст в годах 20 25 30 35 40 45 50 55 60 65 70 18 23 28 33 38 43 48 53 58 63 63+ to to to to to to to to to to to 22 27 32 37 42 47 52 57 62 67 Процентиль UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US UK US 95 67 69 69 70 71 71 73 72 75 73 77 74 79 75 81 76 83 77 85 78 86 77 90 64 63 66 65 68 66 70 67 72 68 74 69 76 70 78 72 80 73 82 73 82 72 75 59 56 61 57 63 58 65 59 67 61 68 63 70 65 71 66 73 68 75 68 74 67 50 53 51 55 52 57 53 58 54 60 55 61 57 62 58 63 60 64 62 65 62 63 61 25 46 44 48 46 50 47 52 48 54 50 55 51 56 52 56 53 56 53 56 53 53 52 10 38 36 42 38 44 40 47 42 49 44 49 46 49 46 49 46 49 46 45 46 36 45 5 28 23 32 25 36 27 40 31 43 33 43 35 43 37 43 38 41 38 33 38 24 36 n 56 26 69 53 81 70 69 75 53 118 60 68 49 31 38 35 44 29 41 32 38 56

Примечание: данные для США основаны на стандартизации СПМ и ППМ в Де Мойнсе, Айова; данные для Англии основаны на стандартизации СПМ и ППМ в Дамфрисе, Шотландия. В обоих случаях тесты выполнялись "на досуге".