Какие методы относятся к методам тестирования. Тесты в процессе разработки программного обеспечения

22.09.2019

Особым методом исследования управления, наиболее популярным в современных условиях и, пожалуй, достаточно эффективным является метод тестирования.

Существует множество определений теста. Тест - это удовлетворяющая критериям исследования эмпирико-аналитическая процедура. Очень общее определение. Но есть определения и более конкретные. Например: тест - это система высказываний, позволяющая получить объективное отражение реально существующих отношений между людьми, их свойств, признаков и количественных параметров.

Но можно сформулировать более точное определение теста относительно проблем исследования управления.Тест - это метод изучения глубинных процессов деятельности человека, посредством его высказываний или оценок факторов функционирования системы управления.

Ошибочно бытует представление, что тестирование используется главным образом в изучении психологических проблем. Действительно, в психологии тестирование является наиболее эффективным методом изучения человека. Но сфера использования тестирования не ограничивается только психологической проблематикой.

Большую роль в исследовании при помощи тестирования играет конструкция теста.

Тест включает набор высказываний и оценок по определенной проблеме или ситуации. Оценки могут быть упрощенные (типа "согласен" - "не согласен" или шкалированные (типа "совершенно верно", "верно", "скорее верно, чем неверно", "трудно сказать", "скорее неверно, чем верно", "неверно", "совсем неверно"). Шкала может иметь цифровые оценки в виде рейтинговых коэффициентов или выбора степени согласия.

Конструкция теста должна предполагать возможность обработки его результатов по определенным статистическим программам.

Каждый тест имеет ключ, позволяющий обработать полученную информацию в соответствии с целями тестирования.

Существуют правила формулировки высказываний. Они включают следующие положения(схема 34 ).

А) высказывания должны быть короткими, не более одного придаточного предложения;

Б) понятны для всех без исключения исследуемых (респондентов);

В) в высказываниях не должно быть намека на правильный, одобряемый или ожидаемый ответ;

Г) структурированные ответы по каждому из высказываний желательно иметь с одним и тем же числом альтернатив (не менее 5 и не более 11);

Д) тест не может состоять целиком из предложений, в которых высказываются только позитивные или только негативные суждения;

е) в каждом высказывании теста следует утверждать что-нибудь одно.

При составлении теста необходимо учитывать его основные характеристики.

Надежность - одна из главных и важнейших характеристик. Ее связывают с точностью, определяющей возможность измерения, перевода в количественные показатели. Надежность определяется целью, задачами и характером тестового исследования, качеством высказываний.

Существуют приемы проверки надежности тестов. Они включают повторное тестирование, параллельное тестирование, прием раздельного коррелирования (внутренняя корреляция высказываний), использование дисперсионного анализа, факторный анализ.

Валидность тестов - способность отражать и измерять то, что оно должен отражать и измерять по замыслу, целям. Это относится не только к самому тесту, но и к процедуре его проведения. Валидность теста может быть проверена посредством сравнительной оценки результатов, полученных другими методами, или экспериментом формирования различных групп тестируемых, можно проверить валидность по содержанию теста, проанализировав каждое его высказывание.

В управлении при помощи тестирования можно исследовать проблемы использования ресурсов (в частности, важнейшего из них - времени), уровень квалификации персонала, распределение функций управления, сочетание формального и неформального управления, стиль управления и пр.

Тестирование.

Тестирование (англ. test - испытание, проверка) - эксперементальный метод психродиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида.

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжиования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Основоположники тестирования - Ф.Гальтон, Ч.Спирман, Дж.Каттел, А.Бине, Т.Симон. Сам термин "умственный тест" придумал Кеттел в 1890 г. Начало развития современной тестологии массового применения тестов на практике связано с именем французского врача Бине, разработавшего в соавторстве с Симоном метрическую шкалу умственного развития, известную под названием "тест Бине-Симона".

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют обёективности оценок, не зависящих от субёективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

Тесты предъявляют требования:

Строгая формализация всех этапов тестирования,

Стандартизация заданий и условий их выполнения,

Квантификация полученных результатов и их структурирование по заданной программе,

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

Каждый тест, соответствующий критериям надежности, кроме набора заданий включает в себя следующие компоненты:

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий,

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится,

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученыный результат.

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь неодходимо учитывать, что переносить интерпретацию плученых результатов можно только на те группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров,

2) введение поправочных коэффициетнов с учетом характеристик выборки,

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос)

б) указаний относительно регистрации или интнграции полученых ответов.

Типичная для тестов стандартизация ситуации обеспечивает им в отличие от "свободного" наблюдения поведения большуюю объективность результатов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя различают тесты объективные и субъективные.

К объективным относятся большинство тестов достижений и психофизиологические тесты, к субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

Для проективных тестов типична ситуация, когда испытуемый не информирован о действительной цели исследования. При выполнениис заданий проективных тестов не существует "правильных" ответов. В зависимости от представленности в тесте речевого компонента различаются тесты вербальные и невербальные. Вербальным, например, является тест на словарный запас, невербальным - тест, требующий в качестве ответа определенных действий.

По формальной структуре различаются тесты простые,т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатичтияескими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой "идеальной норме".

Разработка теста состоит из четырех этапов.

На первомэтапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

На втором - производится отбор предварительных пунктов испытания с из последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

На третьем этапе тест проверяется повторно на той же самой популяции;

На четвертом - калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его пpоявления (напpимеp, способности, уpовень знаний, темпеpамент, интеpесы, установки);

б) связанную с этим валидизацию метода, т.е. опpеделение того, насколько он измеpяет тpебуемое свойство;

в) величину выбоpки из популяции, на котоpой должна пpоводиться оценка метода;

г) стимулиpующий матеpиал (таблички, изобpажения, игpушки, фильмы);

д) влияние исследователя в пpоцессе инстpуктиpования, постановки задач, pазъяснений, ответов на вопpосы;

е) условия ситуации;

ж) такие фоpмы поведения испытуеого, котоpые свидетельствуют об измеpяемом свойстве;

з) шкалиpование pелевантных фоpм поведения;

и) сведение pезультатов по отдельным измеpяемым пунктам в общие значения (напpимеp, суммиpование ответов типа "Да");

к) фоpмулиpовку pезультатов в ноpмиpованной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам. Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечаяя на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, крижочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал "лжи". Опросники применяются преимущественно для диагностики характера, диагностики личности (например, экстроверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций. Для таких свойств личности, как экстраверсия - интроверсия, доминирующий мотив, заторможенность, возбудимость, ригидность, разработан ряд диагностических методов (опросники и проективные тесты), с помощью которых можно определить выраженность этих свойств. При конструировании таких методов, как правило, пользуются факторным анализом (Г. Айзенк, Дж.Каттел, Дж. Гилфорд) и конструктивной валидизацией.

На современном этапе в прикладной социологии чаще всего используются тестовые методики, заимствованные из социальной психологии, касающиеся изучения качеств личности. Появляются тесты, специально разработанные социологами. Эти тесты часто используются в социологических анкетах.

Тест - это проба, испытание, один из способов психологической диагностики уровня развития психических процессов и свойств человека. Психологические тесты представляют собой определенную систему заданий, надежность которых испытывается на определенных возрастных, профессиональных, социальных группах и оценивается и стандартизируется с помощью специального математического (корреляционного, факторного и др.) анализа.

Различают тесты для изучения интеллектуальных способностей, уровня умственного развития личности и тесты успеваемости. С их помощью можно выяснить уровень развития отдельных психических процессов, уровни усвоения знаний, общего умственного развития личности. Тесты как стандартизированные методы дают возможность сравнивать уровни развития и успешности подопытных требованиям школьных программ и профессиограммы различных специальностей.

С целью избежания ошибок при использовании тестов как метода психологического исследования их содержание должно соответствовать исследуемому явлению (умственной деятельности, вниманию, памяти, воображении и т.п.) и не требуется для выполнения специальных знаний. Содержание теста и инструкция к его исполнению должны быть максимально четкими и понятными. Результаты тестового исследования нельзя оценивать как абсолютные показатели умственных возможностей личности. Они являются лишь показателями уровня развития определенных качеств на момент исследования по конкретным условиям жизни, обучения и воспитания личности.

В психологии, в частности в педагогической практике, широко применяют метод опроса , когда нужно выяснить уровень понимания подопытным задач, жизненных ситуаций, употребляемых в обучении и практической деятельности понятий (естественнонаучных, технических, социальных) или когда нужна информация об интересах, взглядах, чувствах, мотивах деятельности и поведения личности. К наиболее распространенным разновидностям опроса как метода психологического исследования относятся беседа, интервью, анкетные и социометрические исследования .

дним из видов эмпирических методов является тестирование.

Тест – кратковременное задание, выполнение которого может служить показателем совершенства некоторых психических функций. Задачей тестов является не получение новых научных дачных, а испытание, проверка.

Тесты – более или менее стандартизированные кратковременные испытания свойств личности. Существуют тесты, направленные на оценку интеллектуальных, перцептивных способностей, двигательных функций, личностных особенностей, порога возникновения тревоги, досады в определенной ситуации или интереса, проявляемого к тому или иному виду активности. Хороший тест – результат большой предварительной экспериментальной проверки. Теоретически обоснованные и экспериментально апробированные тесты имеют научное (дифференциация испытуемых по уровню развития того или иного свойства, особенностей и т. п.) и, главное, практическое (профотбор) значение.

Наиболее широко известны и популярны личностные тесты, направленные на определение уровня интеллектуального развития личности. Однако в настоящее время они все меньше и меньше применяются для отбора, хотя первоначально были созданы именно для этого. Такое ограничение применения данных тестов может быть объяснено целым рядом причин. Но именно благодаря их использованию, критике по поводу злоупотребления тестами и мерам, предпринятым для их улучшения, стали значительно лучше понимать сущность и функционирование интеллекта.

При разработке первых тестов были выдвинуты два основных требования, которым должны удовлетворять «хорошие» тесты: валидность и надежность.

Валидность теста заключается в том, что он должен оценивать именно то качество, для которого предназначен.

Надежность теста заключается в том, что его результаты воспроизводятся с хорошим постоянством у одного и того же человека.

Также очень важным является требование нормализации теста. Это означает, что для него в соответствии с данными испытания эталонной группы должны быть установлены нормы. Такая нормализация может не только четко определить группы лиц, к которым может быть применен данный тест, но и располагать результаты, получаемые при тестировании испытуемых, на кривой нормального распределения эталонной группы. Очевидно, было бы нелепо использовать нормы, полученные на студентах университета, для оценки (с помощью тех же тестов) интеллекта детей начальной школы, или применить нормы для детей из западных стран при оценке умственных способностей молодых африканцев или азиатов.

Таким образом, критерии интеллекта в такого рода тестах обусловливаются преобладающей культурой, т. е. теми ценностями, которые первоначально сложились в западно-европейских странах. При этом не учитывается, что у кого-то могут быть совершенно иное семейное воспитание, иной жизненный опыт, иные представления (в частности, о значении теста), а в некоторых случаях и плохое владение тем языком, на котором говорит большинство населения.

Тестирование - это метод психологической диагностики, использующий стандартизированные вопросы и задачи (тесты), имеющие определенную шкалу значений. Существуют три основные сферы тестирования: а) образование - в связи с увеличением продолжительности обучения и усложнением учебных программ; б) профессиональная подготовка и отбор - в связи с темпом роста и усложнением производства; в) психологическое консультирование - в связи с ускорением социодинамических процессов.

Тестирование позволяет с известной вероятностью определить актуальный уровень развития у индивида необходимых навыков, знаний, личностных характеристик. Сам процесс тестирования может быть разделен на следующие этапы: 1) выбор теста с учетом цели и степени его достоверности; 2) его проведение определяется инструкцией к тесту; 3) интерпретация результатов. На всех трех этапах нужен профессионализм, участие или консультация психолога.

Тест (англ. test - проба, испытание, проверка) - стандартизированное, часто ограниченное во времени испытание, предназначенное для установления количественных или качественных индивидуально-психологических различий.

Существуют разнообразные классификации тестов. Они могут подразделяться:

1) по особенностям используемых тестовых задач на тесты вербальные и тесты практические;

2) по формам процедуры обследования - на тесты групповые и индивидуальные;

3) по направленности - на тесты интеллекта и тесты личности;

4) в зависимости от наличия или отсутствия временных ограничений - на тесты скорости и тесты результативности;

5) тесты различаются также по принципам конструирования, например, в последние десятилетия активно разрабатываются компьютерные тесты.

Вербальные тесты - тип тестов, в которых материал тестовых задач представлен в словесной (вербальной) форме. Основным содержанием работы испытуемого являются операции с понятиями, мыслительные действия в словесно-логической форме. Вербальные тесты чаще всего направлены на измерение способности к пониманию словесной информации, навыков оперирования грамматическими языковыми формами, овладения письмом и чтением, также распространены среди тестов интеллекта, тестов достижений и при оценке специальных способностей (например, тесты творческих способностей, составление рассказов и т.д.).

Практические (невербальные) тесты - тип тестов, в которых материал тестовых задач представлен заданиями в наглядной форме (например, составление фигур, дополнение изображения, определенные действия по образцу, составление изображения из кубиков или перерисовывание).

Тесты групповые - предназначены для одновременного обследования группы испытуемых. Число одновременно тестируемых лиц ограничивается, как правило, возможностями контроля и наблюдения со стороны обследующего. Обычно максимально допустимое количество лиц в обследуемой группе - 20-25 человек. Такая форма обследования для детей является более привычной, так как напоминает естественные условия обучения и осуществления контроля знаний в классе, и поэтому часто используется школьными психологами.

Следующая разновидность тестов - индивидуально-ориентированные; они реализуют индивидуальный подход к диагностике психологических особенностей и поведения испытуемого.

Тесты интеллекта (лат. intellectus - понимание, познание), или тесты общих способностей, предназначены для измерения уровня интеллектуального развития и являются одними из наиболее распространенных в психодиагностике.

Тесты специальных способностей - группа психодиагностических методик, предназначенных для измерения уровня развития отдельных аспектов интеллекта и психомоторных функций, преимущественно обеспечивающих эффективность в конкретных, достаточно узких областях деятельности. Обычно различают следующие группы способностей: сенсорные, моторные, технические (механические) и профессионализированные (счетные, музыкальные, скорости чтения и понимания прочитанного и др.). Наибольшее распространение получили комплексные тестовые батареи способностей.

Разновидностью тестов способностей можно считать тесты креативности (лат. creatio - сотворение, создание) - группа психодиагностических методик, предназначенных для измерения творческих способностей личности (способности порождать необычные идеи, отклоняться от традиционных схем мышления, быстро решать проблемные ситуации).

Тесты личностные - группа тестов, направленных на измерение неинтеллектуальных проявлений личности. Тесты личностные - понятие собирательное, включающее в себя методы психодиагностики, с помощью которых измеряются различные стороны личности индивида: установки, ценностные ориентации, отношения, эмоциональные, мотивационные и межличностные свойства, типичные формы поведения. Известно несколько сот разновидностей личностных тестов. Они обычно имеют одну из двух форм: объективные тесты действия и ситуационные тесты. Объективные тесты действия представляют собой относительно простые, четко структурированные процедуры, ориентирующие обследуемого на выполнение какой-либо задачи. Особенностью ситуационных тестов является помещение обследуемого в ситуации, близкие к реальным.

Компьютерные тесты, несмотря на их широкое распространение и на наличие определенных плюсов (автоматизация обработки, уменьшение эффекта воздействия экспериментатора), недостаточно гибки в интерпретации данных и не могут полностью заменить работу профессионального психолога.

Тесты скорости (англ. speed tests) - тип психодиагностических методик, в которых основным показателем продуктивности работы испытуемых является время выполнения (объем) задач тестовых. Такие тесты обычно включают большое количество однородных заданий (пунктов).

Тесты достижений направлены на оценку достигнутого уровня развития навыков, знаний и умений индивида, как правило, после завершения обучения. Они относятся к наиболее многочисленной группе психодиагностических методик (по числу конкретных тестов и их разновидностей).

Кроме того, существуют и тесты, ориентированные на социально-психологический норматив или общественно заданный объективный содержательный эталон (например, ШТУР - школьный тест умственного развития).

В последнее время все большую популярность приобретает выделившийся из лабораторного психологического экспериментаметод тестирования.
Термин "тест" (по-английски - задача, или проба) был введен в 1890 г. в Англии. Тесты получили широкое распространение в детской психологии после 1905 г., когда во Франции были разработаны серии тестов для определения одаренности детей, и в практике психодиагностики после 1910 г., когда в Германии была разработана серия тестов для профессионального отбора.

Применяя тесты, можно получить относительно точную количественную или качественную характеристику изучаемого явления. От других методов исследования тесты отличаются тем, что предполагают четкую процедуру сбора и обработки первичных данных, а также своеобразие их последующей интерпретации. С помощью тестов можно изучать и сравнивать между собой психологию разных людей, давать дифференцированные и сопоставимые оценки.

Наиболее распространенные варианты теста: тест-опросник, тест-задание, проективный тест.

Тест-опросник основан на системе заранее продуманных, тщательно отобранных и проверенных с точки зрения их валидности и надежности вопросов, по ответам на которые можно судить о психологических качествах испытуемых.

Тест-задание предполагает оценку психологии и поведения человека на базе того, что он делает. В тестах этого типа испытуемому предлагается серия специальных заданий, по итогам выполнения которых судят о наличии или отсутствии и степени развития (выраженности, акцентуации) у него изучаемого качества.

Данные типы тестов применимы к людям разного возраста и пола, принадлежащим к различным культурам, имеющим разный уровень образования, любые профессии и жизненный опыт - в этом их положительная сторона. Но вместе с тем имеется и существенный недостаток, состоящий в том, что при использовании тестов испытуемый по собственному желанию может сознательно повлиять на получаемые результаты, особенно если он заранее знает, как устроен тест и каким образом по результатам будут оценивать его психологию и поведение. Кроме того, такие тесты неприменимы в тех случаях, когда изучению подлежат психологические свойства и характеристики, в существовании которых испытуемый не может быть полностью уверен, не осознает или сознательно не хочет признавать их наличие у себя. Такими характеристиками являются, например, многие отрицательные личностные качества и мотивы поведения.

В этих случаях обычно применяютсяпроективные тесты. В основе их лежит механизм проекции, согласно которому неосознаваемые собственные качества, особенно недостатки, человек склонен приписывать другим людям. Такие тесты предназначены для изучения психологических и поведенческих особенностей людей, вызывающих негативное отношение. Применяя тесты подобного типа, о психологии испытуемого судят на основании того, как он воспринимает и оценивает ситуации, психологию и поведение людей, какие личностные свойства, мотивы положительного или отрицательного характера он им приписывает.

Пользуясь проективным тестом, психолог с его помощью вводит испытуемого в воображаемую, сюжетно неопределенную ситуацию, подлежащую произвольной интерпретации. Такой ситуацией может стать, например, поиск определенного смысла в картинке, где изображены неизвестно какие люди, непонятно чем занятые. Нужно ответить на вопросы, кто эти люди, чем они озабочены, о чем думают и что произойдет дальше. На основании содержательной интерпретации ответов судят о собственной психологии отвечающих.

Тесты проективного типа предъявляют повышенные требования к уровню образованности и интеллектуальной зрелости испытуемых, и в этом состоит основное практическое ограничение их применимости. Кроме того, такие тесты требуют достаточно большой специальной подготовки и высокой профессиональной квалификации самого психолога.

Еще одна важная проблема, относящаяся практически ко всем без исключения типам тестов, в процессе проведения самой процедуры тестирования заключается в формальной, поверхностной интерпретации получаемых результатов эксперимента, в сознательном отказе исследователя от познания сущности изучаемого явления и подмене ее случайным итогом выполнения задания; в фетишизации математической обработки формальных результатов "тестовых испытаний".

Данная проблема непосредственно связана с ошибочными взглядами метафизической функциональной психологии, которая рассматривает каждую "психическую функцию" как нечто неизменное, "всегда само себе равное" и не связанное ни с целями и условиями деятельности человека, ни с другими психическими функциями, ни с особенностями личности в целом. В соответствии с этим тесты нацелены только на учет количественного изменения "уровня развития" каждой отдельной функции - психометрию.

Сами задачи и задания (тесты различных типов) могут при правильном их применении давать весьма ценный материал для психологического анализа, однако неподготовленный в профессиональном отношении исследователь не сможет дать ему адекватную оценку и эффективно применить главный принцип практического психолога "не навреди".

Весьма ошибочным (а нередко и приводящим на практике к весьма печальным последствиям) является мнение, что любой человек, купив популярную книгу с психологическими тестами и бегло ознакомившись с ее содержанием, может представляться окружающим психологом и заниматься тестированием на профессиональном уровне.

Таким образом, порочным является не сам тест, а его неправильное использование.

Социометрия: исследование межличностных отношений в группе.

Социометрическая техника, разработанная Дж. Морено, применяется для диагностики межличностных и межгрупповых отношений в целях их изменения, улучшения и совершенствования. С помощью социометрии можно изучать типологию социального поведения людей в условиях групповой деятельности, судить о социально-психологической совместимости членов конкретных групп.

Социометрическая процедура может иметь целью:

а) измерение степени сплоченности-разобщенности в группе;
б) выявление «социометрических позиций», т. е. соотносительного авторитета членов группы по признакам симпатии-антипатии , где на крайних полюсах оказываются «лидер» группы и «отвергнутый»;
в) обнаружение внутригрупповых подсистем, сплоченных образований, во главе которых могут быть свои неформальные лидеры.

Использование социометрии позволяет проводить измерение авторитета формального и неформального лидеров для перегруппировки людей в командах так, чтобы снизить напряженность в коллективе, возникающую из-за взаимной неприязни некоторых членов группы. Социометрическая методика проводится групповым методом, ее проведение не требует больших временных затрат (до 15 мин.). Она весьма полезна в прикладных исследованиях, особенно в работах по совершенствованию отношений в коллективе. Но она не является радикальным способом разрешения внутригрупповых проблем, причины которых следует искать не в симпатиях и антипатиях членов группы, а в более глубоких источниках.

Надежность процедуры зависит прежде всего от правильного отбора критериев социометрии, что диктуется программой исследования и предварительным знакомством со спецификой группы.

Как и процесс разработки, процесс последующего тестирования программного обеспечения также следует определенной методологии. Под методологией в данном случае мы понимаем разнообразные комбинации принципов, идей, методов и концептов, к которым вы прибегаете во время работы над проектом.

В настоящее время существует довольно большое количество разнообразных подходов к тестированию, каждый со своими отправными точками, продолжительностью выполнения и методами, используемыми на каждом этапе. И выбор того или иного из них может быть довольно непростой задачей. В этой статье мы рассмотрим разные подходы к тестированию ПО и поговорим об их основных особенностях, чтобы помочь вам сориентироваться в существующем многообразии.

Каскадная модель (Линейная последовательная модель жизненного цикла ПО)

Каскадная модель (Waterfall Model) является одной из наиболее старых моделей, которую можно применять не только для разработки или тестирования ПО, но также практически для любого другого проекта. Его базовым принципом является последовательный порядок выполнения задач. Это значит, что мы можем переходить к следующему шагу разработки или тестирования только после того, как предыдущий был успешно завершен. Эта модель подходит для небольших проектов и применима только в том случае, если все требования точно определены. Главными достоинствами этой методологии являются экономическая эффективность, простота использования и управления документацией.

Процесс тестирования ПО начинается после завершения процесса разработки. На этой стадии все необходимые тесты переносятся с юнитов на системное тестирование для того, чтобы контролировать работу компонентов как по отдельности, так и в комплексе.

Помимо упомянутых выше достоинств, данный подход к тестированию также имеет и свои недостатки. Всегда существует вероятность обнаружения критических ошибок в процессе тестирования. Это может привести к необходимости полностью изменить один из компонентов системы или даже всю логику проекта. Но подобная задача невозможна в случае каскадной модели, поскольку возвращение на предыдущий шаг в этой методологии запрещено.

Узнайте больше о каскадной модели из предыдущей статьи .

V-Model (Модель верификации и валидации)

Как и каскадная модель, методика V-Model основана на прямой последовательности шагов. Основным отличием между этими двумя методологиями является то, что тестирование в данном случае планируется параллельно с соответствующей стадией разработки. Согласно этой методологии тестирования ПО, процесс начинается как только определены требования и становится возможным начать статическое тестирование, т.е. верификацию и обзор, что позволяет избежать возможных дефектов ПО на поздних стадиях. Соответствующий план тестирования создается для каждого уровня разработки ПО, что определяет ожидаемые результаты, а также критерии входа и выхода для данного продукта.

Схема данной модели показывает принцип разделения задач на две части. Те, которые относятся к дизайну и разработке, размещены слева. Задачи, относящиеся к тестированию ПО, размещены справа:

Основные этапы этой методологии могут изменяться, однако обычно они включают следующие:

Этап определения требований . Приемочное тестирование относится к этому этапу. Его основная задача состоит в оценке готовности системы к финальному использованию
Этап, на котором происходит высокоуровневое проектирование, или High-Level Design (HDL) . Этот этап относится к системному тестированию и включает оценку соблюдения требований к интегрированным системам
Фаза детального дизайна (Detailed Design) параллельна фазе интеграционного тестирования, во время которой происходит проверка взаимодействий между различными компонентами системы
После этапа написания кода начинается другой важный шаг — юнит-тестирование. Очень важно убедиться в том, что поведение отдельных частей и компонентов ПО корректно и соответствует требованиям

Единственным недостатком рассмотренной методологии тестирования является отсутствие готовых решений, которые можно было бы применить, чтобы избавиться от дефектов ПО, обнаруженных на этапе тестирования.

Инкрементная модель

Данная методология может быть описана, как мультикаскадная модель тестирования ПО. Рабочий процесс разделяется на некоторое количество циклов, каждый из которых также делится на модули. Каждая итерация добавляет определенный функционал к ПО. Инкремент состоит из трех циклов:

дизайн и разработка
тестирование
реализация.

В этой модели возможна одновременная разработка разных версий продукта. Например, первая версия может проходить этап тестирования в то время, как вторая версия находится на стадии разработки. Третья версия в то же самое время может проходить этап дизайна. Этот процесс может продолжаться до самого завершения проекта.

Очевидно, что данная методология требует обнаружения максимально возможного количества ошибок в тестируемом ПО настолько быстро, насколько это возможно. Так же, как и фаза реализации, которая требует подтверждения готовности продукта к доставке к конечному пользователю. Все эти факторы существенно увеличивают весомость требований к тестированию.

В сравнении с предыдущими методологиями, инкрементная модель имеет несколько важных преимуществ. Она более гибкая, изменение требований ведет к меньшим затратам, а процесс тестирования ПО является более эффективным, поскольку гораздо проще проводить тестирование и дебаггинг за счет использования небольших итераций. Тем не менее, стоит отметить, что общая стоимость все же выше, чем в случае каскадной модели.

Спиральная модель

Спиральная модель это методология тестирования ПО, которая основана на инкрементном подходе и прототипировании. Она состоит из четырех этапов:

Планирование
Анализ рисков
Разработка
Оценка

Сразу после того, как первый цикл завершен, начинается второй. Тестирование ПО начинается еще на этапе планирования и длится до стадии оценки. Основным преимуществом спиральное модели является то, что первые результаты тестирования появляется незамедлительно после появления результатов тестов на третьем этапе каждого цикла, что помогает гарантировать корректную оценку качества. Тем не менее, важно помнить о том, что эта модель может быть довольно затратной и не подходит для маленьких проектов.

Несмотря на то, что эта модель является довольно старой, она остается полезной как для тестирования, так и для разработки. Более того, главная цель многих методологий тестирования ПО, включая спиральную модель, изменилась в последнее время. Мы используем их не только для поиска дефектов в приложениях, но также и для выяснения причин, их вызвавших. Такой подход помогает разработчикам работать более эффективно и быстро устранять ошибки.

Читайте подробнее o спиральной модели в предыдущем блог посте .

Agile

Методология гибкой (Agile) разработки и тестирование ПО может быть описана как набор подходов, ориентированных на использование интерактивной разработки, динамического формирования требований и обеспечения их осуществления как результата постоянного взаимодействия внутри самоорганизующейся рабочей группы. Большинство гибких методологий разработки ПО нацелены на минимизацию рисков посредством разработки в рамках коротких итераций. Одним из главных принципов этой гибкой стратегии является возможность быстрого реагирования на возможные изменения, нежели стремление положиться на долгосрочное планирование.

Узнайте больше об Agile (прим. — статья на английском языке) .

Экстремальное программирование (XP, Extreme Programming)

Экстремальное программирование является одним их примеров гибкой разработки ПО. Отличительной особенностью этой методологии является “парное программирование”, ситуация, когда один разработчик работает над кодом, в то время как его коллега постоянно проводит обзор написанного кода. Процесс тестирования ПО является довольно важным, поскольку начинается даже раньше, чем написана первая строка кода. Каждый модуль приложения должен иметь юнит-тест, чтобы большинство ошибок могло быть исправлено на стадии написания кода. Другим отличительным свойством является то, что тест определяет код, а не наоборот. Это значит, что определенная часть кода может быть признана завершенной только в том случае, если все тесты пройдены успешно. В противном случае, код отклоняется.

Главными достоинствами такой методологии являются постоянное тестирование и короткие релизы, что помогает обеспечить высокое качество кода.

Scrum

Scrum — Часть методологии Agile, итеративный инкрементный фреймворк, созданный для управления процессом разработки ПО. Согласно принципам Scrum, команда тестировщиков должна участвовать в следующих этапах:

Участие в Scrum планировании
Поддержка в юнит-тестировании
Тестирование пользовательских историй
Сотрудничество с заказчиком и владельцем продукта для определения критериев приемлемости
Предоставление автоматического тестировании

Более того, участники QA-отдела должны присутствовать на всех ежедневных собраниях, как и другие члены команды, чтобы обсудить, что было протестировано и сделано вчера, что будет протестировано сегодня, а также общий прогресс тестирования.

В то же время принципы Agile методологии в Scrum к появлению специфических особенностей:

Оценка усилий, необходимых для каждой пользовательской истории является обязательной
Тестировщик должен быть внимательным к требованиям, поскольку они могут постоянно изменяться
Риск регрессии возрастает вместе с частыми изменениями в коде
Одновременность планирования и выполнения тестов
Недопонимание между членами команды в случае если требования заказчика не до конца ясны

Узнайте больше о методологии Scrum из предыдущей статьи .

Заключение

В заключение важно отметить, что сегодня практика использования той или иной методологии тестирования ПО подразумевает мультиверсальный подход. Иными словами, не стоит рассчитывать на то, что какая-то одна методология окажется подходящей для всех типов проектов. Выбор одной из них зависит от большого числа аспектов, таких как тип проекта, требования заказчика, поставленные сроки, а также многих других. С точки зрения тестирования ПО, для некоторых методологий характерно приступать к тестированию на ранних этапах разработки, в то время как при работе с другими принято ожидать до тех пор, пока система не готова полностью.

Если вам нужна помощь с разработкой программного обеспечения или тестированием, выделенная команда разработчиков и QA инженеров готова к работе.

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Рязанский государственный радиотехнический университет»

Гуманитарный институт

Кафедра политологии и социальных наук

Курсовая работа
по дисциплине «Методика исследования в социальной работе»
на тему: «Тестирование как метод психодиагностики»

Выполнила:
студентка группы 869
Кузина К.Ю.

Проверила:
Серебрякова Н.Н.

Рязань 2011г.

Приложение 1

Введение.

На современном этапе развития общества актуальность темы курсовой работы заключается в роли психологического тестирования для психотерапевтической и психодиагностической практики. В этих областях метод тестирования решает следующие задачи:
1. Обнаружение психических свойств личности, и исходя из обнаруженных характеристик, строить свои дальнейшие отношения. Т. е. психотерапевт получает сведения о личности больного еще до начала психотерапевтического процесса.
2. Применение методик способствует налаживанию контакта с больным, т. к. дает психотерапевту представление и об интеллектуальном уровне, о внушаемости, о характере коммуникативных особенностей больного и о многих других параметрах личности больного.
В отличие от других некоторых методов психодиагностики метод тестирования обладает высокой надёжностью, валидностью и стандартизированностью процедуры, что означает его устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых, а также высокое качество измерения исследуемого свойства.
Объектом курсовой работы является конкретная семья.
Предмет курсовой работы – технология тестирования как метода психодиагностики.
Цель курсовой работы – применить на практике технологию тестирования.
Для достижения поставленной цели необходимо решить следующие задачи:

Методологической базой исследования являются «Психодиагностика» Бурлачук Л.Ф., «Психология» книга 3 Немов Р.С., «Основы профессиональной психодиагностики» Кулагин Б.В., “Психология” Л.А. Венгер, В.С. Мухина.
Курсовая работа «Тестирование как метод психодиагностики» состоит из трёх глав.
В первой главе рассмотрены теоретические аспекты метода тестирования, история появления и развития метода, учёные, внесшие вклад в распространение и совершенствование тестирования, представлена классификация тестов, а также выделены все достоинства и недостатки метода.
Во второй главе рассмотрены и проанализированы правила и различные методики проведения тестирования.
В третьей главе проведено практическое исследование на примере «Теста родительского отношения».
В заключении сделаны выводы по каждой главе и подведены итоги курсовой работы.

Глава 1. Общая характеристика метода психодиагностики – тестирования.

1.1 Тестирование: понятие, история возникновения и развития.

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида.
Тестовые методы принято связывать с бихевиоризмом. Методологическая концепция бихевиоризма основывалась на том, что между организмом и средой существуют детерминационные отношения. Организм, реагируя на стимулы внешней среды, стремится изменить ситуацию в благоприятную для себя сторону и приспосабливается к ней. В соответствии с этими представлениями цель диагностики сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов (термин введен Ф. Гальтоном). Первым исследователем, употребившим в психологической литературе термин «интеллектуальный тест», был Дж. М. Кеттелл. Этот термин после статьи Кеттелла «Интеллектуальные тесты и измерения», опубликованной в 1890 г. в журнале «Mind», приобрел широкую известность. В статье Кеттелл писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут одинаковыми. Так впервые была провозглашена необходимость стандартизации тестов, для того чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых. Дж. Кеттелл предложил в качестве образца 50 тестов, включавших различного рода измерения чувствительности, времени реакции, времени, затрачиваемого на называние цветов, количества звуков, воспроизводимых после однократного прослушивания, и др. Вернувшись в Америку после работы в лаборатории В. Вундта и чтения лекций в Кембридже, он немедленно стал применять тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Кеттеллом и другие американские лаборатории начали применять метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895–1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам. Метод тестов получил широкое распространение. Новый шаг в его развитии был сделан французским врачом и психологом А. Бине (1857–1911) , создателем самой популярной серии тестов. До Бине определялись, как правило, различия в сенсомоторных качествах – чувствительности, быстроте реакции и т. д. Но практика требовала информации о высших психических функциях, обозначаемых обычно понятиями «ум», «интеллект». Именно эти функции обеспечивают приобретение знаний и успешное выполнение сложной приспособительной деятельности.
В 1904 г. министерство образования поручило Бине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению, но ленивых и не желающих учиться, от страдающих врожденными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей. Бине в сотрудничестве с Анри Симоном провел серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с 3 лет). Проведенные на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня. Первая шкала (серия тестов) Бине – Симона появилась в 1905 г. Затем она несколько раз пересматривалась авторами, которые стремились изъять из нее все задания, требующие специального обучения. Бине исходил из представления о том, что развитие интеллекта происходит независимо от обучения, в результате биологического созревания.
Задания в шкалах Бине были сгруппированы по возрастам (от 3 до 13 лет). Для каждого возраста подбирались определенные тесты. Они считались соответствующими данной возрастной ступени, если их решало большинство детей данного возраста (80–90 %). Детям до 6 лет предлагали четыре задания, а детям старше 6 лет – шесть заданий. Задания подбирались путем исследования большой группы детей (300 человек). Испытание начиналось с предъявления тестовых заданий, соответствующих хронологическому возрасту ребенка. Если он справлялся со всеми заданиями, ему предлагались задания более старшей возрастной группы. Если он решал не все, а некоторые из них, испытание прекращалось. Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давались задания, предназначенные для более младшего возраста. Испытания проводились до тех пор, пока не выявлялся возраст, все задания которого решались испытуемым. Максимальный возраст, все задания которого решаются испытуемым, называют базовым умственным возрастом. Если, кроме того, ребенок выполнял также некоторое количество заданий, предназначенных для более старших возрастных групп, то каждое задание оценивалось числом «умственных» месяцев. Тогда к числу лет, определяемых базовым умственным возрастом, прибавлялось и некоторое число месяцев. Несовпадение умственного и хронологического возраста считалось показателем либо умственной отсталости (если умственный возраст ниже хронологического), либо одаренности (если умственный возраст выше хронологического). Вторая редакция шкалы Бине послужила основой работы по проверке и стандартизации, проведенной в Стэнфордском университете (США) коллективом сотрудников под руководством Л. М. Термена. Этот вариант тестовой шкалы Бине был предложен в 1916 г. и имел так много серьезных изменений по сравнению с основным, что был назван шкалой Стэнфорд – Бине. Основных отличий от тестов Бине было два: введение в качестве показателя по тесту коэффициента интеллектуальности (IQ), определяющегося отношением между умственным и хронологическим возрастом, и применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.
Коэффициент IQ был предложен В. Штерном, считавшим существенным недостатком показателя умственного возраста то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных ступеней имеет неодинаковое значение. Чтобы устранить этот недостаток, Штерн предложил определять частное, получаемое при делении умственного возраста на хронологический. Этот показатель, умноженный на 100, он и назвал коэффициентом интеллектуальности. Используя этот показатель, можно классифицировать нормальных детей по степени умственного развития.
Другим нововведением стэнфордских психологов явилось использование понятия статистической нормы. Норма стала тем критерием, с которым можно было сравнивать индивидуальные тестовые показатели и тем самым оценивать их, давать им психологическую интерпретацию.
Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные люди, имевшие достаточно высокую психологическую квалификацию. Эти особенности первых тестов ограничивали их распространение. Практика же требовала тестировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период Первой мировой войны появилась новая форма тестовых испытаний – групповое тестирование.
Необходимость как можно быстрее отобрать и распределить полуторамиллионную армию рекрутов по различного рода службам, школам и училищам заставила специально созданный комитет поручить А. С. Отису разработку новых тестов. Так появились две формы армейских тестов – «Альфа» и «Бета». Первая предназначалась для работы с людьми, знающими английский язык, вторая – для неграмотных и иностранцев. После окончания войны эти тесты и их модификации продолжали широко применять.
Групповые (коллективные) тесты не только делали реальными испытания больших групп, но наряду с этим допускали упрощение инструктир ования, процедуры проведения и оценки результатов тестирования. К тестированию начали привлекаться люди, не имевшие настоящей психологической квалификации, а всего лишь обученные проведению тестовых испытаний.
В то время как индивидуальные тесты, такие как шкала Стэнфорд – Бине, в основном применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, промышленности и армии. 1920-е гг. характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего ее направленностью на оперативное решение практических задач. Измерение интеллекта с помощью тестов рассматривалось как средство, позволяющее научно, а не эмпирически подойти к вопросам обучения, профотбора, оценки достижений и т. д.
На протяжении первой половины XX в. специалистами в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили ее до совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, что все они отличались высокой надежностью и хорошей валидностью, т.е. были однозначны, устойчивы относительно измеряемых свойств объекта.

1.2 Классификация тестов.

Тесты можно классифицировать в зависимости от того, какой признак взят за основание деления.
По форме тесты могут быть индивидуальные и групповые; устные и письменные; бланковые, предметные, аппаратурные и компьютерные; вербальные и невербальные (практические).
Индивидуальные тесты - это такой тип методик, когда взаимодействие экспериментатора и испытуемого происходит один на один. Эти тесты имеют большую историю. С них началась психодиагностика. Индивидуальное тестирование имеет свои преимущества: возможность наблюдать за испытуемым (за его мимикой, другими непроизвольными реакциями), слышать и фиксировать непредусмотренные инструкцией высказывания, что позволяет оценить отношение к тестированию, функциональное состояние испытуемого и др. Кроме того, психолог, опираясь на уровень подготовленности испытуемого, может по ходу эксперимента заменить один тест другим. Индивидуальная диагностика необходима при работе с детьми младенческого и дошкольного возраста, в клинической психологии - для тестирования лиц с соматическими или нервно-психическими нарушениями, людей с физическими недостатками и т.д. Необходима она и в тех случаях, когда нужен тесный контакт экспериментатора и испытуемого с целью оптимизации его деятельности. Для индивидуального тестирования нужно, как правило, много времени. Оно предъявляет высокие требования к уровню квалификации экспериментатора. В этом отношении индивидуальные тесты менее экономичны по сравнению с групповыми.
Групповые тесты - это такой тип методик, который позволяет одновременно проводить испытания с очень большой группой людей (до нескольких сот человек). Одно из главных преимуществ групповых тестов - массовость испытаний. Другое преимущество - инструкции и процедура проведения достаточно просты, и от экспериментатора не требуется высокой квалификации. При групповом тестировании в большой степени соблюдается единообразие условий проведения эксперимента. Обработка результатов обычно носит более объективный характер. Результаты большинства групповых тестов могут обрабатываться на ЭВМ. Еще одно преимущество группового тестирования - относительная легкость и быстрота сбора данных и как следствие более благоприятные по сравнению с индивидуальным тестированием условия для сопоставления с критерием. Однако следует отметить и определенные недостатки группового тестирования. Так, у экспериментатора гораздо меньше возможностей добиться взаимопонимания с испытуемым, заинтересовать его и заручиться его согласием сотрудничать. Любые случайные состояния испытуемого, такие, как болезнь, утомление, беспокойство и тревожность, которые могут влиять на выполнение заданий, гораздо труднее выявить в групповом тестировании. В целом лица, незнакомые с такой процедурой, скорее покажут более низкие результаты в групповых тестах, нежели в индивидуальных. Поэтому в тех случаях, когда принимаемое по результатам тестирования решение важно для испытуемого, желательно дополнить результаты группового тестирования либо индивидуальной проверкой неясных случаев, либо информацией, полученной из других источников.
Устные и письменные тесты. Эти тесты различаются по форме ответа. Устными чаще всего бывают индивидуальные тесты, письменными - групповые. Устные ответы в одних случаях могут формулироваться испытуемым самостоятельно ("открытые" ответы), в других - он должен из нескольких предложенных ответов выбрать и назвать тот, который считает правильным ("закрытые" ответы). В письменных тестах ответы даются испытуемым или в тестовой тетради, или на специально разработанном бланке ответов. Письменные ответы также могут носить "открытый" или "закрытый" характер.
Бланковые, предметные, аппаратурные, компьютерные тесты различаются по материалу оперирования. Бланковые тесты (другое широко известное название - тесты "Карандаш и бумага") представлены в виде тетрадей, брошюр, в которых содержится инструкция по применению, примеры решения, сами задания и графы для ответов (если тестируются дети младшего возраста). Для старших подростков предусмотрены варианты, когда ответы заносятся не в тестовые тетради, а на отдельные бланки. Это позволяет использовать одни и те же тестовые тетради многократно, до тех пор, пока они не износятся. Бланковые тесты могут применяться как при индивидуальном, так и при групповом тестировании.
В предметных тестах материал тестовых задач представлен в виде реальных предметов: кубиков, карточек, деталей геометрических фигур, конструкций и узлов технических устройств и т.п.
Аппаратурные тесты - это такой тип методик, который требует применения специальных технических средств или специального оборудования для проведения исследования или регистрации полученных данных. Широко известны приборы для исследования времени реакции (реактометры, рефлексометры), устройства для изучения особенностей восприятия, памяти, мышления. В последние годы аппаратурные тесты широко используют компьютерные устройства. С их помощью моделируются различные виды деятельности (например, водителя, оператора). Это особенно важно для профессиональной диагностики, ориентированной на определенный критерий. В большинстве случаев аппаратурные тесты проводятся индивидуально.
Компьютерные тесты. Это автоматизированный вид тестирования в форме диалога испытуемого и ЭВМ. Тестовые задания предъявляются на экране дисплея, а ответы испытуемый вводит в память ЭВМ с помощью клавиатуры; таким образом, протокол сразу создается как набор данных (файл) на магнитном носителе. С помощью компьютера экспериментатор получает для анализа такие данные, которые без ЭВМ получить практически невозможно: время выполнения заданий теста, время получения правильных ответов, количество отказов от решения и обращения за помощью, время, затрачиваемое испытуемым на обдумывание ответа при отказе от решения, время ввода ответа (если он сложен) в ЭВМ и т.д. Эти особенности испытуемых можно использовать для углубленного психологического анализа в процессе тестирования.
Вербальные и невербальные тесты. Эти тесты различаются по характеру стимульного материала. В вербальных тестах основным содержанием работы испытуемых являются операции с понятиями, мыслительные действия, осуществляемые в словесно-логической форме. Составляющие эти методики задания апеллируют к памяти, воображению, мышлению в их опосредованной речевой форме. Они очень чувствительны к различиям в языковой культуре, уровню образования, профессиональным особенностям. Вербальный тип заданий наиболее распространен среди тестов интеллекта, тестов достижений, при оценке специальных способностей (например, творческих). Невербальные тесты - это такой тип методик, в которых тестовый материал представлен в наглядной форме (в виде картинок, чертежей, графических изображений и т.п.). Они включают речевую способность испытуемых только в плане понимания инструкций, само же выполнение этих заданий опирается на перцептивные, психомоторные функции. Невербальные тесты уменьшают влияние языковых и культурных различий на результат обследования. Они также облегчают процедуру обследования испытуемых с нарушением речи, слуха или с низким уровнем образования.
По содержанию тесты обычно делятся на четыре класса, или направления: тесты интеллекта, тесты способностей, тесты достижений и тесты личности.
Тесты интеллекта. Предназначены для исследования и измерения уровня интеллектуального развития человека. Они являются наиболее распространенными психодиагностическими приемами.
Под интеллектом как объектом измерения подразумеваются не любые проявления индивидуальности, а прежде всего те, которые имеют отношение к познавательным процессам и функциям (к мышлению, памяти, вниманию, восприятию). По форме тесты интеллекта могут быть групповыми и индивидуальными, устными и письменными, бланковыми, предметными и компьютерными.
Тесты способностей. Это тип методик, предназначенных для оценки возможностей индивида в овладении знаниями, навыками, умениями, необходимыми для одной или нескольких деятельностей. Принято выделять общие и специальные способности. Общие способности обеспечивают овладение многими видами деятельности. Общие способности отождествляются с интеллектом, и поэтому часто они называются общими интеллектуальными (умственными) способностями. В отличие от общих специальные способности рассматриваются в отношении к отдельным видам деятельности. В соответствии с таким делением разрабатываются тесты общих и специальных способностей.
По своей форме тесты способностей носят разнообразный характер (индивидуальный и групповой, устный и письменный, бланковый, предметный, аппаратурный и т.д.).
Тесты достижений, или, как их можно назвать по-другому, тесты объективного контроля успешности (школьной, профессиональной, спортивной) предназначены для оценки степени продвинутости способностей, знаний, навыков, умений после прохождения человеком обучения, профессиональной и другой подготовки. Таким образом, тесты достижений в первую очередь измеряют влияние, которое оказывает на развитие индивида относительно стандартный набор воздействий. Они широко используются для оценки школьных, учебных, а также профессиональных достижений. Этим объясняется их большое количество и разнообразие. Тесты школьных достижений являются в основном групповыми и бланковыми, но могут быть представлены и в компьютерном варианте.
Профессиональные тесты достижений обычно имеют три разные формы: аппаратурные (тесты исполнения или действия), письменные и устные.
Тесты личности. Это психодиагностические приемы, направленные на оценку эмоционально-волевых компонентов психической деятельности - мотивации, интересов, эмоций, отношений (в том числе и межличностных), а также способностей поведения индивида в определенных ситуациях. Таким образом, тесты личности диагностируют неинтеллектуальные проявления.
По процедуре могут быть выделены стандартизированные и нестандартизированные тесты. Стандартизация психологами понимается в двух аспектах:
· стандартизация процедуры и условий проведения тестирования, способов обработки и интерпретации результатов, которые должны привести к созданию равных условий для испытуемых и минимизировать случайные ошибки и погрешности, как на этапе проведения, так и на этапе обработки результатов и интерпретации данных;
· стандартизация результатов, то есть получение нормы, шкалы оценки, которая служит основанием для определения уровня овладения тем, что выясняет данный тест, при этом не важно, какого рода нормы получаются и какие шкалы используются.
По ведущей ориентации:
· тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время (Кольца Ландольта, Бурдона, «шифровка» из набора Векслера);
· тесты мощности или результативности, включающие трудные задачи, время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Примером такого рода тестовых заданий могут быть задания для письменных итоговых экзаменов за курс школы;
· смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности: от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточное для решения предлагаемых задач большинством обследуемых. Оценкой в данном случае служат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения. Эти тесты наиболее часто применяются на практике.
По виду нормирования:
· ориентированные на статистические нормы - тесты, основанием для сравнения в которых служат соответствующим образом обоснованные статистически полученные значения выполнения данного теста репрезентативной выборкой испытуемых;
· критериально ориентированные - тесты, предназначенные для определения уровня индивидуальных достижений испытуемого относительно некоторого заданного критерия, существующего в реальной практике и заранее известного уровня знаний, умений, навыков, необходимых для выполнения определенного вида деятельности. Критерий может быть определен на основании экспертной оценки (например, критерий школьной успешности может быть определен путем опроса педагогов, работающих в данном классе или с данным ребенком) либо практической деятельности испытуемых (критерий школьной успешности может быть определен по оценкам за четверть или год);
· прогностические, ориентированные на успешность дальнейшей деятельности;
· ненормированные.

1.3 Достоинства и недостатки метода тестов.

Метод тестов является одним из основных в современной психодиагностике. По уровню популярности в образовательной и профессиональной психодиагностике он прочно удерживает первое место в мировой психодиагностической практике уже фактически в течение столетия. Популярность метода тестов объясняется следующими главными его достоинствами:
1) стандартизацией условий и результатов. Тестовые методики относительно независимы от квалификации пользователя (исполнителя), на роль которого можно подготовить даже лаборанта со средним образованием. Это, однако, не означает, что для подготовки комплексного заключения по батарее тестов не надо привлекать квалифицированного специалиста с полноценным высшим психологическим образованием;
2) оперативностью и экономичностью. Типичный тест состоит из серии кратких заданий, на выполнение каждого из которых требуется, как правило, не более полминуты, а весь тест занимает, как правило, не более часа. Тестированию одновременно подвергается сразу группа испытуемых, таким образом, происходит значительная экономия времени на сбор данных;
3) количественным дифференцированным характером оценки. Дробность шкалы и стандартизованность теста позволяют рассматривать его как «измерительный инструмент», дающий количественную оценку измеряемым свойствам. Количественный характер тестовых результатов дает возможность применить хорошо разработанный аппарат психометрики, позволяющий оценить, насколько хорошо работает данный тест на данной выборке испытуемых в данных условиях;
4) оптимальной трудностью. Профессионально сделанный тест состоит из заданий оптимальной трудности. При этом средний испытуемый набирает примерно 50 % из максимально возможного количества баллов. Это достигается за счет предварительных испытаний – психометрического эксперимента (или пилотажа). Если в ходе пилотажа становится известным, что с заданием справляется примерно половина из обследованного контингента, то такое задание признается удачным, и его оставляют в тесте;
5) надежностью. Лотерейный характер современных экзаменов с вытягиванием счастливых или несчастливых билетов давно уже стал притчей во языцах. Лотерейность для экзаменующегося здесь оборачивается низкой надежностью для экзаменатора – ответ на один фрагмент учебной программы, как правило, не показателен для уровня усвоения всего материала. В отличие от этого любой грамотно построенный тест охватывает основные разделы учебной программы. В результате возможность для «хвостистов» выбиться в отличники, а для отличника вдруг провалиться резко сокращается;
6) справедливостью. Является важнейшим социальным следствием перечисленных выше достоинств. Ее следует понимать как защищенность от предвзятости экзаменатора. Хороший тест ставит всех в равные условия; 7) возможностью компьютеризации. В данном случае это не просто дополнительное удобство, сокращающее живой труд квалифицированных исполнителей при массовом обследовании. В результате компьютеризации повышаются все параметры тестирования (например, при адаптированном компьютерном тестировании резко сокращается время тестирования). Компьютерная организация тестирования, предполагающая создание мощных информационных банков тестовых заданий, позволяет технически предотвратить злоупотребления со стороны недобросовестных экзаменаторов. Выбор заданий, предлагаемых конкретному испытуемому, может производить из такого банка сама компьютерная программа прямо в ходе тестирования, и предъявление данному испытуемому определенного задания в этом случае является таким же сюрпризом для экзаменатора, как и для испытуемого.
Во многих странах внедрение метода тестов (равно как и сопротивление этому внедрению) тесно связано с социально-политическими обстоятельствами. Внедрение хорошо технически оснащенных тестовых служб в образование – важнейший инструмент в борьбе с коррупцией, поражающей правящую элиту (номенклатуру) во многих странах. На Западе тестовые службы работают независимо от выпускающих (школы) и принимающих (вузы) организаций и снабжают абитуриента независимым сертификатом о результатах тестирования, с которым он может отправляться в любое учреждение. Эта независимость службы тестирования от выпускающих и принимающих организаций является дополнительным фактором демократизации процесса селекции профессиональных кадров в обществе, дающая талантливому и просто работоспособному человеку лишний шанс проявить себя.
Метод тестов обладает некоторыми весьма серьезными недостатками, не позволяющими свести всю диагностику способностей и знаний исключительно к тестированию, такими как:
1) опасность «слепых» (автоматических) ошибок. Слепая вера низкоквалифицированных исполнителей в то, что тест должен сработать правильно автоматически, порождает иногда тяжелые ошибки и казусы: испытуемый не понял инструкции и стал отвечать совсем не так, как требует стандартная инструкция, испытуемый по каким-то причинам применил искажающую тактику, возник сдвиг в приложении трафарета-ключа к бланку ответов (при ручном, некомпьютерном подсчете баллов) и т. п.;
2) опасность профанации. Не секрет, что внешняя легкость проведения тестов прельщает людей, не пригодных ни к какому квалифицированному труду. Оснастившись тестами, им самим непонятного качества, но с громкими рекламными названиями, профаны от тестирования агрессивно предлагают свои услуги всем и вся. Все проблемы предполагается решать с помощью 2–3 тестов – на все случаи жизни. К количественному тестовому баллу приклеивается новый ярлык – заключение, создающее видимость соответствия диагностической задаче;
3) потеря индивидуального подхода, стрессогенность. Тест – самый общий ранжир, под который подгоняют всех людей. Возможность упустить яркую индивидуальность нестандартного человека, к сожалению, довольно вероятна. Это чувствуют сами испытуемые, и это их нервирует, особенно в ситуации аттестационного тестирования. У людей с пониженной стрессоустойчивостью возникает даже определенное нарушение саморегуляции – они начинают волноваться и ошибаться в элементарных для себя вопросах. Вовремя заметить такую реакцию на тест – задача, которая под силу квалифицированному и добросовестному исполнителю;
4) потеря индивидуального подхода, репродуктивность. Тесты знаний апеллируют прежде всего к стандартному применению готовых знаний;
5) отсутствие возможности раскрыть индивидуальность при наличии стандартных, заданных ответов – ничем не восполнимый недостаток метода тестов. С точки зрения выявления творческого потенциала больш
и т.д.................

Тестирование все шире используется в психологопедагогических исследованиях. Исследователи все чаще обращают внимание на объективность получаемых результатов, а тесты являются объективным методом исследования. Особенно активно в настоящее время создаются тесты оценки учебных достижений. При этом они не всегда отвечают необходимым требованиям. В данном параграфе подробно изложены этапы разработки теста учебных достижений.

Существуют различные точки зрения на определение теста.

Тест - это инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизированной процедуры проведения и заранее спроектированной технологии анализа результатов для измерения качеств и свойств личности, учебных достижений, изменение которых возможно в процессе систематического обучения .

А - знание понятий, определений, терминов;

В - знание законов и формул;

С - умение применять законы и формулы для решения задач;

D - умение интерпретировать результаты на графиках и схемах;

Е - умение проводить оценочные суждения.

Каждый тест должен сопровождаться спецификацией, т.е. его описанием, где указываются цели тестирования, для кого этот тест предназначен, содержание проверки, процентное соотношение заданий по различным разделам и видам деятельности, используемые формы заданий, рекомендуемое время выполнения. Спецификация теста разрабатывается с учетом нормативных документов и образовательных стандартов, которые используются при планировании содержания теста.

	Планируемые к проверке знания и умения					Суммарное число по каждому пункту
	Планируемые к проверке знания и умения					Суммарное число по каждому пункту

	В (20%)


	Е (10%)

На этом же этапе планируется длина теста, которая устанавливается в зависимости от целей тестирования, объема проверяемого содержания и возраста испытуемых. В качестве первоначальной длины итогового теста предлагается 60-80 заданий из расчета: общее время тестирования 1,5-2 часа в среднем по 2 минуты на задание.

Для того чтобы не проводить повторной разработки тестовых заданий и математико-статистической проверки теста, в первоначальном варианте целесообразно разработать на 20-25% больше заданий, чем предполагает окончательная форма теста. В процессе статистической обработки будут удалены задания, не соответствующие требуемым критериям.

Составление тестовых заданий. Составление тестовых заданий - один из важнейших этапов в процессе создания теста. Один из ведущих принципов составления заданий - принцип конгруэнтности, т.е. соответствия содержания заданий проверяемой области содержания. Разработчики должны четко представлять, какой конкретный элемент содержания или умение проверяет каждое задание. С помощью задания проверяется что-то одно. Неправильно считать, что лучше составлять задания на проверку нескольких знаний. Неопределенность предмета измерения может привести к двусмысленности формулировки, что ухудшает качество самого теста и влияет на результаты измерения .

Тестовые задания подразделяются по типам, формам и видам, среди которых можно выделить типы:

- закрытые (формы: альтернативных ответов, множественного выбора, восстановления соответствия, восстановления последовательности);
- открытые (с формами: дополнения и свободного изложения).

Об особенностях каждого вида заданий говорилось в параграфе 3.2 данного учебного пособия. Также вы можете прочитать подробное описание видов и форм заданий в учебном пособии .

При составлении тестовых заданий рекомендуется начинать с формулировки правильного ответа, это помогает избежать возникновения нескольких правильных ответов на задание. При подборе дистракторов надо помнить о том, что все дистракторы должны быть равно привлекательны. Подбор дистракторов - достаточно сложная задача. Иногда для их создания можно использовать неправильные ответы самих учащихся. Для этого на предварительном тестировании испытуемым даются задания в открытой форме на дополнение. Типичные ошибки учащихся при выполнении задания будут правдоподобными дистрак- торами.

Выбор типа и формы тестовых заданий производится в соответствии с содержанием теста. При этом не рекомендуется включать в один тест более трех форм тестовых заданий (например, задания альтернативных ответов, множественного выбора и на дополнение). Задания одной формы рекомендуется группировать. Это требование обусловлено тем, что при переходе с заданий одной формы на другую испытуемые тратят время на привыкание к другой системе ответов и время выполнения теста увеличивается.

Экспертный анализ содержания и формы тестовых заданий. Переработка содержания и формы заданий по результатам экспертизы. После разработки первоначальной формы теста необходимо провести ее проверку. Чаще всего такая проверка проводится экспертами. В качестве экспертов могут выступать преподаватели, учителя, другие специалисты, хорошо знакомые с тестируемым содержанием и основами разработки тестов. Для проверки необходимо привлекать не менее 2-4 экспертов. Эксперты не должны иметь отношения к созданию теста. Иногда в качестве дополнительных экспертов могут выступать сами учащиеся, которые проверяют понятность формулировок вопросов и качество дистракторов.

В задачу экспертов входит проверка и оценка:

- инструкции к тесту;
- спецификации теста, в частности, соответствия процента вопросов для тестирования каждого из разделов объему и уровню сложности раздела;
- тестовых заданий на соответствие заявленному уровню сложности;
- формулировок тестовых заданий на соответствие требованиям к составлению тестовых заданий;
- вариантов ответов на соответствие требованиям к вариантам ответов и требованиям к дистракторам.

Эксперты внимательно прочитывают инструкцию и выполняют каждое задание теста. Все их рекомендации фиксируются в специальных протоколах. На основе полученных рекомендаций разработчик дорабатывает тест. При доработке необходимо учитывать, что индивидуальное мнение эксперта может быть ошибочным и не каждая оценка должна быть учтена. Но если все эксперты высказали одно и то же мнение, то его необходимо учесть обязательно.

Челышкова М. Б. Теория и практика конструирования педагогических тестов. М.,2002.

Воронин Ю. А., Трубина Л. А., Васильева Е. В., Козлова О. В. Курс лекций «Современные средства оценивания результатов обучения»: учеб, пособие. Воронеж: Изд-воВГПУ, 2004. 115 с.

Воронин Ю.А., Трубина Л. А., Васильева Е. В., Козлова О. В. Курс лекций «Современные средства оценивания результатов обучения»: учеб, пособие.

Байбородова Л. В., Чернявская А. П., Ансимова Н. П. Организация научного исследования. Ярославль: Изд-во ЯГГТУ, 2014. 232 с.