심리검사 용어 사전

Psychological Testing

413개 핵심 용어 · 14개 카테고리 · 게임으로 학습하기

🎮 게임 학습 시작

심리검사의 기초와 역사 (Foundations & History) (34개 용어)

심리검사 (Psychological Test)
개인의 행동 표본을 표준화된 조건 하에서 수집하여 심리적 특성을 측정하고 수량화하는 체계적 절차이다.
A standardized procedure for sampling behavior and describing it with categories or scores, used to measure psychological attributes under controlled conditions.
주요 연구자: 앤 아나스타시(Anne Anastasi), 로널드 코헨(Ronald Jay Cohen)
심리평가 (Psychological Assessment)
심리검사, 면접, 행동관찰, 기록 검토 등 다양한 정보원을 통합하여 개인의 심리적 특성에 대해 종합적으로 판단하는 전문적 과정이다.
A comprehensive process of integrating information from multiple sources, including psychological tests, interviews, behavioral observations, and record reviews, to form a professional judgment about an individual's psychological characteristics.
주요 연구자: 게리 그로스-마르낫(Gary Groth-Marnat), 로널드 코헨(Ronald Jay Cohen)
심리측정학 (Psychometrics)
심리적 구성개념을 수량화하고 측정하는 이론과 기법을 연구하는 학문으로, 신뢰도, 타당도, 문항분석 등 검사의 질을 평가하는 통계적 방법론을 다룬다.
The science of measuring psychological constructs, encompassing theories and techniques for quantifying mental attributes including reliability, validity, item analysis, and other statistical methods for evaluating test quality.
주요 연구자: 찰스 스피어만(Charles Spearman), 루이스 서스턴(Louis Leon Thurstone), 프레더릭 로드(Frederic Lord)
표준화 (Standardization)
검사의 실시 조건, 채점 절차, 해석 기준을 일관되게 통일하여 모든 수검자에게 동일한 조건을 보장하는 과정이다.
The process of establishing uniform procedures for administering, scoring, and interpreting a test, ensuring that all examinees are assessed under consistent conditions.
주요 연구자: 알프레드 비네(Alfred Binet), 루이스 터먼(Lewis Terman)
측정 (Measurement)
일정한 규칙에 따라 대상이나 사건에 수치를 부여하는 과정으로, 심리학에서는 관찰 불가능한 심리적 속성을 수량화하는 것을 의미한다.
The process of assigning numbers to objects or events according to rules, in psychology referring specifically to the quantification of unobservable psychological attributes.
주요 연구자: 스탠리 스티븐스(S. S. Stevens), 프랜시스 골턴(Francis Galton)
고전검사이론 (Classical Test Theory)
관찰점수(X)는 진점수(T)와 오차점수(E)의 합(X=T+E)이라는 기본 가정에 기초한 측정 이론으로, 신뢰도와 타당도의 전통적 개념을 제공한다.
A measurement theory based on the fundamental assumption that an observed score (X) equals the sum of a true score (T) and error (E), expressed as X = T + E, providing the traditional framework for reliability and validity.
주요 연구자: 찰스 스피어만(Charles Spearman), 해럴드 걸릭슨(Harold Gulliksen)
측정 수준 (Scales of Measurement)
Stevens가 제안한 네 가지 측정 척도(명명, 서열, 등간, 비율)로, 수치에 부여되는 의미와 허용 가능한 수학적 연산이 수준에 따라 달라진다.
The four levels of measurement proposed by Stevens—nominal, ordinal, interval, and ratio—which determine the meaning of numbers and the mathematical operations permissible at each level.
주요 연구자: 스탠리 스티븐스(S. S. Stevens)
명명척도 (Nominal Scale)
대상을 상호 배타적인 범주로 분류하기 위해 수치를 부여하는 가장 기초적인 측정 수준으로, 수치 간에 양적 의미나 순서가 없다.
The most basic level of measurement in which numbers are assigned to objects for classification into mutually exclusive categories, with no quantitative meaning or order implied.
주요 연구자: 스탠리 스티븐스(S. S. Stevens)
서열척도 (Ordinal Scale)
대상들 간의 상대적 순위나 서열을 나타내는 측정 수준으로, 순서 비교는 가능하지만 순위 간 간격이 동일하지 않다.
A level of measurement that arranges objects in a meaningful order or rank, allowing comparison of relative position but not equal intervals between ranks.
주요 연구자: 스탠리 스티븐스(S. S. Stevens)
등간척도 (Interval Scale)
측정 단위 간의 간격이 동일하여 수치 간 차이 비교가 의미 있지만, 절대영점이 존재하지 않아 비율 비교는 불가능한 측정 수준이다.
A level of measurement with equal intervals between values, making differences meaningful, but lacking a true zero point, so ratio comparisons are not possible.
주요 연구자: 스탠리 스티븐스(S. S. Stevens)
비율척도 (Ratio Scale)
절대영점이 존재하여 수치 간의 비율 비교가 가능한 가장 높은 수준의 측정 척도로, 모든 산술 연산이 허용된다.
The highest level of measurement with a true zero point, allowing meaningful ratio comparisons and all arithmetic operations.
주요 연구자: 스탠리 스티븐스(S. S. Stevens)
프랜시스 골턴의 개인차 측정 (Galton's Individual Differences Measurement)
Francis Galton이 인체측정학적 방법을 통해 감각 변별력, 반응시간 등의 개인차를 체계적으로 측정하고 통계적으로 분석하려 한 선구적 시도이다.
Francis Galton's pioneering efforts to systematically measure individual differences in sensory discrimination, reaction time, and other anthropometric characteristics using statistical methods.
주요 연구자: 프랜시스 골턴(Francis Galton), 칼 피어슨(Karl Pearson)
제임스 캐텔의 정신검사 (Cattell's Mental Tests)
James McKeen Cattell이 1890년 'Mental Tests and Measurements' 논문에서 처음 사용한 용어로, 반응시간, 감각 예민성 등을 측정하는 일련의 검사를 지칭한다.
A term first used by James McKeen Cattell in his 1890 paper 'Mental Tests and Measurements,' referring to a series of tests measuring reaction time, sensory acuity, and other basic processes.
주요 연구자: 제임스 맥킨 캐텔(James McKeen Cattell), 클라크 위슬러(Clark Wissler)
비네-시몽 지능검사 (Binet-Simon Intelligence Scale)
1905년 Alfred Binet와 Theodore Simon이 학습 부진 아동을 판별하기 위해 개발한 최초의 실용적 지능검사로, 정신연령(mental age) 개념을 도입했다.
The first practical intelligence test developed by Alfred Binet and Theodore Simon in 1905 to identify children with learning difficulties, introducing the concept of mental age.
주요 연구자: 알프레드 비네(Alfred Binet), 테오도르 시몽(Theodore Simon), 루이스 터먼(Lewis Terman)
정신연령 (Mental Age)
아동의 지적 능력 수준을 해당 연령 집단의 평균 수행과 비교하여 표현한 것으로, 비네 검사에서 아동이 통과한 문항이 해당하는 연령 수준을 의미한다.
A measure of intellectual ability expressed as the age level at which a child's performance corresponds, based on the average performance of children at each age level in the Binet test.
주요 연구자: 알프레드 비네(Alfred Binet), 윌리엄 슈테른(William Stern)
지능지수 (Intelligence Quotient)
원래 정신연령(MA)을 생활연령(CA)으로 나누고 100을 곱한 비율 IQ(MA/CA×100)로 시작되었으며, 현대에는 동일 연령 집단 내 상대적 위치를 나타내는 편차 IQ를 사용한다.
Originally calculated as the ratio of mental age to chronological age multiplied by 100 (MA/CA × 100), now replaced by the deviation IQ, which indicates relative standing within an age group based on a normal distribution.
주요 연구자: 윌리엄 슈테른(William Stern), 루이스 터먼(Lewis Terman), 데이비드 웩슬러(David Wechsler)
편차 IQ (Deviation IQ)
동일 연령 집단의 점수 분포에서 개인의 상대적 위치를 평균 100, 표준편차 15의 표준점수로 변환하여 나타낸 지능지수이다.
An IQ score derived by comparing an individual's performance to the score distribution of their age group, expressed as a standard score with a mean of 100 and standard deviation of 15.
주요 연구자: 데이비드 웩슬러(David Wechsler)
미 육군 알파/베타 검사 (Army Alpha/Beta Tests)
제1차 세계대전 중 미군 신병의 지적 능력을 분류하기 위해 개발된 최초의 대규모 집단 지능검사로, Alpha는 문자 검사, Beta는 비문자 검사이다.
The first large-scale group intelligence tests developed during World War I to classify military recruits: Army Alpha was a verbal written test, and Army Beta was a nonverbal test for illiterate or non-English-speaking recruits.
주요 연구자: 로버트 여키스(Robert Yerkes), 아서 오티스(Arthur Otis)
속도검사 (Speed Test)
쉬운 문항으로 구성되어 있으며 엄격한 시간 제한 내에 얼마나 빠르게 많은 문항에 응답하는지를 측정하는 검사 유형이다.
A type of test composed of relatively easy items with a strict time limit, measuring how quickly an examinee can respond to as many items as possible.
주요 연구자: 리 크론바흐(Lee Cronbach)
검사 배터리 (Test Battery)
특정 평가 목적을 위해 체계적으로 조합된 여러 개의 검사 또는 하위검사로 구성된 집합이다.
A collection of multiple tests or subtests systematically combined to serve a specific assessment purpose, providing a more comprehensive evaluation than any single test.
주요 연구자: 데이비드 웩슬러(David Wechsler), 랠프 레이탄(Ralph Reitan)
검사 매뉴얼 (Test Manual)
검사의 개발 과정, 실시 절차, 채점 방법, 규준 정보, 신뢰도와 타당도 증거를 체계적으로 기술한 공식 안내서이다.
An official guide that systematically documents a test's development process, administration procedures, scoring methods, normative data, and evidence of reliability and validity.
주요 연구자: 미국심리학회(American Psychological Association (APA))
검사 실시 (Test Administration)
검사 매뉴얼에 명시된 표준화된 절차에 따라 검사를 수검자에게 제시하고 반응을 수집하는 과정이다.
The process of presenting a test to examinees and collecting their responses according to standardized procedures specified in the test manual.
주요 연구자: 앤 아나스타시(Anne Anastasi)
개인검사 (Individual Test)
훈련된 검사자가 한 명의 수검자에게 일대일로 실시하는 검사로, 행동 관찰이 가능하고 유연한 상호작용을 통해 풍부한 임상 정보를 얻을 수 있다.
A test administered one-on-one by a trained examiner, allowing behavioral observation and flexible interaction to obtain rich clinical information.
주요 연구자: 데이비드 웩슬러(David Wechsler), 알프레드 비네(Alfred Binet)
집단검사 (Group Test)
다수의 수검자에게 동시에 실시할 수 있는 검사로, 시간과 비용의 효율성이 높아 대규모 선발이나 선별에 적합하다.
A test that can be administered simultaneously to multiple examinees, offering high efficiency in time and cost, making it suitable for large-scale screening and selection.
주요 연구자: 아서 오티스(Arthur Otis), 로버트 여키스(Robert Yerkes)
역량검사 (Power Test)
쉬운 문항에서 어려운 문항으로 난이도가 점진적으로 증가하며, 충분한 시간이 주어져 수검자의 최대 능력 수준을 측정하는 검사이다.
A test with items arranged in order of increasing difficulty and generous time limits, designed to measure the maximum level of ability an examinee can demonstrate.
주요 연구자: 리 크론바흐(Lee Cronbach)
조작적 정의 (Operational Definition)
추상적인 심리적 구성개념을 관찰 가능하고 측정 가능한 구체적 행동이나 절차로 정의하는 방법이다.
A method of defining an abstract psychological construct in terms of specific, observable, and measurable behaviors or procedures.
주요 연구자: 퍼시 브리지먼(Percy Bridgman), 존 왓슨(John B. Watson)
구성개념 (Construct)
직접 관찰할 수 없지만 관찰 가능한 행동으로부터 추론되는 이론적 개념으로, 지능, 불안, 성격 특성 등이 대표적이다.
A theoretical concept that cannot be directly observed but is inferred from observable behaviors, such as intelligence, anxiety, and personality traits.
주요 연구자: 리 크론바흐(Lee Cronbach), 폴 밀(Paul Meehl)
검사 유형 분류 (Classification of Tests)
심리검사를 실시 방식, 측정 내용, 반응 형식, 해석 기준 등 다양한 차원에 따라 체계적으로 분류하는 것이다.
The systematic categorization of psychological tests along various dimensions, including administration method, content measured, response format, and interpretive framework.
주요 연구자: 앤 아나스타시(Anne Anastasi), 로버트 그레고리(Robert Gregory)
객관적 검사와 투사적 검사 (Objective vs. Projective Tests)
객관적 검사는 구조화된 자극과 표준화된 채점으로 수검자의 반응을 수량화하는 검사이고, 투사적 검사는 모호한 자극에 대한 자유로운 반응을 통해 무의식적 심리를 탐색하는 검사이다.
Objective tests use structured stimuli and standardized scoring to quantify responses, while projective tests use ambiguous stimuli to elicit free responses that reveal unconscious psychological processes.
주요 연구자: 헤르만 로르샤흐(Hermann Rorschach), 스타크 해서웨이(Starke Hathaway)
심리검사의 윤리적 사용 (Ethical Use of Psychological Tests)
심리검사의 개발, 실시, 채점, 해석, 보고 전 과정에서 수검자의 권리 보호, 비밀 보장, 자격 있는 전문가에 의한 사용, 공정성 확보 등 윤리적 원칙을 준수하는 것이다.
Adherence to ethical principles throughout the entire process of test development, administration, scoring, interpretation, and reporting, including protecting examinee rights, maintaining confidentiality, ensuring use by qualified professionals, and ensuring fairness.
주요 연구자: 미국심리학회(American Psychological Association (APA)), 사무엘 메식(Samuel Messick)
규준참조검사 (Norm-Referenced Test)
개인의 검사 점수를 규준 집단의 점수 분포와 비교하여 상대적 위치를 해석하는 검사이다.
A test in which an individual's score is interpreted by comparing it to the score distribution of a normative group, indicating relative standing.
주요 연구자: 로버트 글레이저(Robert Glaser)
준거참조검사 (Criterion-Referenced Test)
개인의 점수를 다른 수검자와 비교하는 것이 아니라, 사전에 설정된 절대적 수행 기준(준거)에 도달했는지 여부로 해석하는 검사이다.
A test in which an individual's score is interpreted against a pre-established absolute performance standard or criterion, rather than by comparison with other examinees.
주요 연구자: 로버트 글레이저(Robert Glaser), 론 햄블턴(Ronald Hambleton)
라포 (Rapport)
검사자와 수검자 간에 형성되는 신뢰와 협력의 관계로, 수검자가 편안하게 최선의 수행을 보일 수 있도록 하는 긍정적 상호작용이다.
A trusting and cooperative relationship between examiner and examinee that enables the examinee to feel comfortable and perform at their best during testing.
주요 연구자: 앤 아나스타시(Anne Anastasi), 앨런 카우프만(Alan Kaufman)
측정의 표준오차 (Standard Error of Measurement)
동일한 사람이 동일한 검사를 무한히 반복 실시했을 때 관찰점수가 진점수 주위로 분포하는 정도를 나타내는 통계량으로, SEM = SD√(1-r)로 산출한다.
A statistic indicating the degree to which observed scores would vary around the true score if the same person took the same test infinitely many times, calculated as SEM = SD√(1-r).
주요 연구자: 찰스 스피어만(Charles Spearman), 해럴드 걸릭슨(Harold Gulliksen)

규준과 점수 해석 (Norms & Score Interpretation) (37개 용어)

규준 (Norms)
검사 점수를 해석하기 위한 기준 틀로, 표준화 표본(규준집단)의 점수 분포를 기반으로 개인의 상대적 위치를 파악할 수 있게 해주는 참조 체계이다.
A frame of reference based on the score distribution of a standardization sample that allows the interpretation of an individual's test score relative to a defined group.
주요 연구자: 앤 아나스타시(Anne Anastasi), 로널드 코헨(Ronald Jay Cohen)
규준집단 (Normative Group)
검사의 규준을 산출하기 위해 표준화 과정에서 검사를 실시한 대표적인 표본 집단으로, 개인의 점수를 비교·해석하는 기준이 된다.
A representative sample of individuals on whom the test was standardized, serving as the reference group against which an individual's score is compared and interpreted.
주요 연구자: 앤 아나스타시(Anne Anastasi), 수잔 어비나(Susana Urbina)
규준표 (Norm Table)
원점수를 환산점수(백분위, 표준점수 등)로 변환할 수 있도록 규준집단의 점수 분포를 정리한 표이다.
A table that presents the score distribution of the normative group, allowing conversion of raw scores to derived scores such as percentile ranks and standard scores.
주요 연구자: 로버트 그레고리(Robert J. Gregory)
표준화 (Standardization)
검사의 실시 절차, 채점 방법, 점수 해석 기준을 통일하고, 대표 표본에 실시하여 규준을 산출하는 체계적 과정이다.
The systematic process of establishing uniform procedures for test administration, scoring, and interpretation, and deriving norms by administering the test to a representative sample.
주요 연구자: 알프레드 비네(Alfred Binet), 루이스 터먼(Lewis Terman)
원점수 (Raw Score)
검사에서 수검자가 획득한 변환 전의 최초 점수로, 정답 수, 총점 합산 등의 직접적 채점 결과이다.
The initial, unconverted score obtained directly from scoring a test, typically the number of correct answers or the sum of item scores.
주요 연구자: 로널드 코헨(Ronald Jay Cohen)
환산점수 (Derived Score)
원점수를 규준이나 수학적 변환을 통해 변환한 점수로, 백분위, 표준점수, 등가점수 등 해석 가능한 형태의 점수이다.
A score obtained by converting a raw score through norms or mathematical transformation into an interpretable form, including percentile ranks, standard scores, and equivalent scores.
주요 연구자: 로버트 손다이크(Robert L. Thorndike)
Z점수 (Z-Score)
원점수에서 평균을 빼고 표준편차로 나눈 값으로, 평균이 0이고 표준편차가 1인 표준점수의 가장 기본적인 형태이다.
A standard score calculated by subtracting the mean from the raw score and dividing by the standard deviation, yielding a distribution with a mean of 0 and standard deviation of 1.
주요 연구자: 카를 프리드리히 가우스(Carl Friedrich Gauss)
T점수 (T-Score)
평균을 50, 표준편차를 10으로 설정한 표준점수로, Z점수에 10을 곱하고 50을 더하여(T = 10Z + 50) 산출한다.
A standard score with a mean of 50 and a standard deviation of 10, calculated by the formula T = 10Z + 50, eliminating negative values and decimals.
주요 연구자: 윌리엄 맥콜(William A. McCall)
표준점수 (Standard Score)
원점수를 평균과 표준편차를 기준으로 변환하여 집단 내 상대적 위치를 나타내는 점수의 총칭으로, Z점수, T점수, 편차IQ 등이 포함된다.
A broad category of scores that express an individual's distance from the mean in standard deviation units, including z-scores, T-scores, and deviation IQ scores.
주요 연구자: 찰스 스피어만(Charles Spearman)
백분위 (Percentile Rank)
규준집단에서 특정 원점수 이하에 해당하는 사례의 백분율로, 개인의 상대적 위치를 0~100 사이의 값으로 나타낸 점수이다.
The percentage of scores in the normative group that fall at or below a given raw score, indicating an individual's relative standing on a scale from 0 to 100.
주요 연구자: 에드워드 손다이크(Edward L. Thorndike)
스테나인 (Stanine)
표준9점수(Standard Nine)의 약칭으로, 정상분포를 1~9의 9개 구간으로 나눈 단일 자릿수 표준점수 체계이며, 평균 5, 표준편차 약 2이다.
An abbreviation for Standard Nine, a single-digit scoring system that divides the normal distribution into nine intervals, with a mean of 5 and a standard deviation of approximately 2.
주요 연구자: 미국 공군 심리학자들(U.S. Army Air Forces Psychologists)
편차IQ (Deviation IQ)
동일 연령 집단의 평균을 100, 표준편차를 15(웩슬러) 또는 16(스탠포드-비네)으로 설정하여 개인의 상대적 위치를 나타내는 현대적 IQ 산출 방식이다.
A modern method of expressing IQ scores based on the individual's relative standing in the age group, with a mean of 100 and a standard deviation of 15 (Wechsler) or 16 (Stanford-Binet).
주요 연구자: 데이비드 웩슬러(David Wechsler), 알렉산더 웩슬러(Alexander Wechsler)
스텐 (Sten Score)
Standard Ten의 약칭으로, 정상분포를 1~10의 10개 구간으로 나눈 표준점수 체계이며, 평균 5.5, 표준편차 2이다.
An abbreviation for Standard Ten, a scoring system that divides the normal distribution into ten intervals ranging from 1 to 10, with a mean of 5.5 and a standard deviation of 2.
주요 연구자: 레이몬드 카텔(Raymond B. Cattell)
정상분포 (Normal Distribution)
평균을 중심으로 좌우 대칭인 종 모양의 연속 확률분포로, 대부분의 심리적 특성 측정값이 근사적으로 따르는 것으로 가정되는 이론적 분포이다.
A symmetrical, bell-shaped continuous probability distribution centered on the mean, which most psychological measurements are assumed to approximate.
주요 연구자: 카를 프리드리히 가우스(Carl Friedrich Gauss), 아돌프 케틀레(Adolphe Quetelet)
표준편차 (Standard Deviation)
각 점수와 평균 간 차이(편차)를 제곱하여 평균한 값의 제곱근으로, 점수 분포의 산포도를 나타내는 대표적 통계량이다.
The square root of the average squared deviation from the mean, representing the typical amount by which scores in a distribution differ from the mean.
주요 연구자: 칼 피어슨(Karl Pearson)
척도변환 (Scale Transformation)
원점수를 다른 척도(Z점수, T점수, 백분위 등)로 변환하는 수학적 절차로, 점수의 해석 가능성과 비교 가능성을 높이는 과정이다.
A mathematical procedure for converting raw scores to a different scale (e.g., z-scores, T-scores, percentiles) to enhance interpretability and comparability.
주요 연구자: 프레더릭 로드(Frederic M. Lord)
선형변환 (Linear Transformation)
원점수에 상수를 더하거나 곱하는 변환(Y = aX + b)으로, 분포의 평균과 표준편차는 변하지만 분포의 형태(왜도, 첨도)는 변하지 않는다.
A transformation of the form Y = aX + b that changes the mean and standard deviation but preserves the shape (skewness, kurtosis) of the original distribution.
주요 연구자: 로널드 코헨(Ronald Jay Cohen)
비선형변환 (Nonlinear Transformation)
원점수를 백분위로 변환한 후 정상분포표를 이용하여 표준점수로 재변환하는 등, 분포의 형태 자체를 변화시키는 변환 방법이다.
A transformation method that alters the shape of the original distribution, typically by converting raw scores to percentile ranks and then to normalized standard scores using a normal distribution table.
주요 연구자: 해롤드 걸릭슨(Harold Gulliksen)
참조집단 (Reference Group)
개인의 검사 점수를 비교·해석하기 위해 선택된 집단으로, 규준집단보다 넓은 개념이며 검사 목적에 따라 다르게 설정될 수 있다.
A group selected for comparing and interpreting an individual's test score, broader than the normative group and variable depending on the purpose of testing.
주요 연구자: 앤 아나스타시(Anne Anastasi)
지역규준 (Local Norms)
특정 지역, 학교, 기관 등 제한된 범위의 집단에서 산출한 규준으로, 해당 집단 내에서의 상대적 위치를 파악하기 위해 사용된다.
Norms derived from a specific, limited population such as a particular school, district, or institution, used to determine relative standing within that specific group.
주요 연구자: 로버트 그레고리(Robert J. Gregory)
전국규준 (National Norms)
전국적으로 대표성 있는 표본에서 산출한 규준으로, 국가 전체 인구를 대표하는 점수 분포를 제공한다.
Norms derived from a nationally representative sample, providing a score distribution that represents the entire national population.
주요 연구자: 앤 아나스타시(Anne Anastasi), 수잔 어비나(Susana Urbina)
연령규준 (Age Norms)
동일 연령 집단의 평균 수행을 기준으로 구성된 규준으로, 특정 연령대에서의 전형적 수행 수준과 비교하여 개인의 점수를 해석할 수 있게 한다.
Norms based on the average performance of individuals within the same age group, allowing interpretation of an individual's score relative to typical performance for that age.
주요 연구자: 알프레드 비네(Alfred Binet), 데이비드 웩슬러(David Wechsler)
학년규준 (Grade Norms)
동일 학년 집단의 평균 수행을 기준으로 구성된 규준으로, 학업 성취도 검사 등에서 개인의 교육적 수행 수준을 비교·해석하는 데 사용된다.
Norms based on the average performance of students within the same grade level, primarily used for interpreting academic achievement test scores.
주요 연구자: 로버트 손다이크(Robert L. Thorndike)
천장효과 (Ceiling Effect)
검사가 너무 쉬워서 다수의 수검자가 최고점 또는 그에 근접한 점수를 받아, 높은 능력 수준에서의 개인차를 변별하지 못하는 현상이다.
A phenomenon occurring when a test is too easy for the examinees, causing many to score at or near the maximum, thereby failing to differentiate among individuals at higher ability levels.
주요 연구자: 앤 아나스타시(Anne Anastasi)
평균 (Mean)
모든 점수를 합산하여 사례 수로 나눈 값으로, 집단의 중심 경향을 나타내는 가장 보편적인 대표값이다.
The arithmetic average of all scores in a distribution, calculated by summing all values and dividing by the number of cases, representing the most commonly used measure of central tendency.
주요 연구자: 칼 피어슨(Karl Pearson)
중앙값 (Median)
점수를 크기 순서로 나열했을 때 정확히 중간에 위치하는 값으로, 분포의 50번째 백분위에 해당하는 중심경향 측정치이다.
The middle value in an ordered distribution of scores, corresponding to the 50th percentile, that divides the distribution into two equal halves.
주요 연구자: 프랜시스 골턴(Francis Galton)
측정의 표준오차 (Standard Error of Measurement)
동일한 검사를 반복 실시할 때 개인의 관찰 점수가 진점수 주위에서 변동하는 정도를 나타내는 통계량으로, SEM = SD√(1-r)로 산출된다.
A statistic indicating the amount of variation expected in an individual's observed scores around the true score upon repeated testing, calculated as SEM = SD√(1-r).
주요 연구자: 찰스 스피어만(Charles Spearman), 프레더릭 로드(Frederic M. Lord)
연령등가점수 (Age Equivalent)
수검자의 원점수가 해당하는 연령 집단의 평균 원점수와 같은 연령으로 표현한 점수로, '8세 6개월 수준' 등으로 표기된다.
A score expressed as the age at which the individual's raw score equals the average raw score for that age group, reported in years and months (e.g., 8 years, 6 months).
주요 연구자: 알프레드 비네(Alfred Binet)
학년등가점수 (Grade Equivalent)
수검자의 원점수가 해당하는 학년 집단의 평균 원점수와 같은 학년으로 표현한 점수로, '5.3학년(5학년 3개월)' 등으로 표기된다.
A score expressed as the grade level at which the individual's raw score equals the average raw score for that grade, reported in grade and month (e.g., 5.3 for fifth grade, third month).
주요 연구자: 로버트 손다이크(Robert L. Thorndike)
신뢰구간 (Confidence Interval)
개인의 진점수가 포함될 것으로 기대되는 점수 범위로, 관찰점수를 중심으로 측정의 표준오차를 이용하여 산출된다.
A range of scores within which an individual's true score is expected to fall with a specified probability, calculated using the observed score and the standard error of measurement.
주요 연구자: 예르지 네이만(Jerzy Neyman), 프레더릭 로드(Frederic M. Lord)
정상화 표준점수 (Normalized Standard Score)
원점수를 백분위로 변환한 후 정상분포표를 이용하여 Z점수로 재변환하여 얻는 표준점수로, 원 분포가 정상분포가 아니더라도 정상분포 형태를 갖게 된다.
A standard score derived by converting raw scores to percentile ranks and then to z-scores using a normal distribution table, yielding a normally distributed score regardless of the original distribution shape.
주요 연구자: 해롤드 걸릭슨(Harold Gulliksen), 윌리엄 맥콜(William A. McCall)
플린효과 (Flynn Effect)
세대에 걸쳐 IQ 검사 점수가 지속적으로 상승하는 현상으로, 대략 10년에 약 3점씩 상승하여 규준의 주기적 재표준화 필요성을 시사한다.
The well-documented observation that IQ test scores have been steadily rising across generations, averaging approximately 3 points per decade, necessitating periodic re-norming of intelligence tests.
주요 연구자: 제임스 플린(James R. Flynn)
바닥효과 (Floor Effect)
검사가 너무 어려워서 다수의 수검자가 최저점 또는 그에 근접한 점수를 받아, 낮은 능력 수준에서의 개인차를 변별하지 못하는 현상이다.
A phenomenon occurring when a test is too difficult for the examinees, causing many to score at or near the minimum, thereby failing to differentiate among individuals at lower ability levels.
주요 연구자: 로버트 그레고리(Robert J. Gregory)
규준참조검사 (Norm-Referenced Test)
개인의 검사 점수를 규준집단의 점수 분포와 비교하여 상대적 위치로 해석하는 검사로, 대부분의 표준화된 심리검사가 이에 해당한다.
A test in which an individual's score is interpreted by comparing it to the performance of a normative group, determining the individual's relative standing within that group.
주요 연구자: 로버트 글레이저(Robert Glaser)
준거참조검사 (Criterion-Referenced Test)
미리 설정된 절대적 기준(준거)에 도달했는지 여부를 판단하는 검사로, 다른 수검자와의 비교가 아닌 특정 내용 영역의 숙달 정도를 평가한다.
A test designed to determine whether an individual has achieved a predetermined standard of performance, focusing on mastery of specific content rather than comparison to others.
주요 연구자: 로버트 글레이저(Robert Glaser), 제임스 포펌(W. James Popham)
기저선점수 (Basal Score)
개별 실시 검사에서 수검자가 특정 수의 연속 문항을 모두 맞힌 시작점으로, 이 수준 이하의 모든 문항은 맞힌 것으로 가정하는 규칙이다.
The level at which an examinee correctly answers a specified number of consecutive items in an individually administered test, below which all items are assumed to be correct.
주요 연구자: 알프레드 비네(Alfred Binet), 데이비드 웩슬러(David Wechsler)
한계선점수 (Ceiling Score)
개별 실시 검사에서 수검자가 특정 수의 연속 문항을 모두 틀린 종료점으로, 이 수준 이상의 모든 문항은 틀린 것으로 가정하고 검사를 중단하는 규칙이다.
The level at which an examinee fails a specified number of consecutive items in an individually administered test, above which all items are assumed incorrect and testing is discontinued.
주요 연구자: 데이비드 웩슬러(David Wechsler)

신뢰도 (Reliability) (32개 용어)

신뢰도 (Reliability)
동일한 대상을 동일한 검사 또는 동등한 검사로 반복 측정했을 때 얻어지는 점수의 일관성(consistency) 정도를 나타내는 개념이다.
The degree to which a test consistently yields the same or similar scores when administered repeatedly to the same individuals under comparable conditions.
주요 연구자: 찰스 스피어만(Charles Spearman), 리 크론바흐(Lee Cronbach)
신뢰도 계수 (Reliability Coefficient)
검사 점수의 일관성 정도를 0에서 1 사이의 수치로 나타낸 상관계수로, 1에 가까울수록 측정오차가 적고 신뢰도가 높음을 의미한다.
A numerical index ranging from 0 to 1 that quantifies the consistency or reproducibility of test scores, where values closer to 1 indicate less measurement error and higher reliability.
주요 연구자: 찰스 스피어만(Charles Spearman), 루이스 거트만(Louis Guttman)
검사-재검사 신뢰도 (Test-Retest Reliability)
동일한 검사를 동일한 집단에게 일정 시간 간격을 두고 두 번 실시한 후, 두 검사 점수 간의 상관계수(안정성 계수)로 신뢰도를 추정하는 방법이다.
A method of estimating reliability by administering the same test to the same group on two separate occasions and computing the correlation (stability coefficient) between the two sets of scores.
주요 연구자: 찰스 스피어만(Charles Spearman)
동형검사 신뢰도 (Alternate Forms Reliability)
내용과 난이도가 동등하게 구성된 두 가지 형태의 검사를 동일 집단에게 실시하고, 두 검사 점수 간의 상관계수(동등성 계수)로 신뢰도를 추정하는 방법이다.
A method of estimating reliability by administering two equivalent forms of a test to the same group and computing the correlation (equivalence coefficient) between the two sets of scores.
주요 연구자: 로버트 손다이크(Robert Thorndike)
반분 신뢰도 (Split-Half Reliability)
단일 검사를 한 번만 실시한 후, 검사 문항을 두 부분(주로 홀수-짝수)으로 나누어 두 반검사 점수 간의 상관계수를 구하고, 이를 전체 검사 신뢰도로 교정하는 방법이다.
A method of estimating reliability from a single test administration by dividing test items into two halves (typically odd-even), computing the correlation between half-test scores, and correcting for full test length.
주요 연구자: 찰스 스피어만(Charles Spearman), 윌리엄 브라운(William Brown)
Spearman-Brown 교정 공식 (Spearman-Brown Prophecy Formula)
반분 신뢰도에서 절반 길이 검사의 상관계수를 전체 검사 길이의 신뢰도로 교정하는 공식으로, 검사 길이 변화에 따른 신뢰도 변화를 예측하는 데 사용된다.
A formula used to correct the split-half correlation to estimate the reliability of the full-length test, and more generally to predict how changes in test length affect reliability.
주요 연구자: 찰스 스피어만(Charles Spearman), 윌리엄 브라운(William Brown)
내적 일관성 (Internal Consistency)
단일 검사를 한 번만 실시하여 검사 내 문항들이 동일한 구인을 얼마나 일관되게 측정하고 있는지, 즉 문항 간 동질성(homogeneity)의 정도를 평가하는 신뢰도 추정 방법이다.
A method of estimating reliability from a single test administration that assesses the degree to which all items on a test measure the same construct, reflecting inter-item homogeneity.
주요 연구자: 리 크론바흐(Lee Cronbach), 쿠더(G. Frederic Kuder)
크론바흐 알파 (Cronbach's Alpha)
다분 문항(예: 리커트 척도)으로 구성된 검사의 내적 일관성 신뢰도를 추정하는 계수로, 가능한 모든 반분 신뢰도의 평균과 수학적으로 동등한 값이다.
A coefficient for estimating the internal consistency reliability of tests with polytomous items (e.g., Likert scales), mathematically equivalent to the average of all possible split-half reliabilities.
주요 연구자: 리 크론바흐(Lee Cronbach), 루이스 거트만(Louis Guttman)
KR-20 (Kuder-Richardson Formula 20)
이분 문항(맞다/틀리다)으로 구성된 검사의 내적 일관성 신뢰도를 추정하는 공식으로, 각 문항의 난이도(p, q)를 이용하여 산출한다.
A formula for estimating the internal consistency reliability of tests composed of dichotomous (right/wrong) items, using item difficulty values (p and q) for each item.
주요 연구자: 쿠더(G. Frederic Kuder), 리처드슨(M. W. Richardson)
KR-21 (Kuder-Richardson Formula 21)
모든 문항의 난이도가 동일하다는 가정하에, 총점의 평균과 분산만으로 이분 문항 검사의 내적 일관성 신뢰도를 간편하게 추정하는 공식이다.
A simplified formula for estimating internal consistency reliability of dichotomous tests under the assumption of equal item difficulty, requiring only the test mean and variance.
주요 연구자: 쿠더(G. Frederic Kuder), 리처드슨(M. W. Richardson)
고전검사이론 (Classical Test Theory (CTT))
관찰점수(X)는 진점수(T)와 오차점수(E)의 합(X = T + E)이라는 기본 가정에 기반하여, 검사 점수의 신뢰도와 측정오차를 설명하는 심리측정학의 기본 이론 체계이다.
A foundational psychometric framework based on the assumption that an observed score (X) is the sum of a true score (T) and an error score (E), providing the basis for understanding test reliability and measurement error.
주요 연구자: 찰스 스피어만(Charles Spearman), 멜빈 노빅(Melvin Novick), 프레드릭 로드(Frederic Lord)
진점수 (True Score)
동일한 검사를 동일한 개인에게 무한히 반복 실시했을 때 얻어지는 관찰점수들의 기댓값(평균)으로, 측정오차가 제거된 이론적 점수이다.
The expected value (mean) of an individual's observed scores if the same test were administered an infinite number of times, representing the score free of measurement error.
주요 연구자: 찰스 스피어만(Charles Spearman), 해롤드 굴릭센(Harold Gulliksen)
오차점수 (Error Score)
관찰점수와 진점수 간의 차이(E = X - T)로, 측정 과정에서 발생하는 무선적 요인에 의한 점수 변동분을 나타낸다.
The difference between the observed score and the true score (E = X - T), representing the random fluctuation in scores due to unsystematic factors in the measurement process.
주요 연구자: 찰스 스피어만(Charles Spearman), 프레드릭 로드(Frederic Lord)
측정의 표준오차 (Standard Error of Measurement (SEM))
동일한 개인이 동일한 검사를 반복 수행했을 때 관찰점수들의 표준편차로, 개인 점수에 포함된 측정오차의 크기를 나타내는 지표이다.
The standard deviation of observed scores that would be obtained if the same individual took the same test repeatedly, indicating the amount of measurement error associated with an individual's score.
주요 연구자: 프레드릭 로드(Frederic Lord), 리 크론바흐(Lee Cronbach)
관찰점수 (Observed Score)
피검자가 검사를 실시하여 실제로 얻은 점수로, 진점수와 오차점수의 합(X = T + E)으로 구성된다.
The actual score obtained by an examinee on a test, composed of the sum of the true score and the error score (X = T + E).
주요 연구자: 찰스 스피어만(Charles Spearman)
신뢰구간 (Confidence Interval)
측정의 표준오차(SEM)를 이용하여 진점수가 포함될 가능성이 있는 점수 범위를 확률적으로 설정한 구간으로, 검사 점수 해석의 불확실성을 반영한다.
A range of scores around an observed score, constructed using the SEM, within which the true score is expected to fall with a specified probability, reflecting the uncertainty in test score interpretation.
주요 연구자: 프레드릭 로드(Frederic Lord), 리 크론바흐(Lee Cronbach)
평정자간 신뢰도 (Inter-Rater Reliability)
두 명 이상의 평정자(채점자)가 동일한 대상이나 수행을 독립적으로 평가했을 때, 평정 결과 간의 일치도 또는 일관성을 나타내는 신뢰도이다.
The degree of agreement or consistency among two or more independent raters who evaluate the same targets or performances, indicating scorer reliability.
주요 연구자: 제이콥 코헨(Jacob Cohen), 조지프 플라이스(Joseph Fleiss)
문항-전체 상관 (Item-Total Correlation)
개별 문항 점수와 전체 검사 총점(해당 문항 점수를 제외한 교정 총점 사용 권장) 간의 상관계수로, 문항이 전체 검사와 얼마나 일관되게 측정하는지를 나타내는 문항변별도 지표이다.
The correlation between an individual item score and the total test score (preferably corrected by excluding that item), indicating how consistently an item measures in line with the overall test.
주요 연구자: 해롤드 굴릭센(Harold Gulliksen), 리 크론바흐(Lee Cronbach)
연습효과 (Practice Effect)
동일한 검사 또는 유사한 검사를 반복 실시할 때, 검사 내용에 대한 친숙성이나 전략 학습으로 인해 두 번째 이후 점수가 체계적으로 상승하는 현상이다.
A systematic increase in scores upon retesting with the same or similar test, due to familiarity with test content, format, or strategies gained from prior exposure.
주요 연구자: 앤 아나스타시(Anne Anastasi)
이월효과 (Carryover Effect)
이전 검사 실시의 경험(기억, 피로, 동기 변화, 태도 변화 등)이 후속 검사 수행에 체계적으로 영향을 미치는 현상으로, 연습효과를 포함하는 더 넓은 개념이다.
A broader phenomenon where experience from a prior test administration (memory, fatigue, motivation, attitude changes) systematically influences performance on a subsequent test, encompassing practice effects.
주요 연구자: 도널드 캠벨(Donald Campbell)
문항 표집 (Item Sampling)
검사에 포함된 문항들이 측정하고자 하는 내용 영역에서 표본으로 추출된 것이라는 관점으로, 문항 표집의 차이는 동형검사 신뢰도와 내적 일관성의 오차원이 된다.
The perspective that test items are a sample drawn from a larger domain of possible items, where differences in item sampling constitute a source of measurement error affecting alternate forms reliability and internal consistency.
주요 연구자: 리 크론바흐(Lee Cronbach), 로버트 손다이크(Robert Thorndike)
검사 길이와 신뢰도 (Test Length and Reliability)
검사의 문항 수(길이)와 신뢰도 간의 관계로, 동질적인 문항을 추가하면 신뢰도가 증가하지만 수확체감의 법칙에 따라 증가폭이 점차 줄어드는 현상이다.
The relationship between the number of items (test length) and reliability, where adding homogeneous items increases reliability but with diminishing returns as test length grows.
주요 연구자: 찰스 스피어만(Charles Spearman), 해롤드 굴릭센(Harold Gulliksen)
코헨의 카파 (Cohen's Kappa)
두 명의 평정자가 범주형 자료를 평정할 때, 우연에 의한 일치를 교정한 후의 실제 일치도를 나타내는 통계 지표로, -1에서 1 사이의 값을 갖는다.
A statistical measure of inter-rater agreement for categorical data that corrects for chance agreement, yielding values between -1 and 1 where 1 indicates perfect agreement beyond chance.
주요 연구자: 제이콥 코헨(Jacob Cohen), 조지프 플라이스(Joseph Fleiss)
평정자내 신뢰도 (Intra-Rater Reliability)
동일한 평정자가 동일한 대상을 서로 다른 시점에 독립적으로 평가했을 때, 평정 결과 간의 일관성을 나타내는 신뢰도이다.
The degree of consistency with which a single rater evaluates the same targets on two or more separate occasions, reflecting the temporal stability of that rater's judgments.
주요 연구자: 제이콥 코헨(Jacob Cohen)
급내상관계수 (Intraclass Correlation Coefficient (ICC))
동일한 대상에 대한 여러 측정값(평정자, 시점 등) 간의 일치도를 평가하는 상관계수로, 연속형 자료의 평정자간 신뢰도를 추정하는 데 가장 적합한 지표이다.
A correlation coefficient that assesses the agreement among multiple measurements (raters, occasions) of the same targets, most appropriate for evaluating inter-rater reliability with continuous data.
주요 연구자: 로널드 피셔(Ronald Fisher), 패트릭 슈라우트(Patrick Shrout)
채점자 훈련 (Rater Training)
평정자간 신뢰도를 향상시키기 위해 평정자에게 채점 기준, 평정 척도 사용법, 오류 유형(후광효과, 관대화 등)에 대한 체계적 교육을 실시하는 과정이다.
A systematic process of educating raters on scoring criteria, scale usage, and common rating errors (halo, leniency, etc.) to improve inter-rater reliability and reduce rater bias.
주요 연구자: 게리 레이섬(Gary Latham), 후안 보르만(Walter Borman)
교정된 문항-전체 상관 (Corrected Item-Total Correlation)
해당 문항의 점수를 총점에서 제외한 교정 총점과 해당 문항 점수 간의 상관계수로, 비교정 문항-전체 상관의 인위적 과대추정을 방지한 지표이다.
The correlation between an individual item score and the total test score computed after excluding that item, preventing the artificial inflation inherent in uncorrected item-total correlations.
주요 연구자: 해롤드 굴릭센(Harold Gulliksen), 리 크론바흐(Lee Cronbach)
일반화가능도 이론 (Generalizability Theory (G Theory))
고전검사이론(CTT)의 단일 오차원 한계를 극복하여, 다양한 오차원(평정자, 문항, 시점 등)을 동시에 분석하고 각 오차원의 기여도를 분리하여 추정하는 확장된 신뢰도 이론이다.
An extension of CTT that overcomes the limitation of a single error source by simultaneously analyzing multiple sources of error (raters, items, occasions, etc.) and partitioning their relative contributions to total score variance.
주요 연구자: 리 크론바흐(Lee Cronbach), 골딘 글레서(Goldine Gleser), 로버트 브레넌(Robert Brennan)
가중 카파 (Weighted Kappa)
순서척도 자료의 평정자간 일치도를 평가할 때, 불일치의 정도에 따라 차등적인 가중치를 부여하여 Cohen's Kappa를 확장한 일치도 지표이다.
An extension of Cohen's Kappa for ordinal data that assigns differential weights to disagreements based on their severity, giving partial credit for near-agreements rather than treating all disagreements equally.
주요 연구자: 제이콥 코헨(Jacob Cohen)
점수 범위 제한과 신뢰도 (Range Restriction and Reliability)
검사 대상 집단의 점수 분포 범위가 좁아질 경우(예: 선발된 집단만 대상으로 할 때) 점수의 변산성이 감소하여 신뢰도 계수가 낮아지는 현상이다.
A phenomenon where restricting the range of scores in a sample (e.g., testing only a selected group) reduces score variability, thereby attenuating the reliability coefficient.
주요 연구자: 카를 피어슨(Karl Pearson), 프레드릭 로드(Frederic Lord)
집단 이질성과 신뢰도 (Group Heterogeneity and Reliability)
검사를 실시하는 집단의 특성(능력, 배경 등)이 이질적일수록 점수의 변산성이 커지고, 그 결과 신뢰도 계수가 높아지는 현상이다.
The phenomenon where greater heterogeneity in the characteristics of the tested group increases score variability, resulting in higher reliability coefficients.
주요 연구자: 해롤드 굴릭센(Harold Gulliksen), 앤 아나스타시(Anne Anastasi)
검사 난이도와 신뢰도 (Test Difficulty and Reliability)
검사의 전반적인 난이도 수준이 신뢰도에 미치는 영향으로, 검사가 지나치게 쉽거나 어려우면 점수 분포가 한쪽으로 치우쳐(천장/바닥 효과) 변산성이 줄어들어 신뢰도가 낮아지는 현상이다.
The effect of overall test difficulty on reliability, where excessively easy or difficult tests produce skewed score distributions (ceiling/floor effects) with reduced variability, thereby lowering reliability.
주요 연구자: 프레드릭 로드(Frederic Lord), 앤 아나스타시(Anne Anastasi)

타당도 (Validity) (30개 용어)

타당도 (Validity)
검사가 측정하고자 하는 것을 실제로 얼마나 정확하게 측정하고 있는지를 나타내는 개념으로, 검사 점수에 기반한 해석과 사용의 적절성을 의미한다.
The degree to which evidence and theory support the interpretations of test scores for proposed uses; it refers to the appropriateness, meaningfulness, and usefulness of the specific inferences made from test scores.
주요 연구자: 사무엘 메식(Samuel Messick), 리 크론바흐(Lee Cronbach), 앤 아나스타시(Anne Anastasi)
내용타당도 (Content Validity)
검사의 문항들이 측정하고자 하는 내용 영역(content domain)을 얼마나 충실하고 균형 있게 대표하고 있는지를 평가하는 타당도 증거이다.
The degree to which the items on a test adequately and representatively sample the content domain that the test purports to measure, typically evaluated through expert judgment rather than statistical procedures.
주요 연구자: 로버트 에벨(Robert Ebel), 크리스 로쉐(C. H. Lawshe)
안면타당도 (Face Validity)
검사가 수검자나 일반인의 눈에 측정하려는 것을 측정하는 것처럼 '보이는' 정도로, 엄밀한 의미에서의 타당도가 아니라 검사의 외관적 적절성에 대한 주관적 인상이다.
The extent to which a test appears to measure what it is supposed to measure from the perspective of examinees or laypersons; it is not a true form of validity but rather a subjective judgment about the test's surface appearance.
주요 연구자: 앤 아나스타시(Anne Anastasi), 로널드 네빌(Ronald Nevo)
준거타당도 (Criterion-Related Validity)
검사 점수와 독립적인 외적 준거(criterion) 간의 통계적 관계를 통해 검사의 타당성을 입증하는 방법으로, 검사 점수가 준거를 얼마나 잘 예측하거나 부합하는지를 상관계수로 나타낸다.
Evidence of validity based on the statistical relationship between test scores and an independent external criterion, expressed as a correlation coefficient indicating how well the test predicts or corresponds to the criterion.
주요 연구자: 리 크론바흐(Lee Cronbach), 폴 미엘(Paul Meehl)
예언타당도 (Predictive Validity)
검사를 먼저 실시하고 일정 시간이 경과한 후에 준거 자료를 수집하여, 검사 점수가 미래의 수행이나 결과를 얼마나 정확하게 예측하는지를 평가하는 준거타당도의 한 유형이다.
A type of criterion-related validity in which test scores are obtained first and criterion data are collected after a specified time interval, assessing how accurately the test predicts future performance or outcomes.
주요 연구자: 존 헌터(John E. Hunter), 프랭크 슈미트(Frank L. Schmidt)
공인타당도 (Concurrent Validity)
검사 점수와 준거 자료를 거의 동시에 수집하여 두 측정치 간의 상관으로 타당도를 평가하는 방법으로, 검사가 현재의 상태나 기존 진단을 얼마나 정확하게 반영하는지를 나타낸다.
A type of criterion-related validity in which test scores and criterion data are collected at approximately the same time, assessing how well the test reflects current status or existing diagnoses.
주요 연구자: 리 크론바흐(Lee Cronbach), 앤 아나스타시(Anne Anastasi)
구인타당도 (Construct Validity)
검사가 측정하고자 하는 이론적 구인(construct)을 실제로 얼마나 충실하게 측정하고 있는지를 다양한 증거를 통해 종합적으로 평가하는 타당도 개념이다.
The extent to which a test actually measures the theoretical construct it is intended to measure, evaluated through multiple lines of evidence including convergent and discriminant validity, factor analysis, and hypothesis testing.
주요 연구자: 리 크론바흐(Lee Cronbach), 폴 미엘(Paul Meehl), 사무엘 메식(Samuel Messick)
요인타당도 (Factorial Validity)
요인분석을 통해 검사의 내적 구조가 측정하려는 이론적 구인의 구조와 일치하는지를 검증하는 구인타당도의 증거로, 검사 문항들이 가정된 요인 구조에 적절히 부하되는지를 평가한다.
Evidence of construct validity obtained through factor analysis, assessing whether the internal structure of a test corresponds to the theoretical structure of the construct it intends to measure, by examining whether items load appropriately on the hypothesized factors.
주요 연구자: 루이스 서스턴(Louis Leon Thurstone), 칼 요레스코그(Karl Jöreskog)
수렴타당도 (Convergent Validity)
동일하거나 유사한 구인을 측정하는 서로 다른 방법이나 검사 간에 높은 상관이 나타나는 정도로, 구인타당도를 지지하는 핵심 증거 중 하나이다.
The degree to which different methods or tests measuring the same or similar constructs show high correlations with each other, providing key evidence supporting construct validity.
주요 연구자: 도널드 캠벨(Donald T. Campbell), 도널드 피스크(Donald W. Fiske)
변별타당도 (Discriminant Validity)
서로 다른 구인을 측정하는 검사들 간에 낮은 상관이 나타나는 정도로, 검사가 측정하려는 구인이 다른 구인과 구별됨을 보여주는 구인타당도의 증거이다.
The degree to which measures of different constructs show low correlations with each other, demonstrating that the construct measured by a test is distinct from other constructs and providing evidence of construct validity.
주요 연구자: 도널드 캠벨(Donald T. Campbell), 도널드 피스크(Donald W. Fiske)
다특성-다방법 행렬 (Multitrait-Multimethod Matrix)
둘 이상의 특성(trait)을 둘 이상의 방법(method)으로 측정하여 구성한 상관행렬로, 수렴타당도와 변별타당도를 동시에 체계적으로 평가할 수 있는 분석 틀이다.
A correlation matrix constructed by measuring two or more traits using two or more methods, providing a systematic framework for simultaneously evaluating convergent and discriminant validity.
주요 연구자: 도널드 캠벨(Donald T. Campbell), 도널드 피스크(Donald W. Fiske)
요인분석 (Factor Analysis)
다수의 관찰 변인들 간의 상관 패턴을 분석하여 그 기저에 있는 소수의 잠재적 요인(factor)을 추출하는 다변량 통계 기법으로, 검사의 내적 구조를 규명하는 데 핵심적으로 활용된다.
A multivariate statistical technique that analyzes patterns of correlations among observed variables to extract a smaller number of latent factors underlying the data, essential for examining the internal structure of tests.
주요 연구자: 찰스 스피어만(Charles Spearman), 루이스 서스턴(Louis Leon Thurstone), 레이먼드 카텔(Raymond Cattell)
탐색적 요인분석 (Exploratory Factor Analysis)
사전에 요인 구조에 대한 특정 가설을 설정하지 않고, 자료의 상관 패턴에서 잠재적 요인 구조를 탐색적으로 발견하는 요인분석 방법이다.
A factor analysis method that explores the latent factor structure from the correlation patterns in data without specifying a prior hypothesis about the factor structure, used in the early stages of test development.
주요 연구자: 루이스 서스턴(Louis Leon Thurstone), 헨리 카이저(Henry Kaiser)
확인적 요인분석 (Confirmatory Factor Analysis)
연구자가 이론에 기반하여 사전에 설정한 요인 구조 모형을 자료에 적합(fit)시키고, 그 모형의 적합도를 통계적으로 검증하는 구조방정식 기반의 요인분석 방법이다.
A structural equation modeling-based factor analysis method that tests the fit of a theoretically specified factor structure model to the observed data, evaluating model adequacy through various fit indices.
주요 연구자: 칼 요레스코그(Karl Jöreskog), 피터 벤틀러(Peter Bentler)
이원분류표 (Table of Specifications)
검사가 다루어야 할 내용 영역(content areas)과 인지적 과정(cognitive processes)을 2차원 행렬로 배치하여 문항 구성의 청사진을 제공하며, 내용타당도를 체계적으로 확보하기 위한 도구이다.
A two-dimensional matrix that cross-classifies content areas and cognitive processes to provide a blueprint for test construction, serving as a systematic tool for ensuring content validity.
주요 연구자: 벤자민 블룸(Benjamin Bloom), 로버트 에벨(Robert Ebel)
구인 (Construct)
직접 관찰할 수 없으나 이론적으로 존재한다고 가정되는 심리적 속성이나 개념으로, 관찰 가능한 행동을 통해 간접적으로 추론되며 검사가 측정하고자 하는 대상이다.
A theoretically posited psychological attribute or concept that cannot be directly observed but is inferred indirectly through observable behaviors; it represents what a test intends to measure.
주요 연구자: 리 크론바흐(Lee Cronbach), 폴 미엘(Paul Meehl)
준거 (Criterion)
검사 점수의 타당도를 평가하기 위해 비교의 기준으로 사용되는 독립적인 외적 측정치로, 검사가 예측하거나 반영하려는 실제 수행이나 상태를 나타낸다.
An independent external measure used as a standard of comparison for evaluating the validity of test scores, representing the actual performance or status that the test is intended to predict or reflect.
주요 연구자: 에드윈 기슬리(Edwin Ghiselli), 제임스 나이어(James Nunnally)
준거오염 (Criterion Contamination)
준거 측정치가 검사 점수에 의해 영향을 받아 준거의 독립성이 훼손되는 현상으로, 예를 들어 평가자가 수검자의 검사 점수를 알고 있는 상태에서 준거 평정을 하면 발생한다.
A situation in which the criterion measure is influenced by knowledge of the test scores, thereby compromising the independence of the criterion; for example, when a rater evaluates criterion performance while knowing the examinee's test scores.
주요 연구자: 앤 아나스타시(Anne Anastasi), 로버트 손다이크(Robert Thorndike)
준거결핍 (Criterion Deficiency)
실제 사용되는 준거가 궁극적 준거(ultimate criterion)의 전체 영역을 충분히 포괄하지 못하는 상태로, 측정하려는 구인의 일부 측면만 반영하여 타당도 계수를 과소추정하게 만든다.
A situation in which the actual criterion fails to adequately cover the full domain of the ultimate criterion, reflecting only some aspects of the construct being measured and leading to underestimation of the validity coefficient.
주요 연구자: 로버트 손다이크(Robert Thorndike), 빈 브로든(Hubert Brogden)
타당도 계수 (Validity Coefficient)
검사 점수와 준거 점수 간의 상관계수로, 검사가 준거를 얼마나 잘 예측하거나 반영하는지를 수량적으로 나타내며, 일반적으로 Pearson r로 산출된다.
The correlation coefficient between test scores and criterion scores, quantifying how well the test predicts or reflects the criterion, typically computed as a Pearson r.
주요 연구자: 칼 피어슨(Karl Pearson), 에드윈 기슬리(Edwin Ghiselli)
타당도 일반화 (Validity Generalization)
메타분석을 통해 개별 타당도 연구들의 결과를 통합 분석하여, 특정 검사의 타당도가 다양한 상황과 집단에 걸쳐 일반화될 수 있는지를 검증하는 접근법이다.
An approach that uses meta-analysis to synthesize results from individual validity studies to determine whether the validity of a specific test can be generalized across different situations and populations.
주요 연구자: 프랭크 슈미트(Frank L. Schmidt), 존 헌터(John E. Hunter)
증분타당도 (Incremental Validity)
기존에 사용되고 있는 예측변인이나 검사에 새로운 검사를 추가했을 때, 준거 예측에서 '추가적으로' 설명되는 분산의 증가량을 나타내는 타당도 개념이다.
The degree to which a new test adds to the prediction of a criterion beyond what is already predicted by existing predictors or tests, typically assessed through hierarchical regression analysis.
주요 연구자: 리 셔(Lee Sechrest), 스콧 릴리언펠드(Scott Lilienfeld)
결과타당도 (Consequential Validity)
검사 점수의 사용과 해석이 개인 및 사회에 미치는 의도적·비의도적 결과(consequences)를 타당도 평가의 일부로 고려하는 개념으로, Messick의 통합적 타당도 프레임워크에서 제안되었다.
The consideration of intended and unintended consequences of test score use and interpretation as part of validity evaluation, proposed within Messick's unified framework of validity.
주요 연구자: 사무엘 메식(Samuel Messick), 마이클 케인(Michael Kane)
생태학적 타당도 (Ecological Validity)
검사 상황에서 얻어진 결과가 실제 일상생활이나 자연스러운 환경에서의 행동을 얼마나 정확하게 반영하고 일반화될 수 있는지를 나타내는 타당도 개념이다.
The extent to which test results obtained in a testing situation accurately reflect and generalize to behaviors in real-world, everyday, or natural settings.
주요 연구자: 에곤 브런스빅(Egon Brunswik), 울릭 나이서(Ulric Neisser)
구인 과소대표 (Construct Underrepresentation)
검사가 측정하려는 구인의 전체 영역을 충분히 포괄하지 못하여 구인의 일부 측면만 측정하게 되는 타당도 위협 요인으로, 검사의 범위가 구인보다 좁은 상태이다.
A threat to validity in which a test fails to adequately cover the full domain of the construct it intends to measure, resulting in measurement of only some facets of the construct; the test is too narrow relative to the construct.
주요 연구자: 사무엘 메식(Samuel Messick), 마이클 케인(Michael Kane)
구인 무관 분산 (Construct-Irrelevant Variance)
검사 점수에 측정하려는 구인과 관련 없는 요인들이 체계적으로 영향을 미쳐 발생하는 분산으로, 검사의 타당도를 저해하는 핵심 위협 요인이다.
Systematic variance in test scores attributable to factors irrelevant to the construct being measured, constituting a major threat to test validity by introducing extraneous influences into the measurement.
주요 연구자: 사무엘 메식(Samuel Messick), 스티븐 다우닝(Steven Downing)
방법 분산 (Method Variance)
측정하려는 구인이 아닌 측정 방법 자체의 특성(예: 자기보고, 관찰, 면접)에 기인하여 발생하는 체계적 분산으로, 동일한 방법으로 측정된 변인들 간의 상관을 인위적으로 높이는 원인이 된다.
Systematic variance attributable to characteristics of the measurement method itself (e.g., self-report, observation, interview) rather than the construct being measured, artificially inflating correlations among variables measured by the same method.
주요 연구자: 도널드 캠벨(Donald T. Campbell), 필립 포더사코프(Philip Podsakoff)
법칙적 관계망 (Nomological Network)
구인과 관련된 이론적 명제, 법칙, 다른 구인들 간의 관계를 체계적으로 나타낸 개념적 틀로, 구인타당도 검증의 기반이 되며 구인이 어떤 이론적 맥락 속에 위치하는지를 보여준다.
A conceptual framework that systematically represents the theoretical propositions, laws, and relationships among constructs, serving as the foundation for construct validation by showing how a construct is situated within its theoretical context.
주요 연구자: 리 크론바흐(Lee Cronbach), 폴 미엘(Paul Meehl)
결정계수 (Coefficient of Determination)
타당도 계수(상관계수)를 제곱한 값(r²)으로, 검사 점수가 준거 점수의 분산을 설명하는 비율을 나타내며, 예측의 정확도를 직관적으로 이해할 수 있게 해준다.
The square of the validity coefficient (r²), representing the proportion of variance in criterion scores that is accounted for by the test scores, providing an intuitive measure of prediction accuracy.
주요 연구자: 칼 피어슨(Karl Pearson), 세월 라이트(Sewall Wright)
내용타당도비 (Content Validity Ratio)
전문가 패널이 각 문항의 필수성(essential)을 평가한 결과를 수량화한 지수로, 문항이 측정 내용 영역에 필수적이라고 판단한 전문가의 비율에 기반하여 산출된다.
A quantitative index based on expert panel ratings of each item's essentiality, computed from the proportion of experts who judge an item as essential to the content domain being measured.
주요 연구자: 크리스 로쉐(C. H. Lawshe)

문항분석과 검사개발 (Item Analysis & Test Development) (30개 용어)

문항분석 (Item Analysis)
개별 검사 문항의 통계적 특성(난이도, 변별도 등)을 분석하여 문항의 질을 평가하고, 불량 문항을 수정하거나 삭제하여 검사 전체의 심리측정적 품질을 향상시키는 절차이다.
A set of statistical procedures used to evaluate the quality of individual test items by examining their difficulty, discrimination, and other psychometric properties, with the goal of improving overall test quality.
주요 연구자: 로버트 에벨(Robert Ebel), 프레더릭 로드(Frederic Lord)
문항난이도 (Item Difficulty)
특정 문항에 정답을 맞힌 피험자의 비율(p값)로 표현되며, 0에서 1 사이의 값을 가진다. 값이 클수록 쉬운 문항이고, 작을수록 어려운 문항이다.
The proportion of examinees who answer an item correctly (p-value), ranging from 0 to 1, where higher values indicate easier items and lower values indicate more difficult items.
주요 연구자: 로버트 에벨(Robert Ebel), 프레더릭 로드(Frederic Lord)
문항변별도 (Item Discrimination)
해당 문항이 능력이 높은 피험자와 낮은 피험자를 얼마나 잘 구분하는지를 나타내는 지표로, 상위집단과 하위집단의 정답률 차이(D지수) 또는 문항-전체 상관으로 산출한다.
An index indicating how well an item differentiates between high-ability and low-ability examinees, typically computed as the difference in proportion correct between upper and lower groups (D-index) or as the item-total correlation.
주요 연구자: 로버트 에벨(Robert Ebel), 트루먼 켈리(Truman Kelley)
문항-전체 상관 (Item-Total Correlation)
개별 문항의 점수와 검사 전체 총점 간의 상관계수로, 해당 문항이 검사 전체가 측정하는 구인을 얼마나 잘 반영하는지를 나타내는 변별도 지표이다.
The correlation between scores on an individual item and the total test score, indicating how well the item measures the same construct as the overall test.
주요 연구자: 루이스 거트만(Louis Guttman), 리 크론바흐(Lee Cronbach)
교정된 문항-전체 상관 (Corrected Item-Total Correlation)
해당 문항의 점수를 총점에서 제외한 후 계산한 문항-전체 상관으로, 자기 자신과의 상관으로 인한 과대추정을 보정한 보다 정확한 변별도 지표이다.
The correlation between an individual item score and the total test score from which that item's score has been removed, providing a more accurate discrimination index by eliminating spurious inflation.
주요 연구자: 리 크론바흐(Lee Cronbach)
문항특성곡선 (Item Characteristic Curve)
문항반응이론에서 피험자의 능력 수준(θ)에 따라 해당 문항에 정답할 확률이 어떻게 변하는지를 S자 형태의 곡선으로 나타낸 그래프로, 문항의 난이도·변별도·추측 모수를 시각적으로 표현한다.
A graphical representation in IRT showing the probability of a correct response as a function of examinee ability (θ), typically forming an S-shaped (ogive) curve that reflects item difficulty, discrimination, and guessing parameters.
주요 연구자: 프레더릭 로드(Frederic Lord), 앨런 번바움(Allan Birnbaum)
문항반응이론 (Item Response Theory)
피험자의 잠재 능력(θ)과 문항 특성(난이도, 변별도, 추측도)의 관계를 확률 모형으로 설정하여, 피험자의 능력과 문항 모수를 독립적으로 추정하는 현대적 측정 이론이다.
A modern measurement framework that models the probability of a correct response as a mathematical function of examinee ability (θ) and item parameters (difficulty, discrimination, guessing), enabling sample-independent item calibration and item-independent ability estimation.
주요 연구자: 프레더릭 로드(Frederic Lord), 게오르그 라쉬(Georg Rasch), 앨런 번바움(Allan Birnbaum)
Rasch 모형 (Rasch Model)
문항의 난이도(b) 하나의 모수만으로 정답 확률을 모형화하며, 모든 문항의 변별도가 동일하고 추측이 없다고 가정하는 가장 단순한 IRT 모형이다. P(θ) = 1 / [1 + e^-(θ-b)].
The simplest IRT model that uses only one item parameter (difficulty, b) to predict the probability of a correct response, assuming equal discrimination across all items and no guessing: P(θ) = 1 / [1 + e^-(θ-b)].
주요 연구자: 게오르그 라쉬(Georg Rasch), 벤자민 라이트(Benjamin Wright)
점이연상관계수 (Point-Biserial Correlation)
이분 변인(정답/오답)과 연속 변인(총점) 간의 상관계수로, 문항분석에서 문항변별도를 산출하는 데 가장 널리 사용되는 통계 지표이다.
A correlation coefficient between a dichotomous variable (correct/incorrect) and a continuous variable (total score), widely used as an index of item discrimination in item analysis.
주요 연구자: 칼 피어슨(Karl Pearson), 로버트 에벨(Robert Ebel)
난이도 모수 (Difficulty Parameter)
IRT에서 피험자가 해당 문항에 정답할 확률이 0.50(또는 추측 확률을 고려한 중간값)이 되는 능력 수준(θ)의 값으로, 능력 척도와 동일한 단위로 표현된다.
In IRT, the point on the ability (θ) scale at which the probability of a correct response is 0.50 (or the midpoint between the guessing parameter and 1.0), expressed on the same metric as ability.
주요 연구자: 프레더릭 로드(Frederic Lord), 게오르그 라쉬(Georg Rasch)
변별도 모수 (Discrimination Parameter)
IRT에서 문항특성곡선의 변곡점에서의 기울기에 비례하는 모수로, 값이 클수록 능력 수준에 따른 정답 확률의 변화가 급격하여 해당 능력 범위에서 피험자를 잘 변별함을 의미한다.
An IRT parameter proportional to the slope of the item characteristic curve at its inflection point; higher values indicate steeper curves and better differentiation between examinees near the item's difficulty level.
주요 연구자: 앨런 번바움(Allan Birnbaum), 프레더릭 로드(Frederic Lord)
추측 모수 (Guessing Parameter)
IRT의 3모수 모형에서 능력이 극히 낮은 피험자가 해당 문항에 정답할 확률의 하한(lower asymptote)을 나타내는 모수로, 선다형 문항에서 무작위 추측에 의한 정답 가능성을 반영한다.
In the 3PL IRT model, the lower asymptote of the item characteristic curve representing the probability that examinees with very low ability will answer correctly by guessing, particularly relevant for multiple-choice items.
주요 연구자: 앨런 번바움(Allan Birnbaum), 프레더릭 로드(Frederic Lord)
문항정보함수 (Item Information Function)
IRT에서 특정 능력 수준(θ)에서 문항이 제공하는 측정 정보량을 나타내는 함수로, I(θ) = a²P(θ)Q(θ) / [P(θ)]²으로 산출되며, 변별도가 높고 난이도가 해당 능력에 가까울수록 정보량이 크다.
A function in IRT that quantifies the amount of information an item provides at each ability level (θ), computed as I(θ) = a²P(θ)Q(θ), with maximum information occurring near the item's difficulty level for highly discriminating items.
주요 연구자: 프레더릭 로드(Frederic Lord), 앨런 번바움(Allan Birnbaum)
검사정보함수 (Test Information Function)
검사에 포함된 모든 문항의 문항정보함수를 합산한 것으로, 각 능력 수준(θ)에서 검사 전체가 제공하는 측정 정보량(정밀도)을 나타낸다.
The sum of all item information functions in a test, indicating the total measurement precision the test provides at each ability level (θ).
주요 연구자: 프레더릭 로드(Frederic Lord), 로날드 햄블턴(Ronald Hambleton)
2모수 로지스틱 모형 (Two-Parameter Logistic Model)
IRT에서 문항의 난이도(b)와 변별도(a) 두 개의 모수를 추정하는 모형으로, Rasch 모형보다 유연하게 문항 간 변별도 차이를 허용한다. P(θ) = 1 / [1 + e^-a(θ-b)].
An IRT model estimating two item parameters—difficulty (b) and discrimination (a)—allowing items to differ in their ability to distinguish among examinees: P(θ) = 1 / [1 + e^-a(θ-b)].
주요 연구자: 앨런 번바움(Allan Birnbaum), 프레더릭 로드(Frederic Lord)
3모수 로지스틱 모형 (Three-Parameter Logistic Model)
IRT에서 난이도(b), 변별도(a), 추측도(c) 세 개의 모수를 추정하는 모형으로, 선다형 문항에서 능력이 낮은 피험자의 추측 정답 가능성을 반영한다. P(θ) = c + (1-c) / [1 + e^-a(θ-b)].
An IRT model estimating three parameters—difficulty (b), discrimination (a), and pseudo-guessing (c)—to account for the probability of low-ability examinees answering correctly by chance: P(θ) = c + (1-c) / [1 + e^-a(θ-b)].
주요 연구자: 앨런 번바움(Allan Birnbaum), 프레더릭 로드(Frederic Lord)
차별기능문항 (Differential Item Functioning)
동일한 능력 수준을 가진 서로 다른 집단(예: 성별, 인종)의 피험자가 특정 문항에 대해 서로 다른 정답 확률을 보이는 현상으로, 문항이 특정 집단에 유불리하게 작용할 가능성을 나타낸다.
A statistical phenomenon in which examinees from different groups (e.g., gender, ethnicity) who have the same ability level differ in their probability of answering an item correctly, indicating potential item bias.
주요 연구자: 폴 홀랜드(Paul Holland), 하워드 웨이너(Howard Wainer), 윌리엄 앵고프(William Angoff)
문항 편향 (Item Bias)
DIF가 검출된 문항에서 집단 간 수행 차이의 원인이 측정하고자 하는 구인이 아닌 구인 무관 요인(예: 문화적 배경, 언어적 요소)에 의한 것으로 판명된 경우를 말한다.
A condition in which differential item functioning is attributable to construct-irrelevant factors (e.g., cultural background, linguistic elements) rather than the construct being measured, resulting in unfair advantage or disadvantage for a particular group.
주요 연구자: 윌리엄 앵고프(William Angoff), 세실 레이놀즈(Cecil Reynolds)
피험자 적합도 (Person Fit)
IRT 모형에서 개별 피험자의 응답 패턴이 모형에서 기대하는 패턴과 얼마나 일치하는지를 평가하는 통계치로, 부적합 응답은 부주의, 추측, 부정행위 등을 시사할 수 있다.
A statistical index evaluating the degree to which an individual examinee's response pattern conforms to the pattern expected by the IRT model, with misfit potentially indicating carelessness, guessing, cheating, or other aberrant response behaviors.
주요 연구자: 롭 메이어드(Rob Meijer), 벤자민 라이트(Benjamin Wright)
컴퓨터 적응검사 (Computerized Adaptive Testing)
IRT에 기반하여 피험자의 응답에 따라 다음 문항을 실시간으로 선택하는 컴퓨터 기반 검사 방식으로, 각 피험자의 능력 수준에 최적화된 문항을 제시하여 적은 문항으로도 높은 측정 정밀도를 달성한다.
An IRT-based testing approach in which the computer selects each subsequent item in real time based on the examinee's previous responses, tailoring item difficulty to the individual's estimated ability to achieve high measurement precision with fewer items.
주요 연구자: 프레더릭 로드(Frederic Lord), 데이비드 와이스(David Weiss), 하워드 웨이너(Howard Wainer)
문항 은행 (Item Bank)
IRT를 통해 문항 모수가 교정(calibration)되어 공통 척도에 배치된 대규모 문항 집합으로, 다양한 검사 형태 구성과 컴퓨터 적응검사의 기반이 된다.
A large collection of test items that have been calibrated using IRT and placed on a common scale, serving as the foundation for constructing multiple test forms and enabling computerized adaptive testing.
주요 연구자: 프랭크 베이커(Frank Baker), 로날드 햄블턴(Ronald Hambleton)
검사 등화 (Test Equating)
서로 다른 검사 형태(form)의 점수를 공통 척도에 놓아 상호 비교 가능하게 만드는 통계적 절차로, 공통 문항(anchor items)이나 공통 피험자를 활용한다.
A statistical process of adjusting scores from different test forms onto a common scale to make them comparable, typically using anchor items or common examinees to establish the linkage.
주요 연구자: 마이클 코엔(Michael Kolen), 로버트 브레넌(Robert Brennan)
선다형 문항 (Multiple-Choice Item)
문두(stem)와 여러 개의 선택지(정답 하나와 오답지/매력적 오답)로 구성된 문항 형식으로, 객관적 채점이 가능하고 넓은 내용 범위를 효율적으로 측정할 수 있다.
An item format consisting of a stem (question or incomplete statement) and several response options (one correct answer and distractors), allowing objective scoring and efficient coverage of broad content domains.
주요 연구자: 프레더릭 켈리(Frederick Kelly), 토머스 헤이라드니크(Thomas Haladyna)
오답 매력도 분석 (Distractor Analysis)
선다형 문항에서 각 오답지(distractor)를 선택한 피험자의 비율과 능력 수준을 분석하여, 오답지가 하위집단 피험자를 효과적으로 유인하는지(매력적인지) 평가하는 절차이다.
A procedure that examines the proportion and ability level of examinees selecting each distractor in a multiple-choice item to determine whether distractors are functioning effectively by attracting lower-ability examinees.
주요 연구자: 토머스 헤이라드니크(Thomas Haladyna), 로버트 에벨(Robert Ebel)
진위형 문항 (True-False Item)
제시된 진술에 대해 참(True) 또는 거짓(False)으로만 응답하는 이분 선택 문항 형식으로, 짧은 시간에 많은 문항을 출제할 수 있지만 추측 확률이 50%로 높다.
A dichotomous item format requiring examinees to judge whether a given statement is true or false, allowing efficient coverage of many items but with a high guessing probability of 50%.
주요 연구자: 로버트 에벨(Robert Ebel), 빅터 프리셀(Victor Frisbie)
검사 청사진 (Test Blueprint)
검사가 측정하고자 하는 내용 영역과 인지 수준(예: Bloom의 분류)의 이원분류표로, 각 영역별·수준별 문항 수와 배점을 사전에 계획한 검사 설계 문서이다.
A two-way table (content areas by cognitive levels) that specifies the number and weight of items for each cell, serving as the master plan for test construction to ensure content representativeness.
주요 연구자: 벤자민 블룸(Benjamin Bloom), 노먼 그론룬드(Norman Gronlund)
리커트 척도 (Likert Scale)
진술문에 대한 동의 정도를 여러 단계(보통 5점 또는 7점)로 응답하게 하는 다분 반응 형식으로, 태도, 의견, 성격 특성 등 정의적 영역을 측정하는 데 가장 널리 사용되는 척도이다.
A polytomous response format in which respondents indicate their degree of agreement with a statement on a multi-point scale (typically 5 or 7 points), most widely used for measuring attitudes, opinions, and personality traits.
주요 연구자: 렌시스 리커트(Rensis Likert), 루이스 서스톤(Louis Thurstone)
검사 개발 절차 (Test Development Process)
검사의 목적 설정에서 표준화·출판까지의 체계적 단계를 말하며, 구인 정의 → 검사 청사진 작성 → 문항 작성 → 전문가 검토 → 예비검사 → 문항분석 → 본검사 실시 → 규준 개발 → 매뉴얼 작성의 순서로 진행된다.
The systematic sequence of stages from defining the purpose and construct of a test through standardization and publication, including construct definition, blueprint creation, item writing, expert review, pilot testing, item analysis, norming, and manual preparation.
주요 연구자: 앤 아나스타시(Anne Anastasi), 로버트 그레고리(Robert Gregory)
문항 작성 원칙 (Item Writing Guidelines)
양질의 검사 문항을 작성하기 위해 따라야 하는 체계적 원칙으로, 문두의 명확성, 선택지의 독립성, 문법적 단서 배제, 부정형 회피, 적절한 난이도 배분 등을 포함한다.
A systematic set of principles for writing high-quality test items, including clarity of stems, independence of options, elimination of grammatical cues, avoidance of negatives, and appropriate difficulty distribution.
주요 연구자: 토머스 헤이라드니크(Thomas Haladyna), 스티븐 다울닝(Steven Downing)
예비검사 (Pilot Test)
본검사 실시 전에 소규모 표본을 대상으로 검사를 시범 실시하여 문항의 질, 검사 시간, 지시문의 명확성 등을 사전에 점검하고 문항분석 자료를 수집하는 절차이다.
A preliminary administration of a test to a small sample before the main administration, conducted to evaluate item quality, test timing, clarity of instructions, and to collect data for item analysis.
주요 연구자: 앤 아나스타시(Anne Anastasi), 로버트 그레고리(Robert Gregory)

지능검사 (Intelligence Testing) (35개 용어)

지능 (Intelligence)
환경에 적응하고, 경험으로부터 학습하며, 추상적으로 사고하고, 문제를 해결하는 일반적인 정신 능력을 의미하는 포괄적 구인이다.
A general mental capability involving the ability to adapt to the environment, learn from experience, think abstractly, and solve problems effectively.
주요 연구자: 찰스 스피어만(Charles Spearman), 데이비드 웩슬러(David Wechsler)
지능지수 (Intelligence Quotient (IQ))
표준화된 지능검사에서 개인의 인지 능력 수준을 수치로 나타낸 점수로, 현대에는 동일 연령 집단의 평균을 100, 표준편차를 15로 설정한 편차IQ가 사용된다.
A standardized score derived from intelligence tests that quantifies an individual's cognitive ability level, with modern deviation IQ scores having a mean of 100 and standard deviation of 15.
주요 연구자: 윌리엄 슈테른(William Stern), 데이비드 웩슬러(David Wechsler)
비율IQ (Ratio IQ)
정신연령(MA)을 생활연령(CA)으로 나눈 후 100을 곱하여 산출하는 초기 지능지수 공식(IQ = MA/CA × 100)으로, Binet 검사에서 처음 사용되었다.
An early method of calculating IQ by dividing mental age (MA) by chronological age (CA) and multiplying by 100 (IQ = MA/CA × 100), first used with the Binet scales.
주요 연구자: 윌리엄 슈테른(William Stern), 루이스 터먼(Lewis Terman)
편차IQ (Deviation IQ)
동일 연령 집단의 점수 분포에서 개인의 상대적 위치를 평균 100, 표준편차 15(Wechsler 체계)의 표준점수로 변환한 현대적 지능지수 산출 방식이다.
A modern method of expressing IQ as a standard score with a mean of 100 and standard deviation of 15 (Wechsler system), based on an individual's relative standing within the same age group.
주요 연구자: 데이비드 웩슬러(David Wechsler)
전체IQ (Full Scale IQ (FSIQ))
Wechsler 지능검사에서 모든 핵심 소검사 점수를 종합하여 산출한 전반적인 인지 능력을 나타내는 합산 지표로, 평균 100, 표준편차 15이다.
A composite score derived from all core subtests of a Wechsler intelligence scale, representing overall cognitive ability with a mean of 100 and SD of 15.
주요 연구자: 데이비드 웩슬러(David Wechsler)
지표점수 (Index Score)
Wechsler 지능검사에서 유사한 인지 기능을 측정하는 소검사들을 묶어 산출한 영역별 합산 점수로, WAIS-IV 기준 VCI, PRI, WMI, PSI 네 가지가 있다.
Composite scores in Wechsler intelligence scales derived from clusters of subtests measuring similar cognitive functions, including VCI, PRI, WMI, and PSI in the WAIS-IV.
주요 연구자: 데이비드 웩슬러(David Wechsler), 로렌스 와이스(Lawrence Weiss)
언어이해지표 (Verbal Comprehension Index (VCI))
Wechsler 지능검사의 4대 지표 중 하나로, 언어적 개념 형성, 추론 능력, 언어 지식 및 표현력을 측정하며 어휘, 공통성, 이해 소검사로 구성된다.
One of four primary index scores in Wechsler intelligence scales, measuring verbal concept formation, reasoning, and expression through subtests such as Vocabulary, Similarities, and Comprehension.
주요 연구자: 데이비드 웩슬러(David Wechsler)
지각추론지표 (Perceptual Reasoning Index (PRI))
WAIS-IV/WISC-IV에서 비언어적 추론, 시공간 처리, 유동적 사고력을 측정하는 지표로, 토막짜기, 행렬추리, 퍼즐 소검사로 구성된다.
An index score in WAIS-IV/WISC-IV measuring nonverbal reasoning, visuospatial processing, and fluid reasoning through subtests such as Block Design, Matrix Reasoning, and Visual Puzzles.
주요 연구자: 데이비드 웩슬러(David Wechsler)
작업기억지표 (Working Memory Index (WMI))
주의집중력과 단기 기억 내 정보를 일시적으로 저장하고 조작하는 능력을 측정하는 Wechsler 검사 지표로, 숫자, 산수, 순서화 소검사로 구성된다.
A Wechsler index measuring attention and the ability to temporarily hold and manipulate information in short-term memory, comprising Digit Span, Arithmetic, and Letter-Number Sequencing subtests.
주요 연구자: 앨런 배들리(Alan Baddeley), 데이비드 웩슬러(David Wechsler)
처리속도지표 (Processing Speed Index (PSI))
단순한 시각 정보를 빠르고 정확하게 탐색, 변별, 순서화하는 인지적 처리 속도를 측정하는 Wechsler 검사 지표로, 기호쓰기, 동형찾기 소검사로 구성된다.
A Wechsler index measuring the speed and accuracy of scanning, discriminating, and sequencing simple visual information, comprising Coding and Symbol Search subtests.
주요 연구자: 데이비드 웩슬러(David Wechsler)
소검사 (Subtest)
지능검사 배터리를 구성하는 개별 과제로, 각각 특정한 인지 기능을 측정하며 소검사 점수의 조합으로 지표점수와 전체IQ가 산출된다.
An individual task within an intelligence test battery that measures a specific cognitive function, with subtest scores combined to form index scores and the Full Scale IQ.
주요 연구자: 데이비드 웩슬러(David Wechsler)
Wechsler 지능이론 (Wechsler's Theory of Intelligence)
Wechsler가 제안한 지능 이론으로, 지능을 '합목적적으로 행동하고 합리적으로 사고하며 환경을 효과적으로 다루는 개인의 총체적 능력'으로 정의하며 인지적·비인지적 요소 모두를 포함한다.
Wechsler's conceptualization of intelligence as 'the aggregate or global capacity of the individual to act purposefully, think rationally, and deal effectively with the environment,' encompassing both cognitive and non-cognitive factors.
주요 연구자: 데이비드 웩슬러(David Wechsler)
일반요인 (General Factor (g))
Spearman이 요인분석을 통해 발견한 모든 인지 과제에 공통적으로 작용하는 단일 일반 지능 요인으로, 다양한 인지 검사 간 정적 상관의 원인으로 가정된다.
A single general intelligence factor proposed by Spearman through factor analysis, hypothesized to underlie performance across all cognitive tasks and explain positive correlations among diverse tests.
주요 연구자: 찰스 스피어만(Charles Spearman), 아서 젠슨(Arthur Jensen)
다중지능이론 (Theory of Multiple Intelligences)
Gardner가 제안한 이론으로, 지능을 단일 요인이 아닌 언어, 논리-수학, 공간, 음악, 신체-운동, 대인관계, 자기이해, 자연주의 등 8가지 이상의 독립적인 지능으로 구분한다.
Gardner's theory proposing that intelligence consists of at least eight independent types—linguistic, logical-mathematical, spatial, musical, bodily-kinesthetic, interpersonal, intrapersonal, and naturalistic—rather than a single general factor.
주요 연구자: 하워드 가드너(Howard Gardner)
유동성 지능 (Fluid Intelligence (Gf))
선천적이고 생물학적 기반의 추론 능력으로, 새로운 상황에서 이전 학습과 무관하게 패턴을 인식하고 문제를 해결하며 관계를 추론하는 능력이다.
An innate, biologically based reasoning ability to recognize patterns, solve novel problems, and identify relationships in new situations independent of previously acquired knowledge.
주요 연구자: 레이먼드 카텔(Raymond Cattell), 존 혼(John Horn)
결정성 지능 (Crystallized Intelligence (Gc))
교육, 문화적 경험, 학습을 통해 축적된 지식과 언어 능력을 반영하는 지능으로, 어휘력, 일반상식, 언어적 추론 등으로 측정된다.
Intelligence reflecting accumulated knowledge and verbal skills acquired through education, cultural experience, and learning, measured by vocabulary, general information, and verbal reasoning tasks.
주요 연구자: 레이먼드 카텔(Raymond Cattell), 존 혼(John Horn)
CHC 이론 (Cattell-Horn-Carroll (CHC) Theory)
Cattell-Horn의 Gf-Gc 이론과 Carroll의 3층 이론을 통합한 현대 지능 이론으로, 일반지능(g) 아래 약 10개의 광역 능력과 70여 개의 협역 능력으로 구성된 위계적 구조를 제안한다.
A modern hierarchical theory of intelligence integrating Cattell-Horn's Gf-Gc model and Carroll's Three-Stratum Theory, proposing general intelligence (g) at the apex, approximately 10 broad abilities, and over 70 narrow abilities.
주요 연구자: 레이먼드 카텔(Raymond Cattell), 존 혼(John Horn), 존 캐롤(John B. Carroll)
삼원지능이론 (Triarchic Theory of Intelligence)
Sternberg가 제안한 이론으로, 지능을 분석적 지능(내적 세계), 창의적 지능(경험과의 관계), 실용적 지능(외적 세계 적응) 세 가지 하위 이론으로 구성된 삼원 구조로 설명한다.
Sternberg's theory proposing three aspects of intelligence: analytical (internal world), creative (relationship with experience), and practical (adaptation to external world), forming a triarchic structure.
주요 연구자: 로버트 스턴버그(Robert Sternberg)
정서지능 (Emotional Intelligence (EI))
자신과 타인의 감정을 인식, 이해, 관리하고 감정 정보를 사고와 행동에 효과적으로 활용하는 능력으로, Salovey와 Mayer가 학술적으로 체계화하였다.
The ability to perceive, understand, manage, and effectively use emotional information in oneself and others, academically formalized by Salovey and Mayer.
주요 연구자: 피터 샐러베이(Peter Salovey), 존 메이어(John Mayer), 대니얼 골먼(Daniel Goleman)
K-WAIS (Korean Wechsler Adult Intelligence Scale (K-WAIS))
Wechsler Adult Intelligence Scale(WAIS)을 한국 실정에 맞게 표준화한 성인용 개인 지능검사로, 16세 이상을 대상으로 FSIQ와 4개 지표점수를 산출한다.
The Korean standardization of the Wechsler Adult Intelligence Scale (WAIS), an individually administered intelligence test for ages 16+ that yields FSIQ and four index scores.
주요 연구자: 데이비드 웩슬러(David Wechsler), 황순택(Hwang Soon-Taek)
K-WISC (Korean Wechsler Intelligence Scale for Children (K-WISC))
WISC를 한국 아동에 맞게 표준화한 아동용 개인 지능검사로, 만 6세~16세 11개월을 대상으로 FSIQ와 5개(WISC-V 기준) 지표점수를 산출한다.
The Korean standardization of the Wechsler Intelligence Scale for Children, an individually administered test for ages 6–16 yielding FSIQ and five primary index scores (WISC-V).
주요 연구자: 데이비드 웩슬러(David Wechsler), 곽금주(Kwak Keum-Joo)
K-WPPSI (Korean Wechsler Preschool and Primary Scale of Intelligence (K-WPPSI))
WPPSI를 한국 유아에 맞게 표준화한 유아용 개인 지능검사로, 만 2세 6개월~7세 7개월을 대상으로 전체IQ와 지표점수를 산출한다.
The Korean standardization of the Wechsler Preschool and Primary Scale of Intelligence, an individually administered intelligence test for ages 2:6–7:7 yielding FSIQ and index scores.
주요 연구자: 데이비드 웩슬러(David Wechsler), 박혜원(Park Hye-Won)
Stanford-Binet 지능검사 (Stanford-Binet Intelligence Scales)
Binet-Simon 검사를 Terman이 Stanford 대학에서 미국 표준화한 개인용 지능검사로, 최초로 IQ 개념을 적용한 검사이며 현재 5판(SB5)은 CHC 이론 기반 5요인 구조를 사용한다.
An individually administered intelligence test originally adapted by Terman at Stanford University from the Binet-Simon scale; the first test to use the IQ concept, with the current SB5 based on a five-factor CHC model.
주요 연구자: 알프레드 비네(Alfred Binet), 루이스 터먼(Lewis Terman), 테오도르 시몽(Theodore Simon)
K-ABC/KABC-II (Kaufman Assessment Battery for Children (KABC-II))
Kaufman 부부가 개발한 아동용 개인 지능검사로, KABC-II는 CHC 이론과 Luria의 신경심리학 모형 두 가지 해석 체계를 제공하며, 문화적 공정성을 강조한다.
An individually administered intelligence test for children developed by the Kaufmans; KABC-II offers dual interpretive frameworks based on CHC theory and Luria's neuropsychological model, emphasizing cultural fairness.
주요 연구자: 앨런 카우프만(Alan Kaufman), 나딘 카우프만(Nadeen Kaufman)
Raven의 진행행렬검사 (Raven's Progressive Matrices (RPM))
Raven이 개발한 비언어적 지능검사로, 기하학적 도형 패턴에서 규칙을 파악하고 빈칸에 맞는 답을 선택하는 과제를 통해 주로 유동성 지능(Gf)을 측정한다.
A nonverbal intelligence test developed by Raven that measures primarily fluid intelligence (Gf) through tasks requiring identification of patterns in geometric figures and selection of the missing piece.
주요 연구자: 존 레이븐(John C. Raven)
문화공정검사 (Culture-Fair Test)
특정 문화, 언어, 교육 배경의 영향을 최소화하여 문화적 배경이 다른 집단 간 공정하게 지능을 측정하고자 설계된 검사의 총칭이다.
A category of tests designed to minimize the influence of specific cultural, linguistic, and educational backgrounds, aiming to assess intelligence fairly across culturally diverse groups.
주요 연구자: 레이먼드 카텔(Raymond Cattell), 존 레이븐(John C. Raven)
토막짜기 (Block Design)
Wechsler 지능검사의 핵심 소검사로, 빨간색과 흰색으로 이루어진 입체 블록을 사용하여 제시된 기하학적 디자인을 제한 시간 내에 재현하는 과제이다.
A core Wechsler subtest requiring the examinee to replicate geometric designs using red-and-white blocks within time limits, measuring visuospatial organization and nonverbal problem-solving.
주요 연구자: 새뮤얼 코스(Samuel Kohs), 데이비드 웩슬러(David Wechsler)
어휘 소검사 (Vocabulary Subtest)
Wechsler 지능검사의 VCI 핵심 소검사로, 단어의 의미를 구두로 정의하게 하여 언어 지식, 개념 형성, 장기 기억을 평가한다.
A core VCI subtest of Wechsler scales requiring verbal definitions of words, assessing language knowledge, concept formation, and long-term memory.
주요 연구자: 데이비드 웩슬러(David Wechsler)
행렬추리 (Matrix Reasoning)
Wechsler 지능검사의 PRI/FRI 핵심 소검사로, 불완전한 행렬 패턴을 보고 규칙을 파악하여 빈칸에 들어갈 적절한 그림을 선택하는 비언어적 추론 과제이다.
A core PRI/FRI subtest of Wechsler scales requiring examinees to identify the rule in an incomplete matrix pattern and select the appropriate response, measuring nonverbal abstract reasoning.
주요 연구자: 존 레이븐(John C. Raven), 데이비드 웩슬러(David Wechsler)
숫자 소검사 (Digit Span)
Wechsler 지능검사의 WMI 핵심 소검사로, 불러주는 숫자를 바로 따라하기, 거꾸로 따라하기, 순서대로 따라하기(WAIS-IV부터) 세 조건으로 주의력과 작업기억을 측정한다.
A core WMI subtest of Wechsler scales measuring attention and working memory through three conditions: Digit Span Forward, Backward, and Sequencing (from WAIS-IV).
주요 연구자: 데이비드 웩슬러(David Wechsler), 조지프 재콥스(Joseph Jacobs)
DAS-II (Differential Ability Scales, Second Edition (DAS-II))
Elliott이 개발한 아동·청소년용 개인 지능검사로, 인지 능력의 프로파일 분석을 강조하며 일반개념능력(GCA)과 특수 비언어적 종합점수(SNC)를 산출한다.
An individually administered intelligence test for children and adolescents developed by Elliott, emphasizing cognitive profile analysis and yielding General Conceptual Ability (GCA) and Special Nonverbal Composite (SNC) scores.
주요 연구자: 콜린 엘리엇(Colin Elliott)
집단지능검사 (Group Intelligence Test)
다수의 피검자를 동시에 평가할 수 있도록 설계된 지능검사로, 지필식 또는 컴퓨터 기반으로 실시되며 Army Alpha/Beta가 최초의 대규모 적용 사례이다.
Intelligence tests designed for simultaneous administration to large groups, typically paper-and-pencil or computer-based, with the Army Alpha/Beta being the first large-scale application.
주요 연구자: 아서 오티스(Arthur Otis), 로버트 여키스(Robert Yerkes)
CAS (Cognitive Assessment System (CAS))
Das와 Naglieri가 Luria의 신경심리학 이론(PASS 모형)에 기반하여 개발한 인지검사로, 계획(Planning), 주의(Attention), 동시처리(Simultaneous), 순차처리(Successive) 4가지 인지 과정을 측정한다.
A cognitive assessment instrument developed by Das and Naglieri based on Luria's PASS (Planning, Attention, Simultaneous, Successive) neuropsychological model, measuring four cognitive processes.
주요 연구자: 잭 나글리에리(Jack Naglieri), 자그나트 다스(Jagannath Das)
플린 효과 (Flynn Effect)
세대가 지남에 따라 IQ 검사 점수가 지속적으로 상승하는 현상으로, Flynn이 20세기 전반에 걸쳐 약 10년당 3점씩 IQ가 증가함을 체계적으로 보고하였다.
The well-documented phenomenon of sustained increases in IQ test scores over successive generations, with Flynn systematically documenting approximately 3 IQ points per decade throughout the 20th century.
주요 연구자: 제임스 플린(James Flynn)
Wechsler-Bellevue 지능검사 (Wechsler-Bellevue Intelligence Scale)
1939년 Wechsler가 Bellevue 병원에서 개발한 최초의 Wechsler 지능검사로, 언어성 척도와 동작성 척도의 이원 구조를 도입하고 편차IQ를 최초로 적용한 검사이다.
The first Wechsler intelligence test developed in 1939 at Bellevue Hospital, introducing the dual verbal-performance scale structure and the first application of deviation IQ scoring.
주요 연구자: 데이비드 웩슬러(David Wechsler)

적성과 성취검사 (Aptitude & Achievement Tests) (25개 용어)

적성검사 (Aptitude Test)
미래의 학습이나 훈련을 통해 특정 기술이나 지식을 습득할 수 있는 잠재적 능력을 예측하기 위해 설계된 검사이다.
A test designed to predict an individual's potential to acquire specific skills or knowledge through future learning or training.
주요 연구자: 앤 아나스타시(Anne Anastasi), 존 캐롤(John B. Carroll)
성취도검사 (Achievement Test)
특정 교육 프로그램이나 훈련 과정을 통해 학습된 지식, 기술, 능력의 현재 수준을 측정하는 검사이다.
A test that measures the current level of knowledge, skills, and competencies acquired through specific educational programs or training experiences.
주요 연구자: 에드워드 손다이크(Edward L. Thorndike), 벤저민 블룸(Benjamin Bloom)
적성-성취 구분 (Aptitude-Achievement Distinction)
적성검사가 미래 수행의 예측에, 성취도검사가 과거 학습의 결과 측정에 초점을 둔다는 전통적 구분으로, 현대에는 이 구분이 연속선상에 있다고 본다.
The traditional distinction that aptitude tests predict future performance while achievement tests measure past learning outcomes, though modern views consider this distinction as a continuum rather than a dichotomy.
주요 연구자: 앤 아나스타시(Anne Anastasi), 리 크론바흐(Lee Cronbach)
SAT (Scholastic Assessment Test)
미국 대학 입학 전형에 사용되는 대표적인 학업적성검사로, 독해·작문과 수학 영역의 추론 능력을 측정하며, College Board가 관리한다.
A widely used college admissions test in the United States that measures reasoning abilities in evidence-based reading and writing and mathematics, administered by the College Board.
주요 연구자: 칼 브리검(Carl Brigham), 헨리 채운시(Henry Chauncey)
일반적성검사 (General Aptitude Test Battery)
미국 노동부가 개발한 다요인 적성검사 배터리로, 9개 적성 요인(일반학습능력, 언어, 수리, 공간, 형태지각, 사무지각, 운동협응, 손가락 민첩성, 손 민첩성)을 측정하여 직업 배치에 활용한다.
A multiple-aptitude test battery developed by the U.S. Department of Labor that measures nine aptitude factors including general learning ability, verbal, numerical, spatial, form perception, clerical perception, motor coordination, finger dexterity, and manual dexterity for vocational placement.
주요 연구자: 미국 노동부 고용안정국(U.S. Employment Service (USES)), 존 헌터(John Hunter)
차별적성검사 (Differential Aptitude Tests)
Bennett, Seashore, Wesman이 개발한 다요인 적성검사로, 언어추론, 수리능력, 추상추론, 지각속도와 정확성, 기계추론, 공간관계, 철자법, 언어사용의 8개 하위검사로 구성된다.
A multiple-aptitude test battery developed by Bennett, Seashore, and Wesman consisting of eight subtests: Verbal Reasoning, Numerical Ability, Abstract Reasoning, Perceptual Speed and Accuracy, Mechanical Reasoning, Space Relations, Spelling, and Language Usage.
주요 연구자: 조지 베넷(George K. Bennett), 알렉산더 웨스만(Alexander G. Wesman), 해럴드 시쇼어(Harold G. Seashore)
ACT (American College Testing)
미국 대학 입학에 사용되는 교육과정 기반 성취도검사로, 영어, 수학, 읽기, 과학추론의 4개 영역과 선택적 작문 영역으로 구성된다.
A curriculum-based achievement test used for U.S. college admissions, consisting of four sections—English, Mathematics, Reading, and Science Reasoning—plus an optional Writing section.
주요 연구자: 에버렛 린드퀴스트(Everett Franklin Lindquist), 테드 매클레이니(Ted McCarney)
GRE (Graduate Record Examinations)
대학원 입학에 사용되는 표준화검사로, 언어추론, 양적추론, 분석적 작문의 일반검사와 특정 학문 영역의 과목별 검사로 구성되며, ETS가 관리한다.
A standardized test for graduate school admissions administered by ETS, consisting of a General Test measuring verbal reasoning, quantitative reasoning, and analytical writing, and Subject Tests in specific academic disciplines.
주요 연구자: 헨리 채운시(Henry Chauncey), 윌버 라포인트(Wilbur Layton)
Holland 자기탐색검사 (Self-Directed Search)
Holland의 RIASEC 직업 성격 이론에 기반하여 개인이 스스로 실시, 채점, 해석할 수 있도록 설계된 진로탐색 도구로, 6가지 유형(실재형, 탐구형, 예술형, 사회형, 진취형, 관습형)의 프로파일을 산출한다.
A career exploration instrument based on Holland's RIASEC theory of vocational personalities, designed for self-administration, self-scoring, and self-interpretation, producing a profile across six types: Realistic, Investigative, Artistic, Social, Enterprising, and Conventional.
주요 연구자: 존 홀랜드(John L. Holland)
Strong 직업흥미검사 (Strong Interest Inventory)
E.K. Strong Jr.가 개발한 대표적 직업흥미검사로, Holland의 일반직업주제(GOT), 기본흥미척도(BIS), 개인스타일척도(PSS), 직업척도(OS)를 통해 개인의 직업흥미 프로파일을 제공한다.
A prominent vocational interest inventory originally developed by E.K. Strong Jr. that provides career interest profiles through General Occupational Themes (GOT), Basic Interest Scales (BIS), Personal Style Scales (PSS), and Occupational Scales (OS).
주요 연구자: 에드워드 스트롱(Edward K. Strong Jr.), 데이비드 캠벨(David P. Campbell), 조앤 해런(Jo-Ida C. Hansen)
준거참조검사 (Criterion-Referenced Test)
개인의 수행을 다른 수검자와의 상대적 비교가 아닌, 사전에 설정된 절대적 수행 기준(준거)에 비추어 해석하는 검사이다.
A test that interprets an individual's performance against a predetermined absolute standard or criterion of mastery, rather than comparing it to other examinees' scores.
주요 연구자: 로버트 글레이저(Robert Glaser), 제임스 포팸(W. James Popham)
규준참조검사 (Norm-Referenced Test)
개인의 검사 수행을 표준화 표본(규준 집단)의 수행 분포와 비교하여 상대적 위치를 해석하는 검사이다.
A test that interprets an individual's performance by comparing it to the performance distribution of a standardization sample (norm group), determining relative standing.
주요 연구자: 로버트 글레이저(Robert Glaser), 앤 아나스타시(Anne Anastasi)
진단검사 (Diagnostic Test)
학습자의 특정 학습 영역에서의 강점과 약점을 상세하게 파악하여, 교정적 교수를 위한 구체적 정보를 제공하는 목적으로 설계된 검사이다.
A test designed to identify specific strengths and weaknesses in a learner's knowledge and skills within particular academic areas, providing detailed information for remedial instruction.
주요 연구자: 프레더릭 윌슨(Frederick Wilson), 리처드 우드콕(Richard Woodcock)
Woodcock-Johnson 검사 (Woodcock-Johnson Tests)
인지능력과 학업성취를 동시에 측정하는 종합적 검사 배터리로, CHC 이론(Cattell-Horn-Carroll)에 기반하여 인지-성취 불일치 분석이 가능하다. 현재 제4판(WJ IV)까지 출간되었다.
A comprehensive test battery measuring both cognitive abilities and academic achievement based on Cattell-Horn-Carroll (CHC) theory, enabling cognitive-achievement discrepancy analysis. Currently in its fourth edition (WJ IV).
주요 연구자: 리처드 우드콕(Richard Woodcock), 메리 존슨(Mary E. Bonner Johnson), 케빈 맥그루(Kevin McGrew)
교육과정 기반 평가 (Curriculum-Based Assessment)
학생이 실제로 배우고 있는 교육과정의 내용에서 직접 검사 문항을 추출하여, 학생의 학습 진전도를 반복적으로 모니터링하는 평가 방법이다.
An assessment approach that draws test items directly from the curriculum being taught to repeatedly monitor student progress in learning, providing ongoing data for instructional decision-making.
주요 연구자: 스탠리 덴노(Stanley Deno), 제럴드 틴달(Gerald Tindal)
학업적성 (Scholastic Aptitude)
학교 교육과정에서의 학습 성공 가능성을 예측하는 인지적 능력으로, 언어적 추론, 수리적 추론, 독해력 등이 주요 구성요소이다.
Cognitive abilities that predict success in academic learning, with verbal reasoning, quantitative reasoning, and reading comprehension as primary components.
주요 연구자: 칼 브리검(Carl Brigham), 존 캐롤(John B. Carroll)
직업적성 (Vocational Aptitude)
특정 직업 분야에서 성공적으로 수행할 수 있는 잠재적 능력으로, 인지적, 지각적, 정신운동적 능력을 포함하는 다차원적 구성개념이다.
The potential ability to perform successfully in a specific vocational field, a multidimensional construct encompassing cognitive, perceptual, and psychomotor abilities.
주요 연구자: 존 플래너건(John Flanagan), 에드윈 기셀리(Edwin Ghiselli)
RIASEC 모델 (RIASEC Model)
Holland이 제안한 직업 성격 유형 이론으로, 사람과 직업 환경을 실재형(R), 탐구형(I), 예술형(A), 사회형(S), 진취형(E), 관습형(C)의 6가지 유형으로 분류하고, 개인-환경 적합도를 6각형 모델로 설명한다.
Holland's theory of vocational personalities classifying people and work environments into six types—Realistic, Investigative, Artistic, Social, Enterprising, and Conventional—and explaining person-environment fit through a hexagonal model.
주요 연구자: 존 홀랜드(John L. Holland)
ASVAB (Armed Services Vocational Aptitude Battery)
미국 국방부가 개발한 다요인 적성검사 배터리로, 군 입대 자격 판정 및 병과 배치에 사용되며, 일반과학, 산수추론, 단어지식, 문단이해 등 10개 하위검사로 구성된다.
A multiple-aptitude test battery developed by the U.S. Department of Defense for military enlistment qualification and job assignment, consisting of ten subtests including General Science, Arithmetic Reasoning, Word Knowledge, and Paragraph Comprehension.
주요 연구자: 미국 국방부(U.S. Department of Defense)
수행평가 (Performance Assessment)
실제적인 과제 수행을 통해 학습자의 지식, 기술, 능력을 직접적으로 관찰하고 평가하는 방법으로, 선다형 검사의 한계를 보완한다.
An assessment method that directly observes and evaluates learners' knowledge, skills, and abilities through the performance of authentic tasks, addressing limitations of multiple-choice tests.
주요 연구자: 그랜트 위긴스(Grant Wiggins), 리처드 스티긴스(Richard Stiggins)
포트폴리오 평가 (Portfolio Assessment)
학습자가 일정 기간에 걸쳐 산출한 다양한 학습 결과물(작품, 보고서, 자기반성문 등)을 체계적으로 수집하여 성장과 발달을 종합적으로 평가하는 방법이다.
An assessment method that systematically collects diverse learning artifacts (works, reports, self-reflections, etc.) produced by learners over a period of time to comprehensively evaluate growth and development.
주요 연구자: 데니스 울프(Dennie Wolf), 로버트 티어니(Robert Tierney)
루브릭 (Rubric)
수행평가나 포트폴리오 등 주관적 평가에서 평가 기준과 수행 수준을 구체적으로 기술한 채점 지침으로, 평가의 일관성과 투명성을 확보하는 도구이다.
A scoring guide that describes specific evaluation criteria and performance levels for subjective assessments such as performance tasks and portfolios, ensuring consistency and transparency in evaluation.
주요 연구자: 하이디 앤드레이드(Heidi Andrade), 리처드 스티긴스(Richard Stiggins)
WIAT (Wechsler Individual Achievement Test)
Wechsler 지능검사와 공동 규준을 갖도록 설계된 개인용 성취도검사로, 읽기, 쓰기, 수학, 구술 언어 영역을 측정하여 능력-성취 불일치 분석에 활용된다.
An individually administered achievement test designed to share norms with Wechsler intelligence scales, measuring reading, writing, mathematics, and oral language for ability-achievement discrepancy analysis.
주요 연구자: 데이비드 웩슬러(David Wechsler), 피어슨 에듀케이션(Pearson Education)
능력-성취 불일치 모델 (Ability-Achievement Discrepancy Model)
지능검사에서 측정된 인지적 능력 수준과 성취도검사에서 측정된 학업 성취 수준 간의 유의미한 차이를 기준으로 학습장애를 진단하는 전통적 모델이다.
A traditional model for diagnosing learning disabilities based on a significant discrepancy between cognitive ability measured by intelligence tests and academic achievement measured by achievement tests.
주요 연구자: 사무엘 커크(Samuel Kirk), 잭 플레처(Jack Fletcher)
중재반응 모델 (Response to Intervention)
단계적으로 강도가 증가하는 교육적 중재를 제공하고, 각 단계에서의 학습 반응 정도를 모니터링하여 학습장애를 판별하는 다층적 예방 및 진단 모델이다.
A multi-tiered prevention and identification model that provides increasingly intensive educational interventions and monitors learning responses at each tier to identify learning disabilities.
주요 연구자: 린 푹스(Lynn Fuchs), 더글라스 푹스(Douglas Fuchs), 잭 플레처(Jack Fletcher)

성격검사 (객관적) (Objective Personality Tests) (30개 용어)

MMPI-2 (Minnesota Multiphasic Personality Inventory-2)
Hathaway와 McKinley가 개발한 MMPI의 개정판으로, 567개 문항의 진위형 자기보고식 성격검사이다. 정신병리 선별과 성격 특성 평가에 가장 널리 사용되는 객관적 검사로, 타당도척도와 임상척도를 통해 프로파일을 해석한다.
A revised edition of the original MMPI developed by Hathaway and McKinley, consisting of 567 true-false self-report items. It is the most widely used objective personality test for screening psychopathology and assessing personality characteristics, interpreted through validity and clinical scale profiles.
주요 연구자: 스타크 해서웨이(Starke Hathaway), J.C. 맥킨리(J.C. McKinley), 제임스 버처(James Butcher)
MMPI-2-RF (MMPI-2-Restructured Form)
Ben-Porath와 Tellegen이 MMPI-2에서 338문항을 선별하여 재구성한 검사로, 재구성임상척도(RC)를 핵심으로 하며 의기소침(Demoralization) 요인을 분리하여 척도 간 변별력을 높였다.
A restructured version of the MMPI-2 developed by Ben-Porath and Tellegen, consisting of 338 items with Restructured Clinical (RC) scales as its core, separating the Demoralization factor to improve discriminant validity among scales.
주요 연구자: 요시 벤-포라스(Yossef Ben-Porath), 아우케 텔레건(Auke Tellegen)
MMPI-3 (Minnesota Multiphasic Personality Inventory-3)
2020년에 Ben-Porath와 Tellegen이 출판한 MMPI 시리즈의 최신판으로, 335문항으로 구성되며 MMPI-2-RF의 구조를 유지하면서 현대적 규준과 새로운 문항을 포함한다.
The latest edition of the MMPI series published in 2020 by Ben-Porath and Tellegen, consisting of 335 items that maintain the MMPI-2-RF structure while incorporating updated norms and new items.
주요 연구자: 요시 벤-포라스(Yossef Ben-Porath), 아우케 텔레건(Auke Tellegen)
타당도척도 (Validity Scales)
MMPI 계열 검사에서 수검자의 검사 태도, 반응 일관성, 과장/축소 경향 등을 평가하여 프로파일의 해석 가능성을 판단하는 척도군이다. L, F, K 등 여러 척도로 구성된다.
A set of scales in the MMPI family that assess the test-taker's response attitude, consistency, and tendencies toward exaggeration or minimization, determining the interpretability of the clinical profile.
주요 연구자: 스타크 해서웨이(Starke Hathaway), 폴 미얼(Paul Meehl)
임상척도 (Clinical Scales)
MMPI-2의 10개 핵심 척도로, 각각 특정 정신병리 집단과 정상집단을 변별하기 위해 경험적 준거집단법으로 개발되었다. Hs(건강염려증), D(우울증), Hy(히스테리), Pd(반사회성), Mf(남성성-여성성), Pa(편집증), Pt(강박증), Sc(조현병), Ma(경조증), Si(내향성)로 구성된다.
The ten core scales of the MMPI-2, each developed through empirical criterion keying to discriminate between specific clinical groups and normal individuals: Hs, D, Hy, Pd, Mf, Pa, Pt, Sc, Ma, and Si.
주요 연구자: 스타크 해서웨이(Starke Hathaway), J.C. 맥킨리(J.C. McKinley)
L척도 (L Scale (Lie Scale))
MMPI의 타당도척도 중 하나로, 사회적으로 바람직하지만 대부분의 사람들이 인정하기 어려운 사소한 결점을 부인하는 경향을 측정한다. 높은 점수는 자신을 지나치게 긍정적으로 보이려는 순박한 방어 태도를 시사한다.
A validity scale of the MMPI that measures the tendency to deny common human faults and present oneself in an unrealistically favorable light. High scores suggest a naive defensive posture of self-presentation.
주요 연구자: 스타크 해서웨이(Starke Hathaway), 제임스 버처(James Butcher)
F척도 (F Scale (Infrequency Scale))
MMPI의 타당도척도 중 하나로, 정상 표본에서 10% 미만이 응답한 비전형적 문항들로 구성된다. 높은 점수는 심각한 정신병리, 증상 과장(꾀병), 무선반응, 또는 독특한 사고방식을 시사한다.
A validity scale of the MMPI composed of items endorsed by fewer than 10% of the normative sample. High scores suggest severe psychopathology, symptom exaggeration (malingering), random responding, or an unusual mindset.
주요 연구자: 스타크 해서웨이(Starke Hathaway), 로저 그린(Roger Greene)
K척도 (K Scale (Correction Scale))
MMPI의 타당도척도 중 하나로, 정신과 환자임에도 정상 프로파일을 보인 사람들과 정상인을 변별하기 위해 개발되었다. 정교한 방어적 태도를 측정하며, 일부 임상척도에 K교정값을 가산하여 방어성의 영향을 보정한다.
A validity scale of the MMPI developed to discriminate between psychiatric patients who produced normal profiles and actual normals. It measures sophisticated defensiveness and is used to add correction values to certain clinical scales.
주요 연구자: 폴 미얼(Paul Meehl), 스타크 해서웨이(Starke Hathaway)
코드타입 (Code Type)
MMPI-2 임상척도 프로파일에서 가장 높이 상승한 2~3개 척도의 조합을 말하며, 특정 성격 특성과 정신병리 패턴에 대한 경험적 해석 정보를 제공한다. 예를 들어 2-7 코드타입은 우울과 불안의 혼합을 시사한다.
A combination of the two or three most elevated clinical scales on the MMPI-2 profile, providing empirically based interpretive information about specific personality characteristics and psychopathology patterns.
주요 연구자: 알렉스 콜드웰(Alex Caldwell), W. 그랜트 달스트롬(W. Grant Dahlstrom)
재구성임상척도 (Restructured Clinical Scales (RC))
Tellegen 등이 기존 MMPI-2 임상척도에서 공통 요인인 의기소침(Demoralization)을 분리하고 각 척도의 핵심 구성개념을 추출하여 재구성한 9개 척도이다. RCd(의기소침)부터 RC9(경조증적 상태)까지로 구성된다.
Nine scales developed by Tellegen et al. by separating the common Demoralization factor from the original MMPI-2 clinical scales and extracting the core construct of each scale, ranging from RCd (Demoralization) to RC9 (Hypomanic Activation).
주요 연구자: 아우케 텔레건(Auke Tellegen), 요시 벤-포라스(Yossef Ben-Porath), 제임스 버처(James Butcher)
의기소침 (Demoralization)
MMPI-2 임상척도들에 공통적으로 존재하는 전반적인 불행감, 불만족, 무력감의 정서적 요인이다. Tellegen이 임상척도의 높은 상호상관의 주요 원인으로 규명하였으며, MMPI-2-RF에서 RCd 척도로 독립 측정된다.
A pervasive emotional factor of general unhappiness, dissatisfaction, and helplessness common across MMPI-2 clinical scales. Identified by Tellegen as the primary cause of high intercorrelations among clinical scales, measured independently as the RCd scale in MMPI-2-RF.
주요 연구자: 아우케 텔레건(Auke Tellegen), 요시 벤-포라스(Yossef Ben-Porath)
프로파일 해석 (Profile Interpretation)
MMPI 계열 검사에서 여러 척도 점수를 그래프로 나타낸 프로파일의 전체적 패턴(상승, 기울기, 형태)을 분석하여 수검자의 심리적 특성과 병리를 종합적으로 해석하는 방법이다.
A method of interpreting MMPI-family test results by analyzing the overall pattern of multiple scale scores displayed graphically, including elevations, slopes, and configurations, to comprehensively understand the examinee's psychological characteristics.
주요 연구자: W. 그랜트 달스트롬(W. Grant Dahlstrom), 로저 그린(Roger Greene)
MBTI (Myers-Briggs Type Indicator)
Carl Jung의 심리유형론에 기반하여 Isabel Myers와 Katharine Briggs가 개발한 성격유형 검사로, 외향-내향(E-I), 감각-직관(S-N), 사고-감정(T-F), 판단-인식(J-P)의 4가지 선호 차원을 조합하여 16가지 성격유형으로 분류한다.
A personality type indicator developed by Isabel Myers and Katharine Briggs based on Carl Jung's theory of psychological types, classifying individuals into 16 types through four preference dimensions: Extraversion-Introversion, Sensing-Intuition, Thinking-Feeling, and Judging-Perceiving.
주요 연구자: 이사벨 마이어스(Isabel Briggs Myers), 캐서린 브릭스(Katharine Cook Briggs), 칼 융(Carl Gustav Jung)
16PF (16 Personality Factors Questionnaire)
Raymond Cattell이 요인분석을 통해 도출한 16개 기본 성격요인을 측정하는 객관적 성격검사이다. 어휘적 접근과 요인분석적 방법론을 결합하여 성격의 기본 구조를 체계적으로 측정한다.
An objective personality test measuring 16 primary personality factors derived by Raymond Cattell through factor analysis. It combines the lexical approach with factor-analytic methodology to systematically measure the basic structure of personality.
주요 연구자: 레이몬드 캐텔(Raymond Cattell), 허버트 에버(Herbert Eber)
NEO-PI-R (NEO Personality Inventory-Revised)
Costa와 McCrae가 개발한 5요인 모델(Big Five)에 기반한 성격검사로, 신경증(N), 외향성(E), 개방성(O), 친화성(A), 성실성(C) 5개 영역과 각 영역별 6개 하위요인(총 30개)을 240문항으로 측정한다.
A personality inventory developed by Costa and McCrae based on the Five-Factor Model (Big Five), measuring five domains (Neuroticism, Extraversion, Openness, Agreeableness, Conscientiousness) and six facets per domain (30 total) with 240 items.
주요 연구자: 폴 코스타(Paul T. Costa Jr.), 로버트 맥크레이(Robert R. McCrae)
5요인 모델 (Five-Factor Model (Big Five))
성격의 기본 구조가 개방성(Openness), 성실성(Conscientiousness), 외향성(Extraversion), 친화성(Agreeableness), 신경증(Neuroticism)의 5가지 광역 차원으로 구성된다는 성격 이론이다. 다양한 문화권에서 반복적으로 확인된 가장 강력한 성격 구조 모델이다.
A personality theory proposing that the basic structure of personality consists of five broad dimensions: Openness, Conscientiousness, Extraversion, Agreeableness, and Neuroticism. It is the most robust model of personality structure, replicated across diverse cultures.
주요 연구자: 폴 코스타(Paul T. Costa Jr.), 로버트 맥크레이(Robert R. McCrae), 루이스 골드버그(Lewis Goldberg)
PAI (Personality Assessment Inventory)
Leslie Morey가 개발한 344문항의 자기보고식 성격 및 정신병리 평가 도구로, 4점 리커트 척도를 사용한다. 타당도척도, 임상척도, 치료고려척도, 대인관계척도의 4개 척도군으로 구성되며, 구성개념 타당화 접근으로 개발되었다.
A 344-item self-report measure of personality and psychopathology developed by Leslie Morey using a 4-point Likert scale. It comprises four scale groups: validity, clinical, treatment consideration, and interpersonal scales, developed through a construct validation approach.
주요 연구자: 레슬리 모레이(Leslie C. Morey)
TCI (Temperament and Character Inventory)
C. Robert Cloninger가 자신의 심리생물학적 성격 모델에 기반하여 개발한 성격검사로, 기질(temperament) 4차원(자극추구, 위험회피, 사회적 민감성, 인내력)과 성격(character) 3차원(자율성, 연대감, 자기초월)을 측정한다.
A personality inventory developed by C. Robert Cloninger based on his psychobiological model of personality, measuring four temperament dimensions (Novelty Seeking, Harm Avoidance, Reward Dependence, Persistence) and three character dimensions (Self-Directedness, Cooperativeness, Self-Transcendence).
주요 연구자: C. 로버트 클로닌저(C. Robert Cloninger)
CPI (California Psychological Inventory)
Harrison Gough가 개발한 정상 성인의 대인관계적 행동과 사회적 적응을 평가하는 객관적 성격검사이다. MMPI와 유사한 진위형 문항을 사용하되, 병리가 아닌 정상 성격의 사회적 측면에 초점을 맞춘다.
An objective personality test developed by Harrison Gough to assess interpersonal behavior and social adjustment in normal adults. It uses true-false items similar to the MMPI but focuses on social aspects of normal personality rather than pathology.
주요 연구자: 해리슨 가우(Harrison Gough)
자기보고식 검사 (Self-Report Inventory)
수검자가 자신의 성격, 행동, 감정, 태도 등에 대한 문항을 읽고 스스로 응답하는 형식의 검사 방법이다. 구조화된 문항과 표준화된 채점 절차를 사용하여 객관적 점수를 산출한다.
A testing method in which examinees read items about their own personality, behavior, emotions, and attitudes and respond by themselves. It produces objective scores through structured items and standardized scoring procedures.
주요 연구자: 로버트 우드워스(Robert S. Woodworth), 스타크 해서웨이(Starke Hathaway)
경험적 준거집단법 (Empirical Criterion Keying)
검사 문항의 선정 기준을 문항 내용의 논리적 적절성이 아닌, 특정 준거집단(예: 우울증 환자)과 정상집단 간의 실제 응답 차이에 두는 검사 구성 방법이다. MMPI가 대표적으로 이 방법으로 개발되었다.
A test construction method in which item selection is based not on logical content relevance but on actual response differences between a specific criterion group (e.g., depressed patients) and a normal group. The MMPI is the most representative test developed using this method.
주요 연구자: 스타크 해서웨이(Starke Hathaway), 해리슨 가우(Harrison Gough)
요인분석적 검사구성 (Factor-Analytic Test Construction)
요인분석 통계 기법을 활용하여 다수의 문항 응답에서 잠재적인 공통 요인을 추출하고, 같은 요인에 높은 부하량을 보이는 문항들로 척도를 구성하는 검사 개발 방법이다. 16PF와 NEO-PI-R이 대표적이다.
A test development method that uses factor analysis to extract latent common factors from numerous item responses and constructs scales from items with high factor loadings on the same factor. The 16PF and NEO-PI-R are representative examples.
주요 연구자: 레이몬드 캐텔(Raymond Cattell), 폴 코스타(Paul T. Costa Jr.)
강제선택형 (Forced-Choice Format)
사회적 바람직성이 유사한 두 개 이상의 진술문 중에서 자신에게 더 해당되는 것을 반드시 선택하도록 하는 문항 형식이다. 사회적 바람직성 편향을 줄이기 위해 고안되었으며, MBTI와 Edwards PPS가 대표적 사례이다.
An item format that requires the respondent to choose the most applicable statement from two or more alternatives matched for social desirability. Designed to reduce social desirability bias, exemplified by the MBTI and Edwards PPS.
주요 연구자: 앨런 에드워즈(Allen Edwards), 이사벨 마이어스(Isabel Briggs Myers)
반응편향 (Response Bias)
자기보고식 검사에서 문항 내용과 무관하게 특정 방향으로 응답하려는 체계적 경향으로, 사회적 바람직성, 묵인편향, 극단반응, 중앙경향 등이 포함된다. 검사 결과의 타당성을 위협하는 주요 오차 요인이다.
A systematic tendency to respond in a particular direction regardless of item content in self-report tests, including social desirability, acquiescence, extreme responding, and central tendency. It is a major source of error threatening test result validity.
주요 연구자: 리 크론바흐(Lee Cronbach), 앨런 에드워즈(Allen Edwards)
사회적 바람직성 (Social Desirability)
자기보고식 검사에서 사회적으로 바람직하거나 승인받는 방향으로 응답하려는 경향으로, 자기기만(self-deception)과 인상관리(impression management)의 두 요소로 구성된다.
The tendency to respond in a socially desirable or approved direction in self-report tests, composed of two components: self-deception and impression management.
주요 연구자: 앨런 에드워즈(Allen Edwards), 더글라스 폴허스(Delroy Paulhus)
묵인편향 (Acquiescence Bias)
문항의 내용과 무관하게 '예' 또는 '동의'로 응답하려는 체계적 경향이다. 주로 교육 수준이 낮거나 권위에 순종적인 수검자에서 나타나며, 균형 문항(balanced items) 사용으로 통제할 수 있다.
A systematic tendency to respond 'yes' or 'agree' regardless of item content. It is more common among examinees with lower education levels or those who are deferential to authority, and can be controlled by using balanced items.
주요 연구자: 리 크론바흐(Lee Cronbach), 잭 블록(Jack Block)
VRIN척도 (Variable Response Inconsistency Scale (VRIN))
MMPI-2의 타당도척도 중 하나로, 내용이 유사하거나 반대인 문항 쌍에 대한 응답의 일관성을 평가하여 무선반응(random responding)을 탐지한다. 높은 점수는 수검자가 문항 내용을 읽지 않고 무작위로 응답했을 가능성을 시사한다.
A validity scale of the MMPI-2 that evaluates response consistency across pairs of items with similar or opposite content to detect random responding. High scores suggest the examinee may have responded randomly without reading item content.
주요 연구자: 제임스 버처(James Butcher), 요시 벤-포라스(Yossef Ben-Porath)
TRIN척도 (True Response Inconsistency Scale (TRIN))
MMPI-2의 타당도척도 중 하나로, 내용이 반대인 문항 쌍에 대해 둘 다 '그렇다' 또는 둘 다 '아니다'로 응답하는 고정반응 경향(묵인/부인 편향)을 탐지한다.
A validity scale of the MMPI-2 that detects fixed responding tendencies (acquiescence or nay-saying bias) by identifying pairs of items with opposite content that are both endorsed as 'true' or both as 'false.'
주요 연구자: 제임스 버처(James Butcher), 요시 벤-포라스(Yossef Ben-Porath)
Harris-Lingoes 소척도 (Harris-Lingoes Subscales)
Robert Harris와 Jesse Lingoes가 MMPI 임상척도의 문항 내용을 분석하여 내용적으로 동질적인 하위 문항군으로 분류한 소척도이다. 6개 임상척도(D, Hy, Pd, Pa, Sc, Ma)에 대해 총 28개(MMPI-2에서 31개)의 소척도를 제공한다.
Subscales developed by Robert Harris and Jesse Lingoes by analyzing the item content of MMPI clinical scales and classifying items into content-homogeneous subgroups. They provide 28 (31 in MMPI-2) subscales for six clinical scales (D, Hy, Pd, Pa, Sc, Ma).
주요 연구자: 로버트 해리스(Robert Harris), 제시 링고스(Jesse Lingoes)
내용척도 (Content Scales)
MMPI-2에서 James Butcher 등이 문항의 표면 내용을 분석하여 동질적인 내용 영역별로 구성한 15개 척도이다. 불안(ANX), 공포(FRS), 강박(OBS), 우울(DEP), 건강염려(HEA) 등 수검자가 직접 보고한 증상과 관심사를 체계적으로 평가한다.
Fifteen scales constructed by James Butcher and colleagues for the MMPI-2 by analyzing manifest item content and grouping items into homogeneous content domains, including Anxiety, Fears, Obsessiveness, Depression, and Health Concerns, systematically assessing symptoms and concerns directly reported by examinees.
주요 연구자: 제임스 버처(James Butcher), 존 그레이엄(John Graham)

투사검사 (Projective Tests) (30개 용어)

투사검사 (Projective Test)
비구조화되거나 모호한 자극을 제시하고 수검자의 반응을 분석하여 무의식적 욕구, 갈등, 성격 역동을 파악하는 심리검사 방법이다.
A method of personality assessment in which unstructured or ambiguous stimuli are presented to examinees, and their responses are analyzed to reveal unconscious needs, conflicts, and personality dynamics.
주요 연구자: 로런스 프랭크(Lawrence Frank), 헤르만 로르샤흐(Hermann Rorschach)
투사 가설 (Projective Hypothesis)
개인이 모호한 자극에 반응할 때 자신의 욕구, 감정, 경험, 사고방식을 반응에 투사(projection)한다는 가정이다.
The assumption that when individuals respond to ambiguous stimuli, they project their own needs, feelings, experiences, and thought processes onto their responses.
주요 연구자: 로런스 프랭크(Lawrence Frank), 지그문트 프로이트(Sigmund Freud)
로르샤흐 잉크반점검사 (Rorschach Inkblot Test)
10장의 대칭적 잉크반점 카드를 제시하고 수검자가 무엇으로 보이는지 자유롭게 반응하게 하여 성격, 사고, 정서, 지각을 평가하는 투사검사이다.
A projective test using 10 symmetrical inkblot cards in which examinees describe what they perceive, with responses analyzed to assess personality, thinking, emotion, and perception.
주요 연구자: 헤르만 로르샤흐(Hermann Rorschach), 존 엑스너(John Exner), 그레고리 메이어(Gregory Meyer)
Exner 종합체계 (Exner Comprehensive System)
John Exner가 기존의 다양한 로르샤흐 채점/해석 체계(Beck, Klopfer, Hertz, Piotrowski, Rapaport-Schafer)를 경험적으로 통합하여 개발한 표준화된 실시, 채점, 해석 체계이다.
A standardized system for administering, scoring, and interpreting the Rorschach developed by John Exner, empirically integrating five major earlier approaches (Beck, Klopfer, Hertz, Piotrowski, Rapaport-Schafer).
주요 연구자: 존 엑스너(John Exner)
R-PAS (Rorschach Performance Assessment System)
Exner 종합체계의 한계를 보완하기 위해 Meyer 등이 개발한 로르샤흐의 최신 실시·채점·해석 체계로, 국제 규준과 반응 최적화 실시법을 도입했다.
The latest Rorschach administration, scoring, and interpretation system developed by Meyer and colleagues to address limitations of the Exner CS, featuring international norms and R-optimized administration.
주요 연구자: 그레고리 메이어(Gregory Meyer), 도날드 비글리(Donald Viglione)
반응영역 (Response Location)
로르샤흐 검사에서 수검자가 반응할 때 잉크반점의 어느 부분을 사용했는지를 나타내는 채점 범주로, 전체반응(W), 일반부분반응(D), 특이부분반응(Dd)으로 분류된다.
A scoring category in the Rorschach indicating which part of the inkblot the examinee used: Whole (W), Common Detail (D), or Unusual Detail (Dd).
주요 연구자: 헤르만 로르샤흐(Hermann Rorschach), 사무엘 벡(Samuel Beck)
결정인 (Determinants)
로르샤흐 검사에서 수검자가 특정 반응을 한 이유, 즉 잉크반점의 어떤 특성(형태, 색채, 음영, 운동 등)이 반응을 결정했는지를 나타내는 채점 범주이다.
Scoring categories in the Rorschach indicating what features of the inkblot (form, color, shading, movement, etc.) determined the examinee's response.
주요 연구자: 헤르만 로르샤흐(Hermann Rorschach), 브루노 클로퍼(Bruno Klopfer)
형태질 (Form Quality)
로르샤흐 검사에서 수검자의 반응이 잉크반점의 실제 윤곽에 얼마나 적합한지를 평가하는 채점으로, 반응의 현실 검증력과 지각 정확성을 반영한다.
A Rorschach scoring assessing how well the examinee's response fits the actual contours of the inkblot, reflecting reality testing and perceptual accuracy.
주요 연구자: 존 엑스너(John Exner)
주제통각검사 (Thematic Apperception Test)
모호한 대인관계 장면이 그려진 그림 카드를 제시하고 수검자에게 이야기를 만들게 하여 욕구, 갈등, 대인관계 패턴을 파악하는 투사검사이다.
A projective test presenting ambiguous interpersonal scenes on picture cards, asking examinees to create stories to reveal needs, conflicts, and interpersonal patterns.
주요 연구자: 헨리 머레이(Henry Murray), 크리스티나 모건(Christiana Morgan)
반응 최적화 실시 (R-Optimized Administration)
R-PAS에서 도입된 로르샤흐 실시 방법으로, 카드당 2~3개의 반응을 유도하여 총 반응수(R)를 일정 범위로 통제하는 절차이다.
A Rorschach administration procedure introduced in R-PAS that prompts 2-3 responses per card to control the total number of responses (R) within a target range.
주요 연구자: 그레고리 메이어(Gregory Meyer), 도날드 비글리(Donald Viglione)
구조적 요약 (Structural Summary)
로르샤흐 검사의 채점 결과를 비율, 백분율, 파생점수 등으로 종합하여 정리한 양적 요약표로, 해석의 기초 자료가 된다.
A quantitative summary of Rorschach scoring results organized into ratios, percentages, and derived scores that serve as the basis for interpretation.
주요 연구자: 존 엑스너(John Exner)
집-나무-사람 검사 (House-Tree-Person Test)
수검자에게 집, 나무, 사람을 차례로 그리게 한 후 그림의 특성과 사후 질문을 통해 성격, 자아상, 환경 지각을 평가하는 그림 투사검사이다.
A drawing projective test asking examinees to draw a house, tree, and person sequentially, then analyzing drawing features and post-drawing inquiry to assess personality, self-image, and environmental perception.
주요 연구자: 존 벅(John Buck)
인물화검사 (Draw-A-Person Test)
수검자에게 사람을 그리게 하여 신체상, 자아개념, 성격 특성을 파악하는 그림 투사검사로, Machover가 체계화했다.
A drawing projective test asking examinees to draw a person, used to assess body image, self-concept, and personality, systematized by Karen Machover.
주요 연구자: 카렌 마코버(Karen Machover), 플로렌스 굿이너프(Florence Goodenough)
동적가족화 (Kinetic Family Drawing)
가족 구성원이 무언가를 하고 있는 장면을 그리게 하여 가족 역동, 관계 패턴, 가족 내 갈등을 탐색하는 그림 투사검사이다.
A drawing projective test asking examinees to draw their family members doing something, used to explore family dynamics, relationship patterns, and intrafamily conflicts.
주요 연구자: 로버트 번스(Robert Burns), 하바드 카우프만(S. Harvard Kaufman)
벤더게슈탈트검사 (Bender-Gestalt Test)
9개의 기하학적 도형을 하나씩 제시하고 따라 그리게 하여 시각-운동 통합 기능, 신경심리적 손상, 정서적 지표를 평가하는 검사이다.
A test presenting 9 geometric designs for copying, used to assess visual-motor integration, neuropsychological impairment, and emotional indicators.
주요 연구자: 로레타 벤더(Loretta Bender), 엘리자베스 코피츠(Elizabeth Koppitz)
운동반응 (Movement Response)
로르샤흐 검사에서 잉크반점에 움직임을 지각하여 반응한 것으로, 인간운동(M), 동물운동(FM), 무생물운동(m)으로 분류된다.
Rorschach responses involving perceived movement in the inkblot, classified as Human Movement (M), Animal Movement (FM), and Inanimate Movement (m).
주요 연구자: 헤르만 로르샤흐(Hermann Rorschach)
색채반응 (Color Response)
로르샤흐 검사에서 잉크반점의 유채색에 의해 결정된 반응으로, 형태와의 결합 정도에 따라 FC, CF, C로 분류되며 정서 표현과 조절을 반영한다.
Rorschach responses determined by the chromatic color of the inkblot, classified as FC, CF, or C based on the degree of form integration, reflecting emotional expression and regulation.
주요 연구자: 헤르만 로르샤흐(Hermann Rorschach)
특수점수 (Special Scores)
로르샤흐 검사에서 반응의 특이한 언어적·인지적 특성을 나타내는 추가 채점으로, 사고장애, 방어기제, 인지적 특이성을 반영한다.
Additional Rorschach scores reflecting unusual verbal or cognitive characteristics of responses, indicating thought disorder, defense mechanisms, or cognitive peculiarities.
주요 연구자: 데이비드 라파포트(David Rapaport), 존 엑스너(John Exner)
내용 범주 (Content Categories)
로르샤흐 검사에서 수검자가 보고한 반응의 내용(인간, 동물, 자연, 해부 등)을 분류하는 채점 범주이다.
Scoring categories classifying the content of Rorschach responses (human, animal, nature, anatomy, etc.).
주요 연구자: 존 엑스너(John Exner)
아동용 통각검사 (Children's Apperception Test)
3~10세 아동을 대상으로 동물 캐릭터가 등장하는 10장의 그림 카드를 사용하여 이야기를 만들게 하는 투사검사이다.
A projective test for children aged 3-10 using 10 picture cards featuring animal characters, asking children to create stories.
주요 연구자: 레오폴드 벨락(Leopold Bellak), 소냐 벨락(Sonya Bellak)
욕구-압력 분석 (Need-Press Analysis)
Murray의 성격 이론에 기반한 TAT 해석 방법으로, 주인공의 욕구(need)와 환경적 압력(press)의 상호작용을 분석하여 성격 역동을 파악한다.
A TAT interpretation method based on Murray's personality theory, analyzing the interaction between the hero's needs and environmental press to understand personality dynamics.
주요 연구자: 헨리 머레이(Henry Murray)
체험형 (Experience Type)
로르샤흐 검사에서 인간운동반응(M)과 가중색채반응(WSumC)의 비율(EB = M:WSumC)로 나타내는 심리적 대처 양식의 지표이다.
A Rorschach index (EB = M:WSumC) representing psychological coping style, based on the ratio of Human Movement responses to Weighted Sum of Color responses.
주요 연구자: 헤르만 로르샤흐(Hermann Rorschach)
정서비율 (Affective Ratio)
로르샤흐 검사에서 유채색 카드(VIII+IX+X)의 반응 수를 무채색 카드(I~VII)의 반응 수로 나눈 비율로, 정서적 자극에 대한 관심과 개방성을 반영한다.
A Rorschach ratio of responses to chromatic cards (VIII+IX+X) divided by responses to achromatic cards (I-VII), reflecting interest in and openness to emotional stimulation.
주요 연구자: 존 엑스너(John Exner)
사고장애지표 (Thought Disorder Index)
로르샤흐 검사에서 사고의 혼란과 비논리적 사고를 반영하는 특수점수의 가중합(WSum6)과 관련 지표들의 종합적 평가 체계이다.
A comprehensive assessment of thought disturbance in the Rorschach, based on the weighted sum of special scores (WSum6) and related indices reflecting cognitive slippage and illogical thinking.
주요 연구자: 데이비드 라파포트(David Rapaport), 존 엑스너(John Exner)
문장완성검사 (Sentence Completion Test)
불완전한 문장의 시작 부분(어간)을 제시하고 수검자가 자유롭게 완성하게 하여 태도, 감정, 갈등을 탐색하는 반구조화된 투사검사이다.
A semi-structured projective test presenting incomplete sentence stems for examinees to complete freely, exploring attitudes, feelings, and conflicts.
주요 연구자: 줄리안 로터(Julian Rotter), 제인 뢰빙거(Jane Loevinger)
연상검사 (Word Association Test)
자극 단어를 하나씩 제시하고 떠오르는 단어를 즉시 말하게 하여 반응 내용과 반응 시간을 분석함으로써 무의식적 갈등과 정서 복합체를 탐색하는 검사이다.
A test presenting stimulus words one at a time, asking examinees to respond immediately with the first word that comes to mind, analyzing response content and latency to explore unconscious conflicts and emotional complexes.
주요 연구자: 프랜시스 골턴(Francis Galton), 카를 융(Carl Jung)
Lambda (Lambda)
로르샤흐 검사에서 순수형태반응(F)의 비율을 나타내는 지표로, 자극의 정서적·복합적 측면을 무시하고 단순화하려는 경향을 반영한다.
A Rorschach index representing the proportion of Pure Form (F) responses, reflecting the tendency to simplify stimuli by ignoring emotional and complex aspects.
주요 연구자: 존 엑스너(John Exner)
평범반응 (Popular Response)
로르샤흐 검사에서 일반인의 약 1/3 이상이 보고하는 흔한 반응으로, 관습적 사고와 현실 지각의 적합성을 반영한다.
Common Rorschach responses reported by approximately one-third or more of the general population, reflecting conventional thinking and appropriate reality perception.
주요 연구자: 존 엑스너(John Exner)
음영반응 (Shading Response)
로르샤흐 검사에서 잉크반점의 명암(밝고 어두운 음영)에 의해 결정된 반응으로, 질감(T), 차원(V), 확산음영(Y)으로 분류된다.
Rorschach responses determined by the light-dark shading features of the inkblot, classified as Texture (T), Vista (V), and Diffuse Shading (Y).
주요 연구자: 브루노 클로퍼(Bruno Klopfer)
투사검사의 타당도 논쟁 (Validity Controversy of Projective Tests)
투사검사, 특히 로르샤흐와 TAT의 심리측정적 타당도와 임상적 유용성에 대한 지속적인 학문적 논쟁으로, 과학적 근거와 임상 경험 사이의 갈등을 반영한다.
The ongoing academic debate about the psychometric validity and clinical utility of projective tests, particularly the Rorschach and TAT, reflecting tensions between scientific evidence and clinical experience.
주요 연구자: 스콧 릴리엔펠드(Scott Lilienfeld), 그레고리 메이어(Gregory Meyer)

신경심리검사 (Neuropsychological Assessment) (30개 용어)

간이정신상태검사 (Mini-Mental State Examination (MMSE))
지남력, 기억력, 주의집중, 언어능력, 시공간 구성능력 등을 간단히 평가하는 30점 만점의 인지기능 선별검사로, 치매 선별에 가장 널리 사용된다.
A 30-point screening instrument that briefly assesses orientation, memory, attention, language, and visuospatial construction, most widely used for dementia screening.
주요 연구자: 마셜 폴스타인(Marshal Folstein)
임상치매척도 (Clinical Dementia Rating (CDR))
기억, 지남력, 판단과 문제해결, 사회활동, 가정과 취미, 위생 및 몸치장의 6개 영역을 평가하여 치매의 중증도를 0(정상)~3(중증)으로 등급화하는 임상 평정 척도이다.
A clinical rating scale that evaluates six domains — memory, orientation, judgment, community affairs, home and hobbies, and personal care — to stage dementia severity from 0 (normal) to 3 (severe).
주요 연구자: 존 모리스(John C. Morris), 찰스 휴즈(Charles P. Hughes)
길 만들기 검사 (Trail Making Test (TMT))
Part A는 숫자를 순서대로 연결하여 시각적 탐색과 처리속도를 측정하고, Part B는 숫자와 글자를 번갈아 연결하여 인지적 유연성과 전환능력을 측정하는 신경심리검사이다.
A neuropsychological test in which Part A requires connecting numbers in sequence (measuring visual scanning and processing speed) and Part B requires alternating between numbers and letters (measuring cognitive flexibility and set-shifting).
주요 연구자: 랠프 레이탄(Ralph Reitan)
위스콘신 카드분류검사 (Wisconsin Card Sorting Test (WCST))
카드를 색, 형태, 수의 세 가지 기준에 따라 분류하되 분류 규칙이 피드백 없이 변경되어, 개념 형성, 인지적 유연성, 보속 오류를 측정하는 전두엽 기능 검사이다.
A test of executive function in which cards are sorted by color, shape, or number with unannounced rule changes, measuring concept formation, cognitive flexibility, and perseverative errors.
주요 연구자: 데이비드 그랜트(David A. Grant), 브렌다 밀너(Brenda Milner)
스트룹 검사 (Stroop Test)
글자의 의미와 잉크 색이 불일치하는 조건에서 잉크 색을 명명하게 하여 선택적 주의력과 인지적 억제(간섭 통제) 능력을 측정하는 검사이다.
A test measuring selective attention and cognitive inhibition (interference control) by requiring naming the ink color of color words printed in incongruent colors.
주요 연구자: 존 리들리 스트룹(John Ridley Stroop)
레이-오스테리스 복합도형검사 (Rey-Osterrieth Complex Figure Test (ROCF))
복잡한 기하학적 도형을 모사(copy)한 후 즉시 회상과 지연 회상으로 재산하게 하여 시공간 구성능력과 시각적 기억력을 측정하는 검사이다.
A test assessing visuospatial constructional ability and visual memory by requiring the examinee to copy a complex geometric figure and then reproduce it from memory after immediate and delayed intervals.
주요 연구자: 앙드레 레이(André Rey), 폴 알렉산더 오스테리스(Paul-Alexander Osterrieth)
할스테드-레이탄 신경심리배터리 (Halstead-Reitan Neuropsychological Battery (HRNB))
범주검사, 촉각수행검사, 리듬검사, 음성지각검사, 손가락 두드리기검사 등 다수의 하위검사로 구성된 고정배터리 방식의 종합 신경심리검사로, 손상지표(Impairment Index)를 산출한다.
A comprehensive fixed-battery neuropsychological assessment consisting of multiple subtests including Category Test, Tactual Performance Test, Rhythm Test, Speech Sounds Perception Test, and Finger Tapping Test, yielding an Impairment Index.
주요 연구자: 워드 할스테드(Ward Halstead), 랠프 레이탄(Ralph Reitan)
루리아-네브래스카 신경심리배터리 (Luria-Nebraska Neuropsychological Battery (LNNB))
루리아의 신경심리학 이론에 기반하여 운동, 리듬, 촉각, 시각, 수용언어, 표현언어, 쓰기, 읽기, 산수, 기억, 지적과정 등 11개 임상척도로 구성된 표준화된 신경심리검사 배터리이다.
A standardized neuropsychological battery based on Luria's theory, comprising 11 clinical scales including Motor, Rhythm, Tactile, Visual, Receptive Speech, Expressive Speech, Writing, Reading, Arithmetic, Memory, and Intellectual Processes.
주요 연구자: 알렉산드르 루리아(Alexander Luria), 찰스 골든(Charles Golden)
보스턴 이름대기검사 (Boston Naming Test (BNT))
60개의 흑백 선화를 제시하고 이름을 말하게 하여 대면 이름대기(confrontation naming) 능력, 즉 어휘 인출 및 언어적 표현 능력을 측정하는 검사이다.
A 60-item confrontation naming test using black-and-white line drawings to assess word retrieval and expressive language ability.
주요 연구자: 에디스 카플란(Edith Kaplan), 해럴드 굿글래스(Harold Goodglass)
레이 청각언어학습검사 (Rey Auditory Verbal Learning Test (RAVLT))
15개 단어 목록을 5회 반복 학습시킨 후 즉시 회상, 간섭 목록 후 회상, 지연 회상, 재인을 실시하여 언어적 학습 및 기억의 다양한 측면을 측정하는 검사이다.
A verbal learning and memory test involving five learning trials of a 15-word list, followed by an interference list, immediate recall, delayed recall, and recognition, assessing multiple aspects of verbal memory.
주요 연구자: 앙드레 레이(André Rey)
웩슬러 기억검사 (Wechsler Memory Scale (WMS))
청각적/시각적 기억, 즉시/지연 기억, 작업기억 등 기억의 다차원적 측면을 체계적으로 평가하는 종합 기억검사 배터리이다.
A comprehensive memory battery that systematically assesses multiple dimensions of memory including auditory/visual memory, immediate/delayed memory, and working memory.
주요 연구자: 데이비드 웩슬러(David Wechsler)
캘리포니아 언어학습검사 (California Verbal Learning Test (CVLT))
4개 의미 범주에 속하는 16개 단어 목록을 5회 학습시킨 후 자유 회상, 단서 회상, 재인을 실시하여 언어적 학습 전략과 기억 과정을 분석하는 검사이다.
A verbal learning test using a 16-word list from four semantic categories across five learning trials, followed by free recall, cued recall, and recognition, enabling analysis of learning strategies and memory processes.
주요 연구자: 딘 델리스(Dean Delis), 조엘 크레이머(Joel Kramer)
시계그리기검사 (Clock Drawing Test (CDT))
시계 원판을 그리고 지정된 시각(예: 11시 10분)의 시침과 분침을 그리게 하여 시공간 구성능력, 실행기능, 의미적 지식을 간편하게 평가하는 선별검사이다.
A brief screening test requiring the examinee to draw a clock face with hands set to a specified time, assessing visuospatial construction, executive function, and semantic knowledge.
주요 연구자: 이반 슐만(Kenneth Shulman)
연속수행검사 (Continuous Performance Test (CPT))
연속적으로 제시되는 자극 중 목표 자극에만 반응하게 하여 지속적 주의력(sustained attention)과 억제 능력(commission error)을 측정하는 컴퓨터 기반 검사이다.
A computer-based test measuring sustained attention and response inhibition by requiring responses to target stimuli among continuously presented stimuli, using omission and commission errors as key indices.
주요 연구자: 로버트 로스볼드(Herbert Rosvold), 키스 코너스(C. Keith Conners)
신경심리검사 배터리 (Neuropsychological Test Battery)
주의력, 기억, 언어, 시공간, 실행기능 등 주요 인지 영역을 포괄적으로 평가하기 위해 여러 개별 검사를 체계적으로 조합한 종합 검사 모음이다.
A systematic combination of individual tests designed to comprehensively assess major cognitive domains including attention, memory, language, visuospatial ability, and executive function.
주요 연구자: 랠프 레이탄(Ralph Reitan), 머릴 허터(Muriel Lezak)
고정배터리 vs 유연배터리 (Fixed Battery vs Flexible Battery)
고정배터리는 모든 피검자에게 동일한 검사 세트를 실시하는 접근이며, 유연배터리는 의뢰 질문과 환자 특성에 따라 검사를 선택적으로 구성하는 접근이다.
Fixed battery administers the same set of tests to all examinees, while flexible battery selectively assembles tests based on the referral question and patient characteristics.
주요 연구자: 랠프 레이탄(Ralph Reitan), 에디스 카플란(Edith Kaplan)
편측무시 (Hemispatial Neglect)
뇌 손상 반대쪽 공간의 자극에 대해 주의를 기울이지 못하거나 반응하지 못하는 신경심리학적 증후군으로, 주로 우반구 두정엽 손상 시 좌측 무시로 나타난다.
A neuropsychological syndrome characterized by failure to attend or respond to stimuli in the contralesional space, most commonly left-sided neglect following right parietal lobe damage.
주요 연구자: 에두아르도 비시아크(Edoardo Bisiach), 마르셀 메쥘랑(M. Marcel Mesulam)
실행기능 (Executive Function)
목표 설정, 계획 수립, 조직화, 인지적 유연성, 억제 통제, 자기 모니터링 등 목표지향적 행동을 조절하는 상위 인지 기능의 총칭으로, 주로 전전두피질이 관여한다.
An umbrella term for higher-order cognitive processes that regulate goal-directed behavior, including goal setting, planning, organization, cognitive flexibility, inhibitory control, and self-monitoring, primarily mediated by the prefrontal cortex.
주요 연구자: 알렉산드르 루리아(Alexander Luria), 아델 다이아몬드(Adele Diamond)
작업기억 (Working Memory)
정보를 일시적으로 유지하면서 동시에 조작하는 능력으로, 음운루프, 시공간 잡기장, 중앙집행기로 구성되며, 신경심리검사에서는 숫자 역순 따라하기, 연산 과제 등으로 측정한다.
The capacity to temporarily hold and manipulate information, comprising the phonological loop, visuospatial sketchpad, and central executive, measured in neuropsychological testing by digit span backward, arithmetic tasks, etc.
주요 연구자: 앨런 배들리(Alan Baddeley), 그레이엄 히치(Graham Hitch)
주의력 (Attention)
외부 자극이나 내적 표상 중 특정 정보를 선택하고 유지하며 전환하는 인지 기능으로, 집중 주의, 지속 주의, 선택 주의, 분할 주의, 교대 주의 등으로 세분화된다.
The cognitive function of selecting, sustaining, and shifting focus on specific information from external stimuli or internal representations, subdivided into focused, sustained, selective, divided, and alternating attention.
주요 연구자: 마이클 포스너(Michael Posner), 이언 로버트슨(Ian Robertson)
시공간능력 (Visuospatial Ability)
공간 내 대상의 위치, 방향, 거리를 지각하고, 공간적 관계를 분석하며, 시각 정보를 조작하여 구성하는 능력으로, 주로 우반구 두정엽과 후두엽이 관여한다.
The ability to perceive the location, orientation, and distance of objects in space, analyze spatial relationships, and manipulate visual information for construction, primarily mediated by the right parietal and occipital lobes.
주요 연구자: 아서 벤턴(Arthur Benton), 브렌다 밀너(Brenda Milner)
언어기능 (Language Function)
말의 이해(수용 언어)와 표현(표현 언어), 이름대기, 따라 말하기, 읽기, 쓰기 등을 포괄하는 인지 기능으로, 주로 좌반구의 브로카 영역과 베르니케 영역이 관여한다.
Cognitive functions encompassing comprehension (receptive language) and production (expressive language), naming, repetition, reading, and writing, primarily mediated by Broca's and Wernicke's areas in the left hemisphere.
주요 연구자: 폴 브로카(Paul Broca), 카를 베르니케(Carl Wernicke)
기억 (Memory)
정보를 부호화(encoding), 저장(storage), 인출(retrieval)하는 인지 과정의 총칭으로, 신경심리검사에서는 감각기억, 단기/작업기억, 장기기억(명시적/암묵적) 등으로 구분하여 평가한다.
The collective cognitive processes of encoding, storing, and retrieving information, assessed in neuropsychological testing across sensory memory, short-term/working memory, and long-term memory (explicit/implicit) systems.
주요 연구자: 브렌다 밀너(Brenda Milner), 엔델 털빙(Endel Tulving)
전두엽 기능 (Frontal Lobe Function)
계획, 의사결정, 충동 억제, 사회적 행동 조절, 작업기억 등 고차 인지 기능을 담당하는 전두엽, 특히 전전두피질의 기능으로, 실행기능의 신경해부학적 기반이 된다.
Higher-order cognitive functions mediated by the frontal lobes, especially the prefrontal cortex, including planning, decision-making, impulse control, social behavior regulation, and working memory, forming the neuroanatomical basis of executive function.
주요 연구자: 알렉산드르 루리아(Alexander Luria), 안토니오 다마지오(Antonio Damasio)
뇌손상 선별 (Brain Damage Screening)
간단한 검사를 통해 뇌손상 또는 인지기능 저하의 유무를 빠르게 확인하는 초기 평가 과정으로, 양성 결과 시 종합 신경심리검사 배터리로 정밀 평가를 의뢰한다.
An initial assessment process using brief tests to quickly identify the presence of brain damage or cognitive impairment, with positive results warranting referral for comprehensive neuropsychological battery evaluation.
주요 연구자: 마셜 폴스타인(Marshal Folstein), 아서 벤턴(Arthur Benton)
치매 선별 (Dementia Screening)
MMSE, CDR, 시계그리기검사 등 간이 도구를 사용하여 치매 의심 환자를 조기에 식별하고 종합 신경심리검사로 의뢰하기 위한 체계적 선별 과정이다.
A systematic screening process using brief instruments such as MMSE, CDR, and Clock Drawing Test to identify suspected dementia patients early and refer them for comprehensive neuropsychological evaluation.
주요 연구자: 마셜 폴스타인(Marshal Folstein), 자드 모리스(John C. Morris)
실어증 (Aphasia)
뇌 손상(주로 좌반구)으로 인해 이전에 정상이었던 언어의 이해, 표현, 따라 말하기, 이름대기 등의 능력이 후천적으로 손상된 상태를 말한다.
An acquired language disorder resulting from brain damage (primarily left hemisphere) that impairs previously normal abilities in language comprehension, expression, repetition, and naming.
주요 연구자: 폴 브로카(Paul Broca), 카를 베르니케(Carl Wernicke), 노먼 게슈윈드(Norman Geschwind)
실행증 (Apraxia)
운동 능력, 감각 기능, 언어 이해에 이상이 없음에도 불구하고 학습된 의도적 동작(예: 가위질, 손 흔들기)을 올바르게 수행하지 못하는 고차 운동 장애이다.
A higher-order motor disorder characterized by the inability to correctly perform learned purposeful movements (e.g., using scissors, waving) despite intact motor ability, sensory function, and language comprehension.
주요 연구자: 후고 리프만(Hugo Liepmann), 노먼 게슈윈드(Norman Geschwind)
실인증 (Agnosia)
감각 기관과 기초 감각 기능은 정상이지만 이전에 알고 있던 대상, 사람, 소리 등을 인식하지 못하는 고차 지각 장애로, 손상된 감각 양식에 따라 시각, 청각, 촉각 실인증으로 분류된다.
A higher-order perceptual disorder in which previously familiar objects, faces, or sounds cannot be recognized despite intact sensory organs and basic sensory function, classified by affected modality as visual, auditory, or tactile agnosia.
주요 연구자: 하인리히 리사우어(Heinrich Lissauer), 올리버 색스(Oliver Sacks)
신경심리학적 프로파일 (Neuropsychological Profile)
주의력, 기억, 언어, 시공간, 실행기능 등 주요 인지 영역별 수행 수준을 종합적으로 도식화한 결과 패턴으로, 인지적 강점과 약점의 전체적 그림을 제공한다.
A comprehensive pattern of performance levels across major cognitive domains — attention, memory, language, visuospatial ability, and executive function — providing an overall picture of cognitive strengths and weaknesses.
주요 연구자: 머릴 허터(Muriel Lezak), 에디스 카플란(Edith Kaplan)

임상면접과 행동평가 (Clinical Interview & Behavioral Assessment) (25개 용어)

임상면접 (Clinical Interview)
임상가가 내담자와 직접 대면하여 심리적 문제, 병력, 생활사 등의 정보를 수집하고 진단적 판단을 내리기 위해 수행하는 체계적 면담 과정이다.
A systematic face-to-face interaction between a clinician and a client designed to gather information about psychological problems, history, and life circumstances for diagnostic decision-making.
주요 연구자: 칼 로저스(Carl Rogers), 게리 그로스-마르나(Gary Groth-Marnat)
구조화 면담 (Structured Interview)
미리 정해진 질문 목록, 질문 순서, 채점 기준을 엄격히 따르는 표준화된 면담 형식으로, 면접자 간 신뢰도를 최대화하기 위해 설계되었다. 대표적으로 SCID(Structured Clinical Interview for DSM)가 있다.
A standardized interview format with predetermined questions, fixed order, and explicit scoring criteria designed to maximize inter-rater reliability. The SCID (Structured Clinical Interview for DSM) is a prominent example.
주요 연구자: 로버트 스피처(Robert Spitzer), 마이클 퍼스트(Michael First), 재닛 윌리엄스(Janet Williams)
반구조화 면담 (Semi-Structured Interview)
핵심 질문과 평가 영역은 미리 정해져 있으나, 면접자가 내담자의 반응에 따라 추가 질문이나 탐색적 질문을 융통성 있게 할 수 있는 면담 형식이다.
An interview format with predetermined core questions and assessment domains, but allowing the interviewer flexibility to ask follow-up or exploratory questions based on the client's responses.
주요 연구자: 데이비드 쉬한(David Sheehan), 장 이노걸(Jean Endicott)
비구조화 면담 (Unstructured Interview)
사전에 정해진 질문 목록이나 순서 없이, 면접자가 내담자의 반응과 임상적 판단에 따라 자유롭게 질문하고 탐색하는 면담 형식이다.
An interview format without predetermined questions or fixed order, in which the interviewer freely explores topics based on the client's responses and clinical judgment.
주요 연구자: 칼 로저스(Carl Rogers), 해리 설리번(Harry Stack Sullivan)
정신상태검사 (Mental Status Examination)
면접 시점에서 내담자의 외양, 행동, 기분, 정동, 사고 과정과 내용, 지각, 인지 기능, 병식, 판단력 등을 체계적으로 평가하는 임상 절차이다. 의학에서의 신체검사에 해당하는 정신의학적 평가이다.
A systematic clinical procedure for evaluating a client's appearance, behavior, mood, affect, thought process and content, perception, cognition, insight, and judgment at the time of the interview, analogous to a physical examination in medicine.
주요 연구자: 아돌프 마이어(Adolf Meyer), 마샬 폴스타인(Marshal Folstein)
행동관찰 (Behavioral Observation)
자연적 또는 통제된 환경에서 개인의 행동을 체계적으로 관찰하고 기록하여 행동의 빈도, 강도, 지속시간, 맥락을 파악하는 평가 방법이다.
An assessment method involving systematic observation and recording of an individual's behavior in natural or controlled settings to determine the frequency, intensity, duration, and context of behavior.
주요 연구자: B.F. 스키너(B.F. Skinner), 시드니 비주(Sidney Bijou)
행동평가 (Behavioral Assessment)
행동주의 원리에 기반하여 관찰 가능한 행동과 그 환경적 맥락을 체계적으로 평가하는 접근으로, 행동의 선행사건, 행동 자체, 결과를 분석하여 중재 계획을 수립한다.
A systematic approach based on behavioral principles to assess observable behavior and its environmental context, analyzing antecedents, behavior, and consequences to develop intervention plans.
주요 연구자: 마빈 골드프리드(Marvin Goldfried), 미셀 허슨(Michel Hersen)
기능적 행동분석 (Functional Behavioral Analysis)
문제행동이 어떤 기능(목적)을 수행하는지를 파악하기 위해 선행사건, 행동, 결과의 관계를 체계적으로 분석하는 과정으로, 행동의 유지 원인을 규명하여 효과적 중재를 설계한다.
A systematic process of identifying the function (purpose) that a problem behavior serves by analyzing the relationships among antecedents, behavior, and consequences, used to design effective interventions based on behavioral maintenance factors.
주요 연구자: 브라이언 이와타(Brian Iwata), 에드워드 카(Edward Carr)
BDI (Beck Depression Inventory)
Aaron Beck이 개발한 21문항의 자기보고식 우울 증상 평가 척도로, 지난 2주간의 우울 증상(정서적, 인지적, 신체적)의 심각도를 0~3점으로 평정하여 총점 0~63점 범위로 산출한다.
A 21-item self-report inventory developed by Aaron Beck that measures the severity of depressive symptoms (affective, cognitive, and somatic) over the past two weeks, rated on a 0-3 scale yielding a total score of 0-63.
주요 연구자: 아론 벡(Aaron T. Beck), 로버트 스티어(Robert Steer)
BAI (Beck Anxiety Inventory)
Aaron Beck이 개발한 21문항의 자기보고식 불안 증상 평가 척도로, 지난 1주간의 불안 증상(특히 신체적 증상)을 0~3점으로 평정하여 우울과 변별되는 불안 고유의 증상을 측정한다.
A 21-item self-report inventory developed by Aaron Beck that measures anxiety symptoms (particularly somatic symptoms) over the past week, rated on a 0-3 scale, designed to discriminate anxiety from depression.
주요 연구자: 아론 벡(Aaron T. Beck), 게리 에머리(Gary Emery)
STAI (State-Trait Anxiety Inventory)
Spielberger가 개발한 40문항(각 20문항)의 자기보고식 불안 척도로, 현재 느끼는 일시적 불안(상태불안)과 불안을 느끼는 일반적 성향(특성불안)을 구분하여 측정한다.
A 40-item self-report anxiety scale developed by Spielberger consisting of two 20-item subscales that separately measure transient state anxiety (how one feels now) and dispositional trait anxiety (general tendency to feel anxious).
주요 연구자: 찰스 스필버거(Charles D. Spielberger), 리처드 고서치(Richard Gorsuch)
SCL-90-R (Symptom Checklist-90-Revised)
Derogatis가 개발한 90문항의 자기보고식 다차원 정신건강 선별 도구로, 9개 증상 차원(신체화, 강박, 대인예민, 우울, 불안, 적대감, 공포불안, 편집증, 정신증)과 3개 전체 지표를 통해 정신병리의 전반적 양상을 평가한다.
A 90-item self-report multidimensional mental health screening tool developed by Derogatis that assesses nine symptom dimensions (somatization, obsessive-compulsive, interpersonal sensitivity, depression, anxiety, hostility, phobic anxiety, paranoid ideation, psychoticism) and three global indices.
주요 연구자: 레너드 데로가티스(Leonard Derogatis), 로널드 립먼(Ronald Lipman)
라포 형성 (Rapport Building)
면접자와 내담자 사이에 신뢰, 존중, 편안함에 기반한 협력적 관계를 구축하는 과정으로, 효과적인 임상면접과 정확한 정보 수집의 선행 조건이다.
The process of establishing a cooperative relationship between interviewer and client based on trust, respect, and comfort, serving as a prerequisite for effective clinical interviewing and accurate information gathering.
주요 연구자: 칼 로저스(Carl Rogers), 에드워드 보딘(Edward Bordin)
정보 수집 (Information Gathering)
임상면접에서 내담자의 주 호소, 현병력, 과거력, 가족력, 발달력, 사회력 등 진단과 사례개념화에 필요한 포괄적 정보를 체계적으로 수집하는 과정이다.
The systematic process of collecting comprehensive information during clinical interviews, including chief complaint, present illness, past history, family history, developmental history, and social history needed for diagnosis and case conceptualization.
주요 연구자: 게리 그로스-마르나(Gary Groth-Marnat), 앨런 카플란(Allan Kaplan)
진단적 면담 (Diagnostic Interview)
DSM-5 또는 ICD-11 등 표준화된 진단 분류 체계의 기준에 따라 정신장애의 유무와 유형을 체계적으로 평가하기 위한 목적으로 수행되는 면담이다.
An interview conducted systematically to evaluate the presence and type of mental disorders according to standardized diagnostic classification criteria such as DSM-5 or ICD-11.
주요 연구자: 로버트 스피처(Robert Spitzer), 리 로빈스(Lee Robins)
위기면접 (Crisis Interview)
자살 시도, 자해, 급성 정신증 삽화, 폭력 위험 등 긴급한 심리적 위기 상황에서 즉각적 안전 확보와 안정화를 목적으로 수행되는 시간 제한적이고 목표지향적인 면접이다.
A time-limited and goal-directed interview conducted in acute psychological crisis situations such as suicide attempts, self-harm, acute psychotic episodes, or violence risk, aimed at immediate safety and stabilization.
주요 연구자: 에릭 린데만(Erich Lindemann), 제럴드 캐플란(Gerald Caplan)
자살위험성 평가 (Suicide Risk Assessment)
내담자의 자살사고, 자살 계획, 자살 의도, 과거 시도력, 위험 요인과 보호 요인을 체계적으로 평가하여 자살 위험 수준을 판단하고 적절한 개입 수준을 결정하는 임상 과정이다.
A clinical process of systematically evaluating suicidal ideation, plans, intent, past attempts, risk factors, and protective factors to determine the level of suicide risk and appropriate intervention.
주요 연구자: 에드윈 슈나이드만(Edwin Shneidman), 마샤 리네한(Marsha Linehan), 토마스 조이너(Thomas Joiner)
체계적 행동관찰 (Systematic Behavioral Observation)
관찰 대상 행동을 조작적으로 정의하고, 표준화된 관찰 절차, 기록 방법, 코딩 체계를 사용하여 행동 데이터를 수량화하는 구조화된 관찰 방법이다.
A structured observation method that operationally defines target behaviors and uses standardized observation procedures, recording methods, and coding systems to quantify behavioral data.
주요 연구자: 토드 리슬리(Todd Risley), 몬트로스 울프(Montrose Wolf)
빈도기록 (Frequency Recording)
관찰 기간 동안 목표 행동이 발생할 때마다 횟수를 기록하는 행동 측정 방법으로, 시작과 끝이 명확하고 지속시간이 비교적 일정한 이산적(discrete) 행동에 적합하다.
A behavioral measurement method that records the number of times a target behavior occurs during an observation period, most suitable for discrete behaviors with clear onset and offset and relatively consistent duration.
주요 연구자: 오그든 린즐리(Ogden Lindsley), B.F. 스키너(B.F. Skinner)
간격기록 (Interval Recording)
관찰 시간을 균등한 간격(예: 10초, 30초)으로 나누고, 각 간격 내에서 목표 행동의 발생 여부를 기록하는 시간표집 기반의 행동 측정 방법이다.
A time-sampling behavioral measurement method that divides the observation period into equal intervals (e.g., 10 or 30 seconds) and records whether the target behavior occurs within each interval.
주요 연구자: 돈 베어(Donald Baer), 토드 리슬리(Todd Risley)
ABC 분석 (ABC Analysis)
선행사건(Antecedent), 행동(Behavior), 결과(Consequence)의 순서적 관계를 기록하고 분석하여 문제행동의 유발 요인과 유지 요인을 파악하는 행동평가의 핵심 기법이다.
A core behavioral assessment technique that records and analyzes the sequential relationship of Antecedent, Behavior, and Consequence to identify triggering and maintaining factors of problem behavior.
주요 연구자: B.F. 스키너(B.F. Skinner), 시드니 비주(Sidney Bijou)
자기감찰 (Self-Monitoring)
개인이 자신의 행동, 사고, 감정, 생리적 반응을 체계적으로 관찰하고 기록하는 자기보고 기반의 행동평가 방법으로, 평가와 중재의 이중 기능을 가진다.
A self-report behavioral assessment method in which individuals systematically observe and record their own behaviors, thoughts, emotions, or physiological responses, serving the dual function of assessment and intervention.
주요 연구자: 프레더릭 칸퍼(Frederick Kanfer), 로저 넬슨(Rosemery Nelson-Gray)
생태학적 순간평가 (Ecological Momentary Assessment)
일상생활 환경(생태학적)에서 실시간 또는 준실시간으로(순간) 반복적으로 행동, 감정, 증상 등을 수집하는 평가 방법으로, 스마트폰 등 모바일 기술을 활용하여 회고 편향을 최소화한다.
An assessment method that repeatedly collects data on behaviors, emotions, and symptoms in real-time or near-real-time in naturalistic settings (ecological), using mobile technology such as smartphones to minimize retrospective recall bias.
주요 연구자: 소울 시프만(Saul Shiffman), 아서 스톤(Arthur Stone)
임상적 판단 (Clinical Judgment)
임상가가 면접, 관찰, 검사 결과 등 다양한 정보를 통합하여 진단, 예후, 치료 방향에 대해 전문적 결론을 도출하는 인지적 의사결정 과정이다.
A cognitive decision-making process in which clinicians integrate diverse information from interviews, observations, and test results to reach professional conclusions about diagnosis, prognosis, and treatment direction.
주요 연구자: 폴 밀(Paul Meehl), 하워드 가너(Howard Garb), 로빈 도스(Robyn Dawes)
구조화된 전문적 판단 (Structured Professional Judgment)
경험적으로 검증된 위험 요인 목록과 체계적 평가 절차를 활용하되, 최종 판단은 임상가의 전문적 종합에 맡기는 의사결정 접근으로, 순수한 임상적 판단과 보험계리적 판단의 절충 모델이다.
A decision-making approach that utilizes empirically validated risk factor checklists and systematic assessment procedures while leaving the final judgment to the clinician's professional synthesis, representing a compromise between pure clinical and actuarial judgment.
주요 연구자: 크리스토퍼 웹스터(Christopher Webster), 스티븐 하트(Stephen Hart), 케빈 더글라스(Kevin Douglas)

발달/교육검사 (Developmental & Educational Testing) (25개 용어)

Bayley 영유아발달검사 (Bayley Scales of Infant and Toddler Development (BSID))
생후 1~42개월 영유아의 인지, 언어, 운동, 사회-정서, 적응행동 발달을 종합적으로 평가하는 개별 실시형 표준화 발달검사로, 영유아 발달평가의 국제적 표준(gold standard)으로 간주된다.
An individually administered standardized assessment measuring cognitive, language, motor, social-emotional, and adaptive behavior development in infants and toddlers aged 1–42 months, considered the international gold standard for infant developmental assessment.
주요 연구자: 낸시 베일리(Nancy Bayley), 글렌 엘더(Glen Elder)
Denver 발달선별검사 (Denver Developmental Screening Test (DDST))
출생부터 6세까지의 아동을 대상으로 개인사회성, 미세운동-적응, 언어, 전체운동의 4개 영역에서 발달 지연 가능성을 선별하는 간편 발달선별검사이다.
A brief developmental screening tool for children from birth to 6 years, assessing four domains—personal-social, fine motor-adaptive, language, and gross motor—to identify children at risk for developmental delays.
주요 연구자: 윌리엄 프랑켄버그(William K. Frankenburg), 조시아 돕스(Josiah B. Dodds)
Vineland 적응행동척도 (Vineland Adaptive Behavior Scales (VABS))
출생~90세를 대상으로 의사소통, 일상생활기술, 사회화, 운동기술의 4개 영역과 부적응행동을 측정하는 반구조화 면담 기반의 적응행동 평가도구이다.
A semi-structured interview-based assessment measuring adaptive behavior across four domains—communication, daily living skills, socialization, and motor skills—plus maladaptive behavior, for individuals from birth to age 90.
주요 연구자: 에드가 돌(Edgar A. Doll), 사라 스패로우(Sara S. Sparrow)
K-CBCL (Korean Child Behavior Checklist (K-CBCL))
부모가 아동·청소년(1.5~18세)의 정서 및 행동 문제를 평정하는 표준화된 체크리스트로, 내재화·외현화 문제와 DSM 진단 기준 척도를 포함하는 ASEBA 체계의 핵심 도구이다.
A standardized parent-report checklist assessing emotional and behavioral problems in children and adolescents aged 1.5–18, encompassing internalizing/externalizing problems and DSM-oriented scales as a core instrument of the ASEBA system.
주요 연구자: 토머스 아켄바크(Thomas M. Achenbach), 오경자(Kyung-Ja Oh)
ADHD 평가도구 (Conners Rating Scales)
주의력결핍 과잉행동장애(ADHD) 증상의 평가에 특화된 다중정보원 평정척도 체계로, 부모용, 교사용, 자기보고용 양식을 통해 부주의, 과잉행동/충동성, 학습 문제 등을 측정한다.
A multi-informant rating scale system specialized for assessing ADHD symptoms, with parent, teacher, and self-report forms measuring inattention, hyperactivity/impulsivity, learning problems, and related behavioral concerns.
주요 연구자: 키스 코너스(C. Keith Conners), 러셀 바클리(Russell A. Barkley)
학습장애 검사 (Learning Disability Assessment)
읽기, 쓰기, 수학 등 특정 학업 영역에서 기대 수준과 실제 성취 간의 유의미한 차이를 확인하기 위한 종합적 평가 과정으로, 지능검사와 학업성취도검사의 비교를 핵심으로 한다.
A comprehensive evaluation process to identify significant discrepancies between expected and actual achievement in specific academic areas such as reading, writing, and mathematics, primarily involving comparison of intelligence and academic achievement test scores.
주요 연구자: 사무엘 커크(Samuel Kirk), 잭 플레처(Jack M. Fletcher)
자폐스펙트럼 검사 (Autism Diagnostic Observation Schedule (ADOS) & Autism Diagnostic Interview-Revised (ADI-R))
자폐스펙트럼장애(ASD)의 진단을 위한 표준화된 평가 도구로, ADOS-2는 반구조화 관찰 평가이고 ADI-R은 양육자 대상 반구조화 면담이며, 두 도구를 함께 사용하여 ASD 진단의 정확성을 극대화한다.
Standardized assessment tools for diagnosing autism spectrum disorder (ASD), where ADOS-2 is a semi-structured observational assessment and ADI-R is a semi-structured caregiver interview, used together to maximize diagnostic accuracy.
주요 연구자: 캐서린 로드(Catherine Lord), 마이클 러터(Michael Rutter), 앤 르 쿠터(Ann Le Couteur)
발달검사 (Developmental Assessment)
영유아 및 아동의 인지, 언어, 운동, 사회-정서, 적응행동 등 주요 발달 영역의 현재 기능 수준을 체계적으로 평가하여 발달 지연이나 장애를 확인하는 포괄적 평가 과정이다.
A systematic evaluation of an infant's or child's current functional level across major developmental domains including cognitive, language, motor, social-emotional, and adaptive behavior to identify developmental delays or disabilities.
주요 연구자: 아놀드 게젤(Arnold Gesell), 낸시 베일리(Nancy Bayley)
선별검사 vs 진단검사 (Screening vs Diagnostic Testing)
선별검사는 발달 위험군을 빠르고 간편하게 식별하여 추가 평가를 의뢰하는 1차 도구이고, 진단검사는 발달 문제의 유무와 유형을 정밀하게 확인하여 진단적 판단을 내리는 2차 도구이다.
Screening tests are brief, first-level tools designed to quickly identify individuals at risk for developmental problems and refer them for further evaluation, while diagnostic tests are comprehensive, second-level tools that precisely confirm the presence and type of developmental issues.
주요 연구자: 프랜시스 글래스코(Frances Page Glascoe), 윌리엄 프랑켄버그(William K. Frankenburg)
적응행동 (Adaptive Behavior)
개인이 일상생활에서 독립적으로 기능하기 위해 필요한 개념적, 사회적, 실제적 기술의 집합으로, 의사소통, 자기관리, 가정생활, 사회성, 지역사회 활용 등을 포함한다.
The collection of conceptual, social, and practical skills that individuals need to function independently in daily life, encompassing communication, self-care, home living, social skills, and community use.
주요 연구자: 에드가 돌(Edgar A. Doll), 미국 지적·발달장애 협회(AAIDD)
발달지체 (Developmental Delay)
아동이 인지, 신체, 의사소통, 사회-정서, 적응행동 중 하나 이상의 발달 영역에서 연령 기대 수준에 비해 유의미하게 뒤처져 있는 상태로, 일반적으로 평균에서 1.5~2.0 표준편차 이하의 수행을 기준으로 한다.
A condition in which a child performs significantly below age expectations in one or more developmental domains—cognitive, physical, communication, social-emotional, or adaptive behavior—typically defined as performance 1.5 to 2.0 standard deviations below the mean.
주요 연구자: 마이클 셰비츠(Michael Shevell), 폴 립킨(Paul H. Lipkin)
발달장애 (Developmental Disability)
22세 이전에 발생하며 인지, 언어, 운동, 행동 등 주요 발달 영역에서 실질적 기능 제한을 초래하는 만성적이고 심각한 장애의 집합으로, 지적장애, 자폐스펙트럼장애, 뇌성마비 등을 포함한다.
A group of chronic, severe conditions originating before age 22 that cause substantial functional limitations in major developmental domains including cognition, language, mobility, and behavior, encompassing intellectual disability, autism spectrum disorder, cerebral palsy, and others.
주요 연구자: 미국 발달장애 협의회(U.S. Administration on Developmental Disabilities), 로버트 셰일록(Robert L. Schalock)
지적장애 평가 (Intellectual Disability Assessment)
지적장애(지적발달장애) 진단을 위해 표준화된 지능검사와 적응행동 평가를 종합적으로 실시하여, IQ 약 70 이하와 적응행동의 유의미한 결손이 발달기(18세 이전)에 시작되었음을 확인하는 평가 과정이다.
A comprehensive evaluation process for diagnosing intellectual disability involving standardized intelligence testing and adaptive behavior assessment to confirm an IQ of approximately 70 or below and significant adaptive behavior deficits with onset during the developmental period (before age 18).
주요 연구자: 미국 지적·발달장애 협회(AAIDD (American Association on Intellectual and Developmental Disabilities)), 로버트 셰일록(Robert L. Schalock)
K-ASQ (Korean Ages and Stages Questionnaires (K-ASQ))
부모가 작성하는 영유아 발달선별 도구로, 의사소통, 대근육운동, 소근육운동, 문제해결, 개인-사회성의 5개 영역에서 발달 지연 위험을 선별하며, 한국 영유아 규준으로 표준화되었다.
A parent-completed developmental screening tool assessing five domains—communication, gross motor, fine motor, problem solving, and personal-social—to identify infants and toddlers at risk for developmental delays, standardized with Korean normative data.
주요 연구자: 제인 스콰이어스(Jane Squires), 은백린(Baik-Lin Eun)
Gesell 발달검사 (Gesell Developmental Schedules)
4주~6세 아동을 대상으로 적응행동, 대운동, 소운동, 언어, 개인-사회성의 5개 영역에서 발달 이정표 달성 여부를 관찰하여 발달연령(developmental age)과 발달지수(DQ)를 산출하는 최초의 체계적 발달검사이다.
The first systematic developmental assessment for children aged 4 weeks to 6 years, evaluating milestone attainment across five domains—adaptive, gross motor, fine motor, language, and personal-social—to yield developmental age and developmental quotient (DQ).
주요 연구자: 아놀드 게젤(Arnold Gesell), 캐서린 아마트루다(Catherine Amatruda)
Mullen 발달척도 (Mullen Scales of Early Learning (MSEL))
출생~68개월 영유아를 대상으로 시각수용, 소근육, 수용언어, 표현언어, 대근육의 5개 척도를 통해 초기 학습 능력을 평가하는 개별 실시형 발달검사이다.
An individually administered developmental test assessing early learning abilities in infants and toddlers from birth to 68 months through five scales: visual reception, fine motor, receptive language, expressive language, and gross motor.
주요 연구자: 아일린 멀렌(Eileen M. Mullen)
영유아 인지평가 (Infant Cognitive Assessment)
영유아(0~3세)의 인지 발달 수준을 측정하는 평가로, 감각운동 능력, 대상영속성, 수단-목적 관계, 인과관계 이해, 기억, 문제해결 등 초기 인지 기능을 평가하여 인지적 발달지체를 확인한다.
Assessment of cognitive development in infants and toddlers (0–3 years), evaluating early cognitive functions such as sensorimotor abilities, object permanence, means-end relationships, causality understanding, memory, and problem solving to identify cognitive developmental delays.
주요 연구자: 장 피아제(Jean Piaget), 이나 우지기리스(Ina Uzgiris)
언어발달 평가 (Language Development Assessment)
아동의 수용언어(이해)와 표현언어(산출) 능력을 체계적으로 평가하여 언어발달 지체나 장애의 유무와 유형을 확인하는 과정으로, 표준화 검사, 언어 표본 분석, 관찰 등 다양한 방법을 사용한다.
A systematic process of evaluating a child's receptive (comprehension) and expressive (production) language abilities to identify the presence and type of language delays or disorders, using methods including standardized tests, language sample analysis, and observation.
주요 연구자: 로렌스 레너드(Laurence B. Leonard), 엘리자베스 페나(Elizabeth D. Pena)
사회성숙도검사 (Social Maturity Scale)
개인의 사회적 능력과 자립 수준을 측정하는 검사로, 자기관리, 이동, 작업, 의사소통, 자기지시, 사회화의 6개 영역에서 적응행동의 발달 정도를 평가하여 사회연령(SA)과 사회지수(SQ)를 산출한다.
A test measuring an individual's social competence and self-sufficiency level, evaluating adaptive behavior development across six domains—self-help, locomotion, occupation, communication, self-direction, and socialization—to yield social age (SA) and social quotient (SQ).
주요 연구자: 에드가 돌(Edgar A. Doll), 김승국(Seung-Kook Kim)
학습준비도검사 (School Readiness Test)
취학 전 아동이 초등학교 교육과정에 참여하기 위해 필요한 인지적, 언어적, 사회-정서적, 운동적 기술의 준비 정도를 평가하는 검사로, 학교 적응 및 학업 성공 가능성을 예측한다.
A test assessing the degree to which preschool children possess the cognitive, linguistic, social-emotional, and motor skills needed to participate in elementary school curricula, predicting school adjustment and academic success potential.
주요 연구자: 아놀드 게젤(Arnold Gesell), 마리온 다우니(Marion Monroe)
교육심리평가 (Educational Psychological Assessment)
학생의 인지 능력, 학업 성취, 정서-행동 상태, 적응 기능 등을 종합적으로 평가하여 학습 문제의 원인을 파악하고, 적절한 교육적 배치와 개입 전략을 수립하기 위한 다학문적 평가 과정이다.
A multidisciplinary evaluation process that comprehensively assesses a student's cognitive abilities, academic achievement, emotional-behavioral status, and adaptive functioning to identify causes of learning difficulties and develop appropriate educational placement and intervention strategies.
주요 연구자: 앨런 카우프만(Alan S. Kaufman), 에드워드 셰이위츠(Sally Shaywitz)
학업성취 진단 (Academic Achievement Diagnosis)
학생의 읽기, 쓰기, 수학 등 핵심 학업 영역에서의 현재 수행 수준을 표준화 검사로 측정하고, 기대 수준과의 차이를 분석하여 학습 곤란의 구체적 패턴과 원인을 확인하는 평가 과정이다.
An evaluation process measuring a student's current performance level in core academic areas such as reading, writing, and mathematics through standardized tests, analyzing discrepancies from expected levels to identify specific patterns and causes of learning difficulties.
주요 연구자: 리처드 우드콕(Richard W. Woodcock), 잭 플레처(Jack M. Fletcher)
특수교육 적격성 (Special Education Eligibility)
장애가 있는 학생이 특수교육 서비스를 받을 자격이 있는지를 판별하는 과정으로, 법적으로 정해진 장애 범주에 해당하고 그 장애가 교육적 수행에 부정적 영향을 미치는지를 종합적으로 평가하여 결정한다.
The process of determining whether a student with a disability qualifies for special education services by comprehensively evaluating whether the student meets criteria for a legally defined disability category and whether that disability adversely affects educational performance.
주요 연구자: 미국 의회(U.S. Congress), 대니얼 래프란카(Daniel J. Reschly)
개별화교육프로그램 (Individualized Education Program (IEP))
특수교육 대상 학생 개인의 현재 수행 수준, 연간 목표, 특수교육 서비스, 관련 서비스, 배치 등을 구체적으로 명시한 법적 문서로, 다학문 팀에 의해 매년 작성되고 검토된다.
A legally binding document specifying a special education student's current performance levels, annual goals, special education services, related services, and placement, developed and reviewed annually by a multidisciplinary team.
주요 연구자: 미국 의회(U.S. Congress), 바텔 배트먼(Bateman, Barbara)
조기개입 (Early Intervention)
발달지체나 장애가 확인되었거나 위험이 있는 영유아(0~3세)와 그 가족에게 제공되는 체계적인 치료, 교육, 지원 서비스로, 뇌의 가소성이 높은 시기에 최적의 발달을 촉진하는 것이 목적이다.
Systematic therapeutic, educational, and support services provided to infants and toddlers (0–3 years) with identified or at-risk developmental delays or disabilities and their families, aimed at promoting optimal development during the period of highest brain plasticity.
주요 연구자: 사무엘 커크(Samuel Kirk), 잭 숀코프(Jack P. Shonkoff)

산업/조직 심리검사 (Industrial/Organizational Testing) (25개 용어)

평가센터 (Assessment Center)
다수의 평가자가 다양한 시뮬레이션 과제(역할극, 인바스켓, 집단토론 등)를 사용하여 후보자의 역량을 다차원적으로 평가하는 종합적 인사 평가 방법이다.
A comprehensive personnel evaluation method in which multiple assessors use a variety of simulation exercises (role plays, in-baskets, group discussions) to assess candidates' competencies across multiple dimensions.
주요 연구자: 더글러스 브레이(Douglas Bray), 조지 손턴(George Thornton III)
360도 평가 (360-Degree Feedback)
상사, 동료, 부하, 고객 및 자기 자신 등 다양한 평가원으로부터 직무수행에 대한 피드백을 수집하는 다원적 평가 방법이다.
A multi-source evaluation method that collects performance feedback from supervisors, peers, subordinates, customers, and the individual being assessed.
주요 연구자: 마크 에드워즈(Mark Edwards), 앨런 처치(Allan Church)
구조화 면접 (Structured Interview)
사전에 직무분석을 바탕으로 표준화된 질문, 질문 순서, 평가 기준을 설정하여 모든 지원자에게 동일한 조건으로 실시하는 채용 면접 방법이다.
A job interview method based on job analysis with standardized questions, fixed order, and predetermined rating scales applied uniformly to all applicants.
주요 연구자: 마이클 캠피온(Michael Campion), 앨런 허프컷(Allen Huffcutt)
비구조화 면접 (Unstructured Interview)
사전에 정해진 질문이나 평가 기준 없이 면접관의 재량에 따라 자유롭게 진행하는 채용 면접 방법이다.
A job interview conducted without predetermined questions or evaluation criteria, relying on the interviewer's discretion to guide the conversation.
주요 연구자: 리처드 에르베스트(Richard Arvey), 앨런 허프컷(Allen Huffcutt)
직무분석 (Job Analysis)
특정 직무를 구성하는 과업, 의무, 책임과 그 직무를 성공적으로 수행하는 데 필요한 지식, 기술, 능력(KSA)을 체계적으로 파악하는 과정이다.
A systematic process of identifying the tasks, duties, responsibilities, and knowledge, skills, and abilities (KSAs) required for successful performance of a particular job.
주요 연구자: 시드니 파인(Sidney Fine), 어니스트 맥코믹(Ernest McCormick)
인적성검사 (Aptitude and Personality Test)
채용 과정에서 지원자의 인지 능력(적성)과 성격 특성을 측정하여 직무 적합성을 예측하는 표준화된 검사이다.
A standardized test battery used in hiring to measure cognitive abilities (aptitude) and personality traits to predict job fit and performance.
주요 연구자: 존 헌터(John Hunter), 프랭크 슈미트(Frank Schmidt)
조직몰입 척도 (Organizational Commitment Scale)
조직 구성원이 자신이 속한 조직에 대해 갖는 심리적 유대감, 동일시, 헌신의 정도를 측정하는 자기보고식 척도이다.
A self-report scale measuring the psychological bond, identification, and dedication an employee feels toward their organization.
주요 연구자: 존 메이어(John Meyer), 나탈리 앨런(Natalie Allen)
직무만족 척도 (Job Satisfaction Scale)
직무의 다양한 측면(급여, 승진, 상사, 동료, 업무 자체 등)에 대한 구성원의 만족도를 측정하는 자기보고식 척도이다.
A self-report scale measuring an employee's satisfaction with various aspects of their job, including pay, promotion, supervision, coworkers, and the work itself.
주요 연구자: 패트리샤 스미스(Patricia Cain Smith), 폴 스펙터(Paul Spector)
역량모델링 (Competency Modeling)
조직의 전략 목표 달성에 필요한 핵심 역량(지식, 기술, 행동, 특성)을 체계적으로 파악하고 정의하는 과정이다.
A systematic process of identifying and defining the key competencies (knowledge, skills, behaviors, and characteristics) required for achieving organizational strategic goals.
주요 연구자: 데이비드 맥클리랜드(David McClelland), 리처드 보야치스(Richard Boyatzis)
선발 타당도 (Selection Validity)
인사 선발 도구(검사, 면접 등)가 실제 직무수행을 얼마나 정확하게 예측하는지를 나타내는 정도로, 주로 선발 점수와 직무수행 준거 간의 상관으로 산출한다.
The degree to which a personnel selection tool (test, interview, etc.) accurately predicts actual job performance, typically computed as the correlation between selection scores and job performance criteria.
주요 연구자: 프랭크 슈미트(Frank Schmidt), 존 헌터(John Hunter)
예측적 타당도 연구 (Predictive Validity Study)
선발 검사를 실시한 후 일정 기간이 경과한 뒤 직무수행 준거를 수집하여, 검사 점수와 준거 간의 상관을 산출하는 타당도 연구 설계이다.
A validity study design in which selection test scores are collected first, then after a time interval, job performance criteria are gathered to compute the correlation between test scores and criteria.
주요 연구자: 에드윈 기셀리(Edwin Ghiselli), 프랭크 슈미트(Frank Schmidt)
상황판단검사 (Situational Judgment Test)
직무 관련 상황을 제시하고 여러 가지 대처 방안 중에서 가장 적절한 행동을 선택하게 하여 실무적 판단력을 측정하는 검사이다.
A test presenting job-related scenarios and asking respondents to select the most appropriate course of action from multiple options, measuring practical judgment and decision-making.
주요 연구자: 마이클 맥대니얼(Michael McDaniel), 제프 웨클리(Jeff Weekley)
평가자 훈련 (Assessor Training)
평가센터나 인사 평가에서 평가자의 관찰, 기록, 분류, 평가 능력을 향상시키고 평가 오류를 줄이기 위한 체계적 교육 프로그램이다.
A systematic training program designed to improve assessors' observation, recording, classification, and evaluation skills and to reduce rating errors in assessment centers and personnel appraisals.
주요 연구자: 게리 래섬(Gary Latham), 케빈 머피(Kevin Murphy)
후광효과 (Halo Effect)
한 가지 두드러진 특성에 대한 인상이 다른 관련 없는 특성의 평가에까지 영향을 미쳐 전반적으로 긍정적 또는 부정적으로 평가하게 되는 체계적 오류이다.
A systematic error in which an impression of one salient characteristic influences the evaluation of other unrelated characteristics, resulting in uniformly positive or negative ratings.
주요 연구자: 에드워드 손다이크(Edward Thorndike), 솔로몬 애쉬(Solomon Asch)
관대화 경향 (Leniency Bias)
평가자가 피평가자를 실제 수행 수준보다 체계적으로 높게 평가하는 경향으로, 평가 점수 분포가 상위에 편중되는 오류이다.
A systematic tendency of raters to evaluate ratees higher than their actual performance level, resulting in an upward skew of the rating distribution.
주요 연구자: 케빈 머피(Kevin Murphy), 제프리 칸(Jeffrey Kane)
중심화 경향 (Central Tendency Bias)
평가자가 극단적인 점수를 피하고 중간 범위에 집중하여 평가하는 경향으로, 평가 점수의 분산이 지나치게 줄어드는 오류이다.
A tendency of raters to avoid extreme scores and cluster ratings around the midpoint, resulting in restricted variance in the rating distribution.
주요 연구자: 로버트 귀언(Robert Guion), 프랭크 란디(Frank Landy)
직무수행 평가 (Performance Appraisal)
조직 구성원의 직무수행 수준을 체계적으로 측정하고 평가하여 인사 결정(보상, 승진, 교육)과 피드백에 활용하는 공식적 과정이다.
A formal process of systematically measuring and evaluating employees' job performance for use in personnel decisions (compensation, promotion, training) and feedback.
주요 연구자: 게리 래섬(Gary Latham), 제임스 파르(James Farr)
역할극 (Role Play)
평가 대상자가 특정 직무 관련 상황에서 역할을 연기하며, 평가자가 대인관계 기술, 갈등 해결, 리더십 등의 역량을 직접 관찰하여 평가하는 시뮬레이션 기법이다.
A simulation technique in which the assessee enacts a role in a job-related scenario while assessors directly observe and evaluate competencies such as interpersonal skills, conflict resolution, and leadership.
주요 연구자: 제이콥 모레노(Jacob Moreno), 조지 손턴(George Thornton III)
인바스켓 검사 (In-Basket Test)
가상의 관리자 역할에서 서류함에 쌓인 다양한 업무(메모, 이메일, 보고서 등)를 제한된 시간 내에 우선순위를 정하고 처리하게 하는 시뮬레이션 검사이다.
A simulation test in which the assessee assumes a managerial role and must prioritize and handle accumulated work items (memos, emails, reports) within a limited time period.
주요 연구자: 노만 프레더릭센(Norman Frederiksen), 더글러스 브레이(Douglas Bray)
성실성 검사 (Integrity Test)
지원자의 정직성, 신뢰성, 도덕적 판단력을 측정하여 직장 내 절도, 규칙 위반 등 반생산적 업무 행동을 예측하기 위한 검사이다.
A test designed to measure applicants' honesty, trustworthiness, and ethical judgment to predict counterproductive work behaviors such as workplace theft and rule violations.
주요 연구자: 데니스 오네스(Deniz Ones), 폴 사케트(Paul Sackett)
약물검사 (Drug Testing)
채용 전 또는 재직 중 약물 남용 여부를 생물학적 표본(소변, 혈액, 모발 등)을 통해 확인하는 선발 및 관리 도구이다.
A selection and management tool that detects substance abuse through biological specimens (urine, blood, hair) either pre-employment or during employment.
주요 연구자: 자크 노먼드(Jacques Normand), 케빈 머피(Kevin Murphy)
표준화 면접 채점 (Standardized Interview Scoring)
구조화 면접에서 지원자의 응답을 사전에 개발된 행동 고정 평정 척도(BARS)나 채점 루브릭에 따라 일관되게 평가하는 체계적 채점 방법이다.
A systematic scoring method for structured interviews that uses pre-developed behaviorally anchored rating scales (BARS) or scoring rubrics to consistently evaluate applicant responses.
주요 연구자: 마이클 캠피온(Michael Campion), 패트리시아 스미스(Patricia Cain Smith)
직무지식검사 (Job Knowledge Test)
특정 직무 수행에 필요한 전문 지식과 기술적 이해도를 객관적으로 측정하는 검사이다.
An objective test measuring the specialized knowledge and technical understanding required for performing a specific job.
주요 연구자: 프랭크 슈미트(Frank Schmidt), 존 헌터(John Hunter)
조직시민행동 (Organizational Citizenship Behavior)
공식적 직무 요건에 포함되지 않지만 조직의 효과적 기능에 기여하는 자발적이고 재량적인 행동으로, 동료 돕기, 자발적 참여 등을 포함한다.
Voluntary, discretionary behaviors not formally required by the job but contributing to the effective functioning of the organization, including helping coworkers and voluntary participation.
주요 연구자: 데니스 오건(Dennis Organ), 필립 포드사코프(Philip Podsakoff)
직무스트레스 척도 (Job Stress Scale)
직무 환경에서 경험하는 스트레스의 원인(스트레서), 수준, 결과를 체계적으로 측정하는 자기보고식 척도이다.
A self-report scale systematically measuring the sources (stressors), levels, and consequences of stress experienced in the work environment.
주요 연구자: 로버트 카라섹(Robert Karasek), 크리스티나 마슬라흐(Christina Maslach)

검사 윤리와 공정성 (Ethics, Bias, & Fairness) (25개 용어)

검사 공정성 (Test Fairness)
검사가 다양한 집단(성별, 인종, 문화 등)에 대해 동등하게 타당하고 편향 없이 기능하며, 검사 결과의 사용이 모든 집단에게 공평한 결과를 가져오는 정도이다.
The degree to which a test functions equivalently and without bias across diverse groups (gender, race, culture), and the extent to which test use leads to equitable outcomes for all groups.
주요 연구자: 앤 아나스타시(Anne Anastasi), 세실 레이놀즈(Cecil Reynolds)
검사 편향 (Test Bias)
검사가 동일한 능력을 가진 서로 다른 집단의 구성원에게 체계적으로 다른 의미를 갖거나 다른 예측력을 보이는 통계적 속성이다.
A statistical property in which a test systematically yields different meanings or different predictive accuracy for members of different groups who possess the same level of the construct being measured.
주요 연구자: 세실 레이놀즈(Cecil Reynolds), 아서 젠슨(Arthur Jensen)
차별적 문항 기능 (Differential Item Functioning)
동일한 능력 수준을 가진 서로 다른 집단(성별, 인종 등)의 수검자가 특정 문항에서 체계적으로 다른 정답률을 보이는 현상이다.
A phenomenon in which examinees from different groups (gender, race, etc.) with the same ability level show systematically different probabilities of answering a particular item correctly.
주요 연구자: 폴 홀랜드(Paul Holland), 하워드 와이너(Howard Wainer)
불리한 영향 (Adverse Impact)
선발 절차의 결과 특정 보호 집단(인종, 성별 등)의 선발률이 다수 집단에 비해 체계적으로 낮아지는 차별적 결과를 의미한다.
A discriminatory outcome of a selection procedure in which the selection rate for a protected group (race, gender, etc.) is substantially lower than that of the majority group.
주요 연구자: 모리스 스탬프(Morris Stamp), 프랭크 슈미트(Frank Schmidt)
문화적 편향 (Cultural Bias)
검사 내용, 언어, 형식이 특정 문화권의 가치, 경험, 지식에 유리하게 편향되어 다른 문화권 수검자에게 불리하게 작용하는 현상이다.
A phenomenon in which test content, language, or format is biased toward the values, experiences, and knowledge of a particular culture, disadvantaging examinees from other cultural backgrounds.
주요 연구자: 로버트 스턴버그(Robert Sternberg), 포바 판데이(Fons van de Vijver)
4/5 규칙 (Four-Fifths Rule)
소수 집단의 선발률이 다수 집단 선발률의 80%(4/5) 미만일 때 불리한 영향(adverse impact)이 존재하는 것으로 판단하는 실무적 기준이다.
A practical guideline stating that adverse impact exists when the selection rate for a minority group is less than 80% (four-fifths) of the selection rate for the majority group.
주요 연구자: EEOC 통일지침 위원회(EEOC Uniform Guidelines Committee)
긍정적 조치 (Affirmative Action)
역사적으로 차별받아 온 집단의 대표성을 높이기 위해 채용, 승진, 교육 등에서 적극적으로 기회를 확대하는 정책이다.
A policy that actively expands opportunities for historically disadvantaged groups in hiring, promotion, and education to increase their representation.
주요 연구자: 린든 존슨(Lyndon B. Johnson), 프랭크 슈미트(Frank Schmidt)
문화 공정 검사 (Culture-Fair Test)
언어, 문화적 지식, 교육 경험의 영향을 최소화하도록 설계된 검사로, 주로 비언어적 과제나 도형 추리를 활용한다.
A test designed to minimize the influence of language, cultural knowledge, and educational experience, typically using nonverbal tasks or figural reasoning.
주요 연구자: 레이먼드 캐텔(Raymond Cattell), 존 레이븐(John Raven)
검사 번역과 적응 (Test Translation and Adaptation)
한 언어/문화권에서 개발된 검사를 다른 언어/문화권에서 사용할 수 있도록 번역하고 문화적 맥락에 맞게 수정하는 과정이다.
The process of translating and culturally modifying a test developed in one language/culture for use in another language/culture.
주요 연구자: 로날드 함블턴(Ronald Hambleton), 포바 판데이(Fons van de Vijver)
사전 동의 (Informed Consent)
수검자에게 검사의 목적, 절차, 결과의 사용 방법, 비밀보장의 한계 등을 충분히 설명하고 자발적 동의를 얻는 윤리적 절차이다.
An ethical procedure of fully informing the examinee about the purpose, procedures, use of results, and limits of confidentiality of the test and obtaining voluntary agreement to participate.
주요 연구자: APA 윤리위원회(APA Ethics Committee)
비밀보장 (Confidentiality)
검사 결과와 수검자의 개인 정보를 허가 없이 제3자에게 공개하지 않을 전문적 의무이다.
The professional obligation not to disclose test results and personal information of examinees to third parties without authorization.
주요 연구자: APA 윤리위원회(APA Ethics Committee)
APA 윤리 코드 (APA Ethics Code)
미국심리학회(APA)가 제정한 심리학자의 윤리 원칙과 행동 강령으로, 심리검사의 개발, 실시, 채점, 해석, 보고에 관한 윤리 기준을 포함한다.
The ethical principles and code of conduct established by the American Psychological Association (APA) that includes ethical standards for the development, administration, scoring, interpretation, and reporting of psychological tests.
주요 연구자: 미국심리학회(American Psychological Association)
검사 결과 피드백 (Test Feedback)
검사 실시 후 수검자에게 검사 결과의 의미, 해석, 한계를 이해 가능한 방식으로 설명하는 전문적 과정이다.
A professional process of explaining the meaning, interpretation, and limitations of test results to the examinee in an understandable manner after test administration.
주요 연구자: 스티븐 핀(Stephen Finn), 콘스탄스 피셔(Constance Fischer)
검사 보안 (Test Security)
검사 자료(문항, 채점 기준, 매뉴얼)가 미허가 접근이나 유출로부터 보호되어 검사의 타당성과 유용성이 유지되도록 하는 절차와 정책이다.
Procedures and policies that protect test materials (items, scoring criteria, manuals) from unauthorized access or disclosure to maintain test validity and utility.
주요 연구자: 미국심리학회(American Psychological Association), 국제검사위원회(International Test Commission)
검사 자격 (Test User Qualifications)
심리검사를 적절하게 선택, 실시, 채점, 해석하기 위해 검사 사용자가 갖추어야 하는 전문적 훈련, 교육, 자격 요건이다.
The professional training, education, and credential requirements that test users must possess to appropriately select, administer, score, and interpret psychological tests.
주요 연구자: 미국심리학회(American Psychological Association), 국제검사위원회(International Test Commission)
검사 표준 (Standards for Testing)
APA, AERA, NCME가 공동으로 제정한 '교육 및 심리 검사 표준(Standards for Educational and Psychological Testing)'으로, 검사 개발, 평가, 사용의 기술적·윤리적 기준을 포괄한다.
The 'Standards for Educational and Psychological Testing' jointly published by APA, AERA, and NCME, providing comprehensive technical and ethical criteria for test development, evaluation, and use.
주요 연구자: AERA/APA/NCME 합동위원회(AERA/APA/NCME Joint Committee)
검사 결과의 책임 있는 사용 (Responsible Use of Test Results)
검사 결과를 해석하고 활용할 때 검사의 목적, 한계, 측정의 표준오차를 고려하며, 단일 검사 점수만으로 중요한 결정을 내리지 않는 윤리적 사용 원칙이다.
The ethical principle of considering the test's purpose, limitations, and standard error of measurement when interpreting and utilizing test results, and not making important decisions based on a single test score alone.
주요 연구자: 사무엘 메식(Samuel Messick), 리 크론바흐(Lee Cronbach)
프라이버시권 (Right to Privacy)
수검자가 자신의 개인 정보와 심리적 특성에 대한 정보를 통제할 수 있는 권리로, 검사가 수검자의 사적 영역을 부당하게 침해해서는 안 된다는 원칙이다.
The right of examinees to control information about their personal characteristics and psychological attributes, based on the principle that testing should not unduly intrude upon their private domain.
주요 연구자: 알란 웨스틴(Alan Westin)
낙인 효과 (Labeling Effect)
검사 결과에 의해 부여된 진단명이나 분류 레이블이 개인에 대한 타인의 기대와 대우, 그리고 자기 자신의 행동에 부정적 영향을 미치는 현상이다.
A phenomenon in which diagnostic labels or classification categories assigned through testing negatively influence others' expectations and treatment of the individual, as well as the individual's own behavior.
주요 연구자: 토마스 사스(Thomas Szasz), 로버트 로젠탈(Robert Rosenthal)
다문화 평가 역량 (Multicultural Assessment Competence)
문화적 배경이 다양한 수검자에게 검사를 적절하게 실시하고 해석하기 위해 검사자가 갖추어야 하는 문화적 지식, 태도, 기술이다.
The cultural knowledge, attitudes, and skills that test administrators must possess to appropriately administer and interpret tests for examinees from diverse cultural backgrounds.
주요 연구자: 데럴드 윙 수(Derald Wing Sue), 리처드 다나(Richard Dana)
결과 타당도 (Consequential Validity)
검사 점수의 해석과 사용이 가져오는 사회적 결과(긍정적·부정적)를 타당도 평가의 일부로 고려하는 개념이다.
The concept of including the social consequences (positive and negative) of test score interpretation and use as part of validity evaluation.
주요 연구자: 사무엘 메식(Samuel Messick), 리 크론바흐(Lee Cronbach)
컴퓨터 기반 검사 윤리 (Ethics of Computer-Based Testing)
컴퓨터와 인터넷을 활용한 검사 실시에서 발생하는 고유한 윤리적 쟁점(접근성, 동등성, 데이터 보안, 비대면 감독)을 다루는 윤리 영역이다.
An ethics domain addressing unique ethical issues (accessibility, equivalence, data security, remote proctoring) arising from test administration via computers and the internet.
주요 연구자: 국제검사위원회(International Test Commission), 데이비드 바트람(Dave Bartram)
점수 조정 (Score Adjustment)
집단 간 점수 차이를 보정하기 위해 특정 집단의 점수를 통계적으로 조정하는 방법으로, 집단 내 규준 적용, 밴딩(banding) 등의 기법이 포함된다.
Statistical methods of adjusting scores of specific groups to compensate for group differences, including within-group norming, banding, and other techniques.
주요 연구자: 폴 사케트(Paul Sackett), 웨인 카시오(Wayne Cascio)
고정관념 위협 (Stereotype Threat)
자신이 속한 집단에 대한 부정적 고정관념이 활성화되면 수검자가 불안을 느끼고 실제 능력보다 낮은 수행을 보이는 현상이다.
A phenomenon in which the activation of negative stereotypes about one's group causes examinees to experience anxiety and perform below their actual ability level.
주요 연구자: 클로드 스틸(Claude Steele), 조슈아 아론슨(Joshua Aronson)
소수 집단 검사 쟁점 (Minority Testing Issues)
인종적·민족적·언어적 소수 집단에 대한 심리검사의 적용에서 발생하는 공정성, 편향, 문화적 적절성, 법적·윤리적 쟁점의 총체이다.
The totality of fairness, bias, cultural appropriateness, and legal/ethical issues arising from the application of psychological tests to racial, ethnic, and linguistic minority groups.
주요 연구자: 래리 래리 P. 판결(Larry P. v. Riles), 로버트 윌리엄스(Robert Williams)