Session 7 · Survey Design & Construct Measurement

두 논문은 하나의 이야기

Vomberg & Klarmann은 도구 만드는 법을 가르치고, Hohenberg & Taylor는 그 도구로 무엇을 측정할 것인가를 보여준다. 핵심 메시지는 하나: 측정 오류는 전파된다.

서베이 설계 엉망 → 만족도 점수 왜곡 → 충성도 예측 실패 → 잘못된 의사결정

그래서 서베이 설계(V&K)와 구성개념 측정(H&T)은 따로 배우는 게 아니라, 하나의 측정 파이프라인으로 이해해야 한다.

Paper 1 Vomberg & Klarmann — 서베이를 잘 만드는 법

핵심 질문: 마케팅 연구에서 서베이를 어떻게 체계적으로 설계하고, 데이터 품질은 어떻게 확보하는가?

구성개념 조작화 Construct Operationalization

"고객 만족" 같은 추상적 개념은 눈에 보이지 않는다. 이걸 실제로 물어볼 수 있는 설문 문항으로 번역하는 과정이 조작화다.

"사랑"이라는 감정을 측정하고 싶다고 치자. "사랑하세요?"라고 한 문항만 물으면 사람마다 "사랑"의 의미가 다르니까 엉망이 된다. 대신 "이 사람을 생각하면 기분이 좋아진다", "이 사람 없는 삶은 상상하기 어렵다" 같은 여러 문항으로 쪼개서 물어야 한다. 이미 검증된 척도(established scales)가 있으면 그걸 먼저 쓰고, 없을 때만 새로 만든다.

어떤 construct든 "내가 이걸 어떻게 측정할 것인가?"를 명확히 못 하면, 그 이후의 모든 분석은 모래 위의 성이 된다.

신뢰도 vs. 타당도 Reliability vs. Validity

Reliability = 같은 걸 반복 측정했을 때 일관성이 있는가?
Validity = 실제로 측정하려는 것을 측정하고 있는가?

체중계를 생각해보자. 올라갈 때마다 72kg을 찍으면 → 신뢰도 높다. 그런데 실제 체중이 68kg이면? → 타당도 낮다. 일관되게 틀릴 수 있다. 그래서 reliability는 필요조건이지 충분조건이 아니다.

기준치: Cronbach's α ≥ 0.7, Composite Reliability ≥ 0.7, AVE ≥ 0.5

AVE(Average Variance Extracted)는 "construct가 측정 오차보다 더 많은 분산을 설명하는가?"를 본다. 0.5 미만이면 noise가 signal을 이긴다는 뜻.

공통 방법 편향 Common Method Bias, CMB

같은 서베이에서, 같은 시점에, 같은 사람에게 원인(IV)과 결과(DV)를 모두 물으면 → 응답자가 무의식적으로 답을 맞춰버린다 → 두 변수의 관계가 실제보다 부풀려진다.

시험에서 "나는 공부를 열심히 했다"(IV)와 "나는 성적이 좋았다"(DV)를 같은 설문에서 물으면, 응답자는 자기도 모르게 둘 다 높게 혹은 둘 다 낮게 맞추려 한다. 실제 관계가 아니라 응답 패턴 때문에 correlation이 생기는 거다.

진단법: Harman's single-factor test, marker variable technique
대응: 시점 분리(temporal separation), 방법 분리(다른 소스 데이터 병행), 통계적 보정

응답 편향과 설문 설계 Response Bias & Questionnaire Design

설문의 사소한 디테일이 데이터 품질을 결정한다:

순서 효과(order effects) — 앞에서 물은 질문이 뒤의 답에 영향. 만족도를 먼저 물은 후 재구매 의향을 물으면, 응답자가 일관성을 유지하려 한다.

사회적 바람직성(social desirability) — "당신은 환경을 생각하는 소비를 하십니까?" 같은 질문에는 다들 "예"라고 답하고 싶어한다.

이중 질문(double-barreled) — "이 제품은 품질이 좋고 가격이 합리적입니까?" → 품질은 좋은데 비싸면 어떻게 답하지?

표본과 무응답 편향 Sampling & Non-response Bias

누가 응답하고 누가 안 하는가가 결과를 결정한다. 불만족한 고객이 설문을 무시하면, 결과는 실제보다 긍정적으로 나온다.

수업 강의평가를 생각해보자. 수업이 너무 싫었던 학생은 아예 평가를 안 하고, 좋아했던 학생만 참여하면? 평균 점수는 높지만 진실을 반영하지 않는다.

"누가 응답하지 않았는가?"를 항상 물어야 한다. Key informant 접근에서는 "이 사람이 이 질문에 답할 적임자인가?"도 확인해야 한다.

Paper 2 Hohenberg & Taylor — 만족과 충성도를 제대로 측정하기

핵심 질문: Customer satisfaction과 loyalty를 어떻게 조작화하고, 측정 시스템을 어떻게 구축하는가?

기대-불일치 패러다임 Confirmation-Disconfirmation Paradigm

만족은 절대적 품질에서 오는 게 아니다. 기대(E)와 경험(P)의 격차에서 온다 (Oliver, 1980).

만족 형성 모델

경험(P) > 기대(E) → 만족 ✓

경험(P) = 기대(E) → 확인

경험(P) < 기대(E) → 불만족 ✗

동네 분식집에서 떡볶이를 먹는데 의외로 맛있으면 만족한다. 미슐랭 레스토랑에서 "이 정도?"라고 느끼면 불만족한다. 같은 음식 품질이라도 기대에 따라 만족이 달라진다.

기업이 기대를 지나치게 높이면(과대 광고), 제품이 좋아도 불만족이 생긴다. 기대 관리가 품질만큼 중요하다.

만족-충성도 단절 Satisfaction–Loyalty Disconnect

만족이 충성도 분산의 25% 미만만 설명한다 (Szymanski & Henard, 2001). 만족한 고객의 60% 이상이 여전히 이탈한다 (Reichheld, 1996).

카페 커피가 맛있어서 만족해도, 출근길에 더 가까운 카페가 생기면 바로 옮긴다. 만족 ≠ 충성. 중간에 trust, commitment, switching costs, 습관 같은 다른 요인들이 끼어 있다.

만족도만 측정하는 시스템은 위험하다. "만족도 95%"라는 숫자가 고객 이탈을 예측하지 못할 수 있다.

의도 ≠ 행동 Intentions ≠ Behavior

"다시 살 거예요"라고 말하는 것과 실제로 다시 사는 것은 다르다 (Sheppard et al., 1988). 이것이 dual measurement 접근의 근거.

주관적 서베이(태도/의도) + 객관적 CRM 데이터(실제 구매 행동)를 함께 봐야 진짜 충성도를 파악할 수 있다.

"다이어트 시작할 거야"라고 매주 월요일에 말하는 사람 — 의도는 진심이지만 행동은 안 바뀐다. 서베이로 의도만 재면 실제를 놓친다.

순추천고객지수 Net Promoter Score, NPS

단 하나의 질문: "0-10점, 이 회사를 추천하시겠습니까?"

Promoters(9-10) - Detractors(0-6) = NPS

장점: 효율적, 이해하기 쉽다, 전사적으로 공유하기 좋다.
한계: Keiningham et al. (2007)이 "NPS가 가장 신뢰할 수 있는 성장 지표"라는 주장을 반박했다. 왜 6점이 Detractor인지 이론적 근거도 약하다.

NPS는 체온계 같은 것 — 빠르게 확인하는 데 유용하지만, 그것만으로 진단을 내리면 안 된다. 시스템의 한 구성요소로 써야지 전체를 대체하면 안 된다.

자기선택 편향과 Heckman 보정 Self-Selection Bias & Heckman Correction

로열티 프로그램 멤버가 비멤버보다 더 많이 소비한다. 이게 프로그램 효과인가? 아니면 원래 큰 소비자가 가입한 건가?

헬스장 회원이 비회원보다 건강하다고 해서 "헬스장이 건강하게 만든다"고 결론 내리면 안 된다. 이미 건강에 관심 있는 사람이 가입한 거일 수 있으니까. 이게 self-selection이다.

Heckman 2단계 보정

Stage 1 (선택 방정식): 누가 프로그램에 가입하는가? → Probit 모델로 추정
→ inverse Mills ratio λ(z) = ϕ(z) / Φ(z) 산출

Stage 2 (결과 방정식): 소비 = β₀ + β₁X + ρλ + ε
→ λ를 포함시켜 "가입 성향" 자체의 효과를 분리

ρ가 유의하면 → selection bias가 있었다 → 보정 필요
ρ ≈ 0이면 → selection bias 없다 → 단순 모델로 충분

Dr. Du가 강조할 가능성이 높은 포인트

"이 서베이 결과가 실제 행동을 predict하는가?" — Intentions ≠ Behavior 이슈를 통해 서베이의 근본적 한계를 짚을 가능성이 높다.

"이 correlation이 진짜인가, artifact인가?" — CMB 문제. 같은 서베이에서 IV와 DV를 측정하면 관계가 진짜처럼 보이지만 방법론적 artifact일 수 있다.

Heckman correction의 identification logic — self-selection 문제를 구조적으로 해결하는 방법. Week 1의 causal inference 프레임워크와 직결.

AVE의 실질적 의미 — "이 construct가 noise보다 더 큰 signal을 담고 있는가?"

수업에서 던질 수 있는 질문

Question 1 · CMB와 측정 설계

"If CMB inflates correlations when IV and DV are measured in the same survey, what's the practical threshold for deciding whether temporal separation is sufficient — or whether we need an entirely different data source for the DV?"

Question 2 · Satisfaction–Loyalty Gap

"If satisfaction explains less than 25% of loyalty variance, what are the most promising moderators or mediators that marketing researchers have identified to close that gap — and how do we measure them without introducing more CMB?"

수업 전 셀프 체크

Confirmation-Disconfirmation 공식 (P vs. E → 만족/불만족) 30초 내 설명 가능? Reliability vs. Validity 차이를 체중계 비유로 설명 가능? CMB가 뭔지, 왜 위험한지, 어떻게 대응하는지 설명 가능? NPS의 공식, 장점, 한계를 아는가? Heckman 2단계 보정 — 왜 필요한지, Stage 1/2가 각각 뭘 하는지 이해했는가? 두 논문의 관계를 한 문장으로 말할 수 있는가?

Survey Design &Construct Measurement

Survey Design &
Construct Measurement