분석 방법

최종 업데이트: 2026-03-28

분석 체계 개요

본 연구는 13개 분석 트랙(T0~T8)을 통해 K-하이테크 플랫폼 데이터를 다각적으로 분석한다. 각 트랙은 독립적인 R 프로젝트로 구성되어 있으며, QMD 보고서를 통해 재현 가능한 형태로 결과를 산출한다.

핵심 판정 기준:

지표변수 (6개): DT인식_산업분야이해, DT인식_대응방안, 직무전환_필요성, 스마트팩토리_현재수준, 교육훈련수준, 디지털업무자동화수준

최적 솔루션: 3-class (Entropy = 0.846)

Outcome: Q3_전후차이 (M=1.45, SD=1.21)

Conditions: DT인식_합산, 스마트시스템_합산, 교육훈련수준, DT부서_보유(crisp), DT교육_있음(crisp)

결과: 8개 충분 경로 도출 (등결과성 확인)

단계	분석	대상	도구
1	대응표본 t-검정 / Wilcoxon	48개 기업	R `t.test(paired=TRUE)`
2	효과크기 산출		Cohen’s d
3	변화량 예측 회귀 (Baseline Regression)	48개	R `lm`
4	변화 궤적 시각화 (Spaghetti Plot)		R `ggplot2`
5	변화 패턴 유형화	14개 (3회+)	질적 기술

핵심: 교육훈련수준 평균 +0.77 향상 (d=0.60)

단계	분석	도구	기준
1	한국어 형태소 분석	mecab-ko	명사 추출
2	DTM 생성, 불용어 제거	R `tidytext`	도메인 불용어 사전
3	STM K=5~15 탐색	R `stm`	semantic coherence + exclusivity
4	최적 K=7 선택, 주제 명명		해석 가능성
5	Prevalence 공변량	R `stm`	11개 공변량 투입
6	LPA 프로파일별 토픽 차별화		T2 연계
7	복수참여 기업 텍스트 변화		T4 연계
8	다중 텍스트 컬럼별 독립 분석		DT애로사항, TO_BE, 성과상세, AS_IS
9	Content covariate 효과		토픽 내용에 대한 공변량
10	Sensitivity analysis		토픽 수(k) 변동

공변량 (11개): 연도, 기업규모, DT대응수준, 교육훈련수준, SF도입, DT추진부서, DT교육경험, 업종, 스마트시스템 수준, DT인식 합산, 교육훈련 필요성

분석 대상: 18개 노드 (DT기술 + DT기대효과 + DT필요교육), 이분형 복수응답

핵심 갭: 교육필요성(M=4.36) vs 교육수준(M=2.52) = 1.84점 갭

DV: 현업적용도_조직환경, Q3_차이

3가지 처치 변수에 대해 독립적 PSM 분석을 수행한다.

PSM 유형	처치 변수	대조군	처치군	매칭 방법
T8-2-1	DT교육경험 유무	없음	있음	Nearest neighbor, caliper=0.2
T8-2-2	스마트팩토리 도입	미도입	도입	Nearest neighbor, caliper=0.2
T8-2-3	복수참여 여부	1회	2회+	Nearest neighbor, caliper=0.2

공통 도구: R MatchIt, cobalt (균형 진단)

항목	사양
R 버전	4.4+
주요 패키지	tidyverse, lavaan, tidyLPA, mclust, QCA, stm, igraph, FactoMineR, plm, MatchIt
보고서 형식	Quarto (.qmd) → HTML/PDF/DOCX/MD (4포맷)
R 프로젝트	13개 독립 프로젝트
총 코드 라인	4,362 lines