텍스트 및 네트워크 분석 결과 (T5, T6)
최종 업데이트: 2026-03-28
T5: 구조적 토픽 모델링 (STM)
분석 개요
K-하이테크 플랫폼 참여 중소기업의 DT 애로사항 자유기술 텍스트를 대상으로 구조적 토픽 모델(STM)을 적용하였다.
| 항목 | 내용 |
|---|---|
| 분석 텍스트 | DT 애로사항 (281건, 평균 314자) |
| 형태소 분석 | mecab-ko (명사 추출) |
| 최적 토픽 수 | k=7 |
| 공변량 | 11개 (연도, 기업규모, DT대응수준 등) |
추가 분석 텍스트: TO_BE(254건), 성과상세(239건), AS_IS(254건)
7개 토픽 구조
| 토픽 | 명칭 | 핵심 내용 |
|---|---|---|
| 1 | 제조 현장의 디지털 전환 장벽 | 사출 등 제조 현장에서 DT 적용의 물리적/기술적 장벽 |
| 2 | 데이터 관리 및 수집 역량 부족 | 데이터 수집, 저장, 활용 역량의 부재 |
| 3 | 디지털 인재 확보의 구조적 한계 | 전문 인력 채용 어려움, 중소기업 구조적 제약 |
| 4 | 기존 인력의 적응과 저항 | 근로자의 변화 저항, 디지털 리터러시 부족 |
| 5 | 스마트 팩토리 구축 장벽 | 스마트팩토리 도입 비용, 기술 선택, 인프라 문제 |
| 6 | 품질 결함 관리의 디지털 전환 | 불량 관리, 품질 검사 자동화 필요성 |
| 7 | 교육훈련 프로그램의 실효성 | 교육 내용과 현장 간 괴리, 맞춤형 교육 필요 |
공변량 효과 (11개)
공변량: 연도, 기업규모(상시근로자수), DT대응수준, 교육훈련수준, SF도입여부, DT추진부서보유, DT교육경험, 업종, 스마트시스템 수준, DT인식 합산, 교육훈련 필요성
공변량에 따른 토픽 비율(prevalence)의 차이가 확인되었다. 특히 기업규모와 DT대응수준이 토픽 구성에 유의한 영향을 미쳤다.
LPA 프로파일별 토픽 차별화
T2 LPA에서 도출된 3개 프로파일별로 DT 애로사항 토픽 비율이 차별적 패턴을 보였다:
- DT 미인식형: 기본적 인프라/인력 문제(토픽 3, 4) 비중 높음
- 인식-미실행형: 데이터/스마트팩토리 장벽(토픽 2, 5) 비중 높음
- 적극 전환형: 품질/교육 실효성(토픽 6, 7) 비중 높음
이는 기업의 DT 성숙도에 따라 직면하는 애로사항의 질적 구조가 다름을 의미한다.
복수참여 기업 텍스트 변화
T4 종단분석과 연계하여, 복수참여 기업의 참여 시점 간 DT 애로사항 텍스트 변화를 추적하였다. 반복 참여에 따라 토픽 구성이 “기초 인프라 문제 → 고급 활용 문제”로 이동하는 패턴이 관찰되었다.
민감도 분석
토픽 수(k)를 5~15로 변동시켜 결과의 강건성을 확인하였다. k=7이 semantic coherence와 exclusivity의 최적 균형점으로 유지되었다.
T6: 네트워크 분석
분석 개요
18개 노드(DT기술 + DT기대효과 + DT필요교육)의 이분형 복수응답 데이터를 기반으로 공동출현 네트워크를 구성하였다.
네트워크 구조
| 지표 | 값 | 해석 |
|---|---|---|
| 노드 수 | 18개 | DT기술(10) + DT기대효과(7) + DT필요교육 |
| 네트워크 밀도 | 0.719 | 고밀도 (대부분의 기술이 서로 연결) |
| 주요 허브 | 빅데이터(62.4%) | 가장 높은 중심성 |
주요 공동출현 패턴
| 기술 쌍 | 공동출현 건수 |
|---|---|
| 업무효율화 + 생산최적화 | 175건 |
| 빅데이터 + 사물인터넷 | 52건 |
| 빅데이터 + 로봇공학 | 42건 |
| 인공지능 + 사물인터넷 | 34건 |
허브 기술: 중심성 분석
빅데이터가 degree, betweenness, closeness 중심성 모두에서 최상위를 차지하였다. 이는 빅데이터가 다른 기술들과의 연결을 매개하는 “허브” 역할을 수행함을 의미한다.
커뮤니티 탐지 (Louvain Algorithm)
Louvain 알고리즘을 통해 3개의 기술 커뮤니티가 탐지되었다. 각 커뮤니티는 자연적 기술 군집을 형성하며, 이는 기업들의 기술 수요가 특정 패턴으로 묶여 나타남을 보여준다.
MCA (다중대응분석)
FactoMineR의 MCA를 통해 기술수요의 잠재 차원을 추출하였다. 2차원 biplot에서 기업들의 공간적 분포와 기술 항목의 좌표를 확인하였다.
기업규모별 기술수요 패턴
기업규모에 따라 기술수요 패턴이 차별적으로 나타났다. 대규모 기업은 AI/클라우드 수요가 상대적으로 높고, 소규모 기업은 빅데이터/사물인터넷 중심의 수요를 보였다.
연관분석 (Association Rules)
Apriori 알고리즘을 통해 기술수요 항목 간 연관규칙을 도출하였다. 높은 지지도(support)와 신뢰도(confidence)를 가진 규칙들이 정책적 시사점을 제공한다.
T5-T6 연계
텍스트 분석(T5)에서 도출된 비정형 애로사항 토픽 구조와 네트워크 분석(T6)에서 도출된 정형 기술수요 패턴을 비교하면:
- 구조화 데이터(T6): 기업이 선택한 기술수요는 빅데이터 중심의 고밀도 네트워크
- 비구조화 데이터(T5): 실제 애로사항은 인력/인프라/데이터 역량 부족이 주
이 괴리는 중소기업의 “희망하는 기술”과 “실제 직면하는 문제” 사이의 갭을 보여주며, 교육 프로그램 설계에 중요한 시사점을 제공한다.