텍스트 및 네트워크 분석 결과 (T5, T6)

최종 업데이트: 2026-03-28

T5: 구조적 토픽 모델링 (STM)

K-하이테크 플랫폼 참여 중소기업의 DT 애로사항 자유기술 텍스트를 대상으로 구조적 토픽 모델(STM)을 적용하였다.

추가 분석 텍스트: TO_BE(254건), 성과상세(239건), AS_IS(254건)

공변량: 연도, 기업규모(상시근로자수), DT대응수준, 교육훈련수준, SF도입여부, DT추진부서보유, DT교육경험, 업종, 스마트시스템 수준, DT인식 합산, 교육훈련 필요성

공변량에 따른 토픽 비율(prevalence)의 차이가 확인되었다. 특히 기업규모와 DT대응수준이 토픽 구성에 유의한 영향을 미쳤다.

T2 LPA에서 도출된 3개 프로파일별로 DT 애로사항 토픽 비율이 차별적 패턴을 보였다:

이는 기업의 DT 성숙도에 따라 직면하는 애로사항의 질적 구조가 다름을 의미한다.

T4 종단분석과 연계하여, 복수참여 기업의 참여 시점 간 DT 애로사항 텍스트 변화를 추적하였다. 반복 참여에 따라 토픽 구성이 “기초 인프라 문제 → 고급 활용 문제”로 이동하는 패턴이 관찰되었다.

토픽 수(k)를 5~15로 변동시켜 결과의 강건성을 확인하였다. k=7이 semantic coherence와 exclusivity의 최적 균형점으로 유지되었다.

18개 노드(DT기술 + DT기대효과 + DT필요교육)의 이분형 복수응답 데이터를 기반으로 공동출현 네트워크를 구성하였다.

빅데이터가 degree, betweenness, closeness 중심성 모두에서 최상위를 차지하였다. 이는 빅데이터가 다른 기술들과의 연결을 매개하는 “허브” 역할을 수행함을 의미한다.

Louvain 알고리즘을 통해 3개의 기술 커뮤니티가 탐지되었다. 각 커뮤니티는 자연적 기술 군집을 형성하며, 이는 기업들의 기술 수요가 특정 패턴으로 묶여 나타남을 보여준다.

FactoMineR의 MCA를 통해 기술수요의 잠재 차원을 추출하였다. 2차원 biplot에서 기업들의 공간적 분포와 기술 항목의 좌표를 확인하였다.

기업규모에 따라 기술수요 패턴이 차별적으로 나타났다. 대규모 기업은 AI/클라우드 수요가 상대적으로 높고, 소규모 기업은 빅데이터/사물인터넷 중심의 수요를 보였다.

Apriori 알고리즘을 통해 기술수요 항목 간 연관규칙을 도출하였다. 높은 지지도(support)와 신뢰도(confidence)를 가진 규칙들이 정책적 시사점을 제공한다.

텍스트 분석(T5)에서 도출된 비정형 애로사항 토픽 구조와 네트워크 분석(T6)에서 도출된 정형 기술수요 패턴을 비교하면:

이 괴리는 중소기업의 “희망하는 기술”과 “실제 직면하는 문제” 사이의 갭을 보여주며, 교육 프로그램 설계에 중요한 시사점을 제공한다.