Asian Oncol Nurs. 2021 Dec;21(4):231-240. Korean.
Published online Dec 31, 2021.
© 2021 Korean Oncology Nursing Society
Original Article
암생존자 삶의 질 영향요인에 대한 연구동향: 텍스트 네트워크 분석과 토픽모델링
박진희,1 전미선,2 배선형,3 김희준4
Research Trends on Factors Influencing the Quality of Life of Cancer Survivors: Text Network Analysis and Topic Modeling Approach
Jin-Hee Park,1 Mison Chun,2 Sun Hyoung Bae,3 and Hee-Jun Kim4
    • 1아주대학교 간호대학·간호과학연구소 교수
    • 2아주대학교 의과대학 방사선종양학과 교수
    • 3아주대학교 간호대학·간호과학연구소 부교수
    • 4아주대학교 간호대학 박사과정생, 아주대병원 간호사
    • 1Professor, College of Nursing · Research Institute of Nursing Science Ajou University, Suwon, Korea.
    • 2Professor, School of Medicine, Ajou University, Suwon, Korea.
    • 3Associate Professor, College of Nursing · Research Institute of Nursing Science Ajou University, Suwon, Korea.
    • 4Doctoral Student, College of Nursing, Ajou University, Nurse, Ajou University Hospital, Suwon, Korea.
Received October 01, 2021; Revised November 24, 2021; Accepted December 13, 2021.

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nd/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Abstract

Purpose

This study aimed to identify the major keywords and the structure of the networks for each major topic to gain knowledge on factors influencing the quality of life of cancer survivors using Text Network Analysis (TNA) and topic modeling.

Methods

The study was conducted in four steps:(1) collecting abstracts, (2) text preprocessing in Python, (3) building a co-occurrence matrix, and (4) analyzing network features and clustering topic groups. From 2010 to 2020, 133 studies related to factors affecting the quality of life of cancer survivors were collected from several databases (PubMed, Embase, Cochrane, CINAHL RISS, KoreaMed, KISS).

Results

As a result of analyzing 9,968 evaluation results on “breast cancer,” “female,” “depression,” “treatment,” “age,” “questionnaire,” “symptom,” and “diagnosis,” five topics were derived after topic modeling considering coherence score and perplexity score. The main themes were breast cancer survivor, symptom experience, colon cancer survivor, psycho-social factors, and lifestyle and health management.

Conclusion

Based on the results of this study, symptoms such as depression, physical activity, and lifestyle and health management are significant factors affecting the quality of life of cancer survivors.

Keywords
Cancer survivors; Quality of life; Causality; Social network analysis; Topic modeling
암생존자; 삶의 질; 인과관계; 주제어 문헌고찰

서론

1. 연구의 필요성

우리나라의 2018년 암발생률은 10만명당 290.1명으로 꾸준히 증가하는 추세를 보이고 있다.1) 또한 암의 조기발견 및 치료기술의 발달과 함께 2014년부터 2018년까지 발생한 암 환자의 5년 상대생존율은 70.3%로 2001~2005년 54.1%에 비해 큰 폭으로 증가하였다.1) 이는 암 환자의 치료와 생존율에 초점을 맞추는 것도 중요하지만 암생존자의 건강문제 및 삶의 질에 관심을 가져야 함을 의미한다.

암생존자란 암 진단 후 생존해있는 사람을 의미하기도 하지만 일반적으로 암 진단을 받은 후 수술, 항암화학요법, 방사선치료 등의 적극적 치료를 끝낸 자를 의미한다.2, 3) 암생존자는 치료가 끝난 후에도 신체적으로는 피로감, 무력감, 수면장애와 같은 신체적 문제를 경험할 뿐 아니라 불안, 우울, 고립감, 일상생활 및 직장으로의 복귀 어려움과 같은 심리사회적 문제, 의료비용 및 재정적 부담 증가와 같은 경제적 문제 등 복합적인 문제를 경험한다.3, 4) 이러한 다양하고 복합적인 문제로 인해 암생존자의 삶의 질은 건강한 일반인에 비해 낮은 것으로 보고된다.3) 삶의 질은 개인이 자신의 삶에 대해 경험하는 주관적인 안녕 상태를 의미하는 것으로 암생존자의 예후에도 영향을 미쳐 삶의 질이 높을수록 생존 가능성도 높아진다.5) 따라서 암생존자의 관리에서 삶의 질은 암치료와 중재의 효과 및 건강과 적응을 판단하는 중요한 지표로 주목받고 있다.

암생존자의 삶의 질을 증진시키는 중재 요소들을 규명하기 위해서는 관련 요인에 대한 체계적인 조사를 통한 경험적 근거가 축적되어야 한다.2, 6) 이에 따라 암생존자의 삶의 질에 영향을 미치는 요인에 관한 연구들이 국내외에서 활발히 이루어지고 있다. 암생존자의 삶의 질 관련 요인으로는 나이, 지각된 경제 수준 등과 같은 인구사회학적 특성,7) 통증, 피로, 인지기능저하, 성기능장애, 수면장애, 우울, 불안 등과 같은 치료와 암으로 인하여 경험하는 신체적·정서적 증상,4, 7, 8, 9, 10, 11) 신체활동, 식이 등과 같은 건강행위,3, 12, 13, 14) 사회적 지지,15) 재발 두려움,16) 자기효능감4, 15, 17) 등 선행연구마다 다양한 요인들을 제시하고 있다.

이처럼 암생존자의 삶의 질의 영향요인에 관한 연구가 지속해서 발표되고 축적됨에 따라 기존의 문헌분석방법이 아닌 방대한 자료를 정량적으로 분석하여 의미가 있는 연구개념 및 연구 동향을 파악하고 연구영역을 확장하려는 시도가 필요하다. 기존의 문헌분석방법은 연구자가 사전에 조사하고자 하는 연구방법을 정하고 현황을 조사 및 기술하는 방식으로 이루어졌으나, 이러한 연구 동향 분석방식은 핵심 주제 및 주요 논의를 종합적으로 파악하는데 한계가 있고, 정량적 내용분석이 이루어지지 않는다는 제한점이 있다. 이에 대한 대안으로 최근 빅데이터 분석기법인 텍스트 네트워크 분석 및 토픽 모델링을 통하여 특정 분야의 연구동향 및 변화과정을 파악하려는 시도가 이루어지기 시작하였다.18)

텍스트 네트워크 분석은 자연어 분석의 한 분야로 대규모 텍스트에 동시 출현(co-occurrence)하는 단어 간의 관계를 근거로 핵심 주제어를 발견하고 주제어 간의 연관성을 확인하여 시각적으로 맥락 파악이 가능한 분석을 말하며 관계론적 관점에서 흐름, 유사성 및 관계 양상 등의 구조적인 현상을 분석할 수 있다는 장점을 가지고 있어 문헌연구, 소셜미디어, 정치 커뮤니케이션 등 사회과학 분야에서 폭넓게 적용되고 있다. 토픽모델링은 텍스트 내에 잠재된 주제어를 찾아 각 주제의 연관성 및 분포를 분석하는 분석법을 말한다.19) 즉 비정형 데이터로 불리는 텍스트 데이터에서 개념들을 추출하여 의미구조뿐만 아니라, 맥락 속에 있는 잠재적 지식구조를 파악할 수 있는 분석방식이고, 많은 양의 관련 연구자료를 수집함에 따라 과학적 근거를 지니고, 핵심 주제어 및 하위개념을 제시함으로써 거시적 조망이 가능하다.20) 특히 토픽모델링은 구조화되지 않은 자료 내 주요 주제별 단어 분포 및 비중을 제시하고, 주제들 간의 군집을 형성하는 비지도 학습 알고리즘으로 역사학, 사회학, 언어학, 정치학, 심리학 등 다양한 분야에서 활용되고 있다. 최근 들어 간호학 관련 분야에서는 연구동향 분석과 더불어 소셜미디어 및 인터넷 포털사이트에서의 간호 관련 이슈를 도출하거나 사회적 인식 변화 파악하는 연구에서 토픽모델링21, 22, 23)을 활용하고 있다.

그러나 암생존자에 대한 연구주제 동향을 파악하기 위한 네트워크 분석 연구21)와 직장복귀 암생존자의 삶의 질에 대한 네트워크 분석 연구22) 2편이 있으나 암생존자의 삶의 질 영향요인에 대한 연구주제 동향 및 현상을 이해하기 위한 네트워크 분석 연구는 미비한 실정이다. 네트워크 분석방법은 계량적인 분석방법이며, 분석의 다양성 및 시각화의 장점이 있기 때문에 이를 통한 연구 분석은 지식구조를 면밀히 파악하고 연구 방향을 보여주는데 도움이 될 것이다.21) 이에 본 연구는 텍스트 네트워크 분석 및 토픽 모델링을 활용하여 암생존자의 삶의 질 영향요인에 관한 연구의 핵심 주제어 및 네트워크의 구조를 파악하고 암생존자의 삶의 질과 관련 요인에 대한 지식구조를 탐색하고자 한다.

2. 연구의 목적

본 연구의 목적은 텍스트 네트워크 분석 및 토픽모델링을 이용하여 암생존자 삶의 질 영향요인에 관한 연구의 핵심 주제어를 파악하고, 주요 토픽별 네트워크의 특성을 확인하여 암생존자 삶의 질 영향요인 연구의 지식구조를 탐색하기 위함이며 구체적인 연구목적은 다음과 같다.

1) 암생존자 삶의 질 영향요인 연구의 핵심 주제어를 추출하고 네트워크를 생성한다.

2) 암생존자 삶의 질 영향요인 연구의 생성된 네트워크의 구조 및 특성을 확인한다.

3) 암생존자 삶의 질 영향요인 연구의 토픽모델링을 통해 주요 토픽을 확인한다.

4) 암생존자 삶의 질 영향요인 연구의 토픽별 주제어 네트워크를 확인한다.

연구방법

1. 연구설계

본 연구는 암생존자 삶의 질 영향요인 연구에 대한 초록을 대상으로 텍스트네트워크분석 및 토픽모델링을 활용하여 핵심 개념과 연구주제를 파악하기 위한 서술적 조사연구이다.

2. 연구대상

본 연구에서는 암생존자 삶의 질 영향요인과 관련된 최신 연구동향을 파악하기 위하여 2010년 1월 1일부터 2020년 12월 31일까지 국외 데이터베이스인 PubMed, EMBASE (Excerpta medica database), Cochrane, CINAHL (Cumulative Index to Nursing and Allied Health Literature)와 국내 데이터베이스인 한국교육학술정보원(Research Information Sharing Service: RISS), KoreaMed, 한국학술정보(Korean studies Information Service System: KISS)에서 검색된 학술지 논문으로 선정하였다. 초록의 검색과 제공이 가능한 논문이 연구대상에 포함되었으며, 학술지 논문이 아닌 경우(예, Letter to editor, Conference proceeding, book 등)와 초록이 제공되지 않거나 영어나 한국어 외의 기타 언어로 작성된 논문은 제외하였다.

3. 자료수집

본 연구에서 영문검색 핵심어는 자연어와 MeSH (medical subject heading) 용어를 혼합하여 대상자는 ‘cancer survivor’ or ‘survivor*’ 그리고 종속변수는 ‘quality of life’, ‘well-being’, ‘recovery’로 검색전략을 수립하였다. 언어는 영어나 한국어(English or Korean)로 제한하였다. 국내 데이터베이스인 경우 ‘암’, ‘생존자’, ‘삶의 질’‘안녕’, ‘회복’, ‘복귀’의 조합으로 넓게 검색하였으며 논문검색은 간호학 주제전문사서 1인의 자문을 받아 수행하였다. 연구의 검색전략은 다음과 같다(Fig. 1).

국내외 데이터베이스에서 검색된 논문 8,516편 및 수기검색으로 찾은 1편을 포함한 총 8,517편 중 중복된 2,478편을 제외한 후 6,038편을 제목과 초록을 중심으로 검토하여 암생존자의 삶의 질 영향요인을 조사한 논문이 아닌 문헌(종속변수 배제) 90편, 암 생존자만을 대상으로 하지 않은 논문(대상자 배제) 5,261편, 실험연구(배제연구) 333편, 초록을 제공하지 않은 논문(저자만 있고 논문 내용이 없는 문헌) 221편을 제외하였다. 논문 선정을 위해 연구자 1인과 간호학과 교수 1인이 독립적으로 논문의 제목과 초록을 검토하여 연구를 제외하였고 연구자 간 의견이 일치하지 않는 문헌은 협의 과정을 거쳐 선정기준에 해당하는지를 재검토하였다. 이렇게 합의가 이루어진 총 133편을 본 연구의 자료분석에 활용하였다.

4. 자료분석

본 연구는 Python 프로그래밍 언어 기반 자연어처리 도구인 NLTK (Natural Language Toolkit)패키지를 사용하여 단어 추출 및 정제하고, 주제어 간의 관계를 확인하기 위하여 텍스트 네트워크 분석을 시행 후 파이선 패키지인 networkx 라이브러리를 통해 시각화하였다. 마지막으로 주요 토픽별 잠재 의미 분석은 파이선 패키지인 gensim 라이브러리를 통한 토픽모델링 작업을 수행하였다.

1) 단어 추출 및 정제

중복 논문을 제거한 암 생존자 삶의 질 영향요인 연구의 서지정보 중 초록을 분석대상으로 하였다. 자연어처리 도구인 NLTK (Natural Language Toolkit) 패키지를 이용하여 단어를 추출하였다. 자연어 분석 시 영문의 대·소문자, 단수와 복수, 약어, 특수문자 등이 다른 단어로 분류되기 때문에 단어의 정제가 필요하다. 이를 위하여 지정어, 유의서, 제외어 사전을 작성하여 분석에 사용될 단어를 정제하였다. 지정어 사전은 여러 단어가 모여 하나의 의미를 이루는 단어사전을 만드는 것으로 ‘quality of life’, ‘social support’, ‘cancer survivors’등이 이에 해당한다. 유의어 사전은 동일하고 유사한 의미를 지니나 표기가 다른 단어를 모아 하나의 대표어로 지정하는 사전을 말한다. ‘QOL’, ‘PA’와 같이 약어로 표기된 경우, ‘cognitive functions’, ‘cognitive function’과 같이 단수 및 복수 표현의 일치가 이에 해당한다. 제외어 사전은 의미를 파악하기 어려운 1글자 단어와 일반적인 개념을 나타내는 단어를 제거하는 사전으로 ‘result’, ‘purpose’, ‘relation’ 등이 이에 해당한다.

2) 핵심 주제어 추출 및 네트워크 생성

단순 출현빈도(frequency)는 전체 문서 내에서 단어의 등장 횟수를 말하며, 문서에서 빈번하게 사용되는 중심 단어로의 의미를 나타낸다. 이에 단순 출현빈도의 상위 30개 단어를 분석하여 핵심 주제어를 추출하였다. 또한, 주제어 간의 연결 관계를 확인하기 위해 상위 30개 단어 간 동시 출현빈도를 링크(link)로 표현하는 텍스트 네트워크 분석(Text Network Analysis: TNA)을 생성하였다. 동시 출현(co-occurrence)이란 특정 기준 범위 내에서 단어 쌍이 동시에 출현하는 것을 의미하는 것이고, 동시 출현빈도는 단어 쌍이 동시 출현하는 문서의 수를 말한다. 동시 출현빈도가 높다는 것은 두 단어 간의 관련성이 높으며 의미 있는 관계를 나타낸다.20)

3) 네트워크 내 주제어의 중심성 분석 및 핵심 주제어 선정

중심성은 네트워크에서 주제어(노드)가 중심에 위치하는 정도를 보여주는 지표로 절대적 크기가 아니라 상대적 순위를 기준으로 평가하여 중심성이 높은 주제어가 핵심 주제어로 간주한다. 중심성 지표의 값은 0~1 사이에 존재하는 값이며, 값이 클수록 네트워크 내에서 단어가 중심에 위치하는 중심성이 높다는 것을 의미한다. 중심성 지표의 평균(average)은 네트워크 전체에서 특정 단어에 몰리는 정도를 표현한 것으로 네트워크가 구조적으로 특정 단어에 집중되어 있는지 혹은 분산되어 있는지를 나타낸다. 네트워크의 중심성은 중심성 지표인 연결 중심성(degree centrality), 근접 중심성(closeness centrality), 매개 중심성(betweenness centrality)을 통해 분석하였다.20)

연결 중심성(degree centrality)은 텍스트에서 한 단어에 직접 연결된 다른 단어의 수가 많으면 연결 중심성이 높다고 보는 것으로 연결정도만으로 측정하면 연결망의 크기에 따라 달라지므로 연결된 모든 노드의 수로 값을 나누어 표준화한다. 근접 중심성(closeness centrality)은 한 단어가 다른 단어에 얼마나 가깝게 있는지를 측정하는 개념으로 근접 중심성이 높을수록 전체 연결망의 중심적 위치에서 다른 단어들과 가까이 위치한다고 해석할 수 있다. 매개 중심성(betweenness centrality)은 네트워크 내에서 다른 노드와의 중개역할을 수행하는 정도를 의미하는 개념으로 매개 중심성이 높으면 전체 연결망을 제어하는 힘도 커진다는 것을 의미한다.20)

4) 토픽모델링 분석

토픽모델링(topic modeling)이란 문서-단어 행렬을 바탕으로 문서 집합에 숨어 있는 주제를 찾아내는 분석방법이다. 머신러닝 기반의 토픽모델링에 자주 사용되는 기법은 LDA (Latent Dirichlet Allocation)가 대표적이다. 토픽모델링을 위하여 문서(초록)-단어행렬을 생성하고, 토픽 모델링을 수행하기 위하여 파이선 기반의 대표적인 토픽모델링 도구인 gensim을 사용하였다. 토픽의 수(하이퍼파라미터)를 우선으로 선정하기 위하여 일관성 점수(coherence score)와 혼란도 점수(perplexity score)를 검토하였다.

연구결과

1. 암생존자 관련 삶의 질 영향요인 연구의 핵심 주제어

133개의 논문 초록으로부터 추출하여 정제된 총 단어의 수는 9,968개로 암생존자 삶의 질 영향요인 연구의 단순 출현빈도(frequency) 상위 30개 단어는 Figure 2와 같다. 단어의 단순 출현빈도는 ‘breast cancer’ 229회, ‘women’ 159회, ‘depression’ 136회, ‘physical activity’ 107회, ‘treatment’ 104회, ‘age’ 91회, ‘diagnosis’ 84회, ‘symptom’ 77회, ‘questionnaires’ 73회, ‘anxiety’ 63회, ‘needs’ 55회, ‘fatigue’ 49회, ‘men’ 47회, ‘behavior’ 46회, ‘social support’ 43회, ‘stress’ 43회, ‘lifestyle’ 42회, ‘pain’ 41회, ‘risk’ 40회, ‘interventions’ 39회 순으로 출현하였다.

Fig. 2
High rank co-occurrence between the keywords.

2. 암생존자 삶의 질 영향요인 연구의 네트워크 연결구조 및 중심성 분석

단어 간의 관계를 알아본 결과 총 2,669개의 단어(node)와 8,082개의 링크(link)로 구성된 네트워크의 연결구조를 확인할 수 있었다. 분석된 네트워크의 밀도(density)는 0.002, 평균 연결 정도는 6.056, 평균 연결 거리는 3.852로 나타났다. 상위 30개의 핵심 주제어 간의 네트워크 분석을 수행한 결과는 Figure 3과 같다.

Fig. 3
Network analysis by high rank co-occurrence between the keywords.

암생존자의 삶의 질 영향요인 연구의 연결 중심성, 근접 중심성 및 매개 중심성은 Table 1과 같다. 네트워크의 연결 중심성은 ‘breast cancer’ 0.09, ‘women’ 0.07, ‘depression’ 0.06, ‘treatment’ 0.05, ‘physical activity’ 0.05, ‘age’ 0.04, ‘questionnaires’ 0.04, ‘symptom’ 0.04, ‘diagnosis’ 0.04, ‘needs’ 0.03 순으로 나타났다.

Table 1
High Rank Keywords by Degree Centrality, Closeness Centrality, Between Centrality

네트워크의 근접 중심성은 ‘breast cancer’ 0.38, ‘women’ 0.37, ‘symptom’ 0.37, ‘depression’ 0.37, ‘age’ 0.36, ‘treatment’ 0.36, ‘risk’ 0.35, ‘behavior’ 0.35, ‘questionnaires’ 0.35, ‘diagnosis’ 0.35 순으로 나타났다.

네트워크의 매개 중심성은 ‘breast cancer’ 0.17, ‘women’ 0.11, ‘depression’ 0.08, ‘treatment’ 0.07, ‘physical activity’ 0.07, ‘questionnaires’ 0.06, ‘symptom’ 0.05, ‘diagnosis’ 0.05, ‘age’ 0.05, ‘needs’ 0.03 순으로 나타났다. ‘breast cancer’, ‘women’, ‘depression’, ‘treatment’, ‘age’, ‘questionnaires’, ‘symptom’, ‘diagnosis’는 출현빈도 및 중심성 분석에서 모두 높게 나타났다.

3. 토픽모델링 분석

본 연구에서는 반복 횟수는 100회, α는 .05, β = 0.01로 설정하여 일관성 점수(coherence scores)와 혼란도 점수(perplexity scores)를 통해 최적의 토픽 수를 5개로 설정하였다. 토픽 수 8개의 일관성 점수(coherence scores)는 0.402, 혼란도 점수(perplexity scores)는 -8.098로 확인되었다. 본 연구에서 λ값을 0.6으로 한 결과 5가지 주제 그룹이 도출되었다(Table 2).

첫 번째 주제 그룹 구성하는 주제어는 ‘breast cancer’, ‘women’, ‘physical activity’, ‘distress’, ‘diagnosis’, ‘depression’, ‘diet’, ‘needs’, ‘fatigue’, ‘treatment’, ‘education’, ‘questionnaires’, ‘resilience’, ‘social support’, ‘age’, ‘symptom’, ‘stress’, ‘eating’, ‘change’, ‘recurrence’, ‘comorbidity’, ‘hot flushes’, ‘exercise’, ‘body mass index’, ‘supportive care’이 도출되었다. 이들 주제어는 유방암생존자와 관련된 주요 증상, 중재, 생활습관 및 관련된 요인으로 ‘유방암생존자’로 명명하였다.

두 번째 주제 그룹을 구성하는 주제어는 ‘depression’, ‘breast cancer’, ‘cognition’, ‘symptom burden’, ‘physical activity’, ‘tooth loss’, ‘metabolic syndrome’, ‘older’, ‘impairment’, ‘dyspnea’, ‘utility’, ‘fruit and vegetable consumption’, ‘fatigue’, ‘cortisol’, ‘anxiety’, ‘lung cancer’, ‘post-traumatic growth’, ‘age’, ‘lifestyle’, ‘family communication’, ‘change’, ‘mood’, ‘treatment’, ‘health care’, ‘secretion’이 도출되었다. 이들 주제어는 암생존자가 경험하는 증상 및 관련 요인이 도출되어 ‘증상경험’으로 명명하였다.

세 번째 주제 그룹을 구성하는 주제어는 ‘colorectal cancer’, ‘anxiety’, ‘worry’, ‘life satisfaction’, ‘symptom’, ‘work’, ‘age’, ‘lifestyle’, ‘satisfaction’, ‘hope’, ‘pain’, ‘self-efficacy’, ‘behavior’, ‘rural’, ‘management’, ‘difficulty’, ‘sleeping’, ‘mental health’, ‘information needs’, ‘social support’, ‘report’, ‘extremity function’, ‘relationships’으로 대장암생존자와 관련된 주요개념으로 판단하여 ‘대장암생존자’로 명명하였다.

네 번째 주제 그룹을 구성하는 주제어는 ‘psychological distress’, ‘support’, ‘bone’, ‘sedentary time’, ‘women’, ‘financial burden’, ‘psychosocial adjustment’, ‘pain’, ‘endometrial cancer’, ‘self-management’, ‘stress’, ‘associations’, ‘differences’, ‘needs’, ‘bowel’, ‘continuity’, ‘self-efficacy’, ‘difficulty’, ‘stage’, ‘role’, ‘gender’, ‘self-esteem’이 도출되었다. 이들 주제어는 암생존자와 관련된 심리사회적 요인이 도출되어 ‘심리사회적 요인’으로 명명하였다.

다섯 번째 주제 그룹을 구성하는 주제어는 ‘reconstruction’, ‘treatment’, ‘sexual function’, ‘fracture’, ‘uncertainty’, ‘surgery’, ‘prostate cancer’, ‘cervical cancer’, ‘body image’, ‘mastectomy’, ‘diagnosis’, ‘unemployment’, ‘radiotherapy’, ‘men’, ‘risk’, ‘eating difficulties’, ‘sexual minority’, ‘health condition’, ‘body fat’, ‘cardiovascular health’, ‘weight loss’, ‘questionnaires’, ‘infections’, ‘comorbidity’이 도출되어 암생존자 재발 방지 및 건강증진을 위한 ‘생활양식 및 건강관리’로 명명하였다.

논의

본 연구는 암생존자 삶의 질 영향요인에 대한 논문 초록을 텍스트 마이닝 기법으로 분석하여 핵심 주제어를 추출하고, 텍스트 네트워크 분석 및 토픽모델링을 통해 추출된 핵심 주제어 간의 네트워크 및 핵심 주제를 확인하는 서술적 조사연구로 암생존자 삶의 질 영향요인 연구의 핵심 개념 및 연구 동향을 파악하고자 하였다. 논문 초록에 포함된 핵심 주제어를 텍스트네트워크 분석을 통해 2010년부터 2020년까지 암생존자 삶의 질 영향요인 연구영역을 확인한 결과 단순 출현빈도, 연결 중심성, 근접 중심성, 매개 중심성 및 토픽모델링 결과에서 모두 가장 높게 나타난 주제어는 ‘유방암(breast cancer)’으로 암생존자 삶의 질 영향요인과 관련된 연구 주제가 유방암생존자를 대상으로 많이 이루어졌음을 의미한다. 이는 네트워크 분석을 통해 암생존자의 지식구조를 살펴본 연구21)에서도 유방암이 주요 핵심어로 산출된 것으로 보고 되어 본 연구결과를 지지한다. 유방암은 우리나라에서 갑상선암 다음으로 높은 발생률을 보이는 여성암이며 미국, 영국과 같은 국외에서는 가장 발생률이 높은 암으로 최근 의학기술의 발전과 적극적인 보조요법으로 유방암 환자의 생존율은 다른 암에 비해 높은 편이다. 이렇게 유방암생존자의 수가 증가함에 따라 유방암 생존자의 삶의 질은 중요한 건강문제로 대두되고 있다.23)

본 연구의 연결 중심성, 근접 중심성, 매개 중심성 및 토픽모델링 전 그룹에서 다수 나타나는 주제어를 살펴보면 ‘진단(diagnosis)’, ‘치료(treatment)’와 더불어 ‘증상(symptom)’, ‘우울(depression)’, ‘피로(fatigue)’, ‘생활양식(lifestyle)’, ‘통증(pain)’, ‘불안(anxiety)’, ‘정신건강(mental health)’, ‘디스트레스(distress)’, ‘스트레스(stress)’와 같은 주제어였다. 이는 우울, 피로와 같이 증상이 암생존자 삶의 질 영향요인의 주요 연구주제임을 보여주는 것으로 텍스트네트워크분석을 통해 종양간호학회지의 연구 동향을 분석한 연구24)에서도 2012년 이전의 핵심 주제어는 ‘가족(family)’, ‘교육(education)’, ‘간호(nursing)’, ‘중재(intervention)’, ‘통증(pain)’인 것에 반해 2012년 이후 핵심 주제어는 ‘우울(depression)’, ‘건강(health)’, ‘증상(symptom)’으로 변화했다고 보고한 것과 유사하다. 암생존자의 증상관리는 일반적으로 진단과 치료시기에 초점이 맞추지만, 치료가 종료된 후에도 몇 년간 그 영향은 계속된다. 암생존자를 대상으로 한 질적연구와 양적연구결과들을 보면3, 4) 암생존자들은 치료 종료 후에도 신체적 증상과 심리적 증상으로 인한 고통은 계속되며 이를 조절하기 위한 자원과 지지는 치료 시기만큼 중요한 것으로 나타난다. 암생존자가 경험하는 신체적, 정서적 증상 고통이 심할수록 일상생활의 복귀와 적응이 어려워지기 때문에 치료가 종료된 후 암생존자가 경험하는 증상에 대한 관리가 요구된다.8, 9)

암생존자가 경험하는 증상 중에서 우울(depression)은 연결 중심성, 근접 중심성, 매개중심성 및 토픽 모델링 전 그룹에서 모두 높은 수치를 보이고, 토픽모델링 분석 결과에서는 69.8%를 차지하는 세 가지 토픽 그룹에서 높은 비중을 차지하고 있다. 우울이 본 연구의 핵심 주제어로 도출된 것은 우울이 삶의 질, 치료이행 및 생존에 악영향을 미치는 요인으로 제시되면서 다수의 선행연구가 진행되었기 때문일 것이다.10) 우울은 암생존자의 12~20% 정도가 경험하며 이는 암 관련 치료가 끝난 10년 후에도 지속하는 건강문제로 제시된다.10) 암생존자의 수가 증가하고 있으며 이들의 주요 정신적인 건강문제가 우울이라는 점을 고려할 때, 우울증과 같은 정신적 건강문제의 조기 진단과 관리를 포함하는 통합적 접근이 요구된다. 또한, 본 연구에서 우울과 함께 사회적 지지, 회복 탄력성 및 디스트레스라는 주제어가 토픽모델링 분석을 통해 도출되었는데 이들 요인은 선행연구에서 우울의 관련 요인으로 제시되고 있다는 점을 고려할 때11) 이들 요인과 우울의 연관성에 대한 지속적인 연구들이 요구된다.

신체활동(physical activity)은 우울과 함께 연결중심성, 근접중심성, 매개중심성의 상위 주제어로 도출되고, 토픽모델링 분석에서는 67.8%를 차지하는 세 그룹에서 높은 비중을 차지하는 핵심 주제어로 도출되었다. 신체활동은 암치료 단계, 회복 단계 및 장기적 생존단계 전반 걸쳐 암생존자에게 영향을 미치는 요인으로 자가 관리 전략 계획함에 있어 매우 중요한 요인으로 제시된다.25) 신체활동은 신체기능의 향상시켜 생리학적 기능 및 신체의 구성을 변화시킬 뿐 아니라, 심리적 요인까지 영향을 미쳐 삶의 질을 향상시키고,14) 사망률을 감소시키는 것으로 보고된다.26) 하지만 암생존자는 암진단 이후 금연, 금주, 야채섭취의 증가 등에서는 암이 없는 일반인에 비해 잘 준수하지만 신체활동만은 그렇지 않은 경향을 보인다. 더욱이 암생존자를 위한 신체활동의 종류, 강도 및 지속시간에 대한 가이드라인도 불분명하다는 점을27) 고려할 때 추후 효과적인 신체활동 개선 프로그램이나 가이드라인 개발 연구가 요구된다.

토픽 모델링 분석을 통해 도출된 하위 그룹을 살펴보면 ‘심리사회적 요인’으로 명명된 그룹에서 ‘심리적 디스트레스(psychological distress)’, ‘지지(support)’, ‘재정적 부담(financial burden)’, ‘심리적 조절(psychosocial adjustment)’, ‘자가 관리(self-management)’, ‘요구도(needs)’, ‘자기효능감(self-efficacy)’, ‘역할(role)’, ‘자존감(self-esteem)’이라는 핵심 주제어를 확인할 수 있다. 이는 암생존자의 삶의 질 관련 연구에서 다양한 심리사회적 요인이 연구되고 있음을 나타낸다. Becker 등3)의 연구에서도 암생존자의 삶의 질 영향요인으로 신체적 요인보다 심리사회적 요인이 중요하다고 강조하였다는 점을 고려할 때, 암생존자의 삶의 질 증진을 위해서는 암생존자 맞춤형 심리사회적 간호중재가 필요함을 시사한다.

‘생활양식과 건강관리’로 명명된 그룹에서 ‘재건술(reconstruction)’, ‘치료(treatment)’, ‘성기능(sexual function)’, ‘골절(fracture)’, ‘불확실성(uncertainty)’, ‘수술(surgery)’, ‘신체상(body image)’, ‘유방절제술(mastectomy)’, ‘방사선치료(radiotherapy)’, ‘식이 어려움(eating difficulties)’, ‘건강상태(health condition)’, ‘체지방(body fat)’, ‘심혈관 건강(cardiovascular health)’, ‘체중감소(weight loss)’, ‘감염(infections)’, ‘동반질환(comorbidity)’이라는 핵심 주제어가 도출되었다. 암생존자의 장기생존율 증가로 이차 건강문제를 예방하고 재발방지를 위한 흡연, 음주, 비만, 식습관 등 생활양식 및 건강관리의 중요성이 강조되고 있다.13) 본 연구에서도 생활양식과 건강관리는 주요한 주제로 선정되었다는 점을 고려할 때 암생존자를 위한 건강한 생활양식을 지속적으로 유지할 수 있는 전략이 요구된다.

본 연구는 텍스트 네트워크 및 토픽모델링 분석을 기반으로 선정된 연구 내의 잠재된 토픽을 추출하고 주제범주로 분류해주는 작업을 수행한 것으로 유방암, 증상관리, 우울, 신체활동, 생활양식 및 건강관리와 같이 삶의 질에 영향을 미치는 다양한 요인이 추출됨으로써 암생존자 삶의 질 영향요인을 확인하고, 연구동향을 제시함에 의의가 있다. 그러나 최근 10년간 출판된 연구 논문 중 검색엔진을 이용하여 수집된 논문의 초록만을 대상으로 분석을 진행하여 출판 논문의 편향 가능성이 있다는 제한점을 가진다. 또한, 연구자의 판단을 바탕으로 데이터를 정하는 과정 및 분석 후 해석과정에서 주관적 기준이 반영되어 자의적으로 해석된 결과가 반영되었을 수 있었을 것이다. 그러므로 추후 누적된 연구들을 추가하여 반복적인 연구를 수행한다면 객관성을 갖춘 시기별, 암종별 연구흐름을 파악할 수 있을 것이다.

결론

본 연구는 암생존자의 삶의 질 영향요인에 대한 선행연구들을 텍스트 네트워크 분석 및 토픽모델링을 통해 핵심 주제어 및 네트워크의 구조를 파악하고 암생존자 삶의 질과 관련된 영향요인의 지식구조를 고찰하고자 시도되었다. 그 결과 암생존자의 삶의 질 영향요인 연구는 유방암을 대상으로 하거나 삶의 질과 증상의 관련성을 파악한 연구가 많았으며 증상 중에서는 우울 관련 선행연구가 다수를 차지하는 것으로 나타났다.

또한, 암 환자의 삶의 질을 향상시키기 위한 중재전략으로 신체활동을 제시하는 연구가 다수 확인되었고, 우울과 같은 증상경험, 다양한 심리사회적 요인, 생활양식 및 건강관리 등과 같은 주제어에 대한 연구가 이루지고 있음을 확인할 수 있었다. 이에 본 연구의 결과를 토대로 암생존자의 삶의 질을 향상시키기 위한 방안을 고려할 때 이들 요인에 대한 체계적인 접근이 요구되며 앞으로도 암종별, 요인별 분석을 통하여 연구흐름을 파악하는 추후연구들이 요구된다. 또한 암생존자의 삶의 질을 향상시키기 위한 다학제간의 중장기적 연구 전략을 수립하기를 제안한다.

Notes

본 연구는 2020년도 보건복지부 암정복추진연구개발사업 지원으로 이루어 진 것임(과제번호: HA20C0004).

This study was supported by a grant from the National R&D Program for Cancer Control, Ministry of Health & Welfare, Republic of Korea (No. HA20C0004).

References

    1. Statistics Korea. Statistical result of cause of death in 2018 [Internet]. [Accessed April 20, 2021].
      Available from: http://kostat.go.kr/.
    1. Firkins J, Hansen L, Driessnack M, Dieckmann N. Quality of life in “chronic” cancer survivors : a meta-analysis. J Cancer Surviv 2020;14:504–517.
    1. Becker H, Kang SJ, Stuifbergen A. Predictors of quality of life for long-term cancer survivors with preexisting disabling conditions. Oncol Nurs Forum 2012;39:E122–E131.
    1. Zhao L, Portier K, Stein K, Baker F, Smith T. Exploratory factor analysis of the cancer problems in living scale: a report from the American Cancer Society’s studies of cancer survivors. J Pain Symptom Manage 2009;37:676–686.
    1. Anwar S, Tan W, Yu J, Hutson A, Javle M, Iyer R. Quality-of-life (QoL) as a predictive biomarker in patients with advanced pancreatic cancer (APC) receiving chemotherapy: results from a prospective multicenter phase 2 trial. J Gastrointest Oncol 2014;5:433–439.
    1. Adam S, Feller A, Rohrmann S, Arndt V. Health-related quality of life among long-term (≥5 years) prostate cancer survivors by primary intervention: a systematic review. Health Qual Life Outcomes 2018;16:1–14.
    1. Xia J, Tang Z, Deng Q, Yang R, Wang J, Yu J. Predictors of the quality of life in Chinese breast cancer survivors. Breast Cancer Res Treat 2018;167:537–545.
    1. Gosain R, Miller K. Symptoms and symptom management in long-term cancer survivors. Cancer J 2013;19:405–409.
    1. Han CJ, Yang GS, Syrjala K. Symptom experiences in colorectal cancer survivors after cancer treatments: a systematic review and meta-analysis. Cancer Nurs 2020;43:E132–E158.
    1. Götze H, Friedrich M, Taubenheim S, Dietz A, Lordick F, Mehnert A. Depression and anxiety in long-term survivors 5 and 10years after cancer diagnosis. Support Care Cancer 2020;28:211–220.
    1. Puigpinós-Riera R, Graells-Sans A, Serral G, Continente X, Bargalló X, Domènech M, et al. Anxiety and depression in women with breast cancer: social and clinical determinants and influence of the social network and social support (DAMA cohort). Cancer Epidemiol 2018;55:123–129.
    1. Liska TM, Kolen AM. The role of physical activity in cancer survivors’ quality of life. Health Qual Life Outcomes 2020;18:197
    1. Oberguggenberger A, Meraner V, Sztankay M, Hilbert A, Hubalek M, Holzner B, et al. Health behavior and quality of life outcome in breast cancer survivors: prevalence rates and predictors. Clin Breast Cancer 2018;18:38–44.
    1. Fong DY, Ho JW, Hui BP, Lee AM, Macfarlane DJ, Leung SS, et al. Physical activity for cancer survivors: meta-analysis of randomised controlled trials. BMJ 2012;344:e70
    1. Shen A, Qiang W, Wang Y, Chen Y. Quality of life among breast cancer survivors with triple negative breast cancer--role of hope, self-efficacy and social support. Eur J Oncol Nurs 2020;46:101771
    1. Beutel ME, Fischbeck S, Binder H, Blettner M, Brähler E, Emrich K, et al. Depression, anxiety and quality of life in long-term survivors of malignant melanoma: a register-based cohort study. PLoS One 2015;10:e0116440
    1. Culbertson MG, Bennett K, Kelly CM, Sharp L, Cahir C. The psychosocial determinants of quality of life in breast cancer survivors: a scoping review. BMC Cancer 2020;20:948
    1. Lee SS. A content analysis of journal articles using the language network analysis methods. J Korean Soc Inf Manage 2014;31:49–68.
    1. Paranyushkin D, editor. InfraNodus: generating insight using text network analysis; The World Wide Web Conference (WWW ‘19); 2019 May 13; San Francisco, CA. New York: Association for Computing Machinery; 2019. pp. 3584-3589.
    1. Baek YM. In: Text-mining using R. Paju: Hanulacademy Publishers; 2017.
    1. Kwon SY, Bae KR. A study on the knowledge structure of cancer survivors based on social network analysis. J Korean Acad Nurs 2016;46:50–58.
    1. Kim K, Lee KS. Identification of the knowledge structure of cancer survivors’ return to work and quality of life: a text network analysis. Int J Environ Res Public Health 2020;17:9368
    1. Bodai BI, Tuso P. Breast cancer survivorship: a comprehensive review of long-term medical issues and lifestyle recommendations. Perm J 2015;19:48–79.
    1. Kim M, Jeon J, Ryu E. Text network analysis of oncology nursing studies published in the Journal of Asian Oncology Nursing. Asian Oncol Nurs 2019;19:193–203.
    1. Rock CL, Doyle C, Demark-Wahnefried W, Meyerhardt J, Courneya KS, Schwartz AL, et al. Nutrition and physical activity guidelines for cancer survivors. CA Cancer J Clin 2012;62:243–274.
    1. Friedenreich CM, Stone CR, Cheung WY, Hayes SC. Physical activity and mortality in cancer survivors: a systematic review and meta-analysis. JNCI Cancer Spectr 2019;4:pkz080
    1. The Lancet Oncology. Exercise and cancer treatment: balancing patient needs. Lancet Oncol 2018;19:715

Metrics
Share
Figures

1 / 3

Tables

1 / 2

Funding Information
PERMALINK