[AAIC 2018] 알츠하이머병과 빅데이터 활용

In this symposium, recent trends in data analysis and study design were discussed alongside innovative devices being used to generate exciting new data on mobility as well as systems for optimizing the collection and analysis of ‘Big Data’.

이 심포지엄에서는 데이터 분석과 연구 설계의 최근 동향과 함께, 이동성과 관련하여 흥미로우면서도 새로운 데이터를 생성하는 데 사용되는 혁신적 장치들과 ‘빅데이터’의 수집·분석을 최적화하는 시스템에 관하여 논의했습니다.

The wealth of data being generated from studies in Alzheimer's Disease (AD) holds great promise for improving our understanding of the underlying pathology and the development of therapeutic interventions and treatment. With the drive towards collaborative research, innovative technology and ‘Big Data’, new challenges have arisen in terms of data generation, collection, storage, and analysis. These issues were discussed in a thought-provoking symposium at the recent AAIC in Chicago.

알츠하이머병 연구 과정에서 생성되는 풍부한 데이터는 기저 병리학을 보다 깊게 이해하고 치료적 개입과 치료법을 발전시키는 데 있어서 큰 잠재력을 지니고 있습니다. 공동 연구, 혁신 기술 및 ‘빅데이터’를 지향함에 따라 데이터의 생성, 수집, 저장, 분석 측면에서 새로운 과제들이 대두되었습니다. 이러한 과제들은 최근 시카고에서 열린 알츠하이머협회 국제 컨퍼런스(AAIC, Alzheimer's Association Intrnational Conference)의 한 심포지엄에서 흥미롭게 논의되었습니다.

Combining data from multiple studies can be of value in increasing statistical power to test research questions

여러 연구의 데이터를 통합하면 연구 질문에 대한 통계적 검정 능력을 강화하는 데 유용합니다.

Developments in analysis and study design

분석 연구 설계의 발전

Combining data from multiple studies can be of value in increasing statistical power to test research questions – providing more robust findings. However, as Nicole Kochan (Centre for Healthy Brain Ageing, Australia and Neuropsychiatric Institute, Prince of Wales Hospital, Australia) explained, integrating diverse datasets can be extremely problematic due to variability across study populations, designs, and test measures – this is especially true with neuropsychological data. Harmonization is an approach used to improve comparability across trials, by considering each of these factors, and using statistical models chosen according to the research question, cohort and datasets. In the future, alternatives to harmonization may be employed, such as coordinated analysis across studies. One example of such an initiative is the Integrative Analysis of Longitudinal Studies of Aging and Dementia (IALSA) Research Network (https://www.maelstrom-research.org/mica/network/ialsa#/).

여러 연구의 데이터를 통합하면 연구 질문에 대한 통계적 검정 능력을 강화하는 데 유용합니다. 즉, 연구 결과의 강건성(robustness)을 높여줄 수 있습니다. 하지만 호주의 ‘Healthy Brain Ageing’ 센터와 프린스오브웨일즈 병원의 신경정신과학연구소(Neuropsychiatric Institute, Prince of Wales Hospital)에서 연구원으로 활동하고 있는 니콜 코찬(Nicole Kochan)의 설명처럼, 다양한 데이터셋을 통합하는 것은 연구 대상 모집단, 설계, 검정 지표 등이 균일하지 않기 때문에 매우 심각한 문제의 소지가 있습니다. 특히, 신경심리학 데이터의 경우에는 그러한 문제가 더욱더 뚜렷합니다. Harmonization은 이러한 각각의 요인을 고려하고 연구 질문, 모집단, 데이터셋에 맞게 통계 모델을 선택함으로써 여러 연구 시험들 간 비교를 더욱 효과적으로 하는 데 사용되는 접근법입니다. 향후에는 연구들 간 공조 분석과 같은 harmonization 에 대한 대안적 방법들도 활용될 수 있을 것입니다. 이러한 계획들의 한 사례로 ‘고령화 및 치매에 관한 종단적 연구들의 통합 분석’(IALSA, Integrative Analysis of Longitudinal Studies of Aging and Dementia) 연구 네트워크(https://www.maelstrom-research.org/mica/network/ialsa#/)를 들 수 있습니다.

Mathematical modelling and computer simulations are recent newcomers to AD research

수학 모델링과 컴퓨터 시뮬레이션은 최근 알츠하이머병 연구에 등장한 새로운 방법입니다.

Although randomized controlled trials (RCT) are considered the gold standard for estimating causal effect, Chung-Chou H Chang, PhD (University of Pittsburgh Graduate School of Public Health, USA) noted that randomization is not always feasible. In these situations, a number of alternative methods can be used with observational data, for example propensity scores or instrumental variables. Mathematical modelling and computer simulations are recent newcomers to AD research,1 and have the advantage of being able to incorporate data from both RCTs and observational studies, but sensitivity analyses must be used to estimate effects. The benefits and limitations of each approach should be considered with special attention paid to the assumptions that have been made.

무작위 통제 시험(RCT, randomized controlled trials)은 인과 효과 추정을 위한 최적의 방법으로 여겨지지만, 미국 피츠버그 보건대학원(Public Health School of Public Health)의 청차우 H 창(Chung-Chou H Chang)박사는 무작위 배정이 항상 가능한 것은 아니라고 지적했습니다. 이러한 경우에는 여러 가지 대안적 방법을 관측 데이터(예를 들면, 성향 점수 또는 도구 변수)와 함께 사용할 수 있습니다. 수학 모델링과 컴퓨터 시뮬레이션은 최근 알츠하이머병 연구에 등장한 새로운 방법으로서1 RCT와 관측 연구 데이터를 통합할 수 있다는 장점이 있지만, 효과를 추정하기 위해서는 민감도 분석이 수행되어야만 합니다. 각 접근방식의 장점과 한계가 고려되어야 하는데 그에 수반되는 가정들에 특별한 주의를 기울여야 합니다.

Wearable devices – more than a measure of mobility

웨어러블 장치 이동성 지표 이상

The focus on mobility in AD remains controversial – is mobility a modifiable risk factor for cognition? A number of large, longitudinal cohort studies have shown a relationship between cognition and impairment of mobility, with lower baseline levels of cognition associated with a more rapid decline in mobility.2, 3

알츠하이머병에서 이동 능력에 초점을 두는 것, 즉 이동 능력이 인지기능에 대한 수정 가능한 위험인자인지 여부는 여전히 논란이 되고 있습니다. 대규모로 이루어진 몇몇 종단적 코호트 연구에서 인지기능과 이동 능력 저하 사이에 관련이 있음을 보여주었는데, 인지기능의 기저치가 낮을수록 이동 능력 저하가 빠르게 진행되었습니다.2, 3

Would a more active lifestyle and improved motor abilities provide resilience against deleterious effects on the brain and cognitive decline?

보다 활동적인 생활방식으로의 변화와 운동 능력의 개선은 뇌에 해로운 영향들과 인지기능 저하에 대해 회복력을 부여할 수 있을까요?

Motor function has been assessed in the Rush Alzheimer's Disease Center cohorts using a range of devices. Early studies highlighted the importance of having a device that could collect all data being generated rather than a subset of data, Aron S Buchman, M.D. (Rush University Medical Center, USA and Rush Alzheimer's Disease Center, USA) explained. A wearable actigraph that stored data every 15 seconds could capture both total daily activity and sleep data.4, 5 In the Rush Memory and Aging Project, actigraphy data captured for 10 days showed that total daily physical activity predicted incident AD and cognitive decline, with reduced levels of activity associated with higher risk of AD.6 Autopsy data from the same study showed that total daily physical activity was also associated with two out of ten common brain pathologies of older adults.7 Total daily activity and motor abilities are independently related to cognition – so, would a more active lifestyle and improved motor abilities provide resilience against deleterious effects on the brain and cognitive decline?

미국 러시 알츠하이머병 센터(Rush Alzheimer's Disease Center)에서는 다양한 장치를 사용하여 동질 집단들의 운동 기능을 평가하였습니다. 러시 대학교 메디컬 센터(Rush University Medical Center)와 러시 알츠하이머 센터(Rush Alzheimer's Disease Center)에서 활동하는 아론 S 북크만 의학박사(Aron S Buchman)에 따르면, 초창기 연구들은 데이터 서브셋이 아닌 생성되는 모든 데이터를 수집할 수 있는 장치를 보유하는 것의 중요성을 강조했다고 합니다. 매 15초마다 데이터를 저장하는 웨어러블 액티그래프를 이용하면 일일 총 활동량과 수면 데이터를 모두 포착할 수 있습니다.4, 5 ‘러시 기억력과 노화 프로젝트’(Rush Memory and Aging Project)에서 10일 동안 포착한 액티그래피 데이터는 일일 총 신체 활동량을 통해 알츠하이머 발병 가능성과 인지기능 저하를 예측할 수 있음을 보여주었는데, 활동량 저하는 알츠하이머병 발병 위험 상승과 관련이 있었습니다.6 동일 연구에서 나온 부검 데이터는 일일 총 신체 활동량이 노인들에게 가장 흔한 10대 뇌 병증 중 2개와 연관성이 있다는 것을 보여주었습니다.7 일일 총 활동량과 운동 능력은 각각 독립적으로 인지 능력과 관련이 있습니다. 그렇다면 보다 활동적인 생활방식으로의 변화와 운동 능력의 개선은 뇌에 해로운 영향들과 인지기능 저하에 대해 회복력을 부여할 수 있을까요?

The assessment of gait may provide some insights into this question, but gait is complex to measure. A wearable body sensor – a tri-axial accelerometer incorporating three gyroscopes – has recently been used to evaluate walking in older adults with mild-cognitive impairment compared with age- and gender-matched controls.8 There is a need for more devices that can capture multiple gait measures, and analyses that can summarize the data and look at correlations between these measures and specific adverse health outcomes such as cognitive decline. In the near future, lab-based 3D motion-capture will be used to collect metrics from joint motion from those wearing these devices.

걸음걸이 평가를 통해 이 질문에 대한 통찰을 얻을 수 있지만, 걸음걸이는 측정하기가 복잡합니다. 최근에 동일한 연령대와 성별의 통제 집단과 비교했을 때 경도 인지 장애가 있는 노인들을 대상으로 3개의 자이로스코프를 갖춘 3축 가속도계인 웨어러블 바디 센서를 이용한 보행 평가가 실시된 바 있습니다.8 여러 걸음걸이 지표를 포착할 수 있는 장치들이 더욱 많이 필요하며, 이렇게 포착된 데이터를 정리하고 해당 지표들과 인지기능 저하 등의 특정한 건강 상태 사이의 상관관계를 살펴볼 수 있는 분석 기법들도 더 필요합니다. 가까운 미래에 이러한 기기를 착용한 사람들로부터 데이터를 수집하기 위한 랩 기반의 3D 모션 포착이 활용될 것입니다.

Big opportunities from Big Data

빅데이터를 통한 기회

‘Big Data’ is not a new concept, and has many advantages in health research – large databases mean relatively inexpensive large analyses, datasets are representative of real life with naturalistic follow-up – but there are a number of challenges too, e.g. does the sample cover all diagnosed patients, are the measurements representative, were analyses performed in the same way, is the use of the dataset ethical?

‘빅데이터’는 새로운 개념이 아니며 보건 연구에 많은 장점을 가지고 있습니다. 대형 데이터베이스를 구축하면 대규모 분석을 비교적 높지 않은 비용으로 수행할 수 있으며, 데이터셋은 자연스러운 추적관찰에 따른 현실 생활을 반영합니다. 하지만 이와 동시에 많은 문제도 있는데, 예를 들면 데이터의 샘플들이 진단 받은 환자 모두를 대표할 수 있는가, 측정 결과가 대표성이 있는가, 분석들이 동일한 방식으로 이루어졌는가, 데이터셋의 사용이 윤리적인가 등입니다.

Using the example of the Clinical Record Interactive Search (CRIS) system set up by the South London and Maudsley NHS Foundation Trust, Robert Stewart, MD FRCPsych, IOPPN (King's College London, United Kingdom) examined some of these questions.

영국 킹스칼리지 런던 정신의학·심리학·신경과학연구소(FRCPsych, IOPPN, King’s College London)의 로버트 스튜어트 의학박사(Robert Stewart, MD FRCPsych)는 이러한 질문 중 일부를 탐구하기 위해 사우스런던앤머즐리 NHS 재단 트러스트(South London and Maudsley NHS Foundation Trust)에서 구축한 임상기록 반응형 검색 시스템(CRIS, Clinical Record Interactive Search)의 사례를 활용하였습니다.

There is a requirement for governance of health records databases, to make sure that information is de-identified, to determine where data are stored and which analyses should be carried out. Structured data collection is also very helpful for ensuring that information retrieval is straightforward, with information captured according to clinical needs.

의료 기록 데이터베이스는 관리체계를 통해 환자의 신원 정보가 식별될 수 없도록 보장하고, 데이터가 저장되는 위치와 수행할 분석을 결정해야 합니다. 구조화된 데이터 수집은 정보를 쉽게 검색하고 임상적 니즈에 맞춰서 정보가 출력되도록 하는 데도 매우 유용합니다.

Tools such as text analytics software using natural language processing are very useful for extracting data, and integrated informatics allow electronic health records to pull data from multiple devices.

자연어 처리 기반의 텍스트 분석 소프트웨어와 같은 도구들은 데이터를 추출하는 데 매우 유용하며, 통합 정보학은 전자 의료 기록이 여러 장치로부터 데이터를 끌어올 수 있도록 해줍니다.

More work is needed to determine how best to use the data generated by electronic health records to answer clinical questions, perhaps through research-quality cohort studies.

전자 의료 기록에 의해 생성된 데이터를 임상적 연구 질문의 답을 도출하는 데 최대한 활용할 수 있는 방안을 찾기 위해서는 더욱 많은 노력이 필요합니다. 아마도 수준 높은 코호트 연구들이 동반되어야 할 것입니다.

본 자료는 Global Lundbeck 의학부에서 선별한 학술대회 콘텐츠이며, 한국룬드벡의 의견과 다를 수 있습니다

참고문헌

  1. Proctor et al. PLoS One. 2013;8:e73631
  2. Bennett et al. J Alzheimers Dis. 2018;64:S161.
  3. Buchman et al. Am J Geriatr Psychiatry. 2011;19:571.
  4. Buchman et al. Am J Geriatr Psychiatry. 2008;16:697.
  5. Lim et al. Sleep. 2011;34:1569.
  6. Buchman et al. Neurology. 2012;78:1323.
  7. Buchman et al. Neurology. 2018;90:e1911.
  8. Hausdorff et al. J Gerontol A Biol Sci Med Sci. 2018;73:1078.