On the journey of

[논문읽기] Detection of alcoholic EEG signals based on whole brain connectivity and convolution neural networks 본문

Experiences & Study/Deep DAIV

[논문읽기] Detection of alcoholic EEG signals based on whole brain connectivity and convolution neural networks

dlrpskdi 2023. 11. 30. 07:59

Original Paper ) https://www.sciencedirect.com/science/article/abs/pii/S1746809422006966 

 

Detection of alcoholic EEG signals based on whole brain connectivity and convolution neural networks

Alcoholism is a common complex brain disorder caused by excessive drinking of alcohol and severely affected the basic function of the brain. This pape…

www.sciencedirect.com

 

Deep DAIV 활동의 프로젝트를 위한 논리적 빌드업? 정도. 이 논문은 알콜 중독을 EEG로 분류하는 이유에 대해 설명한다. 별개로 보통 논문은 arXiv처럼 웹에서 pdf를 다운받는 형식인데 여기는 그냥 웹에서 조회하고 pdf는 별도 구매라 신기..하다고 썼는데 full text pdf를 찾아냈다 ! (아래 링크) ; 그리고 번역 ver.로 정리해보려고 한다. 

https://www.medrxiv.org/content/10.1101/2021.06.02.21258251v1.full.pdf


Abstract

 

알코올 중독은 가장 흔하지만, 성격 및 장기 등 신체, 정신적인 손상을 수반한다. 그럼에도 여전히 이를 탐지하는 빠른 진단 방법은 존재하지 않기에(알콜 남용 및 중독 - 행동 간 생리적 메커니즘은 구체적으로 밝혀진 바 없기 때문), 신경망을 활용한 신속한 진단방법을 제시한다. 여기에, ML 및 DL을 활용하기 떄문에 개인정보가 필요하지 않다는 장점이 있다. 신경망에 의한 전극 신호의 상관 관계를 분석하고, 웨이블릿 변환 및 고속 푸리에 변환을 고려하여 높은 정확도의 분류 성능을 기록하였다.

 

 

본론(실험) - Dataset & Procedure

 

본 논문에서는 Henri Begliter (브루클린 소재 뉴욕주립대 보건센터 신경역학 연구실 database)의 데이터셋과 두피에 설치(?)한 64개 전극을 사용해 알코올 중독에 대한 유전적 소인을 연구하였다. 신호 판독 주파수는 256Hz로, 그 외 사항은 아래와 같다.

  • 대상 : 알코올 중독 vs 비중독(대조군)
  • 각 피험자의 노출 : (S1) vs (S1 and S2) (하나의 자극 or 두 개의 자극)
  • 각 자극은 이미지 데이터셋에서 각 피험자가 선택한 이미지이다. 

EEG의 기록과 결과 데이터 표는 아래와 같다.

 

그리고 아래 그림은 plotly와 python을 활용한,  알코올 - 대조군 집단 중 데이터셋에서 선택한 이미지가 있는 그룹과 없는 그룹을 나타낸 그림이다. 

 

단, 위 a~d 그림에서 알아두어야 하는 artifact들의 존재가 있다. 먼저 그림 c에서는 눈의 움직임, 깜박임 등의 변화로 인해 발생할 수 있는 갑작스러운 장력 증가가 있다. 이런 종류의 노이즈(논문에서는 artifact라고 했음. 잡음이라는 뜻이다) 를 최소화하기 위해 PCA(주성분 분석)을 활용하였다. 

또한 안구 운동으로 발생하는 가장 흔한 근전도 검사(EOG) 또한 하나의 artifact로 자리한다. 이 경우 artifact의 최대 진폭은 전두에서 가장 많이 관찰되며 후두로 갈수록 감소한다. 

 

 

웨이블릿 변환

 

신호 전처리 방법 중 가장 대표적 것은 웨이블릿 변환과 푸리에 급수로의 고속 분해 이 2가지로, 보통 이 둘은 같이 사용된다.  웨이블릿 변환의 경우, 신호에 대한 방대한 양의 그야말로 literally 'big' 데이터를 전달하지만 위상 평면의 각 지점이 결과에 영향을 미치기 때문에 중복성이 강하다는 문제점이 있다. 

ㅕㄴ속 웨이블릿 변환은 아래와 같이 신호와 도터 웨이블릿 함수(Y=로 적힌 애)의 스칼라 곱으로 정의된다. 

이때 W(r,a)는 웨이블릿 확장 계수이며, 도터 웨이블릿 함수 옆에 적힌 입실론, 알파는 각 시간 이동 및 스케일의 매개변수, 연산자 *는 복소 쌍을 의미한다. 또한 웨이블릿 함수 중 자식 웨이블릿 함수는  전단 및 스케일 연산에 의해 형성된다. 

 

여기서 omega()는 부모(mother) 웨이블렛 중심 주파수를, theta는 부모 웨이블렛의 envelope 표준편차를 의미한다. 이런 고정 웨이블릿 변환을 사용해 전극의 신호를 delta,theta,alpha,beta(각 0~4,4~8,8~12,12~20Hz)로 분해한 결과가 아래와 같다. 

고속 푸리에 시리즈

 

연속 푸리에 변환- 이산 푸리에 변환은 둘 다 효율성이 낮은 편이라 자주 사용되는 기법은 아니다. 대신, 고속 푸리에 변환을 사용한 분해가 주로 사용된다. 샘플링 주파수 Fs, 시간 모멘트 n = 0,1, ...N-1로 취한 샘플 시퀀스 형태로 표시되는 신호 x(n)의 경우 이산 푸리에 변환은 아래와 같이 정의된다. 

여기서 F(k)는 주파수를 갖는 신호의 복소 진폭이며 N은 step 주파수, x(n)은 각 시간 순간(n=0,1,..)일 때 측정된 신호 값을 의미한다. scipy.fftpack 라이브러리를 사용해 이를 고속 푸리에 계열로 확장한 결과를 확인해볼 수 있다!

이렇게 수신된 이미지 dataset은 신경망의 입력 데이터(input)으로 활용된다. 

Experiments
3-1. 머신러닝

 

본 논문에서는 트렌드를 살짝 거슬러(?), 분류 작업에서 기계학습(ML)을 사용하였다. 실제로 정확도도 높았는데, 우선 480개 엑셀(csv)로 구성된 데이터셋을 하나로 통일하였다. 그 후 logistic regression, Naive Bayes, KNN, SVM 등의 학습 및 test를 진행한 결과 가장 성능이 좋았던 것은 CART를 활용했을 때 나온 0.81이었다. 

3-2. 심층 신경망(CNN)

 

정확도를 높이기 위해 CNN을 불러왔다. 이미지와 함께 작동하는 CNN을 사용하고자 2D Graphic 상관관계를 불러왔으며, 이를 matplotlib으로 그려냈다. 

분석 결과 서로 가까운 영역 간 상관관계가 높은 것으로 드러났으며, 시각적으로 다른 PO3-CPZ와 F4-C4 영역은 피험자 간 서로 다른 상관관계 값을 보이는 것 또한 확인되었다. 이를 통해, 이미지 데이터가 분류 작업 상 DL,ML 모두에 사용될 수 있다는 결론이 도출되었으며 DL 방법론을 그림으로 나타내면 아래 fig.6과 같아진다. 

분류 작업의 첫 시도에서는 inception network가 사용되었다. layer 1~205에 대해 훈련된 가중치를 사용하고, 훈련 이미지에 대해 network를 완성한 결과 0.72라는 성능이 나왔다. 성적이 낮은 이유는 그래프가 아닌 이미지를 test dataset으로 사용한 것으로 읽히며, 이를 보완하고자 reset 후 VGG를 사용했다. 

이 경우, CNN은 convolution 4회 이후 convolution_2D와 MaxPooling2D 까지 총 6개 layer로 구성된다. 또한 연결 레이어 제외 모든 레이어에서 ReLU 활성화 함수가 사용되며 마지막엔 softmax()를 사용한다. 모델 정규화 시엔 각 sub sample layer와 첫 번째 완전 연결 layer 뒤 dropout layer를 사용하였다(fig.7 참조).성능은 제일 좋았음!

성적을 종합한 결과는 아래와 같다 (정확도 기준)

Conclusion & Discussion

 

선행연구에서는 뇌파 신호의 beta,alpha, theta 리듬을 분류 신호로 많이 사용했다. 그러나 본 논문에서는 연구 대상에 대한 동일한 유형의 data(전극 전압 only)를 사용하는 경우 뇌파 신호의 상관관계 이미지와 함께 convolution network를 사용하는 것이 바람직함을 알려준다.  또한, 본 논문의 목적은 피험자의 알콜 중독 질환을 분류하는 것이었다. 뇌파 신호에 의한 알코올 인식 분야의 다른 (선행) 연구는 결과가 제각기 다르다. 그만큼 통일성 없는 분야라는 뜻이고, 이를 막고 보완하기 위해서는 분류 신경망의 sign(증세) 수를 조절하며 표준화할 필요성이 있다는 결론 :)