On the journey of

[AI Challenge for Biodiversity] 공모전 (1) 본문

Experiences & Study

[AI Challenge for Biodiversity] 공모전 (1)

dlrpskdi 2023. 5. 3. 19:41

위 공모전은 벌써 작년(2022) 9월(10월?)~12월에 걸쳐 이뤄졌던 공모전이다. 기록이 매우 늦을 뿐이다  고등학교 3학년 때 환경과학 수강했던 것을 시작으로 환경에 지속적으로 관심을 갖고는 있었는데, 이를 전공과 연계짓는 공모전은 처음이어서 교내 에타에서 팀원으로 시작했던 기억이 난다. 이 시리즈는 .. 그 경험의 기록장이 될 것이다 :)

 우리 팀은 데이터 분석 리그 1위를 차지했고, 어떻게 분석했는지에 대한 써 보려고 한다.


1. 주제 선정 및 데이터

- Biodiversity(생물다양성)이라는 주제를 얼마나 구체화하는가? : 너무 추상적이기 때문에, 기후변화든 생물다양성이든 최대한 구체적으로 알 수 있는 주제를 선정하고자 하였다.

- 염두에 둔 것 : 데이터의 절대적인 양(분량) 및 품질(사실...품질은 너무 저퀄만 아니면 된다에 가까웠다) 

- 참고한 데이터 : http://genebank.rda.go.kr/PB/bb/dna10_list.bo?ord_nm=%EB%A7%A4%EB%AF%B8%EB%AA%A9 

결론적으로 우리 팀은 '매미'를 지표종 삼아 기후 변화가 얼마나 이뤄졌는지를 분석 하기로 ! 데이터는 지사탐(지구사랑탐사대) 데이터를 활용하였다. 구체적으로는, 매미는 종별로 주로 활동하는 기후가 다르기 떄문에 주로 활동하는 매미 종을 분석하고, 실제 날씨 빈도 수를 파악함으로써 얼마나 정확한지를 평가하고자 하였다.

 

 

2. 데이터 전처리 및 분석 툴

- 기본적으로 Python을 활용했다. 다만, 아래 플랫폼이 다들 익숙하지 않아서 Google Colab과 섞어 사용했다 🤣

- SK 하이닉스(주최 측)에서 구글 분석플랫폼(AWS는 아닌데.. 비슷한 거였는데 기억이..안 남) 환경을 제공해 주셨다. 

 

 

3. 데이터 분석

그러면 여기서부터는 다음 포스팅에 ....