목록전체 글 (307)
On the journey of
* 본문 작성에 앞서, 이는 솔룩스 세미나팀의 부원 두 분께서 준비하신 세미나를 기반으로 작성되었음을 밝힙니다. 0. Prologue - 사전 자료: Git 설치하기 아래 링크(GIt 설치 사이트)를 참고해서 git을 설치해보자. Git - Git 설치 (git-scm.com) Git - Git 설치 이 책은 Git 2.0.0 버전을 기준으로 썼다. 대부분의 명령어는 그 이전 버전에서도 잘 동작하지만, 몇 가지 기능은 아예 없거나 미묘하게 다를 수 있다. Git의 하위 호환성은 정말 훌륭하기 때문에 2.0 git-scm.com 이 중, 나는 windows 체제이기 때문에 위 사이트에 적힌 대로 Git - Downloading Package (git-scm.com) 에서 다운받았다! 1. GIT이란? 그럼..

NLP에 있어서, BERT 모델이란 기본적으로 Unlabeled Data를 활용해 모델을 학습하고, 이를 기반으로 번역/문서 분류/ Q&A(질의응답) 등의 목적을 위해 신경망을 추가하는 전이학습 모델이다. 출처 - 구글링... : 그러나 위 그림에서 알 수 있듯, 대부분의 Bert 모델 및 관련 정보는 전부 영어로만 되어 있다. 뭐 코드나 해석 정보 같은 건 한글로 쳐도 나오는데.....영어 지분율이 90%는 되는 듯. 특히 데이터셋으로 넘어오게 되면 Kor 붙은 데이터가 없다. 이를 해결하기 위해 (공식적으로는 '구글 Bert Base multilingual cased'의 한국어 성능 한계) SKTBrain/KoBERT: Korean BERT pre-trained cased (KoBERT) (githu..

위 공모전은 벌써 작년(2022) 9월(10월?)~12월에 걸쳐 이뤄졌던 공모전이다. 기록이 매우 늦을 뿐이다 고등학교 3학년 때 환경과학 수강했던 것을 시작으로 환경에 지속적으로 관심을 갖고는 있었는데, 이를 전공과 연계짓는 공모전은 처음이어서 교내 에타에서 팀원으로 시작했던 기억이 난다. 이 시리즈는 .. 그 경험의 기록장이 될 것이다 :) 우리 팀은 데이터 분석 리그 1위를 차지했고, 어떻게 분석했는지에 대한 써 보려고 한다. 1. 주제 선정 및 데이터 - Biodiversity(생물다양성)이라는 주제를 얼마나 구체화하는가? : 너무 추상적이기 때문에, 기후변화든 생물다양성이든 최대한 구체적으로 알 수 있는 주제를 선정하고자 하였다. - 염두에 둔 것 : 데이터의 절대적인 양(분량) 및 품질(사실...

1. 자연수 뒤집어 배열로 만들기 문제 - 자연수 n을 뒤집어 각 자리 숫자를 원소로 가지는 배열 형태로 리턴해 주세요. 예를 들어 n이 12345라면 [5,4,3,2,1]을 리턴합니다. 단, n은 10,000,000,000 이하인 자연수입니다. 입출력 예시는 아래와 같습니다. ALG - 입력받은 숫자를 1) 각 자리 숫자별로 쪼갠 다음 2) 리스트로 저장해야 합니다. 3) 그 후, 순서를 뒤집어야 합니다. POINT - 2) 과정을 위해 map 함수를 활용합니다. map 함수란 리스트의 요소를 지정된 함수로 처리해주는 함수로, 원본 리스트를 변경하지 않고 새 리스트를 생성합니다. SOL - def solution(n): n = list(str(n)) #입력받은 숫자를 쪼개기 위해 str 형태로 변환한 ..