목록전체 글 (307)
On the journey of
NLP를 공부하다 보면 가장 많이 느끼게 되는 게, 한국어 데이터셋,한국어 모델이 정말 너무너무 부족하다는 것이다. 대부분이 영어에 초점을 맞추고 있기 때문..그래서, 이번 기회에 공부할 겸 한데 모델들을 모아봐야겠다 싶었다. 그렇다고 모든 종류를 기록하진 못하겠어서 (모두 기록하기엔.. 자료도 시간도 부족) 많이 쓰는 것들 중심으로 기록한다. 각 계열은 아래와 같다 :) Encoder Model(BERT 계열) Decoder Model(GPT 계열) Encoder-Decoder Model(Seq2seq 계열, 어텐션 나오는 그 계열) * 모든 종류가 궁금하다면 https://sooftware.io/korean-plm/ 참고하시길 :) 1. Encoder Model(BERT 계열) 가. KorBERT -..

1. 레스토랑 웨이터의 팁 분석 - https://solvesql.com/problems/tip-analysis/ solvesql solvesql.com Q. tips 테이블에는 식사 주문 금액, 팁, 결제자 성별, 요일, 시간대 등 음식점의 방문 고객들과 관련된 데이터가 들어있습니다. 음식점의 요일, 시간대 별 패턴을 분석해보고자 합니다. 구체적으로는 각 요일의 시간대별 평균 팁은 얼마인지, 평균 일행 수는 몇 명인지 확인하고자 합니다. 평균 팁과 평균 일행 수는 소수점 아래 셋째 자리에서 반올림 해 둘째 자리까지 출력하고, 결과 데이터가 요일, 시간대의 알파벳 순으로 정렬되도록 쿼리를 작성해주세요. 결과 데이터에는 아래 4개의 컬럼이 들어가야 합니다. day - 요일 time - 시간대 avg_tip..

1. 할부는 몇 개월로 해드릴까요 - https://solvesql.com/problems/installment-month/ solvesql solvesql.com Q. olist_order_payments_dataset 테이블에는 각 주문의 결제 정보가 저장되어 있습니다. 고객이 Olist 상점에서 신용카드로 주문한 내역을 할부 개월 수 별로 나누어 살펴보려고 합니다. 할부 개월 수 별로 주문 수, 최소 결제 금액, 최대 결제 금액, 평균 결제 금액을 집계해주세요. 결과 데이터에는 5개의 컬럼이 들어가야 합니다. payment_installments - 할부 개월 수 order_count - 주문 수 min_value - 최소 결제 금액 max_value - 최대 결제 금액 avg_value - 평균 ..

1탄 : https://nowolver.tistory.com/11 [AI Challenge for Biodiversity] 공모전 (1) 위 공모전은 벌써 작년(2022) 9월(10월?)~12월에 걸쳐 이뤄졌던 공모전이다. 기록이 매우 늦을 뿐이다 고등학교 3학년 때 환경과학 수강했던 것을 시작으로 환경에 지속적으로 관심을 갖고는 있었는 nowolver.tistory.com * 들어가기에 앞서, 이 포스팅의 모든 시각화 결과물(예시)은 제공받은 데이터를 활용해 저희 팀이 도출해낸 결과입니다. 참고, 저장까지는 가능하지만 무단 복제 및 사용은 절대 금합니다. 3. 데이터 분석 여기부터 기록해 보겠다. 일단 안타까운 사실은, 대부분의 빅데이터 공모전이 그렇긴 하지만 이 데이터 역시 자체 ML 스튜디오 내에서..