On the journey of

[뉴스레터] 7월 3~4주차 AI Trend 읽기 본문

읽을거리/뉴스레터

[뉴스레터] 7월 3~4주차 AI Trend 읽기

dlrpskdi 2023. 7. 28. 16:34

뉴스레터 읽는 재미가 꽤나 크다 ㅎㅎ 분야도 다양하고 부담이 없어서 계속 읽게 된다! 요즘은 교보 전자도서관과 헤이버니를 번갈아 읽는 편인데, 왜 진즉 이렇게 시간을 쓰지 못했을까 후회되는 것도 있음. 괜찮아 아직 젊으니까 (?)


 

1. XAI 출범

XAI는 eXplainable AI의 줄임말로만 알고 있었는데, 이번에 일론 머스크가 인공지능 스타트업 'xAI'를 출범하였다. 그의 대표작(?) 테슬라와 함께 이익을 내는 기업으로도 남을 것이며 'Theory of everything for large neural networks'를 개발하여 GPT, Bard의 시대에 맞서는 회사가 될 것이라고 밝힌 바 있다. 개인적으로 GPT 모델이 재미있어서 공부하는 학생인 만큼, 이들이 개발하는 모델이 궁금해진다. 

 

2. Stable Diffusion Model & Copyrights

연세대학교 수리계산학부 연구인턴으로 있으면서 Diffusion Model라는 생성형 AI에 대해 공부하고 있다. 생성형 AI에 difussion model만 있는 것은 아니나, 종류가 다양해지고 성능이 뛰어나지고 있는 상황에서 고민해봐야 할 윤리문제가 생긴다. 저작권. 생성형 AI가 만든 그림은, 저작권이 누구에게 있는 걸까. 실제로 콜로라도에서는 AI가 제작한 작품이 수상권에 들어가면서 뜨거운 감자가 되었던 이슈인데, 모델 개발자에게 가야 할지, 이미지 생성자가 저작권자인지 저작권 개념 자체가 없어야 하는지 등 의견이 분분하다. 

 

미국의 경우, 위 콜로라도 사태(?) 이후 AI가 만든 이미지는 더 이상 저작권 보호를 받을 수 없다고 밝힌 바 있다. 우리나라의 경우 저작권을 없애진 않았으나, AI가 저작권자가 될 수는 없다.


3. TEAM Naver의 생성형 AI Lineup 선공개

그렇다면, 생성형 AI로 돌아와서, 우리나라 기업/연구소가 만든 생성형 AI는 없는 걸까? (GAN, GEN, Diffusion Model 등등 모두 우리나라 개발작이 아니니까)

: 지난 주 금요일(7/21) TEAM NAVER 측에서 생성형 AI 라인업을 일부 공개한 바 있다! 찾아보다가 정말 많이 놀랐음.

하이퍼클로바(HyperCLOVA X)는 기존 GPT - 3 학습시킬 때 사용한 '한국어' 데이터의 6500배 많은 양을 학습시킨 모델로, 튜닝 및 커스터마이징이 가능한 모델이다. GPT가 한국어로 질문하면 헛소리를 많이 해서 아쉬운 부분이 있었는데, 6500배라는 게 결코 적은 일단 Colab이 얼마나 빙글빙글 돌아갔을지가 눈에 보이는 수치인걸요 수치가 아닌 만큼 기대가 된다 :)여기서 한발 더 나아가 CLOVA X라는 대화형 AI(챗봇같은) 서비스가 나왔으며, 검색 서비스로는 CUE도 출시 예정에 있다!

 

참고  https://channeltech.naver.com/contentDetail/35 

 

팀네이버 생성형 AI 라인업 공개

 

channeltech.naver.com

비슷한 결로, 7월 3주차 Code VQA 작업이 출시되었다. 사진에 대한 질문이 주어졌을 때, 모델을 이용하여 그에 맞는 답변을 하는 작업으로, 이번 'Code' VQA(Visual Question Answering)는 코드를 생성해서 질문에 답변하도록 만들어졌다(...) GPT처럼 LLM이 Python 코드를 생성하며 질문과 코드 간 유사도를 계산하여 최종적인 답변을 제공한다.