목록Experiences & Study/이브와(KIBWA) (7)
On the journey of

* 본 포스팅은 이브와 프로젝트에서 웹 화면을 기획하기 위해, 개인적으로 엘리스코딩에서 공부한 내용의 기록입니다. 기본적으로 웹을 구성하는 요소는 크게 HTML, CSS, JAVASCRIPT라고 할 수 있다. HTML : 설계도 CSS : 디자인(화면 기획에서 CSS를 편집했다!) Javascript : 그 외 기능과 효과 이를 반영하여 '웹'이라는 건축물을 짓기 위해선, 웹사이트를 작성할 때 따라야 하는 공식 표준(기술 규격) 인 웹 표준, 모두가 웹사이트를 사용할 수 있는 웹 접근성을 특히 고려하여 작성해야 한다. HTML 문서의 경우, 메모장을 켜서 를 맨 처음에 입력해주고, 저장 시 .html 확장자로 저장해주면 된다. 대충 docty.html 로 저장했더니 폴더에 docty에 크롬 이미지가 매칭..

Deep Reinforcement Learning 내용정리는 파알 신입기수 때(...무려 1년 전) 공부하면서 노션에 정리한 내용을 복습하며 티스토리로 옮겨온 내용입니다. 때문에 학회 노션에 최적화된 구조와 내용임을 밝혀둡니다 모종의 이유로 학회활동 당시 Chapter 3는 공부하지 않았었는데 왜 그랬는지는 잘 모르겠습니다 The Cross-Entropy Method DQN or Advantage Actor-Critic과 같은 다른 도구보다 훨씬 덜 유명하지만, 자체적인 강점이 있다 단순성: 교차 엔트로피 방법은 매우 간단 → 직관적인 방법 양호한 수렴 복잡한 다단계 정책을 학습하고 발견할 필요가 없음 rewards가 빈번한 짧은 에피소드를 가진 단순한 환경에서는 교차 엔트로피가 일반적으로 매우 잘 작동..

2.1 The Anatomy of the Agent 2.1.1 A Simplistic Situation Define an environment that gives the agent random rewards for a limited number of steps, regardless of the agent’s actions class Environment: def __init__(self): self.steps_left = 10 # initialize its internal state def get_observation(self): return [0.0, 0.0, 0.0] def get_actions(self): return [0, 1] # agent가 실행할 수 있는 동작의 집합 def is_done(s..

Chapter 1. What is Reinforcement Learning? 💡 Reinforcement Learning (RL) : an approach that natively incorporates extra dimension (which is usually time, but not necessarily) into learning equations 강화학습 : 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법을 통해 학습 Learning - supervised, unsupervised, and reinforcement 지도, 비지도 학습과 비교를 통해 강화 학습의 특징을 정의 supervised learning..