본문 바로가기

Bunny Code

검색하기
Bunny Code
프로필사진 버즈밴드

  • Everything I Wrote (29)
    • Python Basic (24)
    • Deep Learning Basic (1)
    • Reinforcement Learning (0)
    • ROS (3)
    • Paper Review (1)
    • Installation (0)
Guestbook
Notice
Recent Posts
Recent Comments
Link
  • [RILAB] Taemoon's blog
«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Tags
  • 로스
  • 공부일기
  • Except
  • 딕셔너리
  • 논문
  • 컴퓨터
  • Coding
  • 공부
  • 파이썬
  • for반복문
  • 출력함수
  • 독학
  • Ros
  • 컴퓨터언어
  • 키워드
  • 예외처리
  • 재귀함수
  • 코딩
  • Python
  • 프로그래밍
  • 재귀
  • 언어
  • 로봇운영체제
  • 초보
  • 리스트
  • 자료형변환
  • 컴퓨터프로그래밍
  • Else
  • 반복문
  • 리턴
more
Archives
Today
Total
관리 메뉴
  • 글쓰기
  • 방명록
  • RSS
  • 관리

목록Paper (1)

Bunny Code

Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables[ICML 2019]

저자 : Kate Rakelly*, Aurick Zhou*, Deirdre Quillen, Chelsea Finn, Sergey Levine 논문 출처 : https://arxiv.org/pdf/1903.08254.pdf 참고하면 좋은 영상 : https://www.youtube.com/watch?v=w9KAmvUA9WI&t=691s 0. Abstract 기존 Meta Learning 방법들은 대부분 on-policy 에 의존 이는 sample efficiency의 큰 저하를 불러옴 새로운 task에 적응할 때, task uncertainty를 추론하는 메커니즘이 부족해 sparse reward problems에서 효과를 제한함 task inference와 control을 분리하는 off-policy M..

Paper Review 2022. 2. 28. 18:52
Prev 1 Next

Blog is powered by kakao / Designed by Tistory

티스토리툴바