펀디멘탈 논문13 강화 학습 모델의 보조바퀴!-Towards Safe Online RL in CS 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해 드릴 논문은 2019년 신경 정보 처리 시스템 학회에서 소개되었던 ‘Towards Safe Online RL in CS’입니다. 해당 내용은 유튜브 ‘딥러닝 논문 읽기 모임' 중 ‘Towards Safe Online Reinforced Learning in Computer Systems’ 영상 스크립트를 편집한 내용으로, 영상으로도 확인하실 수 있습니다. (영상링크:https://youtu.be/LQRisuX0Ppc) 먼저 introduction입니다. 강화 학습 적용의 한계에 대해서 알아보려고 하는데요. 최근 4~5년 이내 실시간 운영 측에서도 강화 학습을 활용하는 게 점점 증가를 하고 있습니다. 열거된 사례들은 모두 네트워크 제어용으로 강화 학습.. 2022. 7. 6. 군집 기반 훈련! - Effective Diversity in Population Based Reinforce Learning 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해 드릴 논문은 ‘Effective Diversity in Population Based Reinforce Learning’입니다. 해당 내용은 유튜브 ‘딥러닝 논문 읽기 모임' 중 ‘Effective Diversity in Population Based Reinforce Learning' 영상 스크립트를 편집한 내용으로, 영상으로도 확인하실 수 있습니다. (영상링크:https://youtu.be/AG2uYbbXZuo) 오늘 발표할 내용은 2020년 신경 정보 처리 시스템 학회에서 소개되었던 Effective Diversity in Population Based Reinforce Learning입니다. Introduction입니다. 먼저 강화 학습의 기.. 2022. 7. 1. Rainbow : Combining Improvements in Deep Reinforcement Learning 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해 드릴 논문은 ‘Rainbow: Combining Improvements in Deep Reinforcement Learning’입니다. 해당 내용은 유튜브 ‘딥러닝 논문 읽기 모임' 중 ‘Rainbow’ 영상 스크립트를 편집한 내용으로, 영상으로도 확인하실 수 있습니다. (영상링크:https://youtu.be/oC1AOIefjT8) 오늘 발표드릴 논문은 Rainbow라는 2018년도에 딥마인드에서 발표한 논문입니다. 이 논문은 Deep Q learning이 발표된 이후에 Agent의 성능을 향상시키기 위해서 여러 EXTENSION들이 추가적으로 발표가 됐는데, 이 논문은 EXTENSION 들을 모두 다 integration 해서 Agent를 구성을.. 2022. 6. 15. Self-training의 중요성- Self-training Improves Pre-training for Natural Language Understanding 안녕하세요 콥스랩(COBS LAB)입니다. 오늘 소개해 드릴 논문은 ‘Self-training Improves Pre-training for Natural Language Understanding’입니다. 이 논문은 페이스북과 스탠퍼드에서 2020년에 발표한 논문입니다. 해당 내용은 유튜브 ‘딥러닝 논문 읽기 모임' 중 ‘Self-training Improves Pre-training for Natural Language Understanding’ 영상 스크립트를 편집한 내용으로, 영상으로도 확인하실 수 있습니다. (영상링크:https://youtu.be/9iJLzmrUN-8) Self training에 대해서 간단하게 설명하고 넘어가겠습니다. Self training은 Semi supervised le.. 2022. 6. 3. 이전 1 2 3 4 다음