[ML] Reinforcement Learning
Reinforcement Learning 학습은 에이전트와 환경 간의 상호작용의 결과로 이루어진다. 문으로 연결된 건물의 5개의 방이 있고 건물 밖에는 큰 방 하나(5호실)가 있다. 1번과 4번 문은 5번 방에서 건물로 통한다. 요원을 아무 방에나 배치하고, 그 방에서 건물 밖으로 내보내려고 한다. 각 문은 양방향이고, 우리 요원이 다른 방에서 들어와서 다른 방으로 나간다. 5호실이 우리의 목표 방이 될 것이다. State ◼ 위 그림에서 각 방(외부 포함) ◼ 그래프에 노드로 표시 Action ◼ 에이전트가 한 방에서 다른 방으로 이동하는 것 ◼ 그래프에서 방향 링크로 표시 Reward ◼ 목표물과 직접 연결된 문은 보상이 100 ◼ 대상에 직접 연결되지 않은 다른 문은 보상이 0 reward값을 사용..
machine learning
2022. 12. 23. 14:50