이번 포스트는 2번째인 에이전트 설계에 관한 내용입니다.

에이전트는 정의된 환경 상태를 기반으로 최적의 농업 관리 행동을 결정하는 주체입니다.

  • 알고리즘 선택: 농업 환경의 복잡성과 연속적인 상태/행동 공간을 고려할 때, 다음과 같은 알고리즘들이 적합합니다.
    • DQN (Deep Q-Network) 또는 DDQN (Double DQN): 이산적인 행동 공간에 적합하지만, 연속적인 행동을 양자화하여 적용할 수도 있습니다.
    • DDPG (Deep Deterministic Policy Gradient) 또는 TD3 (Twin Delayed DDPG): 연속적인 상태 및 행동 공간에 적합하며, 정밀한 제어가 필요한 농업 환경에 유리합니다.
    • PPO (Proximal Policy Optimization) 또는 SAC (Soft Actor-Critic): 정책 기반 알고리즘으로 안정적인 학습과 탐험 능력이 우수하여 복잡한 환경에 효과적입니다.
  • 행동 (Action) 정의: 에이전트가 환경에 대해 취할 수 있는 행동들을 정의합니다. 이는 농업 생산성 증대에 직접적인 영향을 미치는 관리 활동이어야 합니다.
    • 관수량 조절: 하루 또는 특정 시간 동안 공급할 물의 양 (연속적).
    • 비료 종류 및 투입량: NPK (질소, 인산, 칼륨) 비율 및 투입량 (연속적 또는 이산적).
    • 온실 환경 제어: 온도, 습도, CO2 농도 조절 (연속적).
    • 광주기 제어: 보광등 사용 여부 및 시간 (이산적 또는 연속적).
    • 병해충 방제 시점 및 방법: 예방적 살포 또는 특정 시점의 방제 (이산적).

 

블로그 이미지

AVIYO REPUBLIC Co., Ltd.

(주)아비요리퍼블릭의 홈페이지입니다.