Nó là một quá trình và cơ chế để phát hiện các lỗi và sự thiếu hụt tài nguyên xảy ra trong hệ thống và thông báo cho người quản trị hệ thống bằng cách kiểm tra định kỳ xem các máy chủ, ứng dụng, mạng, v.v. đang chạy trong hệ thống có hoạt động bình thường hay không.