새로운 Windows 맬웨어 헌터는 AV-TEST로 테스트되었으며 매우 끔찍했습니다.
이전 기사에서는 Microsoft Defender, McAfee, Norton과 같은 성능에 영향을 미치는 맬웨어 방지 제품에 대해 다루었습니다. 시스템에 대한 정보와 서로 순위를 매기는 방법. 여기서는 보안 앱이 위협으로부터 방어할 수 없다면 시스템 성능에 대한 경미하거나 중간 수준의 타격은 용서할 수 없기 때문에 이들이 제공하는 보호 기능을 살펴봅니다.
AV-Comparatives와 AV-TEST는 최신 보고서를 통해 결과를 발표했으며 각각 Windows 10과 Windows 11에서 수행되었습니다. 전자는 Real-World Protection 테스트와 Malware Protection 테스트라는 매우 포괄적인 두 가지 개별 기사를 게시했습니다.
AV-Comparatives는 실제 보호 테스트의 작동 방식을 설명합니다.
실제 보호 테스트는 사용자가 매일 경험하는 실제 조건을 시뮬레이션하는 것을 목표로 합니다. 사용자 상호 작용이 표시되면 “허용” 또는 이에 상응하는 항목을 선택합니다. 제품이 시스템을 보호하는 경우 사용자에게 결정을 내려야 할 때 프로그램 실행을 허용하더라도 맬웨어가 차단된 것으로 간주됩니다. 시스템이 손상된 경우 이를 사용자에 따른 것으로 간주합니다.
맬웨어 방지 테스트는 다음과 같습니다.
악성 코드 방지 테스트는 실행 전, 실행 중, 실행 후에 악성 파일에 의한 감염으로부터 시스템을 보호하는 보안 프로그램의 능력을 평가합니다.
테스트된 각 제품에 사용된 방법론은 다음과 같습니다. 실행에 앞서 모든 테스트 샘플은 보안 프로그램에 의해 온액세스 및 온디맨드 검색을 거치며 각 테스트는 오프라인과 온라인에서 모두 수행됩니다.
이러한 스캔으로 감지되지 않은 샘플은 인터넷/클라우드 액세스가 가능한 테스트 시스템에서 실행됩니다. 행동 탐지 기능이 작동됩니다. 제품이 특정 기간 내에 특정 악성 코드 샘플에 의해 발생한 모든 변경 사항을 방지하거나 되돌리지 못하는 경우 해당 테스트 사례는 누락된 것으로 간주됩니다. 사용자에게 악성 코드 샘플 실행을 허용할지 여부를 결정하라는 요청을 받고 최악의 사용자 결정 시스템 변경이 관찰된 경우 테스트 사례는 “사용자 종속”으로 평가됩니다.
실제 테스트는 총 512개의 테스트 사례로 구성되어 있는 반면, Malware Protection 테스트는 10,000, 10,007개가 넘는 테스트 사례로 구성되어 있습니다. 아래 이미지는 후자의 이미지입니다.
Microsoft Defender는 오프라인 범주에서 계속 평범합니다. 이는 이전 평가에서도 나타났지만 온라인 탐지 및 보호 비율에서는 이를 보완하고도 남습니다. Defender를 제외하면 McAfee도 오프라인 탐지 테스트에서 그다지 인상적이지 않았으며 Kaspersky가 간신히 앞서 있었습니다.
순위 중간쯤 되는 디펜더의 경우 오경보가 5개나 있었다. 가장 높은 허위 경보는 F-Secure에서 제공되었습니다. 가장 인기 있는 제품 중에는 McAfee와 Norton이 각각 10개와 12개의 잘못된 경보를 기록해 최악의 제품 중 하나였습니다.
AV-TEST로 이동하면 테스트된 대부분의 제품이 서로 유사하게 작동합니다. 그러나 그 중에는 중대한 특이점이 있습니다.
베트남 기반 바이러스 백신 제품인 Bkav는 AV-TEST 평가에 상당히 새로운 참가자로, 그다지 좋은 성적을 거두지 못한 것이 분명합니다. Bkav 인터넷 보안 AI는 보호 카테고리에서 6.0점 만점에 3.0점, 유용성 부문에서 6.0점 만점에 3.5점을 받았습니다. AV-TEST에서 4.5점 이하로 점수를 매기는 경우가 거의 없기 때문에 역대 최악의 성능을 보인 AI 중 하나입니다.
궁금한 점이 있으시면 사용성 점수는 바이러스 백신 제품으로 인해 발생하는 불편함과 성가심을 측정하기 위한 것입니다. 따라서 허위 경보와 같은 것도 이 범주에 포함됩니다.
Bkav의 점수 분석을 살펴보면 그 이유를 쉽게 이해할 수 있습니다. Bkav는 업계 평균인 99.2%의 거의 절반에 불과한 54.5%의 점수로 제로데이 악성 코드를 처리하는 데 매우 어려움을 겪었습니다. 더욱 안타까운 점은 9월에 비해 이번 달 점수가 낮다는 점이다.
한편, 사용성 카테고리에서는 업계 평균인 1개에 비해 258개의 오탐지가 측정되었습니다. 이 점수는 전월의 732개보다 훨씬 나아졌기 때문에 개발자들이 올바른 길을 가고 있는 것 같습니다.
답글 남기기