CrowdStrike가 Microsoft IT 장애에 미친 영향

Estimated read time 1 min read

금요일에 발생한 Microsoft IT 장애로 인해 항공편이 멈추고, TV 방송이 중단되며, 병원 시스템이 온라인에서 끊기는 등의 문제가 발생했으며, 이 장애는 사이버 보안 기술 회사인 CrowdStrike와 관련이 있습니다.

CrowdStrike의 CEO 조지 커츠는 장애에 대해 사과하며 이번 장애에 대해 입장을 밝혔습니다.

이번 사건으로 인해 전 세계적으로 영향을 미치고 있는 상황에서, CrowdStrike가 어떻게 연관되었는지와 어떤 일이 벌어졌는지에 대해 알아보겠습니다.

더 읽기: CrowdStrike Microsoft IT 장애 후 사기에서 자신을 보호하는 방법

Microsoft 장애의 원인은 무엇인가요?

금요일 이른 아침, 호주에서 Microsoft의 Windows 운영 체제를 사용하는 회사들이 흔히 ‘죽음의 블루 스크린’이라고 불리는 문제를 보고하기 시작했습니다. Microsoft의 웹사이트에 따르면, 이는 심각한 문제가 Windows를 예기치 않게 종료하거나 재시작하게 할 때 발생합니다.

이러한 장애는 빠르게 확산되어 전 세계의 회사와 커뮤니티에 영향을 미쳤습니다. 영국, 인도, 독일, 네덜란드, 미국에서도 장애가 보고되었습니다. 한편, 유나이티드 항공, 델타 항공, 아메리칸 항공은 모든 항공편에 대해 ‘전 세계적 지상 정지’를 발령했습니다.

이번 장애의 원인은 Microsoft Windows를 실행하는 컴퓨터에 배포된 CrowdStrike의 오류 있는 업데이트에서 발생했습니다. 이 문제는 회사의 주요 제품 중 하나인 Falcon과 관련이 있으며, 이는 Mac이나 Linux 운영 체제에는 영향을 미치지 않습니다.

2012년에 출시된 CrowdStrike의 사이버 보안 소프트웨어는 Fortune 500대 기업 중 298개 회사에서 사용되고 있으며, 여기에는 은행, 에너지 회사, 의료 회사, 식품 회사 등이 포함됩니다.

카네기 멜런 대학교의 전기 및 컴퓨터 공학 교수인 데이비드 브럼리에 따르면, 이는 완벽한 폭풍과 같은 문제였습니다. “그들의 코드는 버그가 있었고, 그것은 시간 폭탄처럼 그곳에 있었던 것입니다,”라고 브럼리는 말합니다.

그는 사이버 보안 팀이 업데이트를 배포할 때 일반적으로 세 가지 단계를 구현해야 한다고 말합니다. 첫째, 버그를 잡기 위한 엄격한 소프트웨어 테스트가 있어야 합니다. 둘째, 다양한 종류의 기계에서 테스트가 이루어져야 합니다. 셋째, 업데이트는 점진적으로 롤아웃되어야 하며, 작은 사용자 집단에서 부정적인 결과를 선별해야 합니다.

“Google과 같은 회사는 업데이트가 나쁠 경우 최소한 피해를 제한하기 위해 점진적으로 업데이트를 롤아웃합니다,”라고 브럼리는 말하며, 이 문제가 더욱 두드러질 수 있다고 덧붙였습니다.

“우리가 보고 있는 것과 계속해서 보게 될 것은 사이버 보안 부문의 엄청난 통합이며, 그로 인해 많은 사람들이 한 번에 영향을 받는 것입니다,”라고 브럼리는 말합니다. “우리는 ‘회사가 실수를 저지를 경우 사람들에게 어떤 선택권을 줄 수 있는가?’라는 질문을 던져야 합니다.”

CrowdStrike는 전 세계적으로 느껴지는 장애에 어떻게 대응했나요?

스크린샷 2024 07 22 오후 2.06.19

금요일 Today Show에 영상 링크로 등장한 CrowdStrike의 CEO는 대중에게 사과의 말을 전했습니다:

“우리는 고객, 여행객, 그리고 이번 장애로 인해 영향을 받은 모든 사람들에게 깊이 사과드립니다,”라고 커츠는 말했습니다. “그 업데이트에는 소프트웨어 버그가 있었고, 그것이 Microsoft 운영 체제에 문제를 일으켰습니다… 우리는 이 문제를 매우 신속하게 파악하고 해결했습니다.”

커츠는 이번 문제가 사이버 보안 문제나 어떤 종류의 공격도 아니며, 회사 내부에서 발생한 문제라고 분명히 했습니다.

그들은 문제를 해결하기 위한 변경 사항을 배포했지만, 고객들은 여전히 문제를 겪고 있으며, 전 세계의 시스템이 완전히 정상화되기까지는 시간이 걸릴 수 있습니다.

TIME에 이메일로 보낸 성명에서 CrowdStrike는 “Windows 호스트에 대한 단일 콘텐츠 업데이트에서 발견된 결함으로 영향을 받은 고객들과 적극적으로 협력하고 있다”고 밝혔습니다.

또한, 이번 문제는 보안 사건이 아니며, 문제가 “파악되고, 격리되었으며, 수정 사항이 배포되었다”고 다시 한 번 명확히 했습니다.

커츠는 자신의 X(구 트위터) 계정에도 이 정보를 공유했습니다.

Forbes에 따르면, 금요일 오후 현재, 커츠의 순자산은 IT 장애로 인해 3억 달러 감소하여 32억 달러에서 29억 달러로 떨어졌습니다. CEO의 재산은 CrowdStrike 주식과 연관되어 있으며, 이번 사건 이후 주식이 크게 하락했습니다.

Today Show 세그먼트에서, 커츠는 CrowdStrike가 밤새 고객들과 통화 중이며, 시스템을 재부팅하면 많은 고객들이 문제를 해결할 수 있었다고 말했습니다. 그러나 그는 “모든 고객이 원래 상태로 돌아갈 때까지, 그리고 악의적인 사용자들이 그들의 시스템에 침투하지 않도록 하기까지 우리는 멈추지 않을 것”이라고 말했습니다.

호스트가 여전히 충돌하고 온라인에 접속하지 못해 CrowdStrike의 수정을 다운로드할 수 없는 경우, 회사는 블로그에 문제 해결 방법을 제공했습니다.

Microsoft는 IT 장애에 어떻게 대응했나요?

스크린샷 2024 07 22 오후 2.06.23

목요일 밤, Microsoft 365는 X에 게시하여 “영향을 받은 트래픽을 다른 시스템으로 재라우팅하여 영향을 완화하려고 노력 중”이며 “서비스 가용성에서 긍정적인 추세를 관찰하고 있다”고 밝혔습니다.

토요일에 장애가 계속되자, Microsoft의 엔터프라이즈 및 OS 보안 부사장인 데이비드 웨스턴은 “CrowdStrike 장애로 인한 고객 지원”이라는 제목의 블로그 게시물을 게시했습니다.

블로그 게시물에서, 웨스턴은 Microsoft가 “CrowdStrike의 업데이트가 8백50만 개의 Windows 장치에 영향을 미쳤으며, 이는 전체 Windows 기기의 1% 미만”이라고 추정한다고 말했습니다. 그는 또한 이번 장애가 “우리의 광범위한 생태계—글로벌 클라우드 제공업체, 소프트웨어 플랫폼, 보안 공급업체 및 기타 소프트웨어 공급업체, 그리고 고객—의 상호 연결된 특성을 보여준다”고 말했습니다.

웨스턴은 또한 Microsoft가 고객을 돕기 위해 “24시간 내내” 작업하고 있다고 말했습니다. 그는 CrowdStrike와 함께 장애의 영향을 중재하기 위한 조치, 회사 자체의 수동 문제 해결 방법을 보여주는 게시물을 언급했습니다. 고객은 또한 [Azure 상태 대시보드](https://azure.status.microsoft/en-gb/status)를 통해 사건의 상태를 추적할 수 있습니다.

You May Also Like

More From Author

+ There are no comments

Add yours