구글이 인공지능(AI)을 이용해 정확성과 효율성을 모두 높인 날씨 시뮬레이터를 공개했습니다. 일명 ‘뉴럴GCM(일반순환모델·General circulation models)’입니다.
구글 산하 AI 연구소 딥마인드는 뉴럴GCM을 소개하는 논문을 과학저널 네이처에 지난 22일(이하 현지시각) 게재했습니다. 해당 연구는 유럽중기예보센터(ECMWF)가 함께했습니다.
GCM은 복잡한 방정식을 사용해 대기변화를 모델링한 뒤 날씨를 예측합니다. 장기예측이 가능하지만 실행 속도가 느리고 비용도 높단 단점이 있습니다.
딥마인드 연구진은 이러한 GCM에 AI의 머신러닝(ML)을 결합했다고 말합니다. 덕분에 수십만 줄에 달하던 프로그래밍 코드를 단 수천 줄로 절감할 수 있었단 것이 기관의 설명입니다.
구글 딥마인드 “이젠 노트북으로 날씨 예측” 🖥️
기상 예측은 단기·장기적인 날씨를 미리 살펴보는 기후대응을 위한 중요한 수단 중 하나입니다.
단, 다량의 데이터를 기반으로 하는 만큼 많은 에너지와 분석 시간을 필요로 합니다. 고성능 연산을 위해 슈퍼컴퓨터도 필요합니다.
논문 공동저자인 스테판 호이어 딥마인드 연구원은 뉴럴GCM이 기존 방법론의 한계를 극복했다고 말합니다.
실시간으로 막대한 데이터를 매번 입력해 모델링을 수정하는 대신, 막대한 데이터를 학습한 ML로 기상 예측 모델링을 구축하기 때문입니다.
학습에는 ECMWF의 40년 치 기상데이터가 사용됐습니다. 테라바이트에서 페타바이트(1,000 테라바이트) 단위의 데이터가 사용됐다는 것이 연구진의 설명입니다.
연구진은 구글의 딥러닝용 플랫폼 ‘텐서 프로세싱 유닛(TPU)’을 사용했습니다. TPU는 24시간 안에 7만 일 분의 시뮬레이션을 처리할 수 있습니다.
물론 이 과정에는 많은 에너지가 든다는 한계가 있습니다. 그 대신 일단 모델링 개발이 끝나면 사용 시 시간과 비용은 대폭 줄일 수 있습니다.
뉴럴GCM 모델링을 실행에는 단 5,500줄의 코드만 필요합니다. 미국 국립해양대기청(NOAA)의 기상 예측 모델이 37만 7,000줄의 코드가 필요한 것과 비교됩니다.
이렇게 구축된 모델링은 일반 노트북에서도 구현이 가능하도록 설계됐습니다.
호이어 연구원은 “이 모델은 당신도 (일반 컴퓨터에서) 몇 분 만에 실행할 수 있다”고 설명합니다.

“뉴럴GCM, 유럽 기상청만큼 정확한 예측” 🌞
뉴럴GCM은 구체적으로 어떻게 작동한다는 걸까요?
우선 대규모·장기 예측에는 전통적 모델이 필요합니다. 기존 모델은 지표면을 50~100㎞ 구획으로 나누어 날씨 변화를 예측합니다. 방대한 기상데이터와 물리 법칙을 결합해 예측 정확성이 높습니다.
여기에 제한적으로 ML 모델을 결합합니다. 일종의 하이브리드형 모델입니다.
ML은 전통적 모델이 예측하기 어려운 25㎞ 이하 구획에서 힘을 발휘합니다. 특정 지역에서 구름이 형성되거나 지역 특유의 기상 현상이 이에 해당됩니다. 연구진은 캘리포니아주 샌프란시스코의 안개를 사례로 언급했습니다.
그 결과, 15일 이내 단기 예측에서는 ECMWF의 예보만큼 정확한 결과를 얻었다는 것이 연구진의 말입니다.
연구진은 허리케인 발생을 무려 1년 전에 예측할 수 있는 기능도 개발하고 있다고 밝혔습니다. 이를 통해 사전 대비 기반시설를 구축하는 등 기상이변에 대비할 수 있다는 설명입니다.
일례로 미 뉴욕항의 방파제 건설 등 지역 수준에서 구체적인 기후적응 계획을 세우는데도 도움이 될 수 있다고 연구진은 강조했습니다.
하이브리드 등장 1년 전, AI 날씨 예측 모델 공개 잇따라 🌊
앞서 딥마인드는 순수 AI 기반 기상 예측 모델을 공개한 바 있습니다.
작년 7월 공개한 ‘그래프캐스트(GraphCast)’입니다.
같은해 구글 외에도 여러 빅테크 기업의 AI 기반 기상 예측 모델이 홍수처럼 쏟아졌습니다.
출시 순으로 ▲마이크로소프트(MS) ‘클라이맥스(ClimaX)’ ▲엔비디아 ‘포캐스트넷(Fourcastnet)’ ▲화웨이 ‘판구웨더(Pangu-Weather)’ 등입니다. 모두 ECMWF의 정확성에 비견되는 예측 성과를 보여준 것으로 알려졌습니다.
ECMWF에 의하면, 그중에서도 가장 높은 성능을 인정받은 모델은 구글의 그래프캐스트입니다.
ECMWF는 지난해 11월 과학저널 사이언스에 그래프캐스트 모델을 분석한 보고서를 공개했습니다. 그래프캐스트 모델이 ECMWF 기존 모델보다 90% 이상 뛰어나단 것이 기관의 결론입니다.
당시 매튜 챈트리 ECMWF ML 코디네이터는 “화웨이의 판구웨더, 엔비디아의 포캐스트넷보다 더 나았다”고 평가했습니다.
실제로 그해 9월에는 그래프캐스트의 성능을 증명한 사건이 발생합니다. 북대서양에서 발생한 12호 허리케인 ‘리’의 상륙을 미 국립기상청(NWS)보다 사흘 앞서 예측한 것입니다.
딥마인드는 “덕분에 사람들은 허리케인에 대비할 수 있는 시간을 사흘을 더 벌 수 있었다”고 밝혔습니다.

기후변화에 기상이변 증가, AI만으론 역부족 😢
구글이 굳이 AI와 기존 모델을 더한 하이브리드형 기상 모델을 개발한 이유는 무엇일까요?
시계는 작년 10월로 돌아갑니다. 10월 25일 멕시코 항구도시 아카풀코에 초강력 허리케인 ‘오티스’가 상륙했습니다.
기존 전통 기상 모델이 오티스의 폭발적 강도 예측에 실패했습니다. 열대성 폭풍으로 시작해 단 하루 만에 최고 강도인 5등급 허리케인으로 커졌기 때문입니다.
미 국립허리케인센터는 당시 상황을 “멕시코 남부에 악몽 같은 시나리오가 펼쳐지고 있다”고 설명했습니다. 그래프캐스트 역시 허리케인의 폭발적인 강도 예측에 실패했습니다.
그런데 이는 비단 그래프캐스트만의 문제는 아닙니다. AI 기반 모델 대부분이 비슷한 한계를 안고 있습니다.
AI 자체가 과거의 데이터를 기반으로만 학습하기 때문입니다. AI 기반 예측 모델이 경험하지 못한 이상기상을 포착하는데는 구조적으로 한계가 있다는 뜻입니다.
연구진은 AI와 기존 모델을 더해 이같은 한계를 극복할 수 있다고 말합니다.
실제로 뉴럴GCM이 열대저기압이나 ‘대기의 강’처럼 이상기상 현상을 예측하는데도 효과적이었다고 연구진은 밝혔습니다. 대기의 강은 하늘 위 농축된 수증기가 강처럼 흐르는 현상을 말합니다. 산이나 특정 대기 흐름에 부딪힐 경우 해당 지역에 폭우나 폭설로 이어집니다.
지난 5월 발생한 중국 남부 대홍수와 한반도 남부지방 폭우도 대기의 강으로 인해 발생한 것으로 알려졌습니다.
‘블랙박스’ AI에 과학계 불신 여전, 뉴럴GCM은? 🤔
뉴럴GCM이 기상 예측에 있어 AI에 대한 과학계의 불신을 타개할 수 있다는 기대도 나옵니다.
팀 팔머 영국 옥스퍼드대학 기후물리학과 교수는 딥마인드의 이번 연구가 “순수 물리학과 불투명한 AI 사이의 세 번째 길을 찾으려는 흥미로운 시도”라고 논평했습니다. 팔머 교수는 기후변화에 관한 정부간협의체(IPCC) 주요 저자 중 한 명입니다.
그는 사실 많은 과학자가 과학적 예측에 AI를 사용하는 것에 대해 불신과 불편함을 갖고 있다고 말합니다.
‘블랙박스 현상’은 이를 잘 드러내는 용어입니다. AI의 처리 과정을 인간이 알기 어려운 상황을 말합니다. 우리는 AI에 데이터를 입력하고 결과를 출력받습니다. 그 과정은 복잡한 인공 신경망으로 수행됩니다. 사실상 검은 상자에 가려진 것처럼 알 수 없단 뜻입니다.
이 때문에 AI가 내놓은 기상 예측을 과학적으로 신뢰할 수 있느냐의 문제가 생깁니다.
뉴럴GCM 소개 논문의 공동저자인 피터 듀벤 ECMWF 지구시스템 모델링 책임자도 이와 관련된 어려움을 토로했습니다. AI 기반 모델은 물리학과 방정식에 기반하지 않았기 때문에 “(전문가들로부터) 종종 회의적으로 여겨진다”는 것이 그의 말입니다.
이에 대해 호이어 연구원은 “(GCM은) 물리학 대 AI의 구도가 아니라, 물리학과 AI가 함께하는 것”이라고 설명했습니다.
오픈소스로 공개…“농업·보험 등 다방면 활용 기대” 💪
딥마인드 측은 뉴럴GCM의 소스코드와 모델 가중치 등의 정보를 무료로 공개했습니다.
현재 글로벌 오픈소스 플랫폼 깃허브에서 다운로드가 가능합니다. 더 많은 연구자가 소스코드를 활용해 가설을 실험하고 모델 기능을 개선하기를 바란다는 것이 기관의 설명입니다. 이는 뉴럴GCM이 노트북에서도 실행되기 때문에 가능한 방식입니다.
동시에 연구진은 학계 연구를 넘어 농업·상품 거래·보험 등 다양한 방면에서 도움이 될 것이라고 기대를 내비쳤습니다.
한편, 연구진은 뉴럴GCM 모델이 장기·극한 기상에서의 예측 가능성을 더 높일 계획이라고 밝혔습니다. 이를 위해 이산화탄소 증가가 지구 표면 온도에 미치는 영향을 추정하는 등의 작업들이 남아 있습니다.
호이어 연구원은 “뉴럴GCM은 기후를 이해하기 위한 퍼즐의 한 조각일 뿐”이라며 많은 잠재력이 남아있다고 강조했습니다.