생성형 인공지능(AI) 개발과 데이터센터 냉각을 위해 빅테크 기업의 물소비량 급증에 대해 경각심을 가져야 한단 목소리가 나왔습니다.
데이터센터 내 수많은 서버들은 가동 시 막대한 열을 방출합니다. 원활한 서버들의 작동을 위해선 냉각수가 필요합니다. 해수는 부식 등의 이유로 쓰지 못하기 때문에 깨끗한 담수가 필수적입니다.
영국 경제지 파이낸셜타임스(FT)에서도 생성AI 개발 경쟁 속에 기업마다 ‘물 안보’와 함께 환경영향에 대한 우려가 대두됐다고 지난 25일(이하 현지시각) 전했습니다.
‘물먹는 하마’ 생성AI…챗GPT 대화 한 번에 ‘생수 한 병’ 필요 💧
AI 산업이 급성장하고 있으나 개발에 필요한 물소비량 정보는 베일에 싸인 것인 현실입니다.
생성AI의 거대언어모델(LLM)을 작동하기 위해 데이터센터에 들어가는 물소비량에 대한 정확한 정보도 없습니다. 일부 대학에서 진행된 개별 연구 추정치만 있을 뿐입니다.
지난해 5월 미국 콜로라도대와 텍사스대 공동 연구에 따르면, 오픈AI의 챗GPT의 경우 대화 한 번에 물 500밀리리터(㎖)가 소요되는 것으로 나타났습니다. 질문과 답변을 25~50개 주고받는 수준입니다.
또 연구진이 챗GPT 가동 시 발생한 열을 식히기 위해 데이터센터에 사용된 냉각수량을 추정한 결과, GPT3 훈련에만 70만 톤의 물이 사용된 것으로 나타났습니다.
이에 대해 연구진은 “BMW 자동차 370대를 생산하는데 필요한 물과 맞먹는다”고 설명했습니다.
2022년 물소비량 MS 34%·구글 22%·메타 3% ↑…“생성AI 원인으로 지목” 🤔
오픈AI는 최신 모델인 GPT-4를 훈련하기 위해 미 아이오와주에 있는 데이터센터를 활용했습니다. 해당 지역 주민들은 GPT-4가 지역 전체 담수의 6%를 사용했다고 문제를 제기했습니다.
이와 관련해 미 리버사이드 캘리포니아대(UCL) 전기·컴퓨터공학과의 샤올레이 렌 부교수는 “GPT-4에는 더 많은 매개변수가 있고 전력도 이전보다 많이 필요하다”며 “물소비량이 더 높을 가능성이 있다”고 밝혔습니다.
GPT-4 운영에 필요한 세부 에너지와 물소비량 정보는 공개되지 않았습니다.
이에 대해 오픈AI는 “대형 모델 개발에는 물이 많이 소모될 수 있단 문제를 인식하고 있다”며 “효율성 개선을 위해 지속적으로 노력하고 있다”는 원론적인 입장을 내놓았습니다.
마이크로소프트(MS)의 경우 데이터센터 사용량 증가로 인해 2022년 물소비량이 전년 대비 34% 증가한 64억 리터였습니다. 이는 올림픽용 수영장 2,500개 이상을 채우고도 남는 규모입니다.
전문가들은 MS의 물소비량이 급격히 늘어난 이유로 챗GPT를 꼽았습니다. MS와 오픈AI의 파트너십 이후 GPT-4 개발에 필요한 자원을 공급하는 과정에서 데이터센터 내 냉각을 위해 막대한 물이 소비됐단 분석입니다.
MS는 “데이터센터는 전 세계 전력 공급량의 약 1%를 사용한다”며 “AI에는 이보다 적은 전력이 사용된다”고 밝혔습니다.
같은기간 구글은 22% 늘어난 211억 리터를 기록했습니다. 메타(구 페이스북)는 3% 증가했습니다. 이들 기업 역시 생성AI 붐으로 인해 막대한 자원 투입이 물소비량을 끌어올렸단 분석입니다.
AI 최고 권위자 “AI 모델 물발자국 공개돼야 할 중요한 시점” 📊
문제는 이같은 물소비량 증가는 아직 시작에 불과하단 것입니다.
블룸버그 산하 연구기관 블룸버그인텔리전스에 의하면, 생성AI 전체 시장 규모는 2022년 400억 달러(약 53조원)였습니다. 기관은 시장 규모가 2032년까지 1조 3,000억 달러(약 1,732조원)까지 성장할 것으로 내다봤습니다. 연평균성장률(CAGR)이 42%에 달합니다.
기술혁신이나 효율화 없이 현 추세가 유지된다면 물소비량이 비례해 늘어난단 지적이 나옵니다.
FT는 AI 수요로 인해 오는 2027년 물소비량이 42억에서 66억㎥(입방미터)까지 늘어날 것이란 학계의 분석을 인용했습니다. 66억㎥는 2018년 한국에서 공급된 수돗물 총량(66억 5,100㎥)과 맞먹습니다.
AI 분야 권위자인 케이트 크로포드 미 서던캘리포니아대(USC) 교수도 AI 수요 증가로 인한 물소비 문제를 우려합니다.
크로포드 교수는 과학저널 네이처에 기고한 글에서 “생성AI 시스템을 냉각하고 전기를 생산하기 위해선 엄청난 양의 담수가 필요하다”며 “점점 더 심각해지는 담수 부족 상황에서 AI모델의 물발자국이 공개돼야 할 중요한 시기”라고 강조했습니다.
그는 또 FT와의 인터뷰에서 “이 문제에 대해 더 나은 투명성과 보고 없이는 AI 모델이 실제 환경에 미치는 영향을 추적하는 것이 불가능하다”고 꼬집었습니다.