생물학을 통해 기후변화와 생물다양성 손실 문제를 동시에 해결할 수 있다면 어떨까요?
영국 베이스캠프리서치란 스타트업은 생물학에 인공지능(AI) 기술을 더해 두 문제를 동시에 해결하려 합니다.
2019년 설립된 이 스타트업은 현재 25개국 100여개 조직과 파트너십을 맺고 생물학 데이터베이스(DB)를 구축했습니다. 수십만여개 이상의 DNA·RNA 분자가 담긴 유전자원 정보를 디지털화한 겁니다.
각지에서 특정 생물종의 서식 환경에 대한 데이터가 수집돼 베이스캠프리서치에 전달됩니다. 데이터에는 표본을 채취한 토양의 온도나 수소이온농도지수(pH), 물의 염분 농도, 빛의 양 등이 담겨 있습니다. 열대우림, 동굴, 심해의 분출구 등 표본이 채취되는 장소는 다양합니다.
사측은 각지에서 수집된 데이터를 AI가 분석하도록 합니다. 그리고 AI는 데이터 속 유전정보를 면밀하게 분석함으로써 제약이나 신소재 개발에 새로 활용할 수 있는 정보를 제공합니다.
이같은 기술력 덕에 사측은 빠르게 자금을 조달했습니다.
8일 크런치베이스를 통해 확인한 결과, 크런치베이스는 설립 후 현재까지 약 8,000만 달러(약 1,105억 원)를 조달했습니다. 이중 6,000만 달러(약 830억 원)는 시리즈 B를 통해 올해 10월 조달했습니다.
생물학 ‘챗GPT’로 기후친화적 제품 설계 가능 🧪
베이스캠프리서치는 여기에 AI 기술을 결합했습니다. 회사가 개발한 모델은 ‘베이스폴드(BaseFold)’로 불립니다. 광범위한 데이터 세트를 이용해 학습한 덕에 높은 정밀도로 유전정보를 예측하고 분석할 수 있습니다.
사측은 자사가 개발한 서비스를 ‘챗GPT’에 비유합니다.
기후친화적 소재 개발을 위해 생물학을 어떻게 이용할 수 있는지 질문을 던지면 해당 AI가 구체적으로 답변하는 겁니다.
다국적 소비재 기업 프록터앤드갬블(P&G)의 사례가 대표적입니다. P&G는 베이스캠프리서치가 개발한 AI를 통해 저온에서 얼룩을 제거할 수 있는 친환경 세제 효소를 만들고 있습니다.
바이오염료를 개발하는 컬러리픽스란 업체 역시 베이스캠프리서치의 서비스를 이용했습니다. 이곳은 박테리아를 사용해 염료를 만드는 스타트업입니다. 컬러리픽스는 베이스캠프리서치의 AI 서비스를 활용해 현재 더 지속가능한 박테리아 염색체를 개발 중입니다.
이른바 ‘생물학 챗GPT’ 덕에 더 지속가능한 제품 설계가 가능해졌다는 것이 베이스캠프리서치의 설명입니다.
“유전정보 활용 낯설지 않아…‘해적 행위’ 막는 게 목표” 🦜
유전정보를 활용하는 건 사실 낯선 개념이 아닙니다.
1966년 미국 옐로스톤 국립공원의 간헐천에서 발견된 ‘테르무스 아쿠아티쿠스(Termus aquaticus)’란 박테리아가 대표적입니다. 이 박테리아 덕에 신종 코로나바이러스 감염증(코로나19) 검사가 더 간편해졌습니다. 코로나19 검사에 사용되는 ‘중합효소 연쇄 반응(PCR)’ 검사에서 DNA를 빠르게 복제해준 덕분입니다.
알츠하이머병 치료제의 경우 은방울꽃의 추출물을 기반으로 연구가 진행 중입니다. 플라스틱을 먹어 치우는 박테리아 역시 유전정보를 기반으로 만들어졌습니다.
이미 ‘디지털 염기서열 정보(DSI)’란 국제 데이터베이스도 존재합니다. 이는 생물의 발생과 성장 그리고 기능에 필요한 유전정보를 담은 겁니다. 각 기업과 교육기관은 디지털 형태로 저장된 유전정보를 기반으로 의약품 개발이나 농업·환경 연구 등에 활용해 왔습니다. 심지어 무료입니다.
이에 올리버 빈스 베이스캠프리서치 공동설립자는 기존 데이터베이스에 한계가 많다는 점을 언급했습니다.
자유로운 데이터 활용 덕에 기술 혁신 등에 긍정적인 도움은 됐으나, 실제 유전자원을 제공한 국가에 이익 공유가 전혀 이루어지지 않았기 때문입니다.
실제로 그간 생물다양성 총회에서는 DSI를 두고 ‘해적 행위’라는 비판이 계속 제기됐습니다.
법적 충돌 사례도 여럿 있습니다. 2004년 케냐 야생동물관리청은 자국에서 발견한 효소를 세제 개발에 사용하려 했던 P&G를 상대로 법적 조치를 취할 것이라고 위협한 바 있습니다. 2014년에는 유전정보를 허가 없이 이용한 네덜란드 생물학 기업을 상대로 케냐 정부가 협상을 벌인 끝에 약 4,200만 원 상당의 수수료를 얻은 일도 있습니다.
첨예한 대립 속에 올해 ‘제16차 유엔 생물다양성협약 당사국총회(COP16)’의 최종합의문에는 DSI를 이용하는 기업에 이익의 1%, 또는 매출의 0.1%를 생물다양성 기금에 기부하도록 하는 내용이 담겼습니다. 단, 자발적 형태입니다.
베이스캠프리서치는 이같은 문제를 해결하는 것을 목표로 합니다.
최초 발견자가 유전정보를 홈페이지에 등록할 시 그 수수료를 제공하기 때문입니다. 해당 유전정보가 상업적 가치가 있다는 것이 증명될 경우 시간이 흐를수록 발견자가 받는 수수료 금액 역시 늘어납니다.
베이스캠프리서치, 방대한 유전정보서 AI가 통찰력 제공 💉
DSI에 등록된 유전정보의 수가 많지 않은 것도 한계입니다. 빈스 공동대표는 “현재 생물다양성 정보의 약 1%만 수집한 것으로 추정된다”며 “해당 유전정보를 인류가 제대로 활용할 능력이 없다는 것을 뜻한다”고 꼬집었습니다.
회사 최고기술책임자(CTO)인 필립 로렌츠는 현 상황을 대서양에 비유했습니다. “전지구상 생물의 유전정보가 대서양이라면, 인류가 알고 있는 양은 불과 5방울에 불과하다”고 그는 설명했습니다.
“유전정보를 제대로 활용하기 위해서는 적극적으로 신기술을 접목해야 한다”는 것이 로렌츠 CTO의 말입니다.
실제로 베이스캠프리서치는 자사가 개발한 생물학 AI와 데이터베이스를 통해 ‘통찰력’을 얻을 수 있다는 점을 내세웁니다.
생명을 구성하는 단백질의 기능을 예측하기 위해선 방대한 양의 데이터가 필요합니다. 변수가 많기 때문에 인간이 혼자 모든 것을 파악하는 것은 불가능에 가깝습니다.
그런데 머신러닝(ML)과 AI 기술이 투입될 경우에는 유전정보 지도화가 가능해집니다. 덕분에 사측은 DSI 등 이미 공개된 다른 데이터베이스보다 약 5배는 더 많은 양의 유전정보를 수집했습니다.
나아가 AI가 각 유전정보를 결합해 유용한 정보를 제공해줄 수도 있습니다.
벤처캐피털(VC) S32가 베이스캠프리서치에 투자한 이유도 여기에 있습니다. 구글 모기업 알파벳의 생명과학 자회사인 베릴리생명과학의 전(前) 최고경영자(CEO)인 앤디 콘라드가 파트너로 있는 곳입니다.
콘라드 파트너는 “(베이스캠프리서치의 플랫폼은) 제약산업이 묻지도 않은 질문을 해결할 수 있다”고 평가했습니다. DNA란 언어를 이해하고, 설계와 융합을 반복함으로써 기존 문제들을 해결할 수 있는 새로운 무언가가 나올 수 있기 때문입니다.
생물학+AI+데이터 = 인류 문제 해결 목표 🗺️
베이스캠프리서치는 올해 블룸버그통신이 선정한 영국에서 주목해야 할 스타트업 25곳 중 하나에도 포함됐습니다. 사측의 기술력이 추후 생물다양성 보존과 기후대응에 도움이 될 수 있기 때문입니다.
물론 베이스캠프리서치가 성장할 수 있던 배경에는 구성원들의 전문성이 뒷받침됐기 때문입니다.
40여명에 직원들은 전 세계 27개국에서 유전정보를 수집하고 있습니다.
화산섬, 심해 그리고 남극에 이르기까지 표본이 수집되는 장소 대다수가 오지에 위치해 있습니다. 각 정부나 연구기관, 토지 소유자 등 이해관계자의 동의를 받은 경우만 유전정보를 수집합니다.
사측은 최근 생물의학 연구센터인 브로드연구소와도 파트너십을 맺었습니다. 더 많은 유전정보를 수집하기 위해서입니다. 이 연구소는 미국 매사추세츠공대(MIT)와 하버드가 공동으로 설립한 곳입니다.
빅테크 기업 마이크로소프트(MS)도 베이스캠프리서치의 작업을 눈여겨보고 있습니다. MS는 자체 프로그램을 통해 베이스캠프리서치의 작업을 지원하는 것으로 알려졌습니다.
빈스 공동대표는 “생물학과 AI 그리고 데이터과학의 결합 덕에 미개척지를 완전히 지도화할 수 있을 것”이라며 “인류가 직면한 가장 큰 과제에 대한 답을 환경에서 찾을 수 있을 것”이라고 자신감을 내비쳤습니다.