AI시대의 부의 지도

20
0

[ 글을 시작하기 전에 ]


인공지능은 단순한 발전 수준을 넘어 이제 특이점이 성큼 다가온 것으로 보인다. 


특이점이라는 것은 인공지능의 발달이 인간의 지능을 뛰어넘는 기점을 말한다. 


미국의 인공지능 연구소인 오픈 AI가 2020년 6월 초거대 인공지능 언어 모델 GPT-3을 소개했다. 


GPT-3을 설명할 때 가장 강조된 것은 1,750억 개의 파라미터를 가지고 있다는 내용이며, 이는 이전 모델인 GPT-2의 파라미터 숫자보다도 약 100배 정도 많은 숫자였다. 


도대체 AI 모델의 파라미터가 뭐길래 모두 이 숫자에 집착하는 것일까?


이것은 인간의 뇌에 뉴런 간 정보 전달의 통로 역할을 하는 시냅스에 비유할 수 있다. 


우리 뇌에는 시냅스가 100조 개가량 있는데 이 시냅스가 인간 뇌의 학습과 연산 기능을 담당한다. 


초거대 언어 모델의 AI파라미터 역시 사람의 뇌에서 정보를 학습하고 기억하는 시냅스와 비슷한 역할을 한다. 


따라서 파라미터 수가 많을수록 모델이 학습 데이터에서 더 많은 정보를 받아들일 수 있고, 더 정확한 예측을 할 수 있다는 의미이다. 


파라미터 수는 곧 AI모델의 성능으로 인식되었고, 그만큼 그 숫자가 강조된 것이다. 


기업별로 보게 되면 오픈 AI의 GPT-3는 1,750억 개의 파라미터 수가 있고 AI21 랩스의 쥐라기-1은 1,780억 개, 네이버의 하이퍼클로바는 2,040억 개가 있다. 


LG AI 연구원의 엑사원은 3,000억 개가 있고 MS의 메가트론 NLG는 5,300억 개가 있다. 


마지막으로 구글은 PaLM은 5,400억 개의 파라미터가 있다. 


파라미터가 커지면 커질수록 인공지능의 발전은 그와 비례해서 늘어나게 되고 더욱 다양한 분야에서 사용되게 될 것이다. 


그럼 어떤 형태로 우리 삶에 인공지능이 접목되게 될 것인지 알아보도록 하자. 

Ⅰ. 생성형 AI가 우리에게 던지는 시사점


첫째, 생성형 AI모델들은 기본적으로 모두 이미 충분하게 많은 데이터로 학습된 초거대 AI모델이다.

 

오픈 소스를 비롯해 국내외 빅테크 기업들이 다양한 API나 앱 형태로 기술을 제공함으로써 AI관련 비즈니스를 할 때 AI원천 기술에 대한 진입 장벽이 낮아졌으며, 이로써 AI 기술이 전체적으로 상향 평준화되는 계기가 되었다. 


따라서 AI기술 개발도 중요하지만 실제 활용 측면에서 어떤 차별화된 아이디어로 경쟁력을 가져갈 것인지가 더욱 중요해졌으며, 이제는 AI기술의 우수함과 경쟁력을 비즈니스 가치로 실제로 증명해서 보여줄 시기가 되었다고 할 수 있다. 


둘째, 이러한 AI 민주화로 인해 데이터의 경쟁력이 더욱 중요해졌다. 


데이터의 양이 충분히 많은 것과 동시에 고품질의 데이터를 보유하고 있는지의 여부가 중요하다. 


AI 활용 목적에 맞는 정합성과 정확성을 가지는 데이터이면서 충분히 많은 데이터를 확보하고 수집하는 것이 바로 생성형 AI 기술 시대의 더욱 큰 경쟁력이 될 것이며 해당 데이터들이 학습을 통해 최적의 성능을 만들어 내는 파인튜닝의 노하우 역시 앞으로 더욱 중요해질 것이다. 


셋째, 생성형 AI는 기존의 AI와 비교해 놀라운 성능과 무한한 가능성을 보여줬지만, 동시에 모델 크기가 크고, 활용하기 위해서 많은 학습 비용과 운영 비용이 예상되는 기술이기도 하다. 


또한 알려진 모든 모델에는 보완해야 할 사항과 문제점들이 아직은 존재하며, 매일 새로운 논문과 관련 뉴스들이 넘쳐나고 있다. 


즉 생성형 AI는 여전히 발전하고 있는 기술이며 완성된 기술이 아니다. 


따라서 시각을 다각화하고, 여러 협업 체계와 방법론을 시도해 볼 필요가 있다. 

Ⅱ. 이제는 멀티모달 AI, AI 에이전트 시대가 온다.


한 개 이상의 입력을 받아한 개 이상의 출력을 내는 멀티모달 AI가 주류가 될 것이다. 


즉 텍스트와 이미지 등의 복합적인 정보를 통해 사용자가 원하는 결과를 텍스트, 이미지, 영상 등으로 보여주는 것, 바로 인간과 유사한 경험을 만들어내는 AI에이전트 시대가 오고 있다. 


첫째, 초거대 AI에 붙은 국가 대항전이란 타이틀은 초거대 AI에서 중요하게 다뤄지는 데이터와 데이터 주권과 관련된다. 


여기서 데이터 주권이란 데이터가 수집된 국가의 법률 및 거버넌스 구조의 적용을 받는다는 개념으로, 우선 챗 GPT기술이 현재 가지고 있는 문제점이라 말하고 있는 정보의 신뢰성, 편향성, 설명 가능성, 정확성 등이 모두 데이터와 연관된 문제라고 할 수 있다. 

개인이나 기업 모두 외국 기업의 AI기술과 서비스를 활용하는 데 있어서 우리가 기대하는 그런 성능과 효과를 내기 위해서는 우리의 데이터에 대한 추가 학습이 반드시 필요하다. 


그렇기 때문에 대한민국 국민, 정부, 기업의 데이터가 글로벌 빅테크의 초거대 AI의 학습데이터로 유출될 수도 있다는 우려는 당연히 있을 수 있으며, 여기에는 국가 전략이나 국가안보, 국가경쟁력 등과 관련된 민감한 데이터들이 포함될 수 있다. 


과거의 석유나 전기처럼 앞으로는 데이터가 기업을 비롯한 국가 경쟁력이 될 것이라는 흐름을 봤을 때 데이터 주권에 대한 문제는 일이가 있는 지적이다. 


둘째, 본격적으로 초거대 AI를 대규모로 활용할 경우 그 영향력은 기존 AI기술과는 비교할 수 없을 정도로 광범위할 수 있기 때문에 이는 국가안보와도 연결된 문제로도 볼 수 있다. 


초거대 AI는 그 모델의 크기와 성능 측면에서 범용적으로 활용이 가능한 기술이라고 말한다. 


과거 핵을 보유하는 것과 마찬가지로 단 한 번의 어떤 사건으로 해당 초거대 AI에 연결된 모든 서비스가 영향을 받을 수 있으며, 국가 중요 정보들이 해외로 유출되거나 국가 중요 시스템이 마비될 수도 있다. 


어떤 경우 특정 편향적인 정보로 국가적 손해를 볼 수도 있다. 


셋째, 초거대 AI의 초거대란 단어에서도 풍기듯 기술의 특성상 글로벌 빅테크나 엄청난 규모의 투자를 받은 회사만이 그 자본력으로 유지하고 운영할 수 있다. 


따라서 소수의 기업이 독점적으로 보유할 수 있다는 것이 현재의 현실이다. 그 결과 당연히 경쟁 세력이 없는 독과점 문제가 발생할 우려가 있다. 


이와 같은 이유들로 초거대 AI를 국가 대항전으로 표현하며, 초거대 AI를 특정 글로벌 빅테크가 아닌 국가별 자체 구축해야 한다는 필요성이 제기되며, 이를 통해 데이터 주권을 지켜야 한다는 목소리가 높다. 


최근에는 이러한 현상을 소버린이라는 용어로 표현하기도 한다. 

(Sovereign AI 주권 AI)

Ⅲ. 진정한 초개인화는 데이터에서 만들어진다. 


흔히 초개인화를 이야기하면 개인화를 말하는 것이냐고 재차 질문하곤 한다. 


개인화와 초개인화를 간단히 구분하자면, 먼저 개인화는 고객의 이름, 나이, 소속, 구매내역 등과 같은 개인정보 및 거래 정보를 기반으로 커뮤니케이션하는 것이다. 


반면 초개인화는 한 단계 더 나아가 고객의 행동 및 실시간 데이터까지 활용하면서 고객과 관련성이 높은 상황에 따른 커뮤니케이션을 하는 것이다. 


여기에는 개인의 취향, 특정 상품에 대한 검색 및 구매 내역, 웹 사이트 또는 모바일 앱에서의 사용자 활동 내역, 콘텐츠를 소비하는 데 소요된 시간, 선호채널, 고객이 가장 활발하게 활동하는 시간 등의 데이터가 해당된다. 


생성형 AI는 사람의 감정과 언어를 잘 모방하기 때문에 해당 사용자 고유의 정보와 결합해 더 매력 있는 콘텐츠들을 생성할 수 있다. 


초개인화는 데이터가 핵심이다. 생성형 AI기술은 도구로써 활용되어 좀 더 효과적으로 고객과 커뮤니케이션할 수 있도록 콘텐츠들을 텍스트화하도록 도울 수 있다. 


이는 고객을 위한 초개인화 서비스를 기존에 없었던 새로운 수준으로 끌어올릴 수 있으며, 또한 이를 대규모로 생성해 낼 수 있다. 


각 고객의 관심 사항에 맞춰 특별하게 맞춤화된 콘텐츠와 고객의 검색 행동이나 위치 기반으로 고객과 자연스럽게 대화를 나누고, 과거 대화 이력을 기억해 맞춤형으로 지원하고, 제품 추천을 할 수 있다고 한다면, 이는 최고의 초개인화 서비스가 될 수 있다. 


또한 방대한 데이터를 기반으로 고객의 미래 행동과 성향 변화를 예측해 고객 맞춤의 개인화된 제안을 하고 가장 효과적인 마케팅 채널과 시기를 예측할 수 있다. 

[ 글을 마치며 ]


이 책에서 말하는 인공지능에 대해서 네 가지 정도는 한 번 다시 생각해 보도록 하자. 


첫 번째는 생성형 AI는 기존의 AI와 비교해 놀라운 성능과 무한한 가능성을 보여줬다는 것이다. 


이 말은 인공지능이 가지는 실용성이 본격적으로 우리 시대에 들어올 수 있는 가능성이 생겼다는 것이다. 


인간의 영역이었던 창의의 영역까지도 인공지능을 활용할 수 있는 시대가 되었기 때문에 생성형 AI의 활용성은 점점 더 빠르게 발전해 나갈 것이다. 


인공지능은 이제 완벽한 학습을 마친 상태로 보이고 앞으로는 추론의 영역으로 확장해 나갈 것이다. 


그리고 추론의 영역에서 인간의 성능을 뛰어넘게 된다면 더 막강한 퍼포먼스를 보여주게 될 것이라고 생각한다. 


두 번째는 인공지능 추론의 영역에서 들어가게 될 비용이 만만치 않을 것이라는 점이다. 


인공지능에 들어가는 비용은 크게 두 가지로 나뉘게 되는데 학습과 추론의 영역으로 나뉘게 된다. 


학습의 영역은 들어가는 비용이 사용자가 많아진다고 해서 증가하지는 않는다. 


이 때문에 인공지능의 학습양에 따라서만 비용이 증가하게 되고 비용은 선형적으로 증가하게 된다. 


반면에 추론의 영역은 사용자가 많으면 많을수록 증가하게 되고 반복되면 될수록 더 많이 비용이 들어가게 된다. 


향후 인공지능의 추론을 위해서 더 많은 자원이 들어가데 될 것인데 이는 생성형 AI와 함께 폭발적으로 비용이 증가할 것으로 예상되고 있다. 


세 번째는 초거대 AI는 국가 대항전 초거대 기업 간의 치열한 전쟁이 지속될 것이다. 


인공지능의 활용성이 높아지고 기술이 발전할수록 결국 인공지능 간의 격차는 점점 더 커지게 될 것이다. 


예전에는 인간과 인공지능의 대결이었다면 앞으로는 인공지능과 인공지능의 대결이 될 것이다. 


그리고 어떤 인공지능이 더 우월할 것인지에 대한 논의가 시작될 수 있다. 


최고의 인공지능은 모든 기술에 정점에 서게 될 것이고 소수의 인공지능이 우리 삶의 모든 영향을 주게 될 것이다. 


이 때문에 인공지능에 대한 투자는 막대한 비용이 들어가게 되더라도 멈출 수가 없을 것이고 점점 더 가속화되게 될 것이라고 생각한다. 


이 분야는 앞으로 모든 분야에 걸쳐서 진행이 될 것이라고 생각한다. 


혹자는 예전 IT 버블과 같은 너무 과한 기대감이 올 수 있다고 생각할지 모르지만 지금 인공지능의 성장세를 보면 그와는 다른 양상이라고 생각한다.


인공지능은 끝까지 개발을 멈추지 않을 것이고 원하는 수준에 다다를 때까지 인공지능 투자에 박차를 가할 것이라고 생각한다.


이를 위해서 더 다양한 기술들도 복합적으로 발생이 될 것이라고 생각한다. 


마지막 네 번째는 인공지능을 활용한 초개인화의 시대가 올 것이라는 점이다 


인공지능이 어떻게 활용될 것인가에 대한 이야기는 많다. 


그렇지만 인공지능은 지금 우리가 예상하는 것보다 더 많은 분야에서 더 다양하게 활용이 될 것이다. 


그 이유는 초개인화의 인공지능이 발생이 될 것이기 때문이다. 


많은 사람들이 우수한 인공지능을 활용해 자신이 꿈꾸는 세상에서 자신이 원하는 모든 것을 이루는 시대가 올 것 같다는 생각이 든다.


이런 인공지능의 개발을 위해서 빅테크 기업들은 막대한 돈을 투자하고 있고 더 많은 자원을 활용하게 될 것이다.


앞으로 인공지능의 발전에 대해서 더더욱 관심을 가지고 지켜볼 수 있도록 하자. 


참고 도서 : AI시대의 부의 지도 ( 오순영 )


박천욱님의 더 많은 생각이 궁금하다면?​

✅ https://brunch.co.kr/@grandmer

박천욱 에디터
글쓴이

박천욱 에디터

1만권 독서하고 전세계를 여행하자

답글 남기기

박천욱-1-e1657525526731-150x150

박천욱 에디터

에디터

다른 아티클 보기

AX 인공지능 대전환

기분이 태도가 되지 말자

TSMC, 세계 1위의 비밀

아직 구독 전이신가요?
구독하고 더 많은 콘텐츠를 확인해보세요.

이름/회사명

마케터에게 제안하기

마케팅, 강연, 출판, 프로젝트 제안을 해보세요