오픈AI가 갑자기 새로운 AI모델을 공개했어요.
OpenAI-o1 수학올림피아드에서 83점 획득 (GPT-4o는 13점)
o1은 반응하기 전에 생각하는 데 더 많은 시간을 할애하도록 설계되었다고 합니다. 대부분의 생성형 AI가 학습하는 통상적인 방식은 입력 매개변수와 데이터를 늘리는 것인데, 이런 방법은 거대한 컴퓨팅 파워(GPU)가 필수적입니다. 이에 반해 o1은 인공지능에게 사고할 시간을 더 할애해주는 방식으로 성능을 발전시키는 것이죠.
사람처럼 질문에 반응하기 전에 문제를 생각하는 데 더 많은 시간을 할애하도록 훈련시켰더니 사고 과정을 개선하고, 다양한 전략을 시도하고, 실수를 인식하는 법을 배우더랍니다. 이런 것을 추론모델이라고 합니다. 기존 모델과의 중요한 차이점은 AI에게 추론만을 가르쳤음에도 불구하고 능력이 저절로 가능해 진 것이다 라는 점입니다.
물리학, 화학, 생물학에서 박사 과정 학생과 비슷한 성과를 보이고, 수학과 코딩에서도 뛰어난 성과를 보였다고 합니다. 국제 수학 올림피아드(IMO) 예선 시험에서 GPT-4o는 문제의 13%만을 올바르게 풀었고 o1은 83%를 풀었다고 합니다.
ChatGPT Plus 및 Team 사용자는 지금 부터 사용가능
지금 바로 ChatGPT에서 o1 을 사용할 수 있습니다. o1은 두가지 버전이 있는데 o1-preview의 경우 30개 메시지, o1-mini의 경우 50개의 메시지까지 사용할 수 있습니다.
데모 영상에 등장한 한글
한국에서 화제가 되는 ‘에어비앤비 체’라는 것이 있습니다. 해외여행 중 방문한 숙소나 식당에 안좋은 후기를 남길 때 일부러 자음 모음을 분해하거나 이상하게 재조합해서 한국인들끼리만 이해할 수 있도록 한글을 변형해서 사용하는 것이죠. 아래 캡쳐 이미지의 한글을 읽어보세요. 한국인들이라면 읽고 이해할 수 있을거에요. 하지만 외국인과 번역기는 알아들을 수 없는 의미없는 말이죠. 일종의 패턴이 없는 ‘암호’입니다.
그런데 OpenAI o1에게 에어비앤비체로 일부러 잘못된 문장을 입력했음에도 스스로 추론해서 원래 의미를 찾아 냈습니다.
이 데모는 AI가 더 이상 입력된 데이터에 기반한 단순한 명령 실행에서 머무르지 않고, ‘인간의 뇌 처럼’ 추론과 실수를 통해 문제 해결을 통해 처리할 수 있는 단계로 나아가고 있음을 보여줍니다.