챗GPT(Chat GPT)를 만든 오픈AI가 3일 새로운 심층 추론모델 '딥 리서치(Deep Research)'를 출시했다. 샘 올트먼 CEO(최고경영자)가 일본을 방문하던 도중 회사가 생중계로 깜짝 발표하는 방식으로 공개한 것. 최근 중국의 AI 스타트업 '딥시크'의 등장을 의식한 듯 오픈AI는 딥리서치가 가장 어려운 AI 성능 평가에서 딥시크의 추론모델 R1 대비 3배 높은 정확도를 자랑한다고 홍보했다.
오픈AI는 이날 올트먼 CEO가 일본 도쿄 일정을 이어가던 중 온라인 생중계 발표로 "새로운 AI 에이전트 딥리서치를 챗GPT에 탑재했다"고 밝혔다. 오픈AI의 추론 모델 'o3'에 인터넷 검색 기능을 더한 모델이다.
오픈AI는 "챗GPT가 수백 개 온라인 소스를 찾아 분석, 종합해 연구자 수준의 포괄적인 보고서를 만든다"며 "사람이 수 시간을 들여 해야 하는 작업을 수십 분 만에 완료할 수 있다"고 설명했다.
회사는 공식 홈페이지에서 "딥리서치는 마치 연구원처럼 심층 답변과 보고서, 표·그래프 등 시각물 제작과 인터넷 심층 조사에 따른 인용자료 출처 표기까지 가능한 서비스"라며 "사용자를 대신해 독립적으로 일할 수 있는 오픈AI의 차세대 에이전트"라고 소개했다. 딥리서치는 시간을 충분히 들여 필요한 답변을 제공하도록 했다. 오픈AI는 딥리서치 작업당 5~30분가량이 소요된다고 밝혔다.
이날 오픈AI는 똑같은 질문을 받은 '딥리서치'와 기존 모델인 '챗GPT-4o'가 낸 답변을 각각 공개하며 사용자들의 이해를 도왔다. 질문은 △전세계 모바일 시장 분석(비즈니스)△키워드로 TV드라마 찾기(건초 속 바늘찾기) △논문 분석(의학)△완벽한 스노보드 찾기(쇼핑) △스포츠선수 평균 수명(일반지식) 등 다양한 분야를 망라했다.
오픈AI는 "모든 출력은 명확한 인용문과 사고 요약과 함께 완벽하게 문서화돼 정보를 참조하고 검증하기 쉽다"며 "여러 웹사이트를 탐색해야 하는 틈새 시장의 비직관적인 정보를 찾는 데 효과적"이라고 했다.
특히 딥리서치 기능은 AI 모델의 가장 까다로운 벤치마크(성능실험)로 평가받는 스케일AI의 '인류의 마지막 시험' 벤치마크에서 26.6%의 정확도를 기록한 것으로 전해진다. GPT-4o가 3.3%, 추론 모델인 오픈AI o1과 딥시크 R1이 각각 9.1%와 9.4%를 기록한 것과 비교하면 기능이 크게 향상된 것. 오픈AI는 "오픈AI o1과 비교했을 때 딥리서치가 화학, 인문학과 사회과학, 수학에서 가장 큰 상승폭을 보였다"고 부연했다.
딥리서치 기능은 월 200달러 요금제인 챗GPT 프로 이용자를 대상으로 이날부터 서비스된다. 월 최대 질문 한도는 100개다. 이후 플러스 및 비즈니스 사용자로 서비스 대상을 확대한다. 오픈AI는 "딥리서치는 매우 컴퓨팅 집약적으로 많은 연산 자원이 필요하다"며 "더 작은 모델로 고품질의 결과를 제공하는 더 빠르고 비용 효율적인 버전을 출시하기 위해 노력 중"이라고 했다.
한편 샘 올트먼 CEO는 도쿄에서 손정의 소프트뱅크그룹 회장과 함께 일본판 AI 인프라 구축계획을 발표한다. 니혼게이자이 신문에 따르면 두 사람은 일본 AI스타트업 500개사를 참여시킬 계획이다.
오픈AI는 이날 올트먼 CEO가 일본 도쿄 일정을 이어가던 중 온라인 생중계 발표로 "새로운 AI 에이전트 딥리서치를 챗GPT에 탑재했다"고 밝혔다. 오픈AI의 추론 모델 'o3'에 인터넷 검색 기능을 더한 모델이다.
오픈AI는 "챗GPT가 수백 개 온라인 소스를 찾아 분석, 종합해 연구자 수준의 포괄적인 보고서를 만든다"며 "사람이 수 시간을 들여 해야 하는 작업을 수십 분 만에 완료할 수 있다"고 설명했다.
회사는 공식 홈페이지에서 "딥리서치는 마치 연구원처럼 심층 답변과 보고서, 표·그래프 등 시각물 제작과 인터넷 심층 조사에 따른 인용자료 출처 표기까지 가능한 서비스"라며 "사용자를 대신해 독립적으로 일할 수 있는 오픈AI의 차세대 에이전트"라고 소개했다. 딥리서치는 시간을 충분히 들여 필요한 답변을 제공하도록 했다. 오픈AI는 딥리서치 작업당 5~30분가량이 소요된다고 밝혔다.
이날 오픈AI는 똑같은 질문을 받은 '딥리서치'와 기존 모델인 '챗GPT-4o'가 낸 답변을 각각 공개하며 사용자들의 이해를 도왔다. 질문은 △전세계 모바일 시장 분석(비즈니스)△키워드로 TV드라마 찾기(건초 속 바늘찾기) △논문 분석(의학)△완벽한 스노보드 찾기(쇼핑) △스포츠선수 평균 수명(일반지식) 등 다양한 분야를 망라했다.
오픈AI는 "모든 출력은 명확한 인용문과 사고 요약과 함께 완벽하게 문서화돼 정보를 참조하고 검증하기 쉽다"며 "여러 웹사이트를 탐색해야 하는 틈새 시장의 비직관적인 정보를 찾는 데 효과적"이라고 했다.
특히 딥리서치 기능은 AI 모델의 가장 까다로운 벤치마크(성능실험)로 평가받는 스케일AI의 '인류의 마지막 시험' 벤치마크에서 26.6%의 정확도를 기록한 것으로 전해진다. GPT-4o가 3.3%, 추론 모델인 오픈AI o1과 딥시크 R1이 각각 9.1%와 9.4%를 기록한 것과 비교하면 기능이 크게 향상된 것. 오픈AI는 "오픈AI o1과 비교했을 때 딥리서치가 화학, 인문학과 사회과학, 수학에서 가장 큰 상승폭을 보였다"고 부연했다.
딥리서치 기능은 월 200달러 요금제인 챗GPT 프로 이용자를 대상으로 이날부터 서비스된다. 월 최대 질문 한도는 100개다. 이후 플러스 및 비즈니스 사용자로 서비스 대상을 확대한다. 오픈AI는 "딥리서치는 매우 컴퓨팅 집약적으로 많은 연산 자원이 필요하다"며 "더 작은 모델로 고품질의 결과를 제공하는 더 빠르고 비용 효율적인 버전을 출시하기 위해 노력 중"이라고 했다.
한편 샘 올트먼 CEO는 도쿄에서 손정의 소프트뱅크그룹 회장과 함께 일본판 AI 인프라 구축계획을 발표한다. 니혼게이자이 신문에 따르면 두 사람은 일본 AI스타트업 500개사를 참여시킬 계획이다.
'오픈AI' 기업 주요 기사
- 기사 이미지 오픈AI 샘 올트먼 "스마트폰 대체할 AI 전용 단말기 만든다"
- 기사 이미지 오픈AI·오라클·소뱅, 720조 투입해 AI합작사 '스타게이트' 설립
- 기사 이미지 "오픈AI 대항마" 전문가에 인기있는 앤트로픽, 기업가치 3배↑
- 기자 사진 김하늬 기자
<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>