엔비디아, 8세대 AI개발키트 '텐서RT8' 공개

선한결 2021. 7. 20. 22:01
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

엔비디아가 20일 텐서RT 8를 공개했다.

엔비디아에 따르면 텐서RT 8은 텐서RT 7에 비해 성능이 두 배 빠르다.

싯다르트 샤르마 엔비디아 기술마케팅매니저는 "AI 언어처리 알고리즘이 점점 복잡해지고 다양해지면서 앱 가속화를 위한 유연한 컴파일러의 필요성도 함께 높아졌다"며 "텐서RT 8은 정확성을 보장하면서 지연도는 낮췄다"고 말했다.

엔비디아는 텐서RT가 AI 기반 추천 서비스 품질을 개선할 수 있다고 기대하고 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.


엔비디아가 20일 텐서RT 8를 공개했다. 텐서RT는 엔비디아의 추론 소프트웨어 개발 키트다. 실시간 대화형 인공지능(AI)을 지원한다. 

텐서RT 8은 텐서RT의 8세대 버전이다. 캐리 브리스키 엔비디아 AI 소프트웨어 제품관리 선임본부장은 “엔비디아 AI 소프트웨어에선 상당한 이정표 격”이라며 “각 분야에 적합한 프레임워크를 기반으로 빠르게 AI 기술을 활용하려는 이들을 도울 것”이라고 말했다. 

엔비디아에 따르면 텐서RT 8은 텐서RT 7에 비해 성능이 두 배 빠르다. 정확도도 높아졌다. 구글의 다국어 AI 언어모델 BERT 추론 처리 속도는 텐서RT 7에 비해 2.5배 빠르다. 지연시간을 밀리초 단위로 낮췄다. 

AI 모델의 규모에 따라 유연하게 정보를 처리하도록 하는 QAT 기술을 적용한 것도 특징이다. 이전보다 두 배 더 방대한 모델을 써도 비슷한 지연도, 비슷한 정확도로 정보를 처리할 수 있다는 설명이다. 싯다르트 샤르마 엔비디아 기술마케팅매니저는 “AI 언어처리 알고리즘이 점점 복잡해지고 다양해지면서 앱 가속화를 위한 유연한 컴파일러의 필요성도 함께 높아졌다”며 “텐서RT 8은 정확성을 보장하면서 지연도는 낮췄다”고 말했다. 

엔비디아는 텐서RT가 AI 기반 추천 서비스 품질을 개선할 수 있다고 기대하고 있다. 이커머스, 소셜미디어, 온라인동영상서비스(OTT) 등에서 활용도가 높다는 전망이다. 샤르마 매니저는 “텐서RT 8은 이용자가 하는 말의 뉘앙스와 맥락, 의미를 더 잘 알아들어 적합한 결과를 도출할 수 있다”며 “AI 챗봇, 추천서비스, 검색서비스 등 대화형 AI 어플리케이션에 신기원을 가져올 것”이라고 말했다. 그는 “데이터센터나 의료이미지 분석 등에도 텐서RT를 쓸 수 있다”고 덧붙였다.

엔비디아는 이날 텐서RT 생태계가 커지고 있다고도 발표했다. 작년 기준 다운로드 누적 건수가 250만건, 쓰는 개발자 수는 35만명 가량이다. 국내 기업중엔 SK텔레콤, 네이버, LG 등이 클라우드와 엣지 시스템에 텐서RT를 활용하고 있다. 포드, GE헬스케어, 바이트댄스 등도 텐서RT를 기반으로 서비스를 운영한다. 자연어처리 기업 허깅페이스도 텐서RT를 쓰고 있다.

선한결 기자 always@hankyung.com

경제지 네이버 구독 첫 400만, 한국경제 받아보세요
한국경제신문과 WSJ, 모바일한경으로 보세요

Copyright © 한국경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?