요즘 새롭게 나온 말이 AI 에이전트입니다. AI 기술을 활용해 사람을 대신하여 특정 작업을 수행하는 소프트웨어를 말합니다.

예를 들어, 자율주행차의 AI일 수도 있고, AI 비서일 수도 있고, 스마트 홈 장치일 수도 있습니다.

AI 에이전트라고 불리는 수준에 도달하기 위해서는 데이터 통합, 자율성, 지능, 추론 능력, 상호 작용 등이 가능해야 합니다.

대표적으로 테슬라의 자율주행은 수십억 마일의 데이터를 활용해 훈련하고 있고, 코드가 아닌 엔드투엔드 방식으로 스스로 보고 판단하는 자율성을 갖추었고, 데이터 센터와 자동차 간에 상호 작용이 가능합니다. 나중엔 분산형 컴퓨터 시스템도 구축됩니다.





AI 관련주는 많지만, 대부분은 사라질 것이고 소수의 기업만 남게 됩니다. 사람들은 항상 최고를 좋아하니까요.

자율주행처럼 사람 대신 주문을 받고, 사람 대신 상담을 하며 문제를 해결해주는 AI 에이전트가 등장하고 있습니다. 아직은 정말 작은 시장이지만, AGI라고 불리는 수준에 도달하면 모든 곳에 AI 에이전트가 존재할 겁니다.

사운드하운드AI는 음성 인식, 자연어 처리, 음악 식별 기술을 가진 기업입니다. 사용자가 노래를 식별하고, 음성 명령으로 정보를 검색하고, 대화형 음성 인터페이스를 통해 기기와 상호작용하는 애플리케이션을 개발합니다. 특히 음악 인식 기술은 최고라고 하네요.

Shazam이라는 어플을 많이 사용했었는데, 사운드하운드AI는 노래를 흥얼거리거나 콧노래를 부르거나 일부 가사를 말하면 곡을 식별하고, 가사를 실시간으로 표시하며, 제목, 아티스트, 앨범 등의 정보를 제공합니다. 딥 러닝 기술로 높은 정확도를 가지고 있고, 간편한 인터페이스를 제공합니다.

현재 음악 인식 시장에서 20% 시장 점유율을 보유하고 있고, B2B 라이선싱과 광고, 프리미엄 구독 서비스를 통해 수익을 창출합니다. 삼성, 애플, 화웨이, 스포티파이, 애플 뮤직, 유튜브 뮤직, BMW, 벤츠, 현대 등 굵직한 고객사도 많습니다.

사운드하운드AI는 2005년 키야크 비타니와 마크 마이어가 창업했고, 처음엔 음악 인식 기술로 유명해지면서 Shazam과 경쟁했지만 점점 음성 인식 기술로 영역을 확장하고 있습니다. 

다이내믹 인터랙션이라는 플랫폼을 통해 레스토랑 주문 시스템이나 차량 내 애플리케이션에서의 자연스러운 대화를 지원합니다.

ChatGPT, 구글, xAI의 Grok과 경쟁해야 합니다. 테슬라는 Grok을 탑재하여 자율주행에 이은 AI 에이전트를 추가하려고 하죠. 필연적인 미래입니다.




사운드하운드의 Employee Assist 솔루션이 AI 최적 활용 부문에서 2년 연속 수상했다고 합니다. 레스토랑 직원은 음식, 업무, 기타 운영에 대한 정보를 음성 AI를 통해 얻을 수 있고, 고객도 마찬가지입니다.

음성 인식 기술 자체의 시장규모가 어느정도인지 자세히 알아볼 필요가 있는데, 사운드하운드의 매출은 80~90%씨 증가하며 3Q24 매출은 2,500만 달러였습니다. 많은 기업들이 사람 대신 음성 AI 서비스의 필요성을 느끼고 있습니다. 25년에 흑자전환 가능성도 높습니다.

연간 매출은 대략 1억 달러 정도인데, 현재 시가총액은 80억 달러입니다. 주가는 상당히 오른 상태이기 때문에 좀 더 여유를 가지고 기다릴 필요는 있어 보입니다.