Tech Etched는 한 가지 유형의 모델만 실행하는 AI 칩을 구축 중입니다

Etched는 한 가지 유형의 모델만 실행하는 AI 칩을 구축 중입니다

생성 AI가 점점 많은 산업에 영향을 미치면서, 모델을 실행하는 칩을 생산하는 기업들은 엄청난 혜택을 누리고 있습니다. 특히 AI 칩 시장에서 70%에서 95%를 차지하는 Nvidia는 거대한 영향력을 행사하고 있습니다. Meta에서 Microsoft까지 클라우드 공급업체들은 근본적인 AI에서 뒤쳐지지 않기 위해 Nvidia GPU에 수십억 달러를 투자하고 있습니다.

생성 AI 공급업체들은 눈치채기 어려운 이유로 인해 현재 상황에 만족하지 않습니다. 그들의 성공의 큰 부분이 주도적인 칩 제조업체들의 변덕에 의존하기 때문입니다. 따라서 기회주의적인 벤처 투자자들과 함께 AI 칩 시장의 선두기업을 도전할 유망한 신생 기업을 찾고 있습니다.

Etched는 테이블에 자리를 찾으려는 여러 대체 칩 회사 중 하나이지만, 가장 흥미로운 기업 중 하나이기도 합니다. 단 2년 만의 Etched는 옥스토ML 및 Xnor.ai 출신인 Gavin Uberti와 Chris Zhu(그리고 Robert Wachen과 전 Cypress Semiconductor CTO Mark Ross)가 결합하여 한 가지 일만 할 수 있는 칩을 만들기로 결정했습니다.

이것은 불길하지 않습니다. 다양한 스타트업 및 기술 거인들이 오직 AI 모델만 실행하는 칩, 즉 웨이브 칩을 개발 중이거나 이미 보유하고 있습니다. Meta에는 MTIA, Amazon에는 Graviton 및 Inferentia 등이 있습니다. 그러나 Etched의 칩은 transformers라는 한 가지 유형의 모델만 실행한다는 점에서 독특합니다.

구글 연구팀이 2017년 제안한 transformer는 현재 가장 주된 생성 AI 모델 아키텍처로 자리매김하고 있습니다.

Transformers는 OpenAI의 비디오 생성 모델 소라의 기반이 되었으며, Anthropic의 클로드와 Google의 Gemini와 같은 텍스트 생성 모델, 그리고 최신 버전의 Stable Diffusion과 같은 아트 생성기에도 사용됩니다.

“2022년, 우리는 transformers가 세계를 지배할 것이라는 것에 베팅했습니다,” Etched의 CEO인 Uberti는 TechCrunch에 인터뷰에서 전했습니다. “AI의 진화 과정에서 특수 목적의 칩들이 범용 GPU보다 더 나은 성능을 발휘할 것이 불가피하다는 것을 우리는 알고 있으며, 세계의 기술 결정자들 또한 이를 알고 있습니다.”

Etched의 Sohu라는 칩은 특정 응용 프로그램에 맞춘 ASIC(특정용도 집적 회로)로, transformer를 실행하기 위해 설계되었습니다. TSMC의 4nm 공정을 사용하여 제조된 Sohu는 Uberti에 따르면 GPU 및 기타 일반 AI 칩보다 훨씬 더 나은 추론 성능을 제공하면서 더 적은 에너지를 소모합니다.

“Sohu는 텍스트, 이미지 및 비디오 transformer를 실행할 때 Nvidia의 다음 세대 Blackwell GB200 GPU보다 손쉽고 저렴합니다,”라고 Uberti는 말했습니다. “하나의 Sohu 서버가 160개의 H100 GPU를 대체합니다 ... Sohu는 특수 칩이 필요한 비즈니스 리더들에게 더 저렴하고 효율적이며 환경 친화적인 옵션일 것입니다.”

Sohu가 이를 모두 어떻게 달성하는 것일까요? 몇 가지 방법이 있지만, 가장 명백하고 직감적인 방법은 간소화된 추론 하드웨어 및 소프트웨어 파이프라인입니다. Sohu는 transformer를 실행하지 않으므로, Etched 팀은 transformer와 관련이 없는 하드웨어 구성 요소를 없애고 일반적이지 않은 transformer를 배포하고 실행하기 위해 전통적으로 사용되던 소프트웨어 오버헤드를 줄일 수 있었습니다.

Etched가 메타의 오픈 모델 Llama 70B를 실행할 때 하드웨어 성능을 비교한 그래프.
이미지 크레딧: Etched

Etched는 생성 AI 인프라 경쟁에서 전환점에 도달했습니다. 비용 문제 외에도 현재 규모에 맞게 모델을 실행하기 위해 필요한 GPU 및 다른 하드웨어 구성 요소는 위험하게 에너지를 많이 소비합니다.

골드만 삭스는 2030년까지 AI가 데이터 센터 전기 수요를 160% 증가시킬 것으로 예측하며, 이는 온실 가스 배출량의 상당한 증가에 기여할 것으로 예상됩니다. 한편 UC 리버사이드의 연구원들은 전 세계적인 AI 사용량이 2027년까지 데이터 센터가 1조 1000억~1조 7000억 갤론의 신선한 물을 흡수할 수 있다고 추정하며, 이는 지역 자원에 영향을 미칠 것입니다. (많은 데이터 센터가 서버 냉각을 위해 물을 사용합니다.)

Uberti는 Sohu를 산업의 소비 문제에 대한 해결책으로 낙관적으로 또는 과감하게 제시합니다.

“간단히 말해, 우리의 미래 고객들은 Sohu로 전환하지 않을 수 없을 것입니다,”라고 Uberti는 말했습니다. “기업들은 AI 제품을 개발하려는 노력에서 속도와 비용이 존재할 수밖에 없습니다.”

그러나 Etched는 다수의 다른 기업들이 잇따라 뒤따르고 있는 가운데 성공할 수 있을까요?

현재 Etched는 직접적인 경쟁자가 없지만, AI 칩 스타트업 Perceive가 transformer용 하드웨어 가속화를 갖춘 프로세서를 최근에 선보였습니다. 그로쿠(Groq)는 또한 그의 ASIC에 transformer 특화 최적화에 큰 투자를 했습니다.

경쟁은 제하며, 만약 언젠가 transformers가 인기를 잃는다면 어떨까요? Uberti는 그런 경우에는 당연히 새로운 칩을 설계할 것이라고 말합니다. 그렇게 되면 그동안 Sohu를 완성하기 위해 얼마나 오랜 시간이 걸렸는지 고려해보면 이는 상당히 극단적인 대책일 것입니다.

하지만 이러한 우려들은 투자자들을 매혹시켜 Etched에 엄청난 금액을 투자하게 되었습니다.

오늘, Etched는 Primary Venture Partners와 Positive Sum Ventures가 공동으로 이끌어간 1억 2000만 달러의 시리즈 A 펀딩 라운드를 마감했다고 발표했습니다. Etched가 지금까지 모금한 총액을 1억 2536만 달러까지 늘리며, Peter Thiel(Uberti, Zhu 및 Wachen은 Thiel Fellowship 출신), GitHub CEO Thomas Dohmke, Cruise(그리고 the Bot Company)의 공동 창업자인 Kyle Vogt, Quora의 공동 창업자인 Charlie Cheever를 포함한 중견 천사 투자자들이 참여했습니다.

이 투자자들은 아마도 Etched가 서버를 판매하는 사업을 성공적으로 확장할 가능성이 있는 것으로 보고 있을 것입니다. 그리고 아마 그럴 수도 있습니다 - Uberti는 아직 고객들 중 일부가 현재까지 수십억 달러의 하드웨어를 예약했다고 말했습니다. 고객들이 온라인 대화식 놀이터를 통해 Sohu를 미리 살펴볼 수 있는 예정인 Sohu Developer Cloud의 곧 발매가 추가적인 판매를 촉진할 것으로 Uberti는 시사했습니다.

그러나 아직 Etched와 35명의 팀을 미래로 이끌어 갈 수 있는 충분한 조직 구조인지 여전히 너무 이른 것 같습니다. AI 칩 세그먼트는 어떤 때보다 냉혹할 수 있습니다 - AI 칩 스타트업인 Mythic 및 Graphcore의 유명한 사실패 사례 및 관련 AI 칩 벤처 펀딩의 급락을 참조하십시오.

그러나 Uberti는 강력한 세일즈 문장을 만들었습니다: “비디오 생성, 오디오 대 오디오 모달리티, 로봇공학 및 기타 미래 AI 사용 사례는 Sohu와 같이 더 빠른 칩으로만 가능할 것입니다. 인프라가 확장될 수 있을지 여부에 따라 전체 AI 기술의 미래가 결정될 것입니다.”