Tech

이번 주의 AI: 애플이 어떻게 소세지를 만드는지 말하지 않습니다

인터랙티브 뉴스

Sunday, September 29 2024

안녕하세요, 여러분, 그리고 TechCrunch의 정기 AI 뉴스레터에 오신 것을 환영합니다.

AI에서 이번 주에는 Apple이 주목을 끌었습니다.

애플은 쿠퍼티노의 전 세계 개발자 대회(WWDC)에서 Apple Intelligence를 공개했습니다. Apple Intelligence는 generative AI로의 생태계 전반에 걸친 기대되던 푸시입니다. Apple Intelligence는 업그레이드된 Siri부터 AI 생성 이모티콘, 사진 편집 도구까지 다양한 기능을 구동합니다.

회사는 Apple Intelligence가 안전을 기반으로 구축되고 매우 개인화된 경험을 약속했습니다.

월요일의 키노트에서 CEO 팀 쿡은 "이것은 당신을 이해하고 당신의 일상, 관계, 소통 등과 같이 당신의 개인적 맥락에 근간을 둬야 합니다,"라고 강조했습니다. "이 모든 것은 인공지능을 넘어서는 개인적 인텔리전스이며, 이것이 애플의 다음 큰 발걸음입니다."

Apple Intelligence는 고전적으로 Apple스러운 방식으로, 분명하고 직관적으로 유용한 기능 뒤에 있는 기술적 세부 정보를 숨깁니다. (쿡이 "대규모 언어 모델"이라는 구문을 한 번도 발화시키지 않았습니다.) 하지만 저는 AI의 어둠에 대해 쓰는 사람으로써, 애플이 어떻게 소세지를 만드는지에 대해 이번 한 번만 더 투명하게 했기를 바랍니다.

예를 들어, Apple의 모델 훈련 방법을 살펴보겠습니다. 애플은 AI 모델을 훈련하는 방법에 대해 라이선스를 받은 데이터 세트와 공개 웹의 조합을 사용한다는 것을 블로그 글에서 밝혔습니다. 발행자들은 향후 훈련에서 선택적으로 방출할 수 있습니다. 그러나 당신이 작품에 대해 호기심이 생긴 예술가라면, Apple의 초기 훈련에서 당신의 작품이 수집되었는지 궁금할 수도 있습니다. 힘들게 해보세요 - 입이 열리지 않습니다.

이 비밀은 경쟁적인 이유로 일 수도 있습니다. 그러나 나는 Apple을 저작권과 관련된 법적 도전으로부터 보호하기 위해이것을 예상했을 것입니다. 법원은 애플과 같은 공급 업체가 공개 데이터에 대해 보상이나 해당 데이터의 창작자들에게 크레딧을 제공 할 권리가 있는지 여부 - 다시 말해 생성적 AI에 공정 사용 규정이 적용되는지 여부 - 를 아직 결정하지 않았습니다.

Apple이 상식적인 기술 정책의 옹호자로 자주 자화하는 것을 보면, 이 공정 사용 주장을 때로는 암시적으로 받아들이는 것은 조금 실망스럽습니다. 마케팅의 재에 의해 가려진 채, Apple은 AI에 대해 책임감 있는 균형 잡힌 접근을 취하고 있다고 주장할 수 있으며 아마도 허가 없이 창작자의 작업을 훈련한 것일지도 모릅니다.

작은 설명이 큰 도움이 될 수 있습니다. 우리는 하나를 받지 못했다는 것은 안타깝습니다 - 그리고 소송(또는 두 개)이 없는 한 곧 얻을 수 있다고는 기대하지 않습니다.

뉴스

Apple의 주요 AI 기능: 우리는 이번 주에 WWDC 키노트에서 Apple이 발표한 최고의 AI 기능을 모았습니다, 업그레이드된 Siri부터 OpenAI의 ChatGPT와의 깊은 통합까지.

OpenAI가 임원들을 고용: OpenAI는 이번 주에 전지역 소셜 네트워크 Nextdoor의 이전 CEO인 Sarah Friar를 최고 재무 책임자로, 이전 인스타그램 및 트위터에서 제품 개발을 이끈 Kevin Weil을 최고 제품 책임자로 고용했습니다.

AI가 더 많은 이메일로: 이번 주에 Yahoo(TechCrunch의 부모 회사)가 새로운 AI 기능을 갖춘 YahooMail을 업데이트했습니다. 이 기능에는 이메일의 AI 생성 요약이 포함되어 있습니다. Google은 최근 유사한 생성 요약 기능을 소개했지만 구독 요금이 부과됩니다.

논란의 견해: Carnegie Mellon의 최근 연구에 따르면 모든 AI 모델이 어떻게 극성 있는 주제를 다루는지에 따라 차이가 있습니다.

사운드 생성기: AI 기반 예술 생성기 Stable Diffusion을 만든 스타트업 Stability AI는 로열티 무료 녹음을 훈련한 것으로 주장하는 소리와 노래를 생성하기 위한 오픈 AI 모델을 공개했습니다.

주간 연구 논문

Google은 개인 건강을 위한 생성 AI 모델을 구축할 수 있다고 생각합니다 - 또는 적어도 그 방향으로의 예비 단계를 취할 수 있다고 생각합니다.

Google의 공식 AI 블로그에서 소개 된 새 논문에서 Google의 연구자들은 Personal Health Large Language Model 또는 PH-LLM이라고 하는 Google의 Gemini 모델 중 하나의 세련된 버전을 공개했습니다. PH-LLM은 스마트 워치와 같은 웨어러블로부터의 심박수와 호흡 속도 데이터를 읽는 부분을 통해 수면 및 피트니스를 개선하기 위한 권장 사항을 제공하기 위해 설계되었습니다.

PH-LLM이 유용한 건강 제안을 할 수 있는지 테스트하기 위해 연구자는 미국 기반 주제를 포함한 900 건 넘는 수면 및 피트니스 사례 연구를 작성했습니다. 그들은 PH-LLM이 인간 수면 전문가가 제공한 권장사항과 거의 비슷한 수면 권장사항을 제공하는 것을 발견했습니다.

연구진은 PH-LLM이 "개인 건강 응용 프로그램"을위한 생리 데이터를 맥락화하는 데 도움이 될 수 있다고 말합니다. Google Fit이 떠오르는데, PH-LLM이 최종적으로 어떤 새로운 기능을 전원 를 구동하는 데 사용될지 궁금해하지 않습니다.

주간 모델

애플은 새로운 기기 내 및 클라우드 바운드 생성 AI 모델을 소개하는 블로그 복사본에 상당히 많은 시간을 할애했습니다. 그러나 이 게시물이 얼마나 길든지, 모델의 기능에 대해 거의 아무것도 밝혀주지 않습니다. 여기에서의 최선의 시도입니다:

애플이 강조하는 이름 없는 기기 내 모델은 크기가 작으며 iPhone 15 Pro 및 Pro Max와 같은 애플 기기에서 오프라인으로 실행할 수 있도록 할 것입니다. 이는 Google의 기기 내 Gemini 모델 Gemini Nano와 비교할 수 있는 30억 파라미터를 포함하며 텍스트 생성과 같은 문제에서 그 모델의 기술을 본질적으로 정의하는 부분입니다.

한편, 서버 모델은 더 큽니다(얼마나 큰지, 애플은 정확히 말하지 않습니다). 우리가 알고있는 바로는, 이것이 기기 내 모델보다 성능이 더 뛰어납니다. 애플이 나열하는 벤치마크에서 기기 내 모델이 Microsoft의 Phi-3-mini, Mistral의 Mistral 7B, Google의 Gemma 7B와 같은 모델과 성능이 비견한다면, 서버 모델은 "OpenAI의 예전 주력 모델 GPT-3.5 Turbo와 유사하게 비교 된다"고 애플은 주장합니다.

애플은 또한 기기 내 모델과 서버 모델이 유사한 크기의 모델보다 겉으로 더 나아가기는 더 적은 경향이 있다고 말합니다. 그런 수도 있지만 - 이 작가는 애플 Intelligence를 테스트 할 기회를 얻기 전까지는 판단을 유보하고 싶습니다.

잡다한 내용

이번 주에 GPT-4o의 원조 인 GPT-1이 발표된 지 6주년을 맞았으며, 이는 OpenAI의 최신 주력 생성 AI 모델입니다. 그리고 딥러닝이 한계에 부딪힐 수 있지만, 이 분야가 얼마나 발전했는지 놀라울 정도입니다.

GPT-1을 훈련하는 데 한 달이 걸렸으며, 이는 4.5 기가바이트의 텍스트 데이터 세트 (약 7,000 권의 미 발표 소설 책을 포함한 BookCorpus)를 토대로합니다. 매개파라미터 로 GPT-1의 크기의 거의 1,500배이고 생성할 수있고 분석할 수 있는 산문에 더 나은 GPT-3는 34일이 걸렸습니다. 그런데 일단 GPT-1의 접근 방식은 훈련에 중요한 도래를 보았습니다. 이전 기법들은 엄청난 양의 수동 레이블 데이터에 의존했으며 그들의 유용성을 제한했습니다. (수동 레이블 데이터를 달자는 것은 시간이 많이 걸리고 수고스럽습니다.) 그러나 GPT-1은 그렇지 않았습니다. 다양한 작업을 수행하기위한 "배운" 미노 레이블 데이터를 주로 훈련합니다 (예 : 에세이 쓰기).

많은 전문가들은 GPT-1이 보였던 것 처럼 의미있는 패러다임 변화를 시급하게는 그렇지 않다고 보고 있습니다. 그래도 상관없이 세계는 GPT-1을 본 적이 없었습니다.