Tech Mistral이 코딱지(Code)를 출시, 코딱지는 코드를 위한 첫 번째 생성형 AI 모델

Mistral이 코딱지(Code)를 출시, 코딱지는 코드를 위한 첫 번째 생성형 AI 모델

마이크로소프트에서 후원하는 프랑스 AI 스타트업 Mistral은 60억 달러로 가치가 인정받았습니다. 이 회사가 코딩을 위한 첫 번째 생성형 AI 모델인 Codestral을 출시했습니다.

다른 코드 생성 모델과 마찬가지로 Codestral은 개발자들이 코드를 작성하고 상호 작용하는 데 도움이 되도록 설계되었습니다. Mistral의 블로그 글에서 명시한 바에 따르면 Codestral은 Python, Java, C++ 및 JavaScript 등 80개 이상의 프로그래밍 언어로 교육을 받았습니다. Codestral은 코드 기능을 완성하거나 테스트를 작성하고, 부분 코드를 '채우는' 일을 할 뿐만 아니라 코드베이스에 대한 질문에도 영어로 대답할 수 있습니다.

Mistral은 이 모델을 '공개'로 설명하지만, 이것은 논란의 여지가 있습니다. 스타트업의 라이센스에 따르면 Codestral 및 그 결과물을 상업적인 활동에 사용하는 것이 금지되어 있습니다. '개발'용으로는 예외가 있지만, 심지어 그것에도 '회사의 비즈니스 활동과 관련된 직원의 내부 사용'을 명시적으로 금지하는 조항이 있습니다.

그 이유는 Codestral이 저작권이 있는 콘텐츠를 일부 사용하여 교육을 받았을 수도 있습니다. Mistral은 이를 블로그 글에서 확인하거나 부인하지 않았지만, 이는 놀라운 것은 아닙니다. 과거의 교육 데이터 세트에 저작권이 있는 데이터가 포함되어 있다는 증거가 있습니다.

언제나 문제의 소지가 있는 Codestral이지만 가치 없는 것은 아닐 수 있습니다. 220억 개의 파라미터로 이루어진 이 모델은 실행하기 위해서는 강력한 PC가 필요합니다. (파라미터는 AI 모델의 문제 해결 능력을 정의하는데, 예를 들어 텍스트를 분석하고 생성하는 것) 일부 벤치마크에 의하면 경쟁 모델을 이긴다고 합니다 (신뢰할 수 없는 것으로 알려져 있습니다) 하지만 그 정도만이라는 것입니다.

이미지 제공: Mistral

대부분의 개발자들에게는 부적합하고 성능 향상 면에서 단계적인 Codestral이지만, 프로그래밍 보조로서 코드 생성 모델에 의존하는 지혜에 대한 논쟁을 격려할 것으로 예상됩니다.

개발자들은 최소한 어떤 코딩 작업에 대해 생성형 AI 도구를 환영하고 있습니다. 2023년 6월 Stack Overflow의 여론 조사에 따르면 개발자들 중 44%는 현재 개발 프로세스에서 AI 도구를 사용하고 있으며, 26%는 곧 사용할 예정입니다. 그러나 이러한 도구에는 명백한 결함이 있습니다.

GitClear가 지난 몇 년 동안 프로젝트 저장소에 커밋된 1억 5천만 줄 이상의 코드 분석에서, 생성형 AI 개발 도구가 코드베이스에 더 많은 잘못된 코드를 밀어 넣고 있다는 결과를 발견했습니다. 또 다른 곳에서는 보안 연구원들이 이러한 도구가 소프트웨어 프로젝트의 기존 버그와 보안 문제를 확대시킬 수 있다고 경고했습니다; Purdue의 연구에 따르면 OpenAI의 ChatGPT가 프로그래밍 질문에 대한 답의 반 이상이 잘못된 것으로 밝혀졌습니다.

이것은 Mistral과 기타 회사들이 그들의 모델을 상업화하고(그들의 모델로 인지를 확보하기 위해) 시도하는 것을 막지 않을 것입니다. Mistral은 이번 아침에 Codestral의 호스팅 버전인 Le Chat 대화형 AI 플랫폼과 유료 API를 시작했습니다. Mistral은 또한 Codestral을 LlamaIndex, LangChain, Continue.dev 및 Tabnine과 같은 앱 프레임워크 및 개발 환경에 내장하기 위해 노력했다고 합니다.