AI 산업과 응용 · 2026-05-16 · 08:00:00

AI Engineer Singapore Day 1: 장관 개막 + OpenAI / Google / Vercel / Cursor 주제

연사
AI Engineer Singapore
AI Engineer 첫 아시아 정상회의(65Labs 주최)
유형
Industry Leader

핵심 관점

AI Engineer Singapore Day 1 전체 진행: 장관 개막, NanoClaw 데모, 그리고 OpenAI, Google, Vercel, Cursor 등 선도 팀의 엔지니어링 실전 경험 공유. 싱가포르 첫 AI Engineer 정상회의, 「엔지니어 × AI」실무 레벨로 정위.

가독성 있는 자막 정렬

자막 언어: ko · 수집 날짜: 2026-05-21

토요일 아침 8시 40분에 AI Engineer Singapore의 두 번째 날 회의에 참석했습니다. 어, 소개하자면, 저는 Sherry이고 65 Labs의 회원 중 한 명입니다. 어, 우리는 싱가포르에서 가장 큰 풀뿌리 빌더 집단 중 하나입니다. 어, 사실 이번 주에 우리에 대한 기사가 최근에 발표되었습니다. 음, 이것은 우리 몇 명이 업무 외 시간에 하는 일입니다. 어, 우리 모두 정규직 일을 하고 있지만, 알다시피, 이것은 우리 모두가 싱가포르를 위해 가져오고 싶어 하는 매우 매우 열정적인 것입니다. 그래서 이 회의는 정말로 우리 생태계에 대한 러브레터입니다. 이제 우리가 운영하는 모든 이 해커톤과 빌드 나이트를 따라, 어떤 마법 같은 일이 발생했습니다. 어, 여기서 오늘 당신이 매일 사용하는 모델을 구축하고 있는 일부 첨단 AI 팀이 우리 커뮤니티를 위해 나타나기 시작했습니다.

음, 그들은 우리의 해커톤을 위해 크레딧을 제공했습니다. 어, 심지어 Zoom에서 늦게 들어와서도 여전히 사람들을 위해 워크숍을 개최했습니다. 알다시피 우리는 정말 다양한 사람들이 어 지원을 받았습니다. 13세의 젊은이부터 60대의 사람들까지, 그들도 모두 이 모든 것을 배우고 있습니다. 음, 이것은 정말로 함께 모여 빌더가 될 수 있는 좋은 시간입니다. 하지만 우리가 얻은 것은 단지 몇 개의 크레딧만이 아닙니다. 어, 우리는 실제로 이 팀 중 일부와의 관계를 구축하기 시작했습니다. 어, 그것이 우리가 오늘 이 방에서 보는 마법입니다. 이제 당신은 이 모든 일이 싱가포르에서 처음 발생하는 것이라고 생각할 수 있지만, 우리가 오늘 여기 Capitol Theater에 모이기 전에, 그것은 정말로 이미 오랜 시간 동안 표면 아래에서 발생하고 있었습니다.

음, 그래서 우리의 일부 연사들이 실제로 샌프란시스코에서 싱가포르까지의 전체 비행기가 실제로 AIE를 위해 온 사람들로 가득 차 있다고 우리에게 말했을 때, 놀랍지 않았습니다. 그럼, 이 회의는 실제로 어떻게 일어났을까요? 음, 그래서 어 우리는 실제로 Swix를 만났습니다. 어 그는 CEO이고 AIE Globally의 공동 창립자입니다. 음 우리는 실제로 뉴욕시에서 그를 만났습니다. 어 당신들이 알았는지 모르겠지만, 그는 실제로 원래 싱가포르에서 온 사람입니다. 그래서 이 모든 것이 말이 됩니다. 음 우리는 이 많은 팀들과 원격으로 협력해 왔고, 우리는 단지 싱가포르에서 처음으로 그들 모두를 직접 모으고 싶었습니다. 따라서 AIE에 대한 더 많은 이야기를 듣기 위해, 어, Swix는, 어, 인식을 논의할 것이지만, 첫 날을 마치기 위해 듣기도 해야 합니다. 어, AIE에 대한 더 많은 이야기를 공유하세요. 좋아요. 음, 이제 손을 들어보세요.

나는 어제 누가 워크숍에 참석했는지 궁금해합니다. 와. 좋아요. 그것은 대략 청중의 98%입니다. 음, 이것을 보니 기쁩니다. 왜냐하면 그것은 노트북 오픈 데이였고, 이것이 바로 우리가 이 회의에서 다르게 하고 싶은 것입니다. 우리는 단지 것들에 대해 이야기하는 것뿐만 아니라, 알다시피, 우리는 구축하고 있고 어 어떤 방식으로든 적용하고 있습니다. 그래서 우리는 이 모든 것이 실용적인 지식을 위해 설계되었다는 것을 확인하고 싶습니다. 맞죠? 어 어제 어 우리가 실제로 20개의 워크숍을 동시에 5개 방에서 운영하고 있고 완전한 리더십 트랙이 있다는 것을 알려드렸습니다. 그래서, 어, 우리는 정말로 프로그래밍을 여기 모든 것의 절대적 중심에 놓고 싶습니다. 음, 그래서 우리 모두는 서로 배우고 건설하고 있습니다.

그리고 우리가 이 학습의 장소를 만들고 싶었기 때문에, 음, 우리는 또한 다음 세대에게 이 경험을 얻을 기회를 주고 싶었습니다. 그래서, 어, 우리는 실제로 지역사회로서 모여서 20명의 학생을 지원할 수 있었습니다. 그들은 오늘 실제로 회의의 학자입니다. 그래서, 어, 당신들이 일어나서 손을 흔들 수 있나요? 그래서, 이 티켓들의 각각은 실제로 우리 커뮤니티의 빌더들에 의해 부분적으로 또는 전액 후원되었습니다. 그들은 이것이 싱가포르 AI의 미래의 모습이라고 믿습니다. 그럼, 우리는 앞으로의 이틀 동안 무엇을 기대할 수 있을까요?

어, 우리는 단지 알다시피 여러 번의 이야기를 한데 묶지는 않습니다. 알다시피 당신들이 여기서 어 점심과 비슷한 것들을 하도록 하기 위해서입니다. 하지만 우리는 당신들을 위해 당신이 단지 Google에서 또는 Coursera에서 찾을 수 없는 대화를 가져오고 싶습니다. 하지만 실제로는 이 대화들 속에서, 이 대화들이 실제로 이 도구들을 사용하여 구축하는 사람들과 함께 진행 중입니다. Twitter 또는 연구 논문 등에서든 그래서 우리는 이 대화들을 가져오고 싶습니다. 그래서 당신도 중간에 있을 수 있습니다. 우리는 앞으로 이틀 동안 많은 일이 일어나고 있다는 것을 압니다. 어 60개 이상의 연설이 세 가지 주제에 걸쳐 진행되고 있고, 당신은 탐색하고 해결하는 데 도움이 필요할 수 있습니다. 그래서, 어, 우리는 실제로 가이드가 있습니다. 우리는 지도가 있는 이메일을 보냈고, 우리는 실제로 완전한 일정 목록도 코딩했습니다.

어 뿐만 아니라, 우리는 당신이 사용할 수 있는 API를 만들었습니다. 이것은 공개적으로 이용 가능합니다. 그래서, 당신은 실제로 프로그램 상단에서 자신의 도구를 구축할 수 있습니다. 왜냐하면 우리는 단지 당신이 다운로드하고 사용하는 일체형 응용 프로그램을 만들고 싶지 않기 때문입니다. 우리는 당신이 자신을 위해 구축할 수 있는 것을 만들고 싶습니다. 왜냐하면 이것이 우리가 하는 정신이기 때문입니다. 그래서, AIE는 오늘과 내일 다양한 공간에 분산될 것입니다. 어, 이 극장, 여기 Capitol Theater는 모든 연설이 일어날 장소입니다. 그리고 일단 당신이 영감을 얻으면, 알다시피 뭐, 나는 정말로 이 팀과 이야기하고 싶습니다. 그것은 정말 재미있었습니다. 우리는 두 개의 박람회 영역 설정을 가지고 있습니다. 어 하나는 거리 건너편의 Pullman에 있을 것이고, 다른 하나는 Kinsky의 Attelier입니다.

그리고 이것들은 다시 단지 사람들이 설정한 부스일 뿐이 아닙니다. 어 단지 때문만은 아니지만 우리는 실제로 이것을 신중하게 계획된 공간으로 만들었습니다. 당신은 실제로 당신이 사용하고 있는 도구를 구축하고 있는 바로 그 사람과 직접 대면할 수 있습니다. 그리고 마지막으로, 우리는 또한 당신에게 공간을 제공하고 싶습니다. 어 알다시피 긴장을 풀고 잔디에 접촉하세요. 또한 이것은 긴 이틀이기 때문입니다. 그래서, 어, 우리는 15분의 휴식 회의가 있을 것이라는 것을 기쁘게 공유합니다. 그 안에는 「동굴」이라고 불리는 경험 공간이 있습니다. 이것은 재침몰식 사운드 반응 이완 방입니다. 실제로는 어, 완전히 크리에이터에 의해 코딩되었습니다. 당신은 또한 빨간 셔츠를 입고 사방을 뛰어다니는 많은 사람들을 찾을 수 있습니다.

어, 이것들은 우리의 놀라운 자원봉사자들입니다. 그들은 당신이 공간을 탐색하도록 도와줄 것이고 오늘 여기서 발생하는 모든 대화에서 최대한의 이점을 얻을 수 있도록 합니다. 그리고 우리의 놀라운 스폰서들 없이 이 방에 있지 않을 것입니다. 그래서, 어, 우리의 다이아몬드 스폰서는 OpenAI와 ZAI입니다. 우리의 플래티넘 스폰서는 Google Deep Mind, Arise, Cursor입니다. 감사합니다. 어 우리에게 이 아름다운 공간을 제공한 Capitol Theater에 감사합니다. 이제 싱가포르의 이야기는 항상 빌더들로 시작되었습니다. 어, 이것이 바로 몇 주 전에 어 우리 자신의 외교부장관 Vivian Balakrishnan 박사가 어 자신의 「제2의 뇌」를 구축하기 위해 Twitter 게시물에서 바이럴된 것이 우리를 정말로 놀라게 한 이유입니다. 어, 이것은 말이 됩니다. 왜냐하면 그의 역할은 대량의 정보를 조종하고 빠른 문맥 전환을 요구하기 때문입니다.

그래서 그의 이 종류의 워크플로우와 도구를 구축하는 것에 대한 반성은 정말로 AI에 대한 의미 있는 대화가 도구 자체를 이해하는 것과 관련되어야 한다는 것을 강조했습니다. 단지 당신이 알다시피 이 추상화를 생각하는 것이 아닙니다. 어, 이것과 함께, 어, 나는 절대적으로 우리의 기조 연설자이자 빌더 자신인 싱가포르 외교부장관 Vivian Balakrishnan 박사를 소개하게 되어 영광입니다. >> 이것을 사용하세요. >> 아침입니다, 여러분. 알다시피, 우리는 싱가포르에서 좀 더 편할 수 있습니다. 그래서, 아침입니다. 저는 비가 온다는 것을 알고 있지만, 싱가포르는 보통 맑습니다. 어, 나는 자신을 거짓말쟁이처럼 느낍니다. 어, 나를 모르는 사람들을 위해, 나는 실제로 은퇴한 안과 의사입니다. 정치로의 우회는 아마도 너무 오래되었습니다. 어, 하지만 나는 항상 일을 완료하고, 일을 구축하고, 일을 수정하는 것에 대한 관심을 유지했습니다.

그리고 더 이상 눈 수술을 하지 않기 때문에, 어 나는 시계를 조립합니다. 나는 가전제품을 다시 프로그래밍합니다. 이제 다른 것이 있고, 이것이 내가 오늘 이야기하려는 것입니다. 하지만 실제로, 나는 당신이 내가 왜 했는지를 설명하도록 해야 합니다. 이것이 무엇을 의미합니다. 그리고 나는 이 청중에게 당신이 그것을 바로 얻을 것이라고 생각합니다. 하지만 나는 끝으로 뛰어넘겠습니다. 어, 이것을 말하려면 이것들은 세 가지 핵심 메시지입니다. 당신은 내가 말한 모든 것을 잊을 수 있습니다. 하지만 이 일들을 기억하세요. 우리는 이제 당신이 많은 것들을 아웃소싱할 수 있는 시대에 있습니다. 계산, 계산, 메모리, 복사, 지식의 보급. 당신이 아웃소싱할 수 없는 한 가지는 당신의 개인적인 이해입니다. 그리고 만약 당신이 권력의 위치에 있다면, 당신은 일을 위임할 수 있습니다. 당신이 위임할 수 없는 것은 책임입니다.

그래서 이해와 책임에서 개인적 요소를 기억하세요. 다음 지점에서, 나는 케임브리지 대학 교수 Neil Lawrence가 「금융 타임즈」에 발표한 좋은 짧은 메시지를 참조할 것입니다. 그는 기계 학습의 교수입니다. 그리고 알다시피, AI 모델, 데이터 센터, 하향식 시스템, 규칙, 정부에 대한 많은 과장이 있습니다. 그것은 거시적입니다. 하지만 그의 가정은 경제와 사회에 대한 진정한 가치가 기층 워크플로우, 부서, 부서별로 부서별로 창출되었다는 것입니다. 실제로 개인 수준에서.

이것이 무엇을 의미합니다. 그것은 보입니다, 나는 당신들이 훌륭하다는 것을 압니다. 나는 최전선 모델에서 작업하는 사람들이 믿을 수 없을 정도로 훌륭하다는 것을 압니다. 하지만 진정한 보상은 일반인, 교사, 변호사, 기술자, 관리자, 의사, 변호사, 심지어 장관이 실제로 이미 이용 가능하고 이미 발명된 도구를 사용할 때입니다. 그들의 일을 이해하고 이 도구들에 의해 권한을 부여받은 사람들. 이것이 당신이 사회와 경제에 진정한 가치를 창출하는 방법입니다. 그래서 나는 분권화, 개인화, 사용자 정의된 모델을 보고 있습니다. 나는 당신이 당신의 일상 업무를 더 잘 하고, 더 나아가 당신의 삶의 워크플로우를 재설계하는 것을 말하고 있습니다. 이것이 진정한 가치 향상이 있는 곳입니다. 세 번째 핵심 메시지. 이것이 내가 이 연설을 하는 이유입니다. 나는 진심으로 이 모든 것을 달성하는 장애물이 붕괴되었다고 믿습니다.

이 도구들은 이미 제공되었습니다. 이것은 사람들이 어떤 도구가 있는지 이해하고, 자신의 도구를 조립하고, 자신을 완전히 다른 궤적에 놓는 문제입니다. 좋아요. 그래서 이제 흥미로운 부분을 해보겠습니다. 나의 모험이 어떻게 시작되었는지. 이제 나의 개인적 에이전트는 약 3개월 전에 살았습니다. 어, 예, 나는 OpenAI의 과장에 의해 괴롭혀졌습니다. 어, 하지만 나의 일을 고려하면, 나는 즉시 이것이 실제적이지 않다는 것을 알았습니다. 왜냐하면 보안이 문제이기 때문입니다. 그러면 누군가 nanoclaw를 지적했습니다. 나는 우리가 나중에 Gabriel을 들을 것이라고 생각합니다. 알다시피, 한 극객이자 수리공으로서, 나는 내가 파악할 수 있는 것을 좋아합니다.

사실, nanoclaw는 매우 짧은 코드베이스를 가지고 있습니다. 나 같은 백치도 읽고 이해할 수 있습니다. 사실, 그것은 컨테이너화되었습니다. 외과 의사로서, 나는 정상적인 수술로서의 그런 것은 없다는 것을 압니다. 일들이 잘못됩니다. 일들이 깨집니다. 그들이 깨질 때, 희망 당신은 그들이 장벽 내에서 깨지기를 원합니다. 그래서 컨테이너화 부분, 이해 가능성 부분은 나에게 중요합니다. 어쨌든, 간단히 GitHub로 가서 다운로드하세요. 이것의 또 다른 매력적인 부분은 구성이 없다는 것입니다. 정말 아닙니다. 왜냐하면 당신은 모든 커스터마이제이션의 커스터마이제이션을 위해 LLM에 의존하기 때문입니다. 실제로, 당신은 nanoclaw 인스턴스를 실행하는 모든 사람이 개인화된 시스템을 실행하고 있다는 것을 깨닫습니다. 이제, 이것은 이점도 있고 문제도 있습니다. 하지만 어쨌든, 나는 당신에게 내가 그것으로 한 것을 말해주겠습니다, 맞죠?

따라서 Nano Claw는 플랫폼을 제공합니다. 이를 통해 저는 WhatsApp으로 제 에이전트와 소통할 수 있습니다. 그 부분은 어렵지 않습니다. 제 슬라이드로 돌아가서, 제가 정말로 추구하는 것은 이를 제 일상생활에 어떻게 활용할 수 있을까 하는 것입니다. 제 일상생활의 예를 들어보겠습니다. 이번 달 저는 12개 국가를 방문합니다. 저는 따라서 수백 명의 사람들을 만나야 할 것입니다. 저는 국가의 경제, 지리, 문화, 역사를 이해해야 합니다. 전쟁과 평화를 이해해야 합니다. 저는 사람들을 개인으로서 이해해야 하며, 단순히 브리핑에서 나온 내용만이 아닙니다. 모든 외교관은 엄청난 인지 과부하를 겪고 있습니다. 문제는 저가 이 과정을 어떻게 가속화할 수 있으며, 사실이나 정보가 필요할 때 이를 얻을 수 있고, 어디서나 얻을 수 있고, 필요하다면 깊이 있게 파고들 수 있을까 하는 것입니다. 따라서 이는 이 전체 과부하와 관련된 것입니다.

LLM은 분석, 추상화, 표현에 매우 유용하며, 당연히 브리핑 작성, 연설 작성, 질문에 대한 답변 제시에 매우 유용합니다. 여기에는 제가 제출해야 하는 의회 질문도 포함됩니다. 3개월 전, 전체 의회 토론을 포함하여요. 음, 생성된 질문과 답변을 보는 것이 깊은 인상을 주었고, 음, 제 의회의 모든 동료들을 존중하면서 말씀드리자면, 음, 일부 AI 생성 토론은 음, 더 날카로웠다고 할 수 있습니다. 어쨌든 이는 WhatsApp을 통해 저와 소통합니다. 그래서 Bailey라고 하는 소프트웨어가 있습니다. 제 생각으로는 이것이 음, Meta나 WhatsApp이 우리가 하기를 원하는 것과 완전히 일치하지 않을 수 있습니다. 왜냐하면 이는 실제로 당신이 아시다시피, 우리가 브라우저나 노트북 컴퓨터에서 WhatsApp을 사용하는 방식을 모방하고 있기 때문입니다.

따라서 이는 일종의 가상 터미널입니다. 그리고 제가 저와 같은 사람들에게 정말로 최첨단이라고 생각하는 부분은 메모리입니다. 다행히 저는 Neman이라고 하는 흥미로운 소프트웨어에 우연히 만났습니다. 저는 여전히 개발자를 만나지 못해서 정말로 모르겠지만, 그것은 그래픽이 있는 메모리 시스템입니다. 따라서 그것은 엔티티를 가지고 있습니다. 엣지는 엔티티, 인과관계, 시간 관계 및 의미론적 관계입니다. 그리고 저는 단순히 키워드 검색에만 국한되고 싶지 않기 때문에요. 실제로 저는 로컬에서 Ollama와 임베딩 모델을 실행할 수 있으며 이는 저도 내장된 의미론적 검색을 가지고 있다는 의미입니다. 따라서 이러한 요소들을 가지고, 제 의미는 Whisper는 간단한 부분입니다. WhatsApp이 있기 때문에, 저는 단순히 입력하고 싶지 않습니다. 저는 말할 수 있기를 원하고, 그것이 저에게 말할 수 있기를 원합니다. 당연히 제 꿈은 음, 언젠가 제 에이전트가 의회에서 추가 질문에 답할 수 있도록 하는 것입니다.

이의 합법성에 대해서는 확실하지 않지만, 만약 그런 일이 발생한다면 제가 먼저 당신과 이 아이디어를 공유했다는 것을 알게 될 것입니다. 하지만 핵심은 저가 이제 자료, 연설, 필사본을 큐레이션할 수 있으며, 특히 제 자신의 기여를 이 시스템에 넣고, 소화하고, 추출하고, 그 메모리 데이터베이스에 넣을 수 있다는 것입니다. 그러면 대략 같은 시간에 Andre Kapati가 그의 LLM 감독 wiki 생성을 제시했습니다. 따라서 저도 그것에 참여했습니다. 그러면 사용자 경험, 사용자 인터페이스에 대해서는 저는 Obsidian을 사용했습니다. 부분적으로는 Obsidian이 저를 Apple iCloud를 사용하도록 허용하기 때문이며, 따라서 즉시 저는 개인 클라우드를 가지고 있다는 의미이고, 이 개인 큐레이션된 데이터베이스에서 추출된 모든 위키가 저에게 사용 가능합니다. 왜냐하면 제가 처음 말씀드린 핵심을 기억하세요. 개인적 이해입니다.

따라서 저는 메모리 시스템을 가지고 있고, 저는 통신 시스템을 가지고 있고, 저는 분석 시스템을 가지고 있지만 모든 것이 좋아 보입니다. 그러나 저가 여기서 당신과 공유하는 것은 지난 3개월 동안 저가 이것을 만나기, 여행하기, 연설의 초안 작성, 연설의 초안 작성에서 매우 유용하다는 것을 발견했다는 것입니다.

심지어 오늘의 연설 음, 심지어 슬라이드는 실제로 Claude에 의해 생성되었습니다. 당신이 아시다시피 그것이 일을 완료하는 속도를 높였습니다. 엔지니어로서가 아니라 일상적인 일을 하는 실무자로서, 그것은 매우 유용했습니다. 저는 그것의 유용성을 증명할 수 있습니다. 왜냐하면 저는 정직하게 당신에게 말씀드릴 수 있기 때문입니다. 저는 아직 그것을 끄기를 감히 하지 않았습니다. Nano Claw는 불행히도 1판에서 2판으로 업그레이드되었고, 2판이 온라인에 올라왔을 때 그들의 마이그레이션이 순조롭지 않았기 때문에 저는 1판을 계속 작동시켰고, 다른 컴퓨터에 2판을 두었습니다. 저도 추가해야 할 것은 제가 매일 가장 자주 사용하는 모든 이러한 것들 중 에이전트가 최소 2~3년 전 Raspberry Pi에서 실행되고 있다는 것입니다. 그것은 8GB의 RAM만 가지고 있습니다. 당신은 제가 접근성, 개인화, 관련성, 사용에 대해 말씀드린 내용을 봅니다. 다음 슬라이드로 진행하겠습니다.

이것은 제 견해입니다. 장벽이 무너졌습니다. 왜냐하면 저가 이를 했기 때문입니다. 저는 Claude, Bailey, Neman, Whisper 또는 자격 증명 시스템을 작성하지 않았습니다. 당신이 아시다시피, vibe coding에 관한 이 전체 것이 있습니다. 저는 심지어 제가 vibe coding을 하고 있다고 감히 주장하지도 않습니다. 저는 단지 도구를 조립하고 있습니다. 당신이 보는 것은 단지 도구 조립일 뿐입니다. 그래서 저는 실제로 그 문장을 바꿔야 합니다. 저는 어떤 접착제 코드도 작성하지 않았습니다. 저는 정직하게 말씀드릴 수 있습니다. 네, 저는 코드를 확인했고, 당신이 아시다시피 NanoClaw는 매번 에이전트에게 bash 액세스를 줄 때마다 승인하도록 주장하므로 저는 실제로 스캔했고, 그것은 도움이 되었습니다. 만약 당신이 코딩을 이해하지 못한다면 매우 도움이 됩니다. 그래서 당신은 무슨 일이 일어나는지 이해합니다. 비록 당신이 실제로 코드를 입력하고 편집하지는 않아도요. 다음으로, 어떤 의미에서 이 모든 것에 대한 제 접근 방식은 하면서 배우기를 통해 왔습니다.

단순히 앉아서 읽고, 뉴스를 훑어보고, 요약을 작성하는 것만으로는 충분하지 않습니다. 만약 당신이 무언가에 관심이 있다면, 몸으로 행동해야 합니다. 배우는 최선의 방법은 실천입니다. 진입 장벽이 크게 낮아졌으므로, 모든 사람이 자신의 개인적인 실험을 시작해야 합니다. 당신이 아시다시피 Claude가 이런 말을 제시했으나, 저는 그때 조금 의심했습니다. 당신이 아시다시피 이전에 누가 이 말을 했는지. 그것은 다른 사람이 말한 적이 없다고 주장했습니다. 하지만 실제로 저는 조금 동의합니다. 이것은 제 정부 동료들에 대한 호소입니다. 당신은 당신이 단지 브리핑을 받은 기술을 다스릴 수 없습니다. 당신은 몸소 관여하는 것이 더 낫습니다. 그래야만 당신이 이 기술의 가능성, 한계 및 문제를 이해할 수 있습니다. 여기에는 또한 다른 일부 관련 없는 내용이 있습니다. 음, 확실히 몇 가지 제약이 있습니다.

예를 들어, LLM에 의존할 때, 솔직히 말해서, 현재 AI 대기업이 우리에게 청구하는 가격을 고려하면, 저는 우리 모두가 사실상 보조금을 누렸다는 것을 알고 있다고 생각합니다. 토큰은 저렴하지 않습니다. 계산 능력이 제한됩니다. 전기 가격이 올랐습니다. 전쟁도 도움이 되지 않았습니다. 우리는 모든 문제와 해결책의 모든 단계를 단순히 LLM에 던지는 것에 대해 경계해야 합니다. 이는 저에게 오래된 속담을 생각나게 합니다. 당신이 아시다시피, 망치를 들고 있는 사람에게는 모든 것이 못처럼 보입니다. 실제로 LLM을 사용하는 것에 좋은 경제적 및 설계 장점이 있습니다만, 결정론적 시스템이 여전히 그 역할을 한다는 것을 잊지 마십시오.

전문가 규칙 시스템도 여전히 그 역할을 합니다. 저는 생물학자로서의 개인적인 신념은 결국 어떤 종류의 신경 기호 시스템이 필요하며, 단지 LLM 모델만이 아니라는 것입니다. 저는 Yan Yong의 생각에 어느 정도 공감합니다. 그는 당신이 아시다시피, 저는 LLM이 좋다고 생각하지만, 실제로 이것이 우리가 자연에서 문제를 해결하는 방식이 아닙니다라고 말했습니다. 만약 당신이 인간의 뇌를 본다면, 실제로 저는 인간의 뇌의 계산층이 우리가 오늘 가지고 있는 많은 대규모 언어 모델보다 적다고 의심합니다. 안과 외과의로서, 저는 당신에게 말씀드릴 수 있습니다. 뇌 피질은 시각, 언어, 인지에 대한 계산이 우리가 오늘 가지고 있는 이러한 에너지 소비 시스템보다 더 효율적인 구조에 기반합니다. 제가 표현하고 싶은 요점, 그리고 제가 Yan Yong과 동의하는 곳은 이러한 것들은 궁극적으로 주의와 메모리가 있는 패턴 인식 시스템입니다.

겉으로 보기에 단순한 기본 능력에서 나타나는 창발 행동은 개념 이해를 제공하고, 언어를 제공하며, 일을 할 수 있는 능력을 제공합니다. 따라서 저는 말씀드리고 싶은 것은 이것은 여전히 폭발적으로 발전하고 있는 분야이므로 겸손한 태도로 접근해야 한다는 것입니다. 당신의 일상 업무의 생산성을 개선하기 위해 노력하되, 우리가 실제로 혁명 중인 가장 운 좋은 세대일 수도 있다는 것을 이해하십시오. 도구가 모델보다 더 중요합니다. 저는 음, Gab이 저를 따라 말한 것이 있습니다. 6월, 6월 15일이라고 생각하면, 저는 NanoClaw가 모든 모델을 1급 시민으로 만들어야 한다고 생각합니다. 음, 이유가 있고, 우리는 나중에 토론할 수 있습니다. 마지막은 메모리입니다. 이는 매우 인간적입니다. 저는 이것이 이 최첨단 분야에서 아직 해결되지 않은 훌륭한 문제라고 생각합니다.

다음 슬라이드, 보안 측면에서 저는 너무 많이 논의할 생각이 없습니다. 음, 그냥 지나가면서 말씀드리지만, 심지어 당신이 제 시스템을 해킹한다면, 당신이 얻을 수 있는 최대한의 것은 제 전화번호입니다. 음, 당신은 외교 정책 요약을 얻을 것입니다. 하지만 이들은 제가 지지하는 외교 정책이고, 어쨌든 제가 이미 큐레이션한 것이 들어가 있으므로, 심지어 당신이 제 시스템을 가져가도, 저는 그것이 어쨌든 싱가포르의 외교 정책을 생성할 것이라고 생각합니다. 이제 이것은 보안을 다루는 한 가지 방법입니다. 당신이 단지 이미 오픈소스된 것, 이미 발표된 것을 넣었고 시스템이 견딜 수 있는 투명성과 검토의 수준을 받아들일 수 있도록 함으로써 말입니다. 하지만 보안이 여전히 중요하다는 것을 잊지 마십시오. 실제로, 인공지능의 확산의 복잡한 요소는 상업적 경쟁, 국가 보안, 사이버 보안 및 초강대국 경쟁이 될 것입니다.

이들은 인공지능의 미래의 가용성, 속도 및 확산에 영향을 미칠 정치적 요소들입니다. 이것도 마찬가지로 깊이 있게 탐구할 가치가 있는 독립적인 정치 주제입니다. 다음 슬라이드, 저는 이것이 제 마지막 슬라이드이기를 바랍니다. 따라서 목표는 저는 엣지 배치의 신봉자입니다. 저는 외과의입니다. 저는 실제 관행을 믿습니다. 저는 수리를 믿습니다. 저는 그것이 생명 안전, 가치 창조가 있는 곳입니다. 둘째, 따라서 공공 정책 목표는 이러한 도구의 민주화입니다. 이것이 당신이 경제 전략 검토 위원회에서 DPM Gun이 싱가포르는 모델 개발의 최전선에 있을 가능성이 낮다고 말한 이유입니다. 하지만 우리는 대규모 배치의 최전선에 있을 수 있습니다.

따라서 민주화, 따라서 만약 이것이 우리가 믿는 것이라면, 그것은 반드시 분산화된 하향식 접근이어야 합니다. 이것이 제가 오늘 여기 있는 이유입니다. 왜냐하면 저는 이 또는 회의가 3개월 미만 전에 조직되었다는 것을 발견했기 때문입니다. 65개의 실험실. 당신이 여기서 만나는 모든 사람, 이것이 그들의 일상적인 일이 아닙니다. 이것은 해커톤입니다, 맞죠? 하지만 이것은 저가 미래가 창조될 방식이라고 믿는 것입니다. 따라서 모두가 와주셔서 감사합니다. 당신이 이 여정의 일부가 되어주셔서 감사합니다. 훌륭한 날, 훌륭한 미래를 가지길 바랍니다. 정말 감사합니다. 당신은 이것을 주었어야 합니다. >>아, >>나 이것을 더 일찍 입어야 했습니다. 당신이 더 일찍 나에게 주었어야 합니다. 저는 그것을 입었을 것입니다. >>우리는 요약을 하지 않았습니다. 하지만 정말 감사합니다. 정말 감사합니다. >>감사합니다. >>알겠습니다. 당신이 공지사항을 해야 하죠? 저는 그녀에게 알렸습니다. 알겠습니다, 여러분.

음, 저는 우리의 다음 연사자를 소개하게 되어 매우 흥분됩니다. 다름 아닌 NanoClaw의 창조자 본인, Gabrielle Cohen입니다. 안녕하세요, 모두. 여기 있게 되어 정말 흥분됩니다. 지금 일부 것들을 설정하고 있습니다. 당신들의 웹사이트를 로드해야 하면 모두 좋을 것입니다. >>당신이 마이크를 올려놓을 수 있습니까? 당신이 m 잠깐, 이제 로드했습니다. 없어졌습니다. 거의 다 됐습니다. 알겠습니다. 안녕하세요, 모두. 저는 Gabriel Cohen이고, 나는 NanoClaw를 만들었습니다. 제 Telegram에는 이제 AI 어시스턴트가 있는데, 제 이메일, 제 캘린더에 연결되어 있고, 음, 제 통화 기록에 연결되어 있습니다. 음, 그것은 민감한 정보에 액세스할 수 있습니다. 그것은 민감한 조치를 할 수 있습니다. 제 이메일 읽기, 초대 발송과 같은. 이 연설이 끝난 후, 15분 후, 저는 모두에게 그것에 자유롭게 액세스할 수 있는 권한을 제공할 것입니다.

음, 저는 이렇게 할 수 있으며 미쳐있지도 않고 위험하지도 않습니다. 이 강연 전체를 통해 NanoClaw를 안전하게 만드는 개념들에 대해 설명드리고 싶습니다. 음, 그리고 이 개념들을 시연하기 위해 저희가 구축한 에이전트 팩토리에 대해 이야기하겠으며, 그 과정에서 이를 구축할 때 내린 선택들 중 흥미롭다고 생각하는 것들을 공유하겠습니다. 먼저 NanoClaw는 안전한 자율 보조 또는 클로우 보조를 구축하기 위한 오픈소스 프레임워크입니다. 음, 불과 3개월 만에 GitHub에서 30,000개 이상의 스타를 얻었으며, 음, 싱가포르 외교부 장관인 Vivian Balakrishna 박사를 포함하여 전 세계에 흩어져 있는 수천 명의 사용자들이 있습니다. 음, 하지만 GitHub 스타보다 더 중요한 것은 12,000명 이상이 이미 저장소를 포크했으며, 이것이 사람들이 이를 사용하는 주요 방식입니다.

그들은 포크한 후 이를 실험해보고 nanoflow를 기반으로 자신만의 자율 에이전트를 만듭니다. 음, 그리고 저희는 2,500개 이상의 음 풀 리퀘스트와 이슈가 있습니다. 따라서 오픈소스 프로젝트를 유지보수하는 것은 오늘날, 지금이 오픈소스 프로젝트를 구축하기에 가장 좋은 시기입니다. 동시에 음, 에이전트를 코딩하는 것도 새로운 과제를 가져옵니다. 예전보다 풀 리퀘스트를 열기가 훨씬 더 쉬워졌습니다. 음, 수많은 사람들, 수천 명의 사람들이 이 프로젝트에 훌륭한 기여를 하고 있습니다. 음, 하지만 솔직히 말하면 스팸 풀 리퀘스트도 있습니다. 사람들이 자신의 코딩 에이전트를 저장소에 지시하면서 「여기에 뭔가 기여해」라고 말합니다. 오늘날 스팸 풀 리퀘스트와 좋은 풀 리퀘스트를 구분하기가 어렵습니다. 그들은 비슷해 보입니다.

코드의 양이 비슷할 수 있으며, 그들을 구분하는 것은 프로젝트에 대한 깊은 이해, 프로젝트의 방향, 비전에 달려 있습니다. 따라서 이러한 풀 리퀘스트들을 정리하는 데 도움이 되도록 저희는 에이전트 팩토리를 구축했습니다. 음, 각 기여를 검토하는 데 도움이 됩니다. 음 이것이 저희의 에이전트 팩토리입니다. Slack에 있습니다. xie.dev 음 가상 머신에 호스팅되어 있습니다. 음, GitHub에서 열리는 모든 PR은 음 웹훅을 트리거하며, 음, 저희 Slack에 새로운 스레드를 생성합니다. 검토 에이전트는 먼저 분류를 수행한 후 깊이 있는 검토를 수행합니다. 음 그러면 테스트로 전달되며, 먼저 깊이 있는 테스트를 위한 테스트 계획을 수립합니다. 음, 자동화 테스트뿐만 아니라 실제 테스트입니다. 음 계획을 승인하면 새로운 VM이 시작됩니다.

일련의 전체 테스트를 거치게 되며, 완료되면 음 팩토리 내에서 직접 병합할 수 있으며 온라인 상태가 됩니다. 따라서 여러분 중 절반은 이것을 보고 생각할 것입니다. 훌륭합니다, 저는 스스로 이런 팩토리를 구축하고 싶습니다. 다른 절반은 보안 의미를 생각하고 있으며 생각하기를, 이것은 너무 미쳤습니다. 이것은 무분별합니다. 이것은 안전하지 않습니다. 풀 리퀘스트는 물론 정제되지 않은 음 입력입니다, 맞죠? 누구나 풀 리퀘스트를 열 수 있습니다. 누구나 거기에 무언가를 놓을 수 있습니다. 음 당신은 정말 풀 리퀘스트를 정제할 수 없습니다. 왜냐하면 저는 그것에서 정보를 삭제하고 싶지 않기 때문입니다. 거짓 긍정이 있을 것이고, 당신이 생각할 수 있는 모든 것이 있을 것입니다. 당신은 보안을 강화하기 위해 프롬프트 주입을 방어하기 위해 열린 풀 리퀘스트를 상상할 수 있습니다. 그것은 어떤 유형의 음 탐지를 트리거할 것입니다. 따라서 이것은 치명적인 삼중항을 훨씬 초과합니다.

그리고 음 우리의 에이전트들, 저희 팩토리의 에이전트들은 매우 민감한 조치를 취하고 있습니다. 그들은 가상 머신을 시작하고 있습니다. 그들은 음 풀 리퀘스트를 병합하고 있습니다. 그렇다면 어떻게 저희가 에이전트를 프롬프트 주입으로부터 방지할 수 있을까요? 당신은 명백히 그렇게 할 수 없습니다, 맞죠? 코드베이스에 들어가면 클라우드의 상단에서 보입니다. MD 음 절대로 프로덕션 데이터베이스를 삭제하지 마십시오. 따라서 이것은 해당 에이전트에 대해 두 가지를 알려줍니다. 해당 에이전트가 이전에 프로덕션 데이터베이스를 삭제했다는 것을 알려줍니다. 그들이 그 지시를 거기에 놓았다면 에이전트는 여전히 그렇게 할 수 있다는 것을 알려줍니다. 따라서 여전히 그 능력을 가지고 있습니다. 음 지시는 보안을 위한 것이 아닙니다. 그들은 보안을 위한 것이 아닙니다. 지시는 프로덕션상 가치 있는, 고품질 결과물을 향해 에이전트를 안내하기 위한 것입니다. 당신이 그것이 향하기를 원하는 방향으로 안내하기 위한 것입니다.

그렇다면 nanoclaw로 이런 종류의 위험을 어떻게 처리합니까? 따라서 저희는 저희의 에이전트를 마치 그들이 적의 영토 뒤에서 작동하는 것처럼 생각합니다. 왜냐하면 그들은 적과 접촉 중이기 때문입니다, 맞죠? 누군가가 악의적인 행위자일 수 있으며 당신에게 저항하고 당신의 에이전트가 당신에게 저항하도록 만들려고 시도하는 경우입니다. 따라서 분쟁 지도를 생각해보면, 음 빨간색 구역과 파란색 구역이 있으며, 파란색 구역은 우리 쪽이고 빨간색 구역은 반대편입니다. 에이전트는 빨간색 구역에서 작동하며 언제든지 이중 스파이로 돌변할 수 있습니다. 따라서 저희는 저희의 에이전트를 신뢰하지 않으며, nanoclaw 에이전트는 신뢰할 수 있는 것으로 간주되지 않습니다. 대신 격리됩니다.

따라서 이것이 나노 클로우 아키텍처의 단순화된 버전입니다. 왼쪽에는 Slack 또는 메시지를 보내는 다른 메시지 응용프로그램이 있으며, Slack 서버로 이동한 다음 nanoclaw가 실행되는 어디든지로 전송됩니다. 예를 들어, 가상 머신에서 Slack 브리지가 있으며, Slack 서버에 소켓 또는 웹훅으로 연결되며, 각 메시지는 Slack 브리지로 전송된 다음 라우터를 통해 에이전트에 푸시됩니다. 에이전트가 응답합니다. 그것은 음 라우터를 통해 Slack 브리지, Slack 서버로 다시 전송되는 일부 출력을 생성하며 메시지 응용프로그램에 에이전트로부터의 응답, 당신의 것을 알고 있는, Slack 봇 또는 다른 것으로부터의 응답으로 표시됩니다. 음 하지만 에이전트가 손상되었을 수도 있습니다. 빨간색 구역에서 작동합니다. 따라서 에이전트가 접할 수 있는 모든 것이 손상되었을 수도 있습니다.

에이전트가 라우터에 접근할 수 있다면, 에이전트가 Slack 브리지에 접근할 수 있다면, 그것은 이것들을 조작하고 접근할 수 있는 메시지를 변경할 수 있습니다. 음, 그리고 누구에게 메시지를 보낼 수 있는지를 변경할 수 있습니다. 따라서 에이전트가 실행되는 가상 머신 내의 모든 것이나 실행되는 환경의 모든 것에 접근하도록 하는 것 대신, 저희는 에이전트를 격리시키고 가상 머신 내의 또 다른 격리 계층 내에 배치합니다. 저희의 경우 일반적으로 컨테이너 내에 배치합니다. 이제 컨테이너는 폭발 반경을 제한합니다. 저희는 들어오고 나가는 내용을 통제하며, 나가는 것에 무엇이 발생하는지를 통제합니다. 따라서 에이전트는 메시징 채널에 직접 연결되지 않습니다. 이것은 이미 폭발 반경을 크게 제한하지만, 저희의 에이전트가 외부 세계에 접근할 수 있도록 하려면, 음 자격 증명이 필요합니다.

서비스에 연결하려면, GitHub이든 음 또는 달력이든, CLI, API, MTP를 사용하든, 상관없습니다. 어떤 형태의 자격 증명이 필요합니다. 따라서 두 번째 원칙, 첫 번째 원칙은 격리입니다. 두 번째 원칙은 자격 증명을 에이전트 환경 외부에 유지하는 것입니다. 에이전트 환경은 적의 영토입니다. 당신은 매우 민감한 것을 거기에 놓고 싶지 않습니다. 확실히 음 비밀과 자격 증명은 아닙니다. 에이전트가 자격 증명을 누출하지 않을 것임을 보장하는 유일한 방법은, 이것은 지시를 통해 할 수 없습니다. 음 DLP 또는 출력 분석을 통해서도 할 수 없습니다. 에이전트도 그것을 회피할 수 있습니다. 비밀을 누출하지 않도록 방지하는 유일한 방법은 비밀을 주지 않는 것입니다.

따라서 저희가 외부 자격 증명 서비스와 통신하도록 하는 방식은 자격 증명이 없으며, 저희는 에이전트 요청 사이에 프록시를 추가합니다. 저희는 에이전트에 보관소를 제공합니다. 저희는 one CLI라고 불리는 정말 훌륭한 오픈소스 프로젝트와 협업했습니다. 에이전트 샌드박스를 떠나는 모든 요청은 보관소를 통해 프록시되며, 그러면 저희는 요청을 확인하고 저희가 자격 증명을 추가해야 하는지 여부를 결정합니다. 요청은 자격 증명이 없는 형태로 보관소를 떠나며, 문자 그대로 음 인증 보유자 자리표시자입니다. 문자 그대로 자리표시자라는 단어가 보관소에 있습니다. 에이전트가 해당 리소스에 접근할 권한이 있어야 하는 경우, 자리표시자는 실제 자격 증명으로 대체됩니다.

하지만 에이전트를 격리하고 이 프록시 자격 증명을 제공하는 것만으로는 충분하지 않습니다. 왜냐하면 누군가 직접 저희 에이전트와 대화하면, 저희 에이전트가 열쇠를 보유하지 않아도, 민감한 조치를 취할 수 있다면, 당신은 그것을 조작할 수 있으며, 프롬프트 주입을 할 수 있으며, 당신은 그것을 당신을 위해 민감한 조치를 취하도록 만들 수 있습니다. 따라서 저희의 GitHub 액세스 토큰을 얻을 수 없을 수도 있지만, 당신을 코드 소유자로 추가하도록 만들 수 있을 수도 있습니다. 따라서 저희는 다른 전략 계층이 필요하며, 모든 요청에 대해 고무 스탬프를 찍는 것뿐만이 아니라 에이전트가 접근할 수 있고 접근할 수 없는 것의 정책을 추가합니다. 가장 민감한 작업의 경우, 가장 유연한 정책은 인간이 환(人-在-環) 승인입니다. 그것은 저희가 정책을 실행하는 수준에서 정책 집합을 가질 수 있다는 것처럼 보입니다. 이것에는 인간 승인이 필요합니다.

그러면 요청은 에이전트에서 전송되지 않으며, 보관소에서 또는 음 nanoclaw의 라우터 또는 전달 부분에서 전송됩니다. 해당 메시지는 라우터를 통해 Slack 브리지로 전송되며 메시지 응용프로그램에 에이전트로부터의 권한 요청으로 표시됩니다. 이제 이것은 실제로 환상입니다. 이것은 비디오에 이전에 나타났으며, 에이전트가 당신의 승인을 요청하는 것처럼 보이며, 그러면 당신이 에이전트에게 당신의 승인을 주며, 그러면 그것은 당신을 위해 PR을 병합하도록 계속 진행합니다. 그것 중 아무것도 일어나지 않았습니다. 에이전트는 승인을 요청할 수 없으며, 에이전트는 실제로 병합할 자격 증명이 없습니다. 대신 에이전트는 MCP를 사용하여 요청을 발급하려고 시도하며, 그것은 GH로 GitHub CLI를 실행하려는 명령을 작성합니다.

그러면 저희는 이를 메시지로 에이전트로부터의 요청인 것처럼 표시하지만, 실제로는 Nano 호스트 프로세스에서 나온 것입니다. 당신이 승인하면, 병합은 실제로 에이전트 수준에서 완료되지 않으며, 에이전트 환경 외부에서 완료됩니다. 그 동일한 음 패턴은 어떤 유형의 민감한 작업을 수행하는 데도 사용될 수 있습니다. 예를 들어 전송 시작. 가장 민감한 작업의 경우, 도구 호출을 도구 실행과 분리해야 합니다. 도구 호출은 에이전트의 환경 내에서 발생합니다. 빨간색 구역 내에서, 그것은 빨간색 구역을 떠나고, 에이전트 환경 외부에서, 당신이 정책을 실행하고 해당 조치를 구현하며, 정책을 준수하는 경우, 인간 승인을 포함하여.

저희가 에이전트 팩토리에서 발견한 흥미로운 패턴 하나는 저희가 여러 다양한 사람들이 과도하게 검토하고 음 검토, 계획, 음 분류에 대한 감독을 제공한다는 것입니다. 누가 버튼을 눌러 승인하거나 테스트로 보내든 상관없이, 그것은 그들의 자격 증명을 사용합니다. 따라서 당신은 nano claw 에이전트가 병합한 PR을 저희 GitHub에서 보지 못할 것입니다. 버튼을 누른 사람은 저입니다. 이것은 제가 이것이 올바르다는 것을 증명했다는 의미입니다. 저는 이에 대해 책임을 집니다. 이것은 저의 자격 증명으로 완료됩니다. 따라서 이것이 음 저희의 팩토리가 어떻게 보이는지입니다. 흥미로운 또 다른 사항은 따라서 당신은 여기에서 저희가 음 slack 응용프로그램이 있는 것을 볼 수 있습니다. 음 slack 브리지에 연결됩니다. 저희는 여러 다양한 봇을 가지고 있으며, 그러면 각 봇은 다양한 nano 에이전트로 라우팅됩니다. 각 nano 에이전트는 자체 컨테이너에서 실행됩니다.

따라서 nano claw는 기본적으로 설계에 따라 다중 에이전트 다중 사용자 다중 테넌트입니다. 이제 테스트 계획이 승인되면, 자동화 테스트를 실행하는 것이 아니라, 일어나는 것은 저희가 테스트 음 오케스트레이터를 가지고 있다는 것입니다. 새로운 가상 머신을 생성하고, 가상 머신에서 해당 GitHub 풀 리퀘스트의 분기를 체크아웃합니다. 그러면 저희의 테스트 에이전트는 SSH를 통해 가상 머신에 들어가 Nano 인스턴스를 실행하고, 에이전트를 찌르고 찌르고 시작하고, Telegram에서 메시지를 보내며, 응답을 받으며, 실제 테스트를 받고, 데이터베이스와 로그를 확인할 수도 있습니다. 뒤에서 당신이 일어나기를 기대했던 것이 실제로 일어났는지 확인하기 위해. 음, 또 다른 마지막 흥미로운 패턴은 Slack 스레드의 각 에이전트는 지속적인 환경과 지속적인 세션을 가집니다. 언제든지 그들에게 접근할 수 있으며, 다양한 에이전트 중 하나를 태그합니다.

저희는 테스트 에이전트, 검토 에이전트가 있으며, 어, 그들에게 방향 지시를 주고, 후속 질문을 하고, 어, 테스트 깊이를 변경하며, 당신이 여기에서 보는 것처럼입니다. 저희는 또한 감독자를 태그할 수 있고 피드백을 제공하는 이 능력을 가지고 있습니다. 어, 당신이 약간 Karen 같은 느낌이 이 밈을 아는 경우, 내가 당신의 감독자와 대화할 수 있습니까? 당신은 피드백을 남기고, 그러면 어 감독자는 해당 피드백을 기반으로 지시 및 기술에 대한 변경을 제안할 수 있으며, 그러면 저희가 그러한 변경을 승인하면, 그것들이 구현됩니다. 따라서 저희의 팩토리는 본질적으로 자체를 개선하고 있습니다. 저의 약속대로, 해당 QR 코드를 스캔하면, 저는 Telegram에서 제 에이전트를 가지고 있습니다. 제 이메일, 제 달력 어 그리고 제 드라이브에 접근할 수 있습니다. 어, 하지만 저는 이 에이전트에 모든 액세스 권한을 제공하는 것이 편합니다. 왜냐하면 이 에이전트는 환경 내에 자격 증명이 없기 때문입니다. 격리되어 있습니다.

저는 무엇이 환경으로 들어오고 무엇이 나가는지를 통제합니다. 모든 조치는 인간 승인이 필요합니다. 따라서 이것은 저의 달력에 연결됩니다. 저는 하루 종일 여기에 있습니다. 저는 정말 이 분야에서 흥미로운 일을 하고 있는 일부 사람들과 함께 커피를 마시고 싶습니다. 어, 이와 대화해보세요. 저는 그것에 제 시간에 대해 약간 보호적이라고 말합니다. 저는 그것이 매우 심하기를 원하지 않습니다. 어, 하지만 당신이 이와 대화하고 당신이 무엇을 하고 있는지 말하면, 어, 바라건대 그것은 당신과 저를 위해 커피 채팅을 예약할 것입니다. 감사합니다. >>좋습니다. 어, 저는 저희의 다음 연사자를 매우 흥분해서 소개합니다. 어 이분은 Tibo이시며, OpenAI의 Codex 책임자입니다. 이제 Tibo 어 불행하게도 오늘은 직접 참석하실 수 없습니다. 어 하지만 그는 이 강연을 하고 싶어 했으므로, 그것이 그에게 의미가 있기 때문입니다. 그러므로 그는 설명할 것입니다 어 그가 화면에 나타날 때, 저는 그를 생각합니다.

어 하지만 저희가 할 다른 정말 멋진 일은 어 Tibo가 일부 학생들과 질의응답을 할 수 있게 하는 것입니다. 따라서, 어, 저희가 주자, 어, Tibo를 따뜻하게 환영합시다. >>안녕하세요, 여러분. 어, 여기 있어서 기쁩니다. 저는 직접 여기 있을 수 있기를 정말 희망했습니다. 방에 사람들이 가득 찬 것을 보는 것이 정말 흥미롭습니다. 어, 싱가포르는 독특한 에너지를 가지고 있으며, 저는 샌프란시스코에서 여러분 모두와 대화할 수 있어 기쁩니다. 저는 싱가포르가 실제로 Codex 채택과 참여도 측면에서 전 세계 상위 5개 국가 중 하나라고 말할 수 있어 매우 자랑스럽습니다. 어 그것은 매우 빠르게 상승하고 있습니다. 어 싱가포르가 이전에 없던 속도로 새로운 기술을 채택하는 것처럼 느껴집니다. 어 저희의 전반적인 사명은 모든 인류에게 AGI의 이점을 전달하는 것입니다.

저는 앞으로의 몇 달 안에 세계의 모든 사람에게 AI를 깊이 있게 가치 있게 만드는 일에서 놀라운 진전을 이룰 것이라고 믿습니다. 저희는 ChatGPT로 시작했으며, Codex를 통해 저희는 빌더와 개발자에게 초점을 맞춥니다. 당신은 Codex가 이 작은 응용프로그램이라는 것을 알 수도 있지만, 저희에게는 이것이 저희의 최전선 에이전트입니다. 저는 에이전트가 소프트웨어 개발과 전체 생명 주기에서 무엇을 했는지에 대해 조금 이야기할 것입니다. 저는 이 방에 말할 필요가 없습니다. 하지만 소프트웨어 개발은 명백히 2년 전과는 비교할 수 없으며, 심지어 6개월 전과도 비교할 수 없습니다. 새로운 모델은 완전한 에이전트 위임 또는 나노클로우에서 본 예와 같은 것을 수행할 수 있으며, 당신은 당신을 위한 일을 하는 완전한 자율 시스템을 가집니다. 어 프로그래밍을 훨씬 초과합니다. 당신은 단지 그것에 일을 주면 됩니다.

그것은 독립적으로 작업을 처리하며 코드베이스도 많은 경우 몇 시간 때로는 하루 종일 작업을 완료할 때까지입니다. 처음부터 이것이 저희의 목표였습니다. AI 팀원을 위임할 수 있는 것을 구축하는 것입니다. SDLC를 고려하고 사물 구축의 유용한 방법은 이를 처리량 문제로 보는 것입니다. 수십 년 동안 소프트웨어 개발 생명 주기의 설계는 핵심 가정 주위에 있었습니다. 코드는 작성하기 어렵습니다. 이 가정은 정말 모든 것을 형성했습니다. 저희는 엔지니어링 시간이 부족하기 때문에 광범위하게 계획합니다. 코드를 작성하는 것이 비싸기 때문에 각 줄을 신중하게 검토합니다. 저희는 구축 단계가 파이프라인의 가장 좁은 부분이라는 아이디어 주변의 전달 시스템을 구축했습니다. 에이전트 코딩은 정말 이 가정을 바꿉니다. 파이프라인의 띠 부분을 상당히 넓힙니다.

하지만 다른 부분이 좁은 상태로 유지되면, 전체 처리량은 실제로 증가하지 않습니다. 제약은 구축 단계 주변의 시스템, 계획, 검토, 검증, CI, 보안, 발출, 운영, 디버깅, 심지어 학습 및 실제로 일어나고 있는 것을 이해하는 것으로 전이합니다. 이것이 새로운 병목 현상의 큰 부분입니다. 이 이동은 모든 사람이 이해해야 하는 것입니다. 기회는 단지 더 빠르게 더 많은 코드를 생성하는 것이 아니라, 저희가 어떻게 엔지니어링을 수행하는지 그리고 저희가 함께 제공하는 전체 처리량을 어떻게 증가시킬 수 있는지를 재설계하는 것입니다. 첫 번째 물결 AI 코딩은 정말 이 구축 단계만 확장했습니다. 우리 모두는 더 빠르게 많은 코드를 작성할 수 있어서 매우 기쁩니다. 이것이 중요합니다. 엔지니어들이 이전에 없던 속도로 코드를 생성, 수정 및 테스트할 수 있다는 의미입니다.

하지만 앞에서 말했듯이, 구축 부분만 확장해서는 전체 처리량이 증가하지 않습니다. 다음 단계는 정말 전체 소프트웨어 전달 생명 주기에 걸쳐 용량 확장을 살펴보는 것입니다. 이것이 저희가 Codex라는 에이전트를 생각하는 방법입니다. 그것은 단지 코딩 보조가 아니라, 소프트웨어 구축의 완전한 계층에서 작동할 수 있는 에이전트입니다. 구축 단계에서 Codex는 엔지니어가 구현 작업을 위임하는 데 도움을 줄 수 있습니다. 검토에서 Codex는 변경을 확인하고, 문제를 표면화하고, 인간 검토를 지원할 수 있습니다. 배치와 운영에서 클라우드 에이전트 및 자동화는 팀이 트리거에 응답하고, 문제를 조사하고, 이전에 없던 속도로 작업을 시스템을 통해 진행하는 데 도움을 줄 수 있습니다. 목표는 프로세스에서 인간을 제거하는 것이 아닙니다. 목표는 정말 각 단계를 더 확장 가능하게 만드는 것입니다. 따라서 더 높은 코드 출력은 실제로 더 많은 전달 가치로 변할 수 있습니다.

이것이 핵심 차이점입니다. 에이전트 코딩은 코드 속도를 증가시키지만, Codex 같은 에이전트는 조직이 그 속도 주변의 시스템을 확장하는 데 도움을 줍니다. 따라서 이런 다양한 단계가 있으며, 저희는 에이전트를 사용하여 계획의 속도, 구축의 속도, 검토의 속도, 심지어 배치의 속도도 증가시킬 수 있습니다. 당신이 생각하면, 계획, 구축 그리고 검토는 약간 더 쉽습니다. 왜냐하면 당신은 정말 세상에 어떤 부작용도 없기 때문입니다. 배치는 당신이 아는 보안이 정말 중요하기 시작할 때입니다. 왜냐하면 당신은 세상에 실제 영향을 미치기 때문입니다. 코드는 정말 배치되고 당신의 사용자들이 있는 곳을 만나갑니다. 저희는 이것들의 자동화를 가지고 있습니다. 저희는 에이전트 주변의 빌드를 허용합니다.

그리고 저희는 저희의 클라우드 에이전트 버전을 가지고 있으며 어 보안을 할 수 있으며 저희의 플러그인 시스템을 통해 보안 액세스를 가질 수 있으며 당신이 배치를 배치하고 검증하는 것을 허용합니다. 인간 승인을 통해 배치가 올바른지 검증됩니다. 이것이 저희가 오래 전에 시작한 여행입니다. Codex 팀은 특별합니다. 왜냐하면 저희는 에이전트와 이 에이전트들을 구동하는 모델을 설계했기 때문입니다. 저희는 저희 모델의 최첨단 상태를 발전시키기 위해 연구에 깊이 있게 들어갑니다. 이것은 모델 GPT-51 Codex Max로 시작했으며, 이제 그 이름으로 유명합니다. 저희는 2025년 말에 발출했습니다. 이것은 압축 용 단말간 RL에 대해 훈련되었으며 장기 실행 작업에 대해 훈련되었습니다. 이는 RL 중에 환경에서 저희가 운동할 때 모델에 도전하는 작업을 선택한다는 의미입니다. 컨텍스트 윈도우를 초과해서 잘 작동합니다.

그리고 컨텍스트 윈도우의 끝에서, 그것은 많은 컨텍스트 윈도우에 걸쳐 추론을 달성하기 위해 자신에게 위임해야 합니다. 저희는 또한 높은 추론 노력을 제공했습니다. 저희는 Windows에서 로컬로 작동하도록 훈련시켰으며, 저희는 30% 적은 생각 토큰으로 더 나은 성능을 달성할 수 있으며 새로운 최첨단 토큰 효율성을 달성할 수 있음을 보였습니다. 이것은 계속될 주제이며, 저희는 다른 모든 모델 배이에서 보는 것입니다. 토큰 효율성은 단지 더 좋아지고, 더 좋아지고 있으며, 이것으로 시간의 경과에 따라 에이전트를 더 빠르고 더 저렴하게 실행합니다. 52를 사용하면, 저희는 사이버 보안 기능을 증가시켰으며, 이것은 정말 저희가 지금 보는 전초기이며 사이버 주변의 전례 없는 능력을 가진 모델을 가집니다. 저희는 큰 코드 변경의 성능을 개선했지만, 저희는 또한 시각적 능력을 추가했습니다.

저희는 단지 텍스트에서 텍스트로의 모델을 구축하고 있지 않습니다. 저희는 모든 것 에이전트를 구축하고 있습니다. 53을 사용하면, 저희는 그것을 더 빠르게 했습니다. 54를 사용하면, 저희는 100만 컨텍스트 윈도우를 추가했습니다. 55는 이미 저희가 지금까지 했던 가장 큰 단계 변경입니다. 표면적으로 보이더라도, 54에서 55로의 작은 증분 0.1 어 개선입니다. 그것은 실제로 더 큰 변경입니다. 저희는 컴퓨터 사용을 추가했으며, 저희는 그것을 더 많은 토큰 효율적으로 만들었습니다. 그것은 정말 오늘날 사용 가능한 가장 똑똑하고 가장 빠른 모델입니다. 하지만 무엇이 그것을 작동시킵니까? 무엇이 그것을 작동시킵니까 단지 모델이 아닙니다. 모델과 하드웨어의 조합입니다. 이것이 Codex가 특별한 이유입니다. 저희는 함께 이것들을 공동으로 설계할 수 있으며 하드웨어를 정말 모델에 대해 최적화하고, 모델을 하드웨어에 대해 최적화할 수 있습니다.

그것은 저희가 매우 광범위하고 매우 효율적으로 지능의 새로운 범주를 제공할 수 있도록 허용합니다. 5는 불과 몇 주 전에 발출되었으며, 저희는 이전의 어떤 발출보다도 2배 빠르게 수익 성장을 보고 있습니다. 사람들은 정말 그것을 좋아합니다. 저희는 채택이 정말 미쳤다고 봅니다. 당신은 여기에서 그것이 SweetBench Pro에 새로운 산업 높이를 설정했을 수 있습니다. 저희는 또한 터미널 테이블에서 새로운 소다를 달성했습니다. 저희가 단지 모델을 하나씩 밀어 최전선을 밀어내고 있는 것처럼 보입니다. 모델들은 저희가 현재 약 매월 한 모델의 속도로 배이하고 있습니다. 저희 모두는 또한 이것과 동시에 전례 없는 신뢰성을 제공했습니다. 그리고 이것은 짧은 성과가 아닙니다. 정말 저희가 제공해야 하는 엔지니어링 및 기반 시설 개선의 수준은 약 1년 전에 시작했으며, 이것은 저희가 전례 없는 수요로 확장할 수 있게 했습니다. 폭발을 사용합니다.

저희는 어 수준에서 55의 트래픽을 제공하면서 저는 때때로 실패합니다. 저희는 이런 놀라운 엔지니어 팀과 자신들의 호출자도 있으며, 또한 거의 말하지 않는 것은 저희의 모델이 얼마나 효율적인지이며, 이것은 저희가 단지 정말 모든 계획 전체에 관대한 제한을 제공할 수 있게 합니다. 저희는 99.39의 가용성을 달성했으며, 저는 이에 대해 매우 자랑스럽습니다. 어, 동시에 수백 개 회사에 의해 확장되고 사용되고 있습니다. 저희는 이제 400만 이상을 가지고 있으며, 곧 500만에 가까워지는 주간 활성 사용자입니다. 지금은 시작하기에 최고의 시간입니다. 많은 엔지니어들이 더 많은 코드를 작성합니다. 저희는 이미 이야기했습니다. 하지만 저희가 아직 이야기하지 않은 것은 OpenAI 내부에서 정말 모든 사람, 저는 보는 모든 사람, 제가 말한 모든 사람이 Codex를 정말 모든 것에 사용한다는 것입니다. 단지 엔지니어링만이 아닙니다.

저희는 마케팅 부서가 사용하고 있다고 봅니다. 저희는 재정 개선 어 놀라운 자금 라운드, Codex를 사용하여 모든 것을 조정하고 있습니다. 그것은 모든 것 에이전트가 되었습니다. 그리고 저희는 Codex를 사용하여 Codex를 구축했기 때문에, 저희는 이전보다 더 빠르게 구축했습니다. 저희는 올해 특별한 수의 기능을 발출했습니다. 팀 구성, 새로운 모델, Windows용 Codex입니다. Codex 응용프로그램 자체는 불과 3개월 됐으며, 이것을 생각할 때도 저를 놀라게 합니다. 저희는 빠른 모드를 발출했습니다. 저희는 또한 자동 검토를 발출했으며, 이것은 저의 즐겨 찾기 기능 중 하나입니다. 에이전트와 보안 및 안전을 생각할 때, 자주 간과되는 한 가지는 승인과 인간 승인은 시간이 경과함에 따라 피로와 오류로 이어지는 것입니다.

당신이 당신의 에이전트가 하는 모든 것을 검증해야 하고 당신이 그것을 승인하고 싶은지 진지하게 생각해야 한다면, 당신은 어떤 지점에서 실수를 하도록 운명지어져 있으며 그것에 너무 많은 액세스 권한을 주거나 그것을 무언가를 하도록 할 수 있거나 PR을 병합하거나 더 나쁘게는 메시지를 어딘가로 보낼 수 있으며 당신이 하지 말아야 할 곳입니다. 저희가 계속 확장됨에 따라 이것이 참이 될 것입니다. 당신은 더 많은 에이전트가 당신을 위해 작동합니다. 자동 검토는 새로운 시스템이며, 그것은 두 번째 에이전트를 도입하며, 그것은 첫 번째 에이전트의 행동을 검증하고 당신의 작업의 원래 의도에 따라 그들을 검증합니다. 따라서 당신이 예를 들어 어 내 중요한 이메일을 확인하고 마지막 3개를 끌어 당기도록 말한다면 당신은 알고 있습니다. 오늘 내가 설정한 목표에 특정합니다.

그렇다면 자동 검토는 이것이 귀하의 의도이며, 주요 에이전트가 그 의도와 일치하는 모든 행동을 검증한다는 것을 이해할 것입니다. 의심스럽거나 높은 위험이 있는 모든 항목은 차단되며, 주요 에이전트는 다른 작업을 시도하도록 리디렉션됩니다. 이는 인간의 주의를 보유하고 불필요한 승인으로 피로해지지 않도록 해주므로 매우 중요합니다. 이것은 현재 OpenAI 내에서 기본값이며, 승인을 20배 감소시켰습니다. 우리가 회사에서 본 이점은 코딩을 훨씬 초과합니다. 우리가 자동화, 더 깊은 엔터프라이즈 제어, 선도적인 모델 및 전체 개발자 경험에 투자하는 많은 기둥들이 있습니다. 우리가 배송한 응용 프로그램의 광택 수준과 우리가 배송한 경험이 얼마나 즐거운지에 대해 매우 자랑스럽습니다.

저는 여러분 모두에게 이것을 시도하도록 초대합니다. 이것은 정말로 에이전트와 상호작용하는 다른 방식이며, 시간이 지남에 따라 우리는 이것을 귀하가 관리하는 각 에이전트의 조종석으로 발전시킬 것입니다. Codex는 빌더뿐만 아니라 거의 모든 것에 대해 많은 것을 잠금 해제했습니다. 우리는 비기술자들을 위해서도 매우 놀라운 사용 사례를 봅니다. 이것은 Rowan의 엄마가 Chachi에서 이미지 생성 2의 마법을 처음 경험한 것입니다. 그녀는 경험이 풍부한 채용 담당자입니다. 그녀는 정말로 이력서 관리 전반에 걸쳐 많은 일을 할 필요가 있었고, 그녀는 채용으로 돌아가고 싶었습니다. 우리는 그녀에게 Codex를 보여주었고, 그녀는 즉시 이해했습니다. 에이전트와 상호작용하는 새로운 방식이 있으며, 이것은 정말로 모든 사람에게 올 것입니다. 우리는 에이전트가 기술자들만을 위한 것이라고 생각하지 않습니다.

에이전트를 전 세계로 가져갈 때를 생각하면 다양한 도전이 있으며, 여러분은 정말로 마법을 보존하면서도 안전하고 보안을 유지해야 합니다. 하지만 우리는 이것이 곧 전 세계로 올 것이라고 생각하며, 엔지니어와 기술 담당자들을 더 효율적으로 만드는 것뿐만 아니라입니다. 우리는 우리의 에이전트를 전 세계와 연결합니다. 우리는 거의 모든 것에 대한 플러그인을 가지고 있습니다. 우리는 또한 메모리 시스템에 종사하고 있습니다. 우리는 새로운 모델에 종사하고 있습니다. 여러분은 자동화를 설정하여 특정 일정에 실행되도록 할 수 있으며, 아마도 몇 시간마다 여러분에게 보고서를 제공할 수 있습니다. 그리고 정말로 우리가 시작하는 것은 모델이 복잡한 작업에서 그토록 신뢰할 수 있다는 것이므로, 이것은 정말로 단지 상황에 관한 것과 여러분이 그 모델들에게 주는 접근 권한입니다.

그리고 이것은 정말로 지금 잠재력의 상한선입니다. 이 모델들이 세계에 얼마나 많은 접근 권한을 가지고 있는지와 같습니다. 우리는 다양한 영역에서 큰 성공을 봅니다. 저는 세계에서 가장 선진한 엔지니어링 조직 중 하나의 예를 사용하여 이것을 구체화하겠습니다. C Limited, APAC의 최신이자 가장 큰 디지털 플랫폼 중 하나이며 주요 오픈 고객입니다. C는 Codex로 전력을 다합니다. 전체 개발자 조직에 배포했으며, 최고 제품 책임자가 우리와 공유한 것은 Codex가 정말로 코딩을 뛰어넘으며 꽤 신비로워 보입니다. 우리는 6월 6일에 여기 C에서 첫 번째 지역 Codex 해커톤을 하는 것에 만족합니다. 바로 싱가포르 여기 있습니다. 저는 여러분 모두가 참여하고 온라인에서 확인하길 정말 원합니다. 우리는 또한 45,000명의 Nvidia 직원에게 이것을 배포했습니다. 음, 우리는 단 2주 만에 이것을 했습니다.

Codex는 Nvidia 내의 배포에서 스스로를 도왔으며, 이것은 우리가 보는 추세입니다. 우리는 단지 에이전트를 사용하여 Codex 자체의 배포 및 개발을 포함한 모든 것을 가속화합니다. Codex의 특별한 점은 그것이 완전히 오픈 소스라는 것입니다. 여러분은 GitHub에서 하드웨어의 코드를 읽을 수 있습니다. 그것은 Codex repo 아래 있습니다. 음, 여러분은 또한 그것을 어디든지 가져갈 수 있습니다. 우리는 지금 ChatGPT 앱을 통해 방금 원격 제어를 출시했습니다. 따라서 여러분은 Raspberry Pi에서 실행할 수 있으며, Mac Mini에서 실행할 수 있으며, 여러분의 노트북에서 실행할 수 있으며, 그 다음 여러분의 앱에서 보안 연결을 통해 완전히 제어할 수 있습니다 음, 직접.

여러분은 또한 할 수 있으며, 매우 신비로운 한 가지는 제가 하고 싶어하는 것은 브라우저 사용 또는 컴퓨터 사용 플러그인을 사용하는 것이며, 그것이 단지 사용하고 여러분의 컴퓨터 전체에서 탐색하도록 허용합니다, 하지만 음, 이 작은 명령을 사용하여, 이 작은 원격 제어, 여러분은 단지 여러분의 휴대전화에 있습니다. 그리고 저는 이것이 우리가 곧 실현할 것이라고 생각하며, 에이전트는 그에 대한 일종의 영구성을 가질 것이고, 우리는 단지 정말로 그것을 우리가 다양한 다양한 클라이언트에서 도달할 수 있는 클라우드에 있는 이 작은 엔터티들처럼 보기 시작할 것입니다. 그것은 웹에 있고, 데스크톱 앱을 통해, 클라이언트를 통해. 결국, 여러분은 단지 여러분의 전화를 집어 들고 여러분의 에이전트와 대화하며, 그것은 여전히 여러분을 위해 일을 할 수 있으며 여러분의 삶의 모든 것에 접근할 수 있습니다. 우리는 또한 빠르게 배포하며, 우리는 음, 빠르게 고칩니다.

음, 우리는 우리는 때때로 실수하는 것을 부끄러워하지 않습니다 그리고 음, 우리가 잘못했을 때 일부 음 속도 제한을 리셋합니다. 쿨한 것 중 하나는 또한 Peter가 저와 함께 일하고 있습니다. 그는 OpenClaw의 원래 창시자입니다. 우리는 또한 이것을 오픈 소스 프로젝트로 지원합니다. 우리는 최근 Codex와 동일한 기반을 바탕으로 OpenClaw의 핵심을 다시 쓰기에 종사했습니다. 따라서 그것은 실제로 아래에서 Codex 에이전트를 실행합니다. 여러분은 오픈 소스 repo 음 음 에서 그것을 읽을 수 있습니다. 다시 이 모든 코드가 오픈 소스인 것처럼, 우리는 정말로 단지 간단한 방식으로 이 일들을 하는 방법을 보여줌으로써 발명의 이 새로운 세대에 기여하고 싶습니다. 음, 우리는 안전 우선을 취합니다. 우리는 또한 보안에 대해 많이 생각하고 있습니다. 우리는 Windows 샌드박싱에서 혁신했습니다. 우리는 우리의 블로그 게시물에서 이에 대해 많은 것을 출판했습니다.

여러분은 그곳에서 Windows 샌드박스에 대한 모든 것을 알 수 있습니다. 우리는 또한 제품 수준에서 일부 어려운 문제를 해결하려고 시도하고 있습니다. 미래에 우리는 에이전트를 ChatGPT의 규모로 확장하고 싶으며, 현재 ChatGPT는 거의 10억 명의 사용자를 가지고 있습니다. 저를 흥분시키는 많은 것들이 있지만, 여기 우리가 정말로 하려고 하는 일부입니다. 우리는 새로운 메모리 시스템을 개발 중입니다. 우리는 Chronicle을 출시했으며, 이는 실험적 연구 미리보기 버전이며, 여러분의 에이전트가 여러분이 화면에서 하는 모든 것을 추적하고 그로부터 메모리를 형성할 수 있도록 하므로, 그것은 여러분이 지난주에 무엇을 했는지 알고 있습니다. 그것은 여러분이 오늘 무엇을 했는지 알고 있으며, 더 상황 인식이 되고 있습니다.

우리는 이것이 상당히 획기적일 것이라고 생각하며, 새로운, 새로운 확장 패러다임입니다. 음, 그 다음 우리는 또한 도구 처리의 새로운 방식을 개발 중입니다. 저는 미래에 이들을 더 많이 공유할 수 있기를 기대합니다. 저는 이 방의 일부 개발자들이 몇 가지 질문을 제기하고 싶다는 것을 들었으며, 불행히도 저는 현장에서 질문을 들을 수 없었지만, 우리는 몇 가지 질문을 수집했으며, 저는 그 중 두 가지를 논의할 수 있기를 정말 바랍니다. 음, 이것은 Louis의 질문입니다. Codex 애플리케이션의 DevX는 제가 본 것 중 최고입니다. 프로젝트 구성, 원클릭 PR. 그것은 제 빌드 방식을 바꿨습니다. 에이전트가 점점 더 강력해지고 사용자 기반이 개발자를 넘어 확장되면서, 여러분은 인터페이스 레이어를 어떻게 생각하십니까? 채팅은 우리가 대형 언어 모델에서 상속한 기본값처럼 보입니다. 그것은 실제로 사람과 에이전트의 장기 협업을 위한 올바른 패러다임입니까?

여러분에게 이 진화는 어떻게 보입니까? 저는 이것이 매우 흥미롭다고 생각하며, 처음에 우리는 정말로 단지 이것을 상속했으며, 우리는 대형 언어 모델을 통해 대형 언어 모델에 전력을 공급했고, 대형 언어 모델은 채팅 대화 인터페이스에 전력을 공급했으며, ChatGPT가 이 혁명을 열었으며, 지금 우리가 보는 것은 대형 언어 모델이 여러분을 대신하여 일을 할 수 있으며 모든 접근 권한을 얻을 수 있다는 것입니다. 우리는 이 일들에 대해 우리의 생각하는 방식을 바꿔야 합니다. 그것은 정말로 깊게 변할 것이며, 저는 우리가 컴퓨터와, 기술과 상호작용하는 방식을 생각합니다. 저는 그것이 우리를 우리가 집단적으로 발견했다고 생각하는 일부 제한에서 해방시킬 수 있기를 희망합니다, 저는 우리가 항상 휴대전화에 붙어 있다고 생각하며, 여러분이 알 듯이, 구부러진 음, 여러분이 알 듯이, 아마도 우리는 노트북에서 미쳤지만, 유사하게 우리는 다른 사람들과의 연결이 충분하지 않습니다.

저는 미래가 사람들이 더 많이 연결된 미래가 될 것이라고 생각하며, 모든 것이 더 환경화되고 무결한 미래입니다. 여러분은 자연 언어, 자연 음성을 통해 매우 다중 모달 방식으로 기술과 상호작용할 수 있으며, 그것은 여러분이 그 순간에 하고 싶은 일에 매끄럽게 적응합니다. 지금 상상하기는 어렵지만, 저는 생각하며, 여러분이 알 듯이, 약 1년 안에, 우리는 에이전트가 유형이 되는 것을 시작하고 일들이 더 자연스러워지는 것을 시작할 것입니다. 여러분은 단지 자연 음성을 통해 이 모든 것을 계속 활용합니다. 음, 우리는 오늘날 여러분의 컴퓨터에 존재하는 응용 프로그램의 경계를 깨뜨릴 것입니다. Dehan이 물었습니다, 「여러분은 일부 스캐폴딩이 모델의 개선에 따라 사라져야 한다고 말했지만, 기술은 아마도 유지해야 할 사용자 소유의 스캐폴딩인 것처럼 보입니다.

누군가의 어떤 것이 실패할 때, 여러분은 기술을 활용하기 위해 모델에서 그것을 수정할지 아니면 다른 곳에서 수정할지를 어떻게 결정하십니까? 오늘날의 모델 한계를 명백히 내일의 기반시설로 변환하지 않으면서요?」 이것은 우리가 많이 생각하는 것이고, 이것은 우리의 설정에서 독특합니다. 우리는 모델에 대한 제어권을 가지고 있습니다. 우리는 도구 시스템과 제품에 대한 제어권을 가지고 있으며, 에이전트 원시에 대한 제어권을 가지고 있습니다.

우리는 자주 우리 자신에게 묻습니다. 이봐, 만약 우리가 오늘 도구 시스템에서 이것을 고치지 않는다면, 모델을 개선하는 속도는 얼마나 빠를까? 이것은 여러분이 알 듯이, 예를 들어, 끝단 압축과 끝단 강화 학습 및 매우 오랫동안 실행되는 작업에 대한 압축입니다. 이전에 사람들은 수동 압축 및 매우 복잡한 시스템으로 이것을 수정하려고 시도했으며 상태를 유지했습니다. 우리는 아마도 다음 모델 훈련에서 매우 열심히 일함으로써 이것을 수정할 수 있으며 이 일관성을 유지할 수 있을 것이라고 생각했습니다 매우 오랜 작업을 둘러싸고. 음, 따라서 우리는 모델에서 그것을 고쳤습니다. 때때로 우리는 다음 세대 모델에서 수정하는 데 몇 개월 이상이 필요하다고 추정하며, 그 다음 우리는 일부 지름길을 취하기로 결정하며, 음, 도구 시스템에서 그것을 고칩니다.

따라서 항상 이 건강한 긴장이 있지만, 우리는 함께 사물을 공동 설계할 수 있으며, 정말로 제일 원칙의 관점에서 사물을 다룰 수 있습니다. 음, 이것은 항상 이 문제들에 대해 생각하는 것이 매우 흥미롭습니다. 또한 몇 가지 질문이 있지만, 음, 저는 시간이 조금 부족하다고 생각합니다. 저는 단지 여러분 모두가 여기 있어 주신 것에 감사드리고 싶습니다. 음, 저는 여러분 모두에게 이 기술로 생각하도록 초대하며, 여러분이 알 듯이, 미래가 어떻게 생길지 생각해 보세요, 여러분이 알 듯이, 여러분의 삶에 그것을 초대하세요. 그것은 계속될 것입니다. 그것은 계속 진화할 것입니다. 이것은 모든 이 일들을 탐색하는 멋진 시간입니다, 저는 여러분이 멋진 빌드 시간을 가질 수 있기를 바랍니다. 저는 GovTech의 인공지능 관행 책임자인 Fran Yang 박사를 무대로 초대하고 싶습니다. 음, 모두 아침입니다.

음, 저는 Yang이고, 저는 싱가포르 GovTech에서 AI 팀을 주도합니다. 저는 싱가포르 AI 엔지니어 이벤트에서 우리가 싱가포르 정부에서 인공지능의 채택을 어떻게 추진하고 있는지 여러분과 공유할 수 있게 되어 기쁩니다. 잘못된 원격 제어입니다. 예. 따라서 GovTech의 매우 빠른 소개, 만약 여러분이 친숙하지 않다면. 음, GovTech는 싱가포르 음, 스마트 시티 계획과 공공 부문 디지털 음, 변환을 주도하는 주도 기관입니다. 우리는 디지털 정부 서비스를 제공하기 위해 기술의 힘을 활용합니다. 저는 여러분 중 일부가 실제로 여러분 중 많은 사람이 이미 SyncPus live SG, Go Business 등과 같은 일부 GovTech 제품을 사용했다고 믿습니다. 우리의 사명은 정말로 디지털 정부를 위해 엔지니어링하고 삶을 더 낫게 만드는 것입니다. 음, 실제로 GovTech는 2016년에 설립되었으며, 이 해 우리는 공공 이익을 위한 기술 서비스의 10년을 축하하고 있습니다.

AI로 돌아가며, 정부는 명백히 AI를 채택해야 합니다. 음, 첫 번째 가장 직접적인 이유는 명백히 효과성과 효율성을 위해서입니다. 우리의 정부는 수백만 명의 사람들이 매일 의존하는 서비스를 제공할 책임이 있습니다. AI는 우리에게 이것을 더 빠르고, 더 정확하고, 더 큰 규모로 달성할 수 있는 기회를 제공합니다. 이것은 우리가 놓칠 수 없는 기회입니다. 하지만 운영상 이점 외에도, 시민과 기업의 기대에 관한 질문이 있습니다. 새로운 기술이 시민의 생활 방식과 기업의 운영 방식을 형성할 때, 사람들은 점점 더 정부가 기술 속도를 따라잡기를 기대합니다. 이것은 정부에 대한 국민의 신뢰와 신뢰를 증가시킬 것입니다. 죄송합니다. 디지털 세계에서 좋은 거버넌스에는 더 깊은 이유가 있습니다. 우리는 그것을 형성하는 기술을 이해할 필요가 있습니다.

인공지능과의 실제적 운영 경험은 주의 깊고 정보에 바탕을 두며 목표에 부합하는 정책을 수립하기 위해 필요한 직관을 형성합니다. 우리의 시민을 보호하면서 혁신을 촉진합니다. 마지막으로, 만약 우리가 우리 전체 국가가 우리의 총리가 말한 대로 인공지능을 수용하기를 원한다면, 정부는 할 수 없으며 해야 합니다 할 수 없습니다 옆에 앉아 있습니다. 우리는 모범을 보여야 합니다. 시민들이 자신의 정부가 인공지능을 책임감 있게 그리고 효과적으로 사용하는 것을 볼 때, 이것은 신뢰를 구축하고 전체 사회의 톤을 설정합니다. 실제로, 우리는 영점에서 시작하지 않습니다. 수년에 걸쳐, 우리의 정부는 정책에 정보를 제공하고 운영을 개선하고 서비스 제공을 위해 많은 분야에서 인공지능을 사용하고 있으며, 제도 내부뿐 아니라 시민과 기업에 대한 외부 서비스입니다.

단지 우리가 정부에서 구현한 많은 인공지능 사용 사례 중 일부 예를 공유하고 있습니다. 의료 분야에서 인공지능은 치매 전 증상의 초기 징후를 감지하도록 개발되었습니다. 이 기술은 매우 높은 정확도 수준에 달했으며, 결과는 과학 저널 Nature Communications에 발표되었습니다. 우리는 실제로 올해 지역사회 장소에서 이 기술을 출시하고 있습니다. 교육에서 인공지능은 교사들이 더 높은 정확도로 숙제를 더 빠르게 채점할 수 있도록 배포되었으며, 한 수업당 채점 시간을 3~4시간 줄입니다. 교사들에게 학생들과 상호작용할 더 많은 시간을 제공합니다. 일과 기술의 경우 우리 음, 우리의 추천 엔진은 나의 경력 미래를 지원해 왔으며, 싱가포르인과 주민들에게 개인화된 일과 코스 추천을 제공하여 더 빠르게 더 적합한 직책을 찾고 더 효율적으로 새로운 기술을 배우도록 돕습니다.

시민 서비스의 경우 우리는 우리의 시민 콜센터에 최신 인공지능 모델을 배포했습니다. 전사, 요약 및 분석 기능을 통해 시민들을 더 잘 서비스할 수 있으며, 판매 후 작업을 72% 줄이고 고객 만족도를 95%로 높입니다. 동시에 우리는 또한 안전 테스트 도구 및 보호 장치를 개발함으로써 인공지능을 책임감 있게 적용하도록 보장하여 우리의 인공지능 솔루션이 안전하고 안전하며 의도한 방식으로 작동하는지 확인합니다. 지난 몇 년 동안 정부에 인공지능을 도입하는 면에서 상당한 진전을 이루었지만, 음, 우리는 실제로 더 나아가고 인공지능 활성화 정부에서 인공지능 원시 정부가 되기를 갈구합니다. 따라서 여러분은 차이가 무엇인지 물어볼 수 있습니다. 인공지능 활성화 정부는 인공지능을 도구로 사용하며 기존 프로세스에 대한 유익한 보완입니다.

이것은 보통 유산 시스템에 기반하며 증분 개선이 존재합니다. 시스템은 확장될 수 있지만 복합 성장은 불가능합니다. 반대로, 인공지능 원시 정부는 훨씬 더 야심한 목표입니다. 이것은 인공지능이 모든 것의 기초이자 핵심이라는 의미입니다. 우리는 처음부터 정부의 업무 방식을 다시 상상하며, 우리의 생각, 설계 및 제공 방식에 인공지능을 내장합니다. 따라서 항상 계속되는 혁신이 있을 것입니다. 그렇다면, 인공지능 원시 정부가 우리에게 구체적으로 의미하는 것은 무엇이며, 우리는 어떻게 이를 위해 노력할 것입니까? 우리는 사용자 역할로 구분되는 네 개의 기둥과 하나의 횡단 측면에서 이것을 생각합니다. 빨리 여러분을 위해 진행하겠습니다. 먼저, 우리는 모든 공무원이 인공지능으로 강화되기를 원합니다.

15만 명 이상의 모든 공무원, 기층 직원에서 총리까지 예외 없이. 저는 Vivin 장관이 방금 그가 인공지능을 어떻게 사용하고 구축하는지 이야기했다고 생각합니다. 음, 2주 안에 나는 상임 비서들의 방에 에이전트를 구축하는 방법에 대한 기술 실무 교육을 실시할 것입니다. 우리는 정말로 모든 공무원의 손에 인공지능 생산성 도구를 넣고, 초안 작성, 요약, 전사, 분석 등의 일상 작업 및 워크플로우를 처리하도록 도와주고 싶습니다. 둘째, 우리는 시민 개발자가 인공지능으로 빌드할 수 있기를 원합니다. 이들은 기본적으로 우리가 관심 있는 문제 진술에 가장 가까운 비기술 공무원입니다. 그들은 정책 공무원, 시민 참여 공무원, 제품 관리자 또는 디자이너일 수 있습니다. 우리는 그들에게 코드를 작성하고, 프로토타입을 만들고, 배포할 수 있는 도구를 제공하고 싶습니다.

저는 개인적으로 이것이 게임 변경 이니셔티브라고 생각하며, 전체 정부 내 혁신 패러다임을 변경할 것이므로, 이제 엔지니어에게 더 이상 의존하지 않으며, 사람들은 초기 단계에서 정말로 그들의 아이디어를 실현할 수 있습니다. 셋째, 소프트웨어 엔지니어의 경우 인공지능을 통해 더 빠른 속도와 더 높은 품질로 생산 수준의 응용 프로그램을 구축할 수 있으며, 전체 소프트웨어 개발 생명주기를 압축합니다. 우리는 개발자들에게 Claude Code, Codex와 같은 많은 다양한 인공지능 코딩 보조자를 출시했습니다. 이것은 단지 코딩 작업을 돕기 위한 것이 아니라 코드 검토, 테스트 및 문서와 같은 전체 SDLC를 포함합니다. 마지막 기둥은 도메인의 인공지능과 도메인 변환 및 현대화에 관한 것입니다.

우리는 교육, 운송 및 의료와 같은 몇 가지 핵심 영역과 인력 자원 및 재무와 같은 부서 간 기능에 집중하고 더 나은 결과를 위해 비즈니스 프로세스를 완전히 재설계하고 싶습니다. 여러분은 이 모든 인공지능 이니셔티브를 지원하는 것이 우리의 정부 인공지능 스택이라는 것을 보게 될 것이며, 그것은 정말로 최신 기초 모델뿐만 아니라 시각, 음성, 문서 분석, 평가 및 보안 측면에서 커스텀 인공지능 능력을 제공합니다. 이 모든 것은 정부 컨텍스트 및 현지화를 통해 제공됩니다. 이것은 우리의 인공지능 솔루션이 고성능 모델로 지원되도록 보장할 것이며, 더 짧은 상장 시간을 가지고 있으며, 설계 자체에 안전하고 신뢰할 수 있습니다. 플랫폼의 일부로 우리는 또한 에이전트 도구의 능력을 구축하고 있습니다. 그것이 무엇인지 그리고 우리가 왜 그것을 하는지 설명하기 위해 몇 분을 소비하겠습니다.

미래를 내다보며, 우리는 업계에서 인공지능 에이전트가 곧 대량으로 나타날 것이라는 것을 알고 있습니다. 이것은 인공지능이 더 강력해지고, 데이터에 접근할 수 있으며, 도구에 접근할 수 있으며, 자율적 방식으로 작업을 수행할 수 있다는 것을 의미할 것입니다. 국제 데이터 공사의 연구에 따르면 2028년까지 13억 개 이상의 인공지능 에이전트가 있을 것입니다.

이것은 매우 크고 무서운 숫자이지만, 저는 개인적으로 우리가 관찰할 수 있는 개발 속도에 따르면 이것이 실제로 매우 보수적일 수 있다고 생각합니다. 우리는 이미 개인 사용, 팀 협업 및 엔터프라이즈급 소비를 위해 에이전트를 개발하기 시작하는 사람들을 볼 수 있습니다. 정부에서 시민 서비스, 정책 연구 등과 같은 인공지능 에이전트의 전체 사용 사례 세트가 있습니다. 정부에서 인공지능 에이전트의 확산으로 우리는 반드시, 우리는 가치를 최대화할 수 있고 관련 위험을 관리할 수 있도록 효과적으로 그들을 활성화, 최적화 및 관리할 수 있는 방법을 생각해야 합니다. 죄송합니다, 우리는 여러 구성 요소를 포함하는 주권 에이전트 도구를 구축하고 있습니다.

MCP 게이트웨이는 전면 입구 역할을 하며, 에이전트 런타임은 샌드박스 환경과 에이전트가 작업을 수행하는 리소스를 제공합니다. 에이전트 신원 관리, 각 에이전트가 확인된 신원을 가지며, 무엇을 할 수 있는지 알고 있으며, 그 경계를 넘지 못한다는 것을 보장합니다. 에이전트 메모리, 단일 세션 내에서 단기 메모리가 있고 여러 세션에서 장기 메모리가 있는 개인화된 경험을 사용자에게 제공합니다. 관찰성이 중요합니다. 전체 에이전트 생태계에 대한 감시를 제공하며, 에이전트가 하는 일을 모니터링하고 조기에 문제를 발견하며 무엇이 잘못되었는지 이해합니다.

기술 플랫폼, 웹 검색, 문서 읽기, 이메일 전송과 같은 풍부한 기성 기능 라이브러리를 포함하고 있으며, 이 모든 것은 버전화되고, 평가되고, 공유 가능하며, 관리되므로 에이전트가 작업을 완료하기 위해 활용할 수 있습니다. 그 생각은 정부의 모든 보조자 또는 에이전트, 코딩 에이전트, 협동 작업 세션 또는 워크플로우 에이전트이든 이 스택의 클라이언트입니다. 한 정문, 모든 것이 보입니다. 여러분은 이를 단일 로컬 설정에서 생각하면 상대적으로 간단하다고 생각할 수 있지만 엔터프라이즈 수준에서, 특히 정부 내 여러 조직의 생태계에서 생각할 때, 이것은 완전히 다른 게임입니다.

유추로 나는 항상 자동차 예제를 사용하여 생각하는 것을 좋아합니다. 초강력한 자동차 엔진 자체는 한 위치에서 다른 위치로 사람을 운송하기에 충분하지 않습니다. 여러분은 견고한 자동차 차체가 필요합니다. 여러분은 도로가 필요합니다. 여러분은 또한 안전하고 효율적인 여행을 실현하기 위해 명확한 교통 규칙이 필요합니다. 마찬가지로 인공지능 모델은 자동차 엔진과 같습니다. 그들 자체는 효과적인 에이전트가 되기에 충분하지 않습니다. 그들은 실제로 유용하고 신뢰할 수 있게 되기 위해 도구가 필요합니다. 따라서 우리의 에이전트 인공지능으로의 한 가지 핵심 전략은 실제로 에이전트 도구에서 이 능력을 구축하는 데 무거이 투자하는 것입니다. 이것이 저의 공유의 끝입니다. 여러분의 주의에 매우 감사합니다. 이것은 정말로 흥미로운 시간입니다. 이것은 우리 앞에 정말로 흥미로운 시간입니다. 음, 우리와 협력해 주십시오.

음, 그리고, 여러분이 알 듯이, 만약 여러분이 공공 이익을 위한 인공지능에 대해 이 의미 있는 여정에 우리와 함께하는 데 관심이 있으며, 만약 여러분이 관심이 있다면, 우리 부스를 방문해 주십시오. 여러분이 알 듯이, 우리는 우리가 하는 일, 이니셔티브 및 프로젝트의 일부를 전시하는 팀을 가지고 있으며, 그들은 협력 기회에 대한 더 많은 세부 사항을 매우 기꺼이 공유할 것입니다. 음, 나는 또한 LinkedIn에서 여러분과 연결되는 것을 매우 기꺼이 할 것이며 협력 기회에 대해 더 많은 것을 공유할 것입니다. 매우 감사합니다. 좋습니다, 저는 지금 우리 설계 트랙의 첫 번째 발표자를 무대로 초대하고 싶습니다. Air Foil의 CEO 및 공동 창립자 Phil입니다. 또한 빠른 공고가 있습니다. 음, 이제 오전 10시를 지났습니다. 그래서 우리의 전시실은 실제로 Pullman과 Capitol Kinsky에서 열려 있습니다. 만약 여러분이 지도 참고가 필요하면 우리는 도움이 될 수 있는 몇 가지 도구를 가지고 있습니다. 감사합니다.

좋습니다, >> 훌륭합니다. 모두 아침입니다. 여러분 모두가 여기 있는 것을 보는 것이 정말로 훌륭합니다, 솔직히 말해서, 이 전체 회의가 일어나고 있다는 것에 대해 생각하면, 여러분 중 이렇게 많은 사람들이 세계 각지에서 여행하고 싱가포르에서 이곳에 왔다는 것은 정말로 초현실입니다. 음, 저는 Phil Hedatnea입니다. 저는 Airfoil이라는 회사의 공동 창립자입니다. 음, 우리는 기본적으로 제품 설계, 브랜드 설계 및 설계 연구 회사의 조합이며, 기술 부문의 다양한 회사들과 협력합니다. 음, 하지만 지난 5년 동안 우리는 샌프란시스코와 싱가포르에서 이중 기반 운영을 해왔습니다. 따라서 여러분 모두가 여기 있는 것을 보는 것이 정말로 훌륭합니다. 음, 여러분이 우리가 누구인지 알든지 알지 못하든지, 음, 여러분은 아마도 과거에 우리가 완료한 일부 제품과 상호작용했을 것입니다. 예를 들어, 만약 여러분이 문서 처리를 위해 에이전트를 사용하고 있다면, 여러분은 아마도 Reduct를 사용하고 있을 것입니다.

응용 프로그램에 음성 AI를 임베드하려면 Vappy를 시도해 보세요. Gentic Search를 하고 있다면 Exa를 시도해 보세요. 혹시... 아, 뒷줄에 누가 있네요. 어, 또는 암호화 분야에서 오셨다면 Salana를 시도해 보세요. 음, 하지만 제가 말씀드리고 싶은 것은, 약 1년 전에 우리는 Airflow에 Airflow Labs라는 팀을 세웠습니다. 왜냐하면 우리 모두 마음속에 질문을 가지고 있었기 때문입니다. 그 질문은 매우 매우 단순했습니다. 「우리는 2년 후에도 일자리가 있을까요?」 왜냐하면 설계 회사로서, 맞죠, 특히 Twitter에서 설계세(design tax)에 대한 논의를 본 경험이 있다면, 그리고 지속적으로 개선되는 모델들이 설계자 없이 직접 물건을 구축할 수 있게 해주는 방법에 대한 논의를 본 경험이 있다면. 솔직히 말해서, 우리는 좀 두려웠습니다. 우리는 설계 프로세스에서 우리의 진정한 위치가 무엇인지 알고 싶었습니다. 그래서 우리는 구축을 시작했습니다.

우리는 내부적으로 Check 같은 것들을 개발했습니다. 이것은 우리 설계의 구현을 효율적으로 검증하기 위한 우리 자신의 엔진입니다. 우리는 한쪽에서 Figma 파일을 받을 수 있고, 다른 쪽에서는 라이브 테스트 웹사이트를 받을 수 있으며, 그 다음 이미지 모델을 사용하여 둘을 비교하고, 우리가 올바르게 구현했는지 확인합니다. 결국 이것은 상당히 멋진 것이 되었습니다. 바로 자체 개선 웹사이트입니다. 우리가 심각도에 따라 정렬하고 우선순위를 매길 수 있었기 때문에, 우리는 이를 코드 모델에 직접 피드백할 수 있었고, 첫 번째 개발 버전을 출시한 후에도 계속 웹사이트를 개선할 수 있었습니다. 우리는 Scoop이라는 것을 구축했습니다. 이것은 실제로 고객이 우리에게 주는 모든 정보를 가져와서 매우 포괄적인 브리프로 변환하는 것입니다.

우리가 받은 2~3페이지의 맥락에서 50페이지 이상을 생성합니다. 하지만 더 중요한 것은, 이것이 설계자들에게 그들이 설계하는 산업, 그들이 설계하는 고객과 사용자에 대한 더 많은 맥락을 제공한다는 것입니다. 이렇게 하면 그들이 더 나은 작업을 할 수 있습니다. 하지만 이 모든 것 이후에, 우리는 모두 함께 노력해서 모든 사람이 해결하려고 하는 효율적인 성배 문제인 몇 가지를 해결하기 시작했습니다. 우리는 어떻게 맛이 있는 설계 에이전트를 만들 수 있을까요? 쓰레기처럼 보이지 않는 것을 만들 수 있는 에이전트요. 그래서 오늘, 저는 우리가 배운 것들을 보여드리고 싶습니다. 그렇게 하겠습니다. 음, 그게 아니네요. 그건 완전히 아니군요. 어, 그것은 실제로 Impeccable.style에서 온 스크린샷입니다. 이것은 다운로드할 수 있는 것입니다. 우리는 만들지 않았습니다만, 당신의 에이전트가 더 나은 설계 유동성을 가질 수 있도록 도와줍니다.

그것이 작동하는 기본 방식은 에이전트에게 하지 말아야 할 것들의 묶음을 말하는 것입니다. 맞죠? 색상 대비가 적절한지 확인하거나 더 나은 타이포그래피를 사용하세요. 이것은 정말로 의미 있는 차이를 만듭니다. Impeccable.style 없이 그리고 Impeccable.style과 함께 웹사이트가 어떻게 훨씬 더 좋아 보이는지 볼 수 있습니다만, 여전히 좀 쓰레기처럼 보입니다. 직접 생성할 수 있는 것처럼 보입니다. 그럼 왜일까요? 왜 이것이 여전히 일어나고 있을까요? 음, 우리의 관점은, 우리가 좋은 설계라고 생각하는 것으로 AI를 훈련시키는 것이 AI에게 우리가 어떻게 그곳에 도달했는지를 가르쳐주지 못한다는 것입니다. 이것은 매우 중요한 관점을 놓치고 있습니다. 설계는 제품 명세를 Figma로 가져오는 것이 아닙니다. 설계는 심리학을 적용하는 것입니다. 이것은 사용자가 어떻게 생각하는지, 사용자가 어떻게 행동하는지, 그리고 사용자와 공감하는 프로세스, 시각 효과 및 내러티브를 만드는 것을 이해하는 것입니다.

저는 설계자들이 인간 심리학의 조사자라고 말하는 것을 좋아합니다. 이것은 우리가 하고 있는 상품 프로젝트를 위해 나의 공동 창립자가 정리한 무드보드입니다. 한눈에 봤을 때, 실제로 좀 무작위로 보입니다. 왼쪽 위를 보면, 당신은 샌프란시스코 캘리포니아 거리의 오래된 사진을 볼 것입니다. 이것이 상품과 무엇과 관련이 있는지는 명확하지 않습니다. 하지만 그것이 정말로 의미하는 것은, 우리가 우리가 의미를 얻는 것들을 분류하는 방식입니다. 이 이미지들은 한눈에 봤을 때 무작위로 보일 수 있지만, 그들은 누군가에게 의미를 전달합니다. 설계자들이 이러한 무드보드를 정리할 때, 그들은 이해하려고 합니다. 그들은 조사하려고 합니다. 왜 사람들이 어떤 것에 공감하는지, 어떻게 이를 수행할 것인지에 대한 규칙을 수립하고, 그 다음 자신의 작업에 이를 적용합니다. 이것을 보는 또 다른 방법이 있습니다. 그것은 그냥 인간의 창의성입니다.

음, 《The Runaway Species》라는 책이 있습니다. 작가는 Anthony Brandt와 David Eagleman입니다. Tony Brandt는 실제로 제가 다녔던 라이스 대학교의 교수입니다. 저는 그의 지도 아래에서 공부했습니다. 그는 나의 가장 큰 영감의 원천 중 하나이며, 제가 설계 분야에 들어가게 된 이유 중 하나입니다. 《The Runaway Species》가 명확히 하는 것은 인간 창의성의 정의입니다. 즉, 그것을 도입한 문화에 상대적으로 새로운 것을 만들기 위해 기존의 개념을 구부리고, 부수고, 섞는 것입니다. 간단히 말해서, 사람들은 창의적이 되도록 태어나지 않습니다. 그들은 선천적인 창의적 특성을 가지고 태어나지 않습니다. 우리는 매일 창의적입니다. 이것은 우리 뇌가 작동하는 방식의 간단한 부분입니다. 하지만 이것은 단순히 신경과학적 정의가 아닙니다. 이것은 사회학적 정의입니다. 우리는 생물모방공학 같은 것들에서 이것을 봅니다.

신칸센이 터널 출구에서 나올 때와 산을 지날 때 음폭발을 일으키지 않는 이유는, 그들이 다른 열차뿐만 아니라 왜가의 부리에 따라 신칸센을 모델링했기 때문입니다. 그것은 그들이 자연에서 얻은 통찰력이며, 완전히 다른 맥락에 적용합니다. Reducto 웹사이트 같은 것에서도, 우리는 사람들에게 더 친근하고 접근 가능하게 느껴지기를 원했습니다. 따라서 우리는 점 행렬 프린터의 점 행렬을 상기시킬 수 있는 페이지 요소들을 도입했습니다. 당신은 여기서 실제 예제를 볼 수 있습니다. 이런 작은 결정들이 인터페이스와 브랜드가 좋아 보이는 것과 것들이 쓰레기처럼 보이는 것과 자연스럽고 진정으로 창의적으로 보이는 것 사이의 차이를 만드는 것입니다.

하지만 나의 핵심 요점은, 이 모든 것이 결과에서 추출할 수 없다는 것입니다. 결과에 따라 훈련할 수 있고, 결국 전반적으로 더 나은 시각 효과를 얻을 것이고, 명백한 오류를 얻지 않을 것입니다만, 당신은 새로운, 흥미로운 그리고 신선한 시각 효과를 얻지 못할 것입니다. 우리가 이상적인 설계 결과에 따라 훈련하되 그들 뒤의 맥락과 사고 방식에 따라 훈련하지 않을 때, 그것이 실망스러운 결과를 얻을 때입니다. 그래서 우리는 이 문제를 해결하려고 시도하기로 결정했습니다. 저는 이것을 당신에게 보여드리겠습니다. 우리는 이전에 이것을 시연한 적이 없습니다. 이것은 현재 우리 내부의 것입니다만, 우리는 곧 이것을 대중에게 제시하길 원합니다. 저는 오늘 우리가 구축한 Melt이라고 하는 것의 첫 번째 모습을 당신에게 보여드리고 싶습니다. 그래서, Melt은 우리의 많은 설계자들이 하는 것으로부터 시작됩니다. 즉, 설계 Twitter입니다. 음, 하지만 이것은 많은 설계자들에게 같습니다. 맞죠?

그들은 항상 세상을 다니고 있습니다. 그들은 영감을 찾고 있습니다. 그들은 흥미로운 브랜드 방향을 보고 있고, 이제 직접 Melt에 저장할 수 있습니다. 그들은 Save to Melt 버튼을 클릭할 수 있고, 우리는 이를 그들의 배낭이라고 부르는 곳에 저장합니다. 또는, 예를 들어, 그들이 베트남 여행 중에 Pizza Four Pas라고 불리는 레스토랑에 들어갔다고 합시다. 그들은 「이것은 피자 레스토랑이지만, 이것의 브랜드 방향은 정말 아름답다」라고 생각할 것입니다. 정말로 좋습니다. 어, 일러스트레이션은 그들의 메뉴처럼 화려합니다. 그들은 직접 그들이 보는 것을 촬영할 수 있고, 직접 Melt에 저장할 수 있으며, 그 다음 우리는 타이포그래피, 색상 사용 같은 핵심 메타데이터를 추출하기 시작합니다만, 또한 회사 자체에 대한 배경 정보와 당신이 그것을 촬영했을 때 당신이 있었던 장소에 대한 정보도 포함합니다.

우리가 이 모든 메타데이터를 얻으면, 우리는 - 이것이 데스크톱 버전의 모습입니다. 우리는 이를 당신의 배낭에 넣을 수 있고, 당신은 나중에 이 모든 정보에 접근할 수 있습니다. 음, 그럼 당신은 왜 이 모든 정보를 가지고 싶을까요? 음, 첫 번째 이유는 설계자로서, 당신은 노트북을 사용하는 방식으로 이를 사용하고 싶습니다. 당신이 저장한 샘플에 주석을 달면서, 당신은 당신의 당시 생각을 기록할 수 있고, 이것은 6개월이라는 기간에 있어, 당신이 이 중 어느 하나로 돌아갈 필요가 있다면, 당신은 즉시 그렇게 할 수 있습니다. 하지만 이것은 또한 우리가 우리가 수집한 메타데이터 사이와 사람들이 그것을 어떻게 보는지, 그것이 그들의 인식에 어떻게 영향을 미치는지 사이의 연결고리를 시작할 수 있다는 것을 의미합니다. 따라서 이것은 더 복잡한 쿼리를 물어볼 수 있다는 것을 의미합니다.

예를 들어, 저는 2026년 베트남에서 세리프 타이포그래피와 파란색, 노란색 또는 검은색과 흰색 색상 팔레트가 있는 시각 자료를 찾을 수 있다고 말할 수 있습니다. 두 번째 부분은 당신이 직접 이미지 모델로만 할 수 있을 것이지만, 우리가 모든 것을 거기에 넣으면, 복합 쿼리는 더 쉬워집니다. 당신은 2026년 베트남에서 저장된 것 3개를 찾을 수 있다고 말합니다. 그것은 더 깊은 방식으로 그것이 실제로 참조하는 것을 이해할 수 있었습니다. 물론, 당신은 Figma로 내보내기를 클릭할 수 있습니다. 이것은 모든 설계자가 원하는 것입니다. 더 흥미로운 부분은, Melt이 당신이 물건을 저장하는 이유를 이해하면, 그것을 다른 사람들에게 제시할 수 있고, 그것은 더 많은 사람의 방식으로 공유할 수 있는 능력을 당신에게 제공할 수 있습니다.

따라서 Melt에서, 당신은 일반 쿼리를 수행할 수 있고, 다른 사람들이 남긴 평론과 주석을 사용하여 당신이 찾고 싶은 것을 더 잘 이해할 수 있습니다. 따라서 이것은 더 효율적인 콘텐츠 검색 엔진입니다. 따라서 만약 내가 밝고 통풍이 잘 되는 UI로 무드보드를 조립하는 것과 같은 것들을 말한다면, 그것은 내가 저장한 참고 자료뿐만 아니라 나의 팀원이 저장한 참고 자료도 찾을 수 있고, 그들이 왜 저장했는지에 대한 맥락이 있습니다. 이것은 정말로 정말로 중요합니다. 창의성의 정의로 돌아가면, 우리의 관점은, 회상을 강화하고 더 빠르게 사람들 앞에 물건을 놓는 것을 통해서, 하지만 또한 그 창의적 프로세스를 보존하고, 피드백, 왕복, 그리고 작업이 사람들과 공감하게 하는 평론을 보존하는 것을 확인함으로써, 더 깊은 방식으로 이를 이해합니다.

이것이 우리가 다음 단계를 취할 수 있게 해주는 것입니다. 즉, 실제로 「창작」이라는 「미적 감각」 또는 인간 설계자의 의도를 주입하려는 시도를 이 모델이 실제로 생산하는 작업에 넣습니다. 그래서 이것은 아직 제품의 일부가 아닙니다. 이것은 우리가 Blend이라고 하는 것을 구축했지만, 그것은 당신이 Melt에서 저장한 시각 참고 자료와 메타데이터와 평론을 사용하여 다양한 것들을 재혼합할 수 있습니다. 우리는 지금 Melt의 영향과 사용자 지정 프롬프트와 명령을 사용하여 전체 페이지를 렌더링하는 모델을 사용할 수 있게 하는 도구를 구축하고 있습니다. 비록 그것이 여전히 좀 거친 상태입니다. 우리는 더 많은 일을 해야 하지만, Claude나 GPT를 직접 사용하는 것보다 훨씬 더 나은 결과를 우리에게 생성했습니다.

Dieter Rams는 한때 당신이 사람들을 이해하지 못하면, 당신은 좋은 설계를 이해할 수 없다고 말했습니다. 왜냐하면 설계는 사람들을 위해 만들어지기 때문입니다. 저는 오늘의 설계 에이전트의 문제는, 우리는 사람들이 무엇을 하는지를 보는 것에 많은 시간을 할애했지만, 그들이 왜 이렇게 했는지를 보는 것에는 그렇지 않다고 생각합니다. 하지만 이 모든 것을 플랫폼에 올려놓고, LLM이 읽을 수 있도록 하면, 저는 이것이 우리의 의도를 더 지능적으로 따를 수 있고, 자신들의 결정도 내릴 수 있는 다음 세대의 설계 에이전트를 언락할 수 있다고 믿습니다. 우리는 창의적 프로세스를 강화하는 것으로부터 시작하고 싶습니다. 결국, 이것은 우리가 기계에게 창작을 가르칠 수 있게 해줍니다. 결국, 이것은 우리가 기계에게 결정을 가르칠 수 있게 해줍니다. 이것은 UI 생성의 세계와 우리가 구축하고 싶은 모든 놀라운 미래를 열어줍니다.

그래서, 우리는 곧 대중 앞에서 Melt과 우리가 Airflow에서 한 다른 모든 것에 대해 더 많이 공유할 것입니다. 당신은 화면의 QR 코드를 스캔하여 우리에 대해 조금 더 알아보거나 연락 상태를 유지할 수 있습니다. Min과 저는 모두 오늘과 내일의 회의 주변에 있을 것입니다. 정말 고마워요 모두. 이제 저는 Google의 수석 UX 연구원 Annie Lua를 무대에 초대하고 싶습니다. 안녕하세요, 저는 Annie입니다. 저는 Google의 UX 연구원이며, AI 쇼핑에 관해 일하고 있습니다. 우리는 코딩 에이전트와 더 적은 마찰로 AI가 더 많은 일을 하는 방법에 대해 많이 들었습니다. 저는 다른 측면, 문제들의 한 가지 종류인 것에 대해 말하고 싶습니다. 효율성은 목표가 아니며, 우리는 실제로 이 일상적인 소비자 AI 제품들을 위해 약간의 마찰을 유지해야 합니다. 그래서 잠깐 시간을 가져서 이것에 대해 생각해 봅시다. 거울 앞에서 당신이 자신에게 물을 수 있는 한 질문입니다.

「이 재킷을 입으면 어떤가요?」하지만 그 아래에서, 당신은 실제로 「이것이 내가 되고 싶은 사람을 반영하는가?」라고 묻고 있을 수도 있습니다. 음, 모피 재킷은 제 일상적 범위를 조금 벗어날 수 있고, 「이것을 입을 만큼 용감한가, 아니면 이것이 나를 과하게 노력하는 것처럼 느끼게 할까?」 그래서 이것들은 프롬프트나 검색 쿼리가 아닙니다. 이것은 사람들이 구매 결정을 할 때 조용히 자신에게 묻는 종류의 질문입니다. 따라서 첫 번째 물결의 AI는 문서 요약이나 가장 저렴한 항공편 예약과 같은 작업에 대해 이러한 많은 마찰을 제거함으로써 작동합니다. 이것들은 기능적 작업이며, 성공 지표는 상당히 명확합니다.

음, 당신은 빠르게 작업을 완료하고, AI가 이제 도움을 받으라고 요청받을 때 한 부류의 문제들은 더 주관적입니다. 예를 들어 「이 재킷을 입으면 어떤가요?」 「어떤 종류의 여행을 원하나요?」 음, 이것들은 주관적인 질문이고, 올바른 답변은 개인, 시간, 심지어 기분에 따라 달라지며, 효율성 자체로는 실제로 기능이 실제로 도움이 되었는지 판단할 수 없습니다. 그래서 우리는 어떻게 이를 위해 설계하나요? AI가 사람들이 이러한 정말 개인적이고 주관적인 일상적 결정을 하도록 돕기 위해 전환할 때, 세 가지가 변합니다. 사람들은 실제로 자신이 무엇을 원하는지 모르고, 비교할 일련의 버전을 볼 때까지입니다. 이것이 사람들이 신뢰를 구축하는 방식입니다. AI가 이러한 많은 더 개인적인 결정의 사고 파트너가 될 때, 다른 종류의 신뢰를 획득해야 합니다.

만약 당신이 처음으로 패션 디자이너를 만난다고 상상한다면, 신뢰는 당신들이 앞에서 진행하는 작은 대화나 패션 디자이너가 그날 당신이 입은 것을 평가하는 방식을 통해 구축되며, 당신이 좋아할 것의 범위에 대해 미리 추천을 주는 것이 아닙니다. 당신은 패션 디자이너가 실제로 당신이 무엇을 원하는지 안다고 믿지 않을 것입니다. 그래서 음, 이것은 정말 중요합니다. 왜냐하면 음, 당신은 그들을 신뢰하는 이유는 그들이 그러한 작은 상호 작용을 통해 신호를 보내기 때문이고, 그들은 당신의 분위기를 이해하기 때문입니다. 기능적 작업과 달리, 개인적 결정에 대한 자신감은 당신이 이미 호출을 했다는 느낌에서 옵니다. 이것들은 모두 직접적인 결과물이 아닙니다. 이것들은 AI가 과정에서 당신을 도와 구축해야 하는 것입니다. 음, 그래서 다음 슬라이드들에서, 저는 이것이 어떤 모습인지 보여주기 위해 두 가지 영역을 사용하는 것을 좋아합니다.

음, 패션과 여행에서. 첫째, 이것은 음 가상 피팅입니다. 이것은 내가 계속 하고 있는 Google 쇼핑 AI 기능으로, 당신 몸에 옷이 어떻게 보이는지 시각화하기 위한 것입니다. 패션 전용의 맞춤형 이미지 생성 모델에 의해 구동됩니다. 우리는 지난해 미국과 아시아태평양 지역에서 출시했습니다. 현재 호주, 인도네시아 및 인도 사용자가 이용할 수 있습니다. 작동 방식은 다음과 같습니다. 당신은 청바지 재킷을 보고 있고, 당신 자신의 전신 사진을 업로드합니다. 그래서, 저는 뉴욕 중앙공원에서 제 사진 하나를 선택했습니다. 음, 그러면 AI는 당신의 배경에서 재킷을 당신에게 렌더링할 수 있고, 당신은 제품을 살펴볼 때 그것이 당신에게 어떻게 보일지 상상할 필요가 없습니다. AI가 도와주는 질문이 단지 이것이 재킷을 좋아하는지 싫어하는지를 알아내는 것만은 아닙니다. 그것은 실제로 당신이 이것을 입으면 좋아 보이는지, 분위기를 느낄 수 있는지를 시각화하도록 돕는 것입니다.

그리고 당신은 또한 자신이 다른 재킷을 입은 모습을 볼 수 있습니다. 아마도 저는 흰색을 시도해 보고 싶습니다. 이것은 당신이 많은 것을 보고 비교함으로써 취향을 점진적으로 구축하는 방법입니다. 당신은 흰색 것이 파란색 것 옆에 있는 것을 실제로 본 후에야 흰색을 더 좋아한다는 것을 정말로 모릅니다. 당신이 더 자세히 탐색할 때, 당신은 자신에 대한 패턴을 인식하기 시작하거나 정말로 당신을 놀라게 하는 것을 찾을 수 있습니다. 아마도 갈색이 실제로 정말 좋아 보입니다. 주관적인 결정을 지원하는 AI는 실제로 당신을 위해 결정하는 것이 아니라 당신 자신의 취향을 발견하기 위한 표면을 제공합니다. 이 경우에, 예를 들어, 저는 정말로 이것들에 관심이 없습니다. 나는 팬이 아닙니다. 음, 하지만 기능적 프레임워크에서, 이것은 아무것도 일어나지 않은 것처럼 느껴집니다. 왜냐하면 음 사용자가 구매하지 않았기 때문입니다.

하지만 주관적으로, 그들은 매우 가치 있는 것을 얻었습니다. 왜냐하면 그들은 자신의 취향을 연마했기 때문입니다. 저도 자신에 대해 배웠습니다. 저는 정말로 그 음 보라색 스커트를 보지 않습니다. 이것도 똑같이 가치 있습니다. 우리의 다음 예에서, 음 우리는 또한 여행을 살펴봅시다. 예를 들어, 저는 다음으로 어디를 여행해야 할까요? 다시 한 번, 아래의 진정한 질문은 주관적입니다. 「나는 도전을 받고 싶은가, 아니면 그냥 휴식을 취하고 싶은가?」 또는 이 여행에서, 「나는 박물관 사람이 되고 싶은가, 아니면 해변 사람이 되고 싶은가?」 예약 에이전트는 그 질문에 대답하도록 당신을 도울 수 없습니다. 사람들은 여행을 계획하는 부분이 그것을 알아내기 위한 것입니다. Google Travel에서, 우리는 지도를 단순히 목적지 선택기가 아닌 돌아다닐 수 있는 장소로 봅니다. 이는 탐색을 지원하는 인터페이스의 종류의 참조점이며, 스키 여행을 예약하는 효율성만이 아닙니다.

아마도 당신은 「올겨울 스키 사람이 되어야 할까?」라고 궁금해하고, 당신은 아스펜이나 휘슬러를 탐색하고 싶고, 둘 다 미국의 훌륭한 스키 목적지입니다. 또는 아마도 스키가 옳지 않은 것처럼 느껴지고, 이제 당신은 완전히 다른 종류의 여행을 생각하고 있습니다. 음, 그래서 아마도 당신은 옐로스톤 국립공원이나 요세미티를 탐색하고 싶고, 이제 당신은 완전히 다른 것을 생각하고 있고, 챗봇은 다섯 프롬프트 전에 이미 당신을 스키 여행으로 약속했을 수도 있지만, 지도 인터페이스를 사용하면 당신의 마음을 바꾸고 당신과 함께 탐색할 수 있습니다. 이것이 핵심적인 차이입니다. 그래서, 두 제품 모두 공통점이 있습니다. 그들은 당신에게 빠른 답변을 주려고 하지 않습니다. 그들은 당신에게 생각할 수 있는 더 나은 장소를 주려고 합니다.

이것 때문에, 우리가 제품을 설계할 때 중요한 것은 결정을 설계하는 것이 아니라 「결정 과정」을 설계하는 것입니다. 왜냐하면 취향, 신뢰, 자신감은 모두 과정을 통해 점진적으로 구축되기 때문이며, 마지막에 당신에게 직접 주어지지 않기 때문입니다. 따라서 우리는 작업 완료도, 결과를 얻는 데 걸리는 시간, 전환율 같은 다른 지표 세트를 측정해야 합니다. 이러한 지표들은 기능적 작업에 대해 효과적입니다. 하지만 주관적인 더 많은 질문의 부류에 대해, 정말로 중요한 것들은 정량화하기 어렵습니다. 예를 들어, 사용자가 더 자신감을 느끼는가, 그들이 자신에 대해 배웠는가, 또는 그들이 더 많이 탐색하기 위해 돌아오는가? 이것들이 정말로 중요한 것들입니다. 실제로, 최적화의 세 가지 방법이 탐색을 줄일 수 있습니다. 그리고 그러한 순간에, 우리가 정말로 해야 할 일은 마찰을 다시 추가하는 것입니다.

일상용 소비재의 경우, AI가 사람들의 개인적이고 주관적인 의사결정을 지원할 때, 직접 하나의 조언을 제시하기보다는 비교를 지원하는 것이 매우 중요합니다. 그렇지 않으면 사람들이 신뢰를 구축하는 데 도움이 되는 중요한 순간들을 놓칠 것입니다. 마찬가지로 중요한 것은 빠른 결과를 제시하는 것만이 아니라 의도를 이해하는 것입니다. 왜냐하면 우리는 다양한 종류의 신뢰를 구축해야 하고, 사람들이 의도나 시각적 선호도를 표현할 수 있는 순간에 개입하면서 동시에 AI가 당신의 취향과 당신이 원하는 스타일을 이해하고 있음을 보여주어야 하기 때문입니다. 의도를 직접 가정해서는 안 됩니다. 마지막으로, 능동적인 선택을 초대하세요. 최선의 선택을 자동으로 제시하지 마세요. 왜냐하면 선택이라는 행위 자체가 핵심이기 때문이며, 바로 이러한 탐색 여정의 많은 순간들이 전체 과정을 재미있고 즐거운 것으로 만들기 때문입니다.

네, 이것은 자기 발견과도 관련이 있습니다. 이들은 모두 유지할 가치가 있는 마찰점입니다. 네, 감사합니다. 저는 소비재에 대해 브레인스토밍하는 것을 좋아하고, 저는 또한 Substack에 이런 종류의 내용을 씁니다. 나중에 다시 이야기하고 싶습니다. 좋습니다, 정말 감사합니다. 어, 이것은 우리 오전 과정 첫 번째 부분의 끝입니다. 그래서 우리는 지금 극장에서 15분 휴식을 취할 것입니다. 하지만 이 시간 동안, 어, 우리는 또한 여러분을 위해 몇 가지 경험을 만들고 싶으며, 모두가 휴식을 취할 수 있도록, 어, 당신 알다시피, 사고에서 벗어나 편안함을 느낄 수 있도록 하고 싶습니다. 이것이 바로 제가 정념 훈련을 받은 교사 Kazaya를 무대에 초대하는 것을 정말 기대하는 이유입니다. 어, 그녀는 실제로 감각 명상 경험을 만들었으며, 여기에는 진동 인코딩 입자 시각화 도구가 포함되어 있고, 이는 자신의 수 시간 동안의 유도 명상 기록으로 훈련되었습니다. 오전 휴식을 즐기시길 바랍니다.

지금까지의 강연들이 멋졌기를 바랍니다. 어, 우리는 다음 강연으로 계속합니다. Vercel의 Next.js 책임자인 Jimmy Lie가 다음 단계에 대해 이야기할 것입니다. Jimmy, 무대는 당신의 것입니다. 안녕하세요. 어떻게 들리나요? 아주 좋습니다. 좋아요, 안녕하세요, 저는 Jimmy입니다. 저는 Vercel에서 Next.js와 React 팀을 이끌고 있습니다. 그래서, 우리가 AI 컨퍼런스에 있기 때문에, 저는 조금 궁금한데, 당신 알다시피, Next.js와 Vercel에 대해 일반적으로 어느 정도 알고 있는 사람이 몇 명이나 있는지요. 글쎄, 그리 나쁘지는 않네요. 그럼 어, 그것이 무엇인지 모르는 사람들을 위해, 그것은 사람들이 웹사이트를 구축하는 데 사용하는 웹 프레임워크 같은 것입니다. 이것은 이 강연의 주제가 아니므로 우리는 괜찮을 것입니다. 어, 하지만 이것은 흥미로운 숫자입니다. 4년 전에 Next.js에 가입했을 때, 우리는 매주 약 400만 번의 다운로드를 했었고, 오늘 우리는 기본적으로 4,200만 번에 도달했습니다.

어, 명백히 이것은 제 팀이 하고 있는 놀라운 작업에 대한 감사 때문에 대부분 그렇습니다. 하지만 실제로 어, 실제로 저는 큰 부분이 코딩 에이전트 때문이라고 생각합니다. 어, 따라서 저는 이것이 우리가 개발자를 위한 도구를 구축하는 방식을 생각하는 방식을 많이 바꿨다고 생각합니다. 어, 왜냐하면 우리는 사람들이 미래에 웹사이트를 어떻게 구축할 것인지를 생각하는 데 많은 시간을 보냈고, 지난 6개월 동안 그것이 우리를 따라잡았으며, 어, 우리가 예상했던 것보다 훨씬 빠릅니다. 어, 올해 우리는 많은 시간을 논의하는 데 보냈습니다. 어, 당신 알다시피, 우리가 이러한 새로운 유형의 사용자에 어떻게 적응할 수 있을지, 우리가 팀으로서 어떻게 앞서 나갈 수 있을지, 어, 우리는 미래에 여전히 일할 일이 있을까요?

우리는 어떤 의미에서는 괜찮습니다. 왜냐하면 제 생각에 우리가 경험해야 할 일은 아마도 깨달음일 것이기 때문입니다. 음, 이 작업은 결코 단순히 작업을 실행하는 것만은 아닙니다. 이는 어떤 작업이 존재해야 하는지, 그리고 우리가 그 결과를 소유하기를 원하는지를 결정하는 것입니다. 네, 실제로 인공지능은 단지 실행과 구축을 훨씬 더 빠르게 만들 뿐입니다. 하지만 하루 중에 여전히 같은 시간을 가지고 있다는 것이 드러났습니다. 그래서 실제로 이것은 단지 책임을 더 비싸게 만드는 것입니다. 왜냐하면 당신이 출력하는 내용을, 음, 내보내는 것을 여전히 고려해야 하고, 여전히 음, 그것과 관련된 어떤 문제든 처리해야 하기 때문입니다. 음, 그래서 오늘 저는 이러한 경험들 중 일부를 여러분과 공유하고 싶습니다. 왜냐하면 이것들이 이 방에 있는 모든 사람에게 적용된다고 생각하기 때문입니다. 당신이 에이전트를 위해 구축하든 에이전트로 구축하든, 아니면 당신 자신의 에이전트를 구축하든 상관없이 말입니다.

음, 제 예측은 에이전트가 Next.js를 어떻게 사용하는지에 대해 우리가 배운 것이 에이전트가 더 널리 확산되면서만 더욱 유용해질 것이라는 것입니다. 음, 당신이 그것들을 코딩 이외의 다른 모든 것에 사용하기 시작할 때 말입니다. 음, 아마도 당신을 위해 온라인 쇼핑을 하는 것 같은, 우리는 이미 Open Workflows 같은 곳에서 이런 것들을 보고 있습니다. 음, 그래서 저는 세 가지에 대해 이야기하고 싶습니다. 음, 우리가 에이전트를 위해 구축하기 시작하면서 우리에게 무엇이 바뀌었는지. 에이전트가 또한 우리가 팀으로서 일하는 방식을 어떻게 바꿨는지, 그리고 제 생각에 업계가 어디로 나아갈 것인지에 대해. 음, 특히 왜 오픈 소스가 지금 예전보다 훨씬 더 중요한지. 그래서 2026년에 프레임워크를 유지하는 이상한 점은 당신이 더 이상 키보드 앞에 앉아 있는 사람을 위해 설계하지 않는다는 것입니다. 음, 당신은 그들과 코드 사이의 어떤 것이든 위해 설계합니다.

그래서 그것은 과거에는 에디터의 문서 페이지였지만, 지금은 당신의 전체 컴퓨터에 접근할 수 있는 에이전트 같은 것입니다. 아마도 권한이 너무 많아서 조금 위험하고, 비용도 많이 듭니다. 그래서 재미있는 사실은 오늘 Next.js 문서의 60%가 마크다운 형식으로 제공된다는 것입니다. 음, 이것은 코딩 에이전트뿐만 아니라, 그것이 또한 음, 음, 실험실 인덱싱 음, 등등 같은 것을 의미합니다. 하지만 이것이 의미하는 것은 음, 우리가 더 이상 문서에 대한 많은 수동 클릭들을 하지 않는다는 것입니다. 제 말은, 당신이 생각해보면, 당신이 마지막으로 직접 문서를 찾아본 것이 언제인가요 음, 항상 더 빠릅니다. 이제 마찰이 적어서, 음, 그냥 음, 그냥 묻는 것입니다. 음, 당신도 알다시피, 「클로드, 이게 Next.js에서 어떻게 작동하나요?」 음, 그래서 우리는 소프트웨어가 어느 정도 소프트웨어의 주요 사용자가 되는 세계로 들어가고 있습니다. 그리고 저는 이것이 많은 것을 바꾼다고 생각합니다.

생각해보면 에이전트는 좀 귀찮은 사용자 같은 거예요. 정확히 당신이 쓴 내용을 읽고, 예제를 복사하고, 명령을 실행하고, 오류를 엄격하게 따릅니다. 따라서 루프가 깨졌다면, 당신의 오류가 좋지 않다면, 음, 당신이 알다시피, 마치 어떤 종류의 중단처럼, 커피를 마시고, 잠자리에 들고, 음, 오전 5시에 깨어나서 머리에 수정 사항이 떠오를 거 아니라는 거죠. 그들은 그냥 계속 시도하고 비용을 태우게 되는데 음 결국 수정할 때까지요. 이것이 우리에게 정말 유용한데, 이해할 수 있는 이유는 여전히 음 인간이 루프에 필요하다는 것을 보여주고 있기 때문입니다. 우리가 최적화해야 할 것이 무엇인지를요. 음, 예를 들어 문서는 과거에 좀 수동적인 것이었어요.

우리는 과거에 이를 발표했고 음 우리는 가정했습니다, 음 아무도 음 사람들이 가끔 이를 읽을 거라고, 음 시간이 지남에 따라 지식을 구축하는 것처럼, 그리고 음 당신이 알다시피 나는 항상 좋은 문서를 보유하고 있다는 것에 대해 자랑스러워했는데 다음 웹사이트를 위해, 하지만 진정한 투자 수익률은 정말로 존재한 적이 없었어요. 우리는 매번 음 우리는 이를 살펴봤고, 음 말하곤 했어요 오, 우리는 이 기능이 부족합니다. 음, 하지만 이제 문서처럼 음 당신이 알다시피, 좀 음 에이전트에게는 좀 성경과 같아요. 그들은 당신이 그곳에 쓴 모든 것을 가져가서, 즉시 조치를 취할 거예요. 이것은 음 프레임워크와 같은 정렬로만 적용되지 않아요, 음 개발 도구 같은 것을 제공하는 것처럼요. 이것은 당신의 코드베이스에 있는 모든 것과 같아요, 당신의 README처럼, 당신의 PR 설명처럼, 당신의 음 당신의 스크립트처럼, 당신의 코드베이스의 모든 낡은 파일처럼요. 이것은 좀 음 시한 폭탄 같은 거예요, 맞죠?

이것은 음, 이것은 음, 음, 일어나기를 기다리는 환각이에요. 내가 본 것 중 가장 위험한 것은 음 부재가 아니라, 맞죠? 왜냐하면 에이전트가 코드에 접근할 수 있으면, 그들은 여전히 알아낼 수 있거든요. 이것은 음 문서가 음 좀 오도할 때 같은 거라고요. 음 우리가 실제로 본 것은 정체된 예의 한 가지인데 예전에 음 한 사람을 한 번 혼동했던 것이 이제 기본적으로 음 누가 정말로 주목하기 전에 수십만 개의 프로젝트를 혼동했다는 거예요. 음 우리에게 더 나쁜 것은 음 나쁜 정보가 데이터세트에 들어간다는 거 음 이것은 모델이 이제 오염될 수 있다는 의미예요. 음 이것은 확실히 일부 Next.js 기능에서 발생했어요. 음, 컴파일러 오류도 같은 이야기네요. 우리는 음 음 오류를 가지고 있었는데 나는 다음에서 음 이것이 Next.js의 오류라고 생각했어요, 이슈를 개설하세요.

그리고 이것은 음 이것은 음 이 시대의 범죄 같아요, 왜냐하면 나는 오늘까지 음 에이전트가 음 Next.js에 대한 버그 보고를 개설한 것을 본 적이 없거든요. 음 음 도구처럼 음 이것을 제공하는 것이 우리에게 정말 중요해요, 우리는 음 사용자가 음 항상 음 가능한 한 빠르고 부담 없이 있도록 보장해요. 일반적으로 이것은 음 다시 음 모든 종류의 음 당신이 구축하는 도구처럼 음 음 당신이 알다시피 음 은행 웹사이트 같은 것이 음 음 결제를 음 음 보내기 위해 10단계가 필요하거나 무언가 같은 것에요. 음 그래서 하지만 우리의 경우 에이전트가 이것을 우리에게 훨씬 더 중요하게 만들었어요.

네, 이것은 음 에이전트에게도 좋은 방법이에요 음 당신이 올바르게 설계했는지 테스트하는 좋은 방법처럼요, 왜냐하면 당신이 음 새로운 것을 떠올릴 때, 에이전트는 기본적으로 음 좀 음 아니라, 음 당신이 알다시피, 그들은 음 Stack Overflow 같은 것이 없어요. 그들은 음 Twitter 지식 같은 것이 없어서 음 무언가가 무엇인지 이해하기 위해요. 그래서 음 만약 당신이 음 API 음 잘못 설계되었고, 잘못 명명되었다면, 당신은 음 좀 귀찮음을 겪을 거 맞죠? 그리고 내가 배운 핵심 부분이 하나 있는데, 나는 당신도 당신의 일에 적용해야 한다고 생각해요 음 모든 시스템은 가능한 한 음 명확해야 해요. 당신이 작업을 수행할 때, 당신은 음 정말로 음 깊이 생각해야 해요 음 당신이 이를 설명할 수 있는 방식을요.

500 같은 그런 상태 코드처럼 말하자면, 당신이 알다시피, 아무것도 말하지 않는데, 당신은 여전히 이를 디버그할 수 있어야 하는데, 왜냐하면 우리가 Sio가 codex에 대해 전에 말한 것처럼 세상에 들어가고 있기 때문에, 에이전트는 그냥 모든 사람을 위해 수동적으로 실행할 거 같아요, 그래서 당신은 당신 자신의 시스템이 실행되고 수동적으로 수정되기를 원해요. 당신은 원하고, 당신은 그들이 이해할 수 있기를 원해요, 예를 들어 당신이 알다시피 당신의 전제 조건이 당신의 모든 웹사이트가 빨라야 한다면, 당신은 그런 것들을 정의할 수 있어야 해요, 오늘 우리는 여기 일부 메트릭을 가지고 있지만 아마도 당신은 다른 정의를 가지고 있을 거 그래서 당신은 당신의 코드베이스를 통해 이것을 해야 해요, 그것이 무엇을 의미하죠? 신뢰할 수 있다는 것이 무엇을 의미해요? 이것이 무엇을 의미해요, 응, 빠르다는 게 뭐죠? 안전이 무엇을 의미해요?

음, 이런 식으로 당신은 에이전트가 자율적으로 실행하고 자신을 수정할 수 있을 때 준비가 되어 있어요. 음, 그래서 네, 이것은 음 첫 번째 변화 같은 거 기본적으로 에이전트를 위해 구축하는 것은 기본 원리를 대체하지 않아요, 그냥 그들이, 당신이 알다시피, 더 중요하게 만들어요. 내가 우리가 내부적으로 에이전트를 어떻게 활용하고 있는지 공유하고 싶어요, 맞죠? 당신이 모두 익숙할 거라고 확신해요, 지난 6개월 동안, 음 나는 이 산업이 정신병 단계에 들어갔다고 생각해요, 모든 사람이 전 세계에 모든 것을 구축하려고 시도하고 있어요.

음 나는 확실히 이 중 많은 것을 했어요, 크리스마스 기간 동안 Opus 덕분에, 우리가 그 기간을 지났으면, 음 나는 현실이 정말로 일한다고 생각해요, 당신이 알다시피, 취향과 판단이에요, 그리고 나는 에이전트를 생각하는 더 좋은 방법이 음 당신의 주변 모든 것을 이해하는 데 당신을 도울 수 있다고 생각해요. 음 엔지니어로서 나에게 가장 중요한 것은 집중할 시간이에요. 당신이 그 연구를 들었다고 확신해요, 음 당신이 음 조금 방해를 받으면, 당신은 음 필요해요, 음 평균 30분 정도 음 다시 흐름 상태로 돌아가도록요. 그리고 당신이 알다시피 세상에서, 음 뒤에서 10개의 에이전트를 실행하는 것이 매우 유혹적이에요, 음 동시에 10개의 채팅을 열어 놓고, 당신이 알다시피, 당신은 어떻게 그것을 이해해요? 당신은 그 세상에서 생산성을 어떻게 유지해요? 음, 에이전트가 여전히 매우 강력하기 때문에요.

그들은 당신이 음 당신이 알다시피, 빠른 연구를 할 수 있게 해줘요. 음 혼란스러운 조사를 음 당신이 알다시피, 정말 좋은 문서 사양으로 바꿀 수 있어요. 음, 하지만 내 여기의 핵심 조언은 내 자신의 고통스러운 경험에서 배웠는데, 음 정말로 실제로 자신을 강제로 멈추게 하고 그들과 채팅을 멈춰야 한다는 거예요. 당신은 좀 지금 일에 빠져들고 싶어요, 그래서 당신은 에이전트에게 과도하게 돌려야 하는 것을 피할 수 있어요. 당신이 알다시피 이것은 좀 어려워요, 왜냐하면 나는 동시에 10개의 채팅을 하는 것을 좋아하거든요. 이것은 나에게 음 조금의 도파민 같은 것을 주어요. 하지만 이 말을 생각해봐요, 그리고 당신이 알다시피 10개의 에이전트처럼 당신 자신을 제한하는 대신, 당신은 지금 일에 빠져들어서, 올바른 프롬프트를 적절한 위치에 놓고, 올바른 것처럼 evolves와 방어 조치 같은 것을 통해 이를 할 수 있어요.

당신은 이것은 당신이 어떻게 음 뒤에서 100개의 에이전트가 실행되는 것처럼 당신 자신을 확장하는 방식이에요. 음, 네, 왜냐하면 이것은 우리 산업에서 일어날 일이기 때문이에요. 음, 그래서 그것은 내가 정말 흥미로워하는 AI 버전 같은 거예요, 맞죠? 음, 하지만 또 다른 부분도 있어요, 음 산업이 판단을 보상하지 않을 뿐만 아니라, 맞죠, 그리고 또한 음 동작을 보상하는 것 같은 거예요. 음 그리고 AI는 이 중 많은 것을 만들어요. 그래서 나는 정직함을 이야기하고 싶어요, 이것이 아마도 가장 중요한 것일 거 같아요. 이것은 음 AI를 사용하지 않는 시기를 아는 것처럼요. 음 어떤 사람이 지난 6개월 동안 나에게 과거 6개월이 그들의 인생에서 가장 피곤한 5년 같다고 말했어요. 음, 이것이 대략 맞는 것 같아요. 매주 새로운 모델, 새로운 데모, 새로운 기능이 출시돼요.

그리고 당신이 알다시피, 나의 자연스러운 반응, 나는 당신도 느꼈다고 확신해요, 이런 거예요, 당신은 기본적으로 같은 것을 해야 해요. 당신은 더 많은 코드를 생성해야 해요처럼요. 당신은 더 많은 기능을 발표해야 해요 음 그래서 당신은 경쟁자를 이길 수 있어요 음 그래서 당신은 앞서갈 수 있어요. 하지만 실제로 그리고 그리고 우리는 이것이 음 과거 10년 동안 개발자 도구처럼 빌드하는 것처럼 온다는 것을 알고 있어요 일어날 일은 당신이 그냥 음 기술 깊이를 속도 달리기하고 있다는 거예요. 당신의 모든 당신이 지난 6개월 동안 발표한 데모, 아마도 당신은 지금 이미 이것을 느낀 거예요. 음, 지금 당신은 실제로 이를 처리해야 하고, 이와 함께 오는 것은 많은 음 다른 문제들이에요, 음 관찰성 음 가격 책정 음 모든 것이 음 정말 신뢰할 수 있도록 유지되고 있는지 보장해요.

음, 예를 들어, 당신이 알다시피, 당신은 한 주말 안에 토큰 묶음처럼 Next.js를 fork할 수 있어요. 음, 하지만 그렇다고 해서 당신이 해야 하는 것은 아니에요. 음 왜냐하면 당신이 프레임워크를 fork할 때, 당신은 그것이 가져오는 모든 것을 소유하기 시작하거든요. 음 아마도 가장 최근 최대의 예는 보안 문제예요.

음, 지난해 나는 마지막으로 Shell에 대한 대응을 담당했어요——이것은 매우 중요한 이슈였고, 매우 심각한 취약점이었어요. 이것이 내가 소유권의 극단적인 표현이라고 생각하는 것이에요. 우리는 말했어요, 우리는 NexJS를 전 세계에 발표했어요, 몇 년 전에요. 우리는 계속 발표하고 있었어요, 갑자기——나는 여전히——우리는 여전히 우리가 소유한 몇백, 몇천 명의 사용자를 위해 이를 수정해야 했어요. 이것이 내가 당신에게 상기시켜 주고 싶은 곳이에요: 만약 당신이 당신의 기술 스택의 어떤 부분을 완전히 대체하거나 추상화할 수 있다고 생각한다면, 1년 후 어떻게 될지 생각해봐요——당신이 당신의 웹사이트를 서빙하기 위해 당신 자신의 메타 프레임워크를 만들었을 때, 당신은 정말로 장기적으로 이것을 유지하고 싶어요? 아니면 오픈소스를 사용하는 것이 더 나을까요, 그래서 당신은 당신이 커뮤니티에 다시 기여하고 있고 다른 사람들이 더 안전한 웹사이트를 소유하도록 도울 수 있는 가능성이 있어요.

그런데 말이에요, 보안 문제에 관해서, 우리는 이제 전례 없는 시대에 살고 있어요——어떤 의미에서——취약점이 대략 매달 공개돼요, 맞죠? 이것은 AI가 취약점을 발견하는 것을 극도로 쉽게 만들었기 때문이에요. 마치 당신이 보안 소프트웨어를 사용하지 않고 있는 것 같지만, 실제로는 그 반대예요. 이것은 시스템이 정상적으로 작동하고 있음을 보여줘요. 만약 당신이 보안 패치를 받는다면, 그것은 누군가가 취약점을 보고했다는 의미예요. 다른 선택지는 당신이 당신 자신의 프레임워크나 도구 버전을 구축하는 것이에요. 하지만 그들은 보안 연구원의 주목을 받지 못할 거예요. 그래서 이제 공격자들은 당신이 당신 자신의 기술 스택을 실행하고 있다는 것을 식별할 거 그리고 그들은 당신이 모르는 사이에 당신을 공격할 거예요.

이것이 오픈소스가 정말 중요한 곳이에요——우리는 함께 안정적인 토대를 구축할 수 있어요. 음, Vercel에서 우리는 하는 말이 있는데, 당신은 그냥 것들을 발표할 수만 있어요——이것은 멋진데——우리는 이로부터 정말 훌륭한 많은 제품들을 만들었어요. 하지만 올해 초부터, 우리는 또한 다른 접근 방식을 취하기 시작했어요, 당신이 또한 AI를 사용하여 것들을 삭제할 수 있다는 거예요.

음, 왜냐하면 예전에는 발표가 곧 이기는 것을 의미했거든요——당신은 기능 기능 기능의 로드맵을 가질 수 있었어요. 하지만 지금 이것은 너무 저렴해졌어요. 나는 당신이 대화와 경쟁에서 앞서게 하는 것이 집중이라고 생각해요——왜냐하면 당신은 이를 처리해야 하고, 당신의 사용자도 이를 처리해야 하거든요. 나는 실제로 속도를 늦추고 시간을 들여 생각하고 싶어요 무엇이 정말 있는지, 무엇이 당신의 제품을 구별하게 하는지에요. 음, 왜냐하면 만약 당신이 적은 양의 tokens 안에 1시간 안에 기능을 구축할 수 있다면, 당신의 경쟁자도 같은 것을 할 수 있거든요. 그래서 제가 말하는 것은 전혀 발표하지 말라는 게 아니에요, 맞죠? 더 많은 것은 당신이 어떻게 당신 자신을 보호하는지, 그리고 당신이 어떻게 당신이 계속 발표할 수 있는 능력을 보호하는지에 관한 것이에요.

음, 문제는 아니에요——우리가 이것을 구축할 수 있어요? 왜냐하면 답은 항상 네거든요. 더 어려운 문제는, 그리고 어떤 것이 실제로 할 가치가 있는지를 정말로 결정하는 것은——이것이 존재해야 할까요? 우리가 정말로 장기적으로 이것을 소유하고 싶어요? 음, 네, 내가 Meta에서 일했을 때, 우리는 「여기서 발명되지 않은 증후군」이라고 불리는 것을 가지고 있었어요——사람들은 실제로 지구상에서 가능한 모든 라이브러리를 다시 구축할 거예요. 음, 과거에——사람들은 React Native를 상당히 잘 알고 있었어요, 예를 들어 React로 웹 모바일 앱을 서빙했죠. 흥미롭게도, Meta 내부에는 이 것의 세 가지 버전이 있었어요, 단지 사람들이 이것을 제어하기를 원하지 않았기 때문에——이것은 그 시점에 이미 문제였어요. 지금 모든 사람에게 문제가 점점 더 커지고 있어요.

다시, 음, 당신이 당신 자신의, 음, 당신 자신의 제품을 당신의 기술 스택의 어떤 것을 대체하도록 시작할 것을 고려할 때, 생각해봐요——정신적 부담——이것이 함께 올 거라는 거예요. 음, 그래서 네. 음, 빠른 요약으로, 나는 내 예측이 음——만약 당신이 에이전트로 빌드한다면, 정말 중요한 것은 당신이 빠른 경로에 없는 것을 고려한다는 거예요. 당신이 알다시피, 당신의 사용자가 자신이 스스로 프롬프트하지 않고 실제로 완전히 당신의 도구를 사용할 수 있는지 확인하세요? 당신의 문서, 당신의 오류, 당신의 CLI가 잘 정의되어 있는지 확인하세요. 만약 당신이 에이전트로 빌드한다면, 판단을 외부 위탁하는 것에 대해 매우 조심하세요.

음, 당신은 이들을 사용하여 더 가까운 맥락을 판단해서——당신은 연구를 수행할 수 있어요——당신은 사본 규격을 조사할 수 있어요——성능 문제를 조사해요. 음, 하지만 네, 정말로 당신이 표에 가져가는 것에 집중하세요, 그리고 당신이 이를 위해 시간을 비웠는지 확인하세요. 음, 산업이 가속화될 때, 당신이 소유하기로 결정하는 것에 대해서도 조심하세요. 음, 다시, AI는 창조를 매우 저렴하게 만들었어요——하지만 소유의 비용은 당신이 생각하는 것보다 훨씬 높아요. 음, 그래서 이것은 당신이 발표를 줄여야 한다는 의미가 아니라, 단지 산업으로서 우리는 더 많은 집중으로 발표해야 한다는 의미예요——존재해야 하는 것들을 구축해요——이를 이해할 수 있게, 신뢰할 수 있게, 안전하게 만들고, 당신이 신뢰할 수 있는 기초 위에 서 있으세요. 음, 네, 감사합니다. >> 정말 감사합니다, Jimmy.

우리의 다음 발언자는 Vran Yukich이고, 음, 그는 Daytona의 공동 창립자이자 CTO예요. 음, 그는 자율 AI 에이전트를 위해 샌드박싱이 어떻게 논의 불가능한지를 논의할 거예요. 음, 더 이상 수다 떨지 말고, 우리가 들을 거 >> Van 음, 안녕하세요. 당신들 모두가 여기 있는 것을 보니 기뻐요. 음, 나는 Weather Nich이고, 나는 Daytona의 CTO이자 공동 창립자예요, 싱가포르는 우리의 글로벌 사용자 수가 가장 많은 도시이고, 또한 상위 5개 국가 중 하나예요. 그래서 감사합니다. 오늘 나는 당신의 자율 에이전트를 샌드박스 환경에서 실행해야 하는 이유를 논의할 거예요. 그래서 당신이 Cloud Code, CodeEx, Open Code 또는 도구를 사용하는 모든 에이전트를 설치할 때, 당신은 그것에게 많은 것을 주었어요. 그것은 당신으로서 실행돼요. 그것은 당신의 파일을 읽을 수 있어요. 그것은 당신의 SSH 키를 사용할 수 있어요. 그것은 당신의 AWS 청구서를 소비할 수 있어요. 그것은 것들을 삭제할 수 있어요. 그것은 인터넷에서 읽은 텍스트를 기반으로 무엇을 해야 하는지 결정해요.

그래서 우리는 좋다고 말해요, 생산성은 실제이거든요. 하지만 우리 대부분은 위험을 생각한 적이 없어요. 그럼 에이전트는 왜 그것이 해서는 안 되는 일을 할까요? 글쎄, 그것이 쉽게 손상될 수 있기 때문이에요. 음, 프롬프트 주입은 누군가가 에이전트가 읽는 텍스트에 명령을 숨길 때예요. 두 가지가 있어요. 직접적인 것, 공격자가 나쁜 프롬프트를 입력할 때, 그리고 간접적인 것, 나쁜 프롬프트가 에이전트가 읽는 것에 숨어 있을 때예요. 그것은 웹페이지, rhythm 파일 또는 이메일일 수 있어요. 간접적인 것이 위험한 이유는 자율 에이전트가 인터넷을 읽기 때문이에요. 그것이 그것의 직업이에요. 운이 좋게도, 음, 모델들이 이를 발견하는 데 더 잘해지고 있어요, 하지만 그들은 실제로 이를 신뢰할 수 있게 잡을 수 없어요. 기억해요 공격자는 단 한 번만 성공하면 돼요. 그래서 OASP는 말해요, OASP는 명확하게 말해요. 음, 프롬프트 주입은 완전히 예방할 수 없어요.

이것은 모델이 어떻게 작동하는지에 대한 거예요. OpenAI도 12월에 같은 말을 했어요. 그래서 모델을 구축하는 사람들은 실제로 그들이 이를 중단할 수 없다고 당신에게 말하고 있어요. 이것은 버그가 아니에요. 이것이 기술이 어떻게 작동하는지예요. 우리도 기술을 사용해요, 맞죠? 그래서 기술은 어떤 지시문이 있는 폴더이고, 아마도 약간의 코드도 있고, 당신은 그것을 다운로드해요. 당신은 그것을 당신의 에이전트에게 주고, 당신의 에이전트는 당신의 모든 권한으로 그것을 실행해요——당신의 셸, 당신의 tokens, 당신의 파일. 기억해요, 기술에는 앱스토어 검토가 없어요. 그래서 기술과 당신의 기계 사이에는 샌드박싱이 없어요. 에이전트는 기술에서 지시문을 읽고 그들이 말하는 것을 실행해요. 음, 만약 당신이 숫자를 본다면, 그들은 너무 좋아 보이지 않아요.

세 개의 다른 팀이 2026년 초에 이것을 봤어요, KO 보안이 Cloud의 기술 마켓플레이스를 확인했어요——Cloud 에이전트의 기술 마켓플레이스를요. 그들은 341개의 나쁜 기술을 발견했고, 2월까지 그 숫자는 800개 이상의 나쁜 기술로 증가했어요. Sneaked가 다른 그룹을 확인했고, 그들은 13%의 기술이 심각한 문제를 가지고 있다는 것을 발견했고, 이 중 76개는 명백하게 악의적이었어요. 마찬가지로, 「wild의 악의적 기술」이라는 제목의 연구 논문이 다양한 마켓플레이스에서 98,000개의 기술을 검사했어요, 그들은 157개가 나쁘다는 것을 발견했어요. 이제 살펴봐요——그 연구에서 실제 악의적 기술의 예요. 그것은 정상적인 문서 조수 같아 보여요, 하지만 마크다운에는 숨겨진 주석이 있어요, 맞죠? 만약 당신이 파일을 미리보면, 당신은 볼 수 없지만, 에이전트는 할 수 있어요. 주석은 에이전트에게 당신의 프로젝트 파일을 공격자의 서버로 보내라고 말해요, 맞죠?

그래서 흥미롭게도, 주석의 마지막 줄은 사용자에게 이것에 대해 언급하지 말라고 말해요. 음, 일부 기술은 실제 코드를 배포해요, 이것은 정상적인 원격 측정 함수처럼 보여요, 하지만 만약 당신이 보면, 그것은 일부 데이터를 수집하고 분석 끝점으로 보내요. 하지만 만약 당신이 자세히 보면, 음, 그것이 정말 관심 있는 것은 당신의 API 키, 당신의 비밀, 당신의 tokens예요, 그것은 당신의 환경 변수를 순회할 거예요. 그것은 자격 증명을 추출하고 그것을 밖으로 보낼 거예요. 그래서 손상되려면, 당신은 실제로 아무것도 설치할 필요가 없어요. 음, 에이전트는 모든 readme 파일, 이슈 또는 이메일, 심지어 PDF를 읽을 수 있어요, 그 어느 것도 악의적 명령을 포함할 수 있어요. 그래서 이것을 방지하려고 하기보다는, 우리는 이것이 현실이라는 것을 받아들여야 해요. 모델이 이것을 수정할 수 없어요, OASP와 OpenAI가 말했어요.

새로운 기술 생태계가 이미 나쁜 것들로 가득 차 있어요, 새로운 악의적 기술이 아무도 정말 검토할 수 없는 속도로 나타나고 있어요. 그래서 모든 readme 파일, 모든 티켓, 모든 에이전트가 읽는 이메일은 악의적 명령을 포함할 수 있어요. 그래서 우리가 할 수 있는 것이 뭐예요? 우리는 에이전트가 접근할 수 있는 것을 바꿀 수 있어요. 그래서 호스트 셸이 없어요, 호스트 파일이 없어요, 자격 증명이 없어요, 우리는 인터넷을 제한할 수 있어요, 작업이 끝나면 우리는 또한 그것을 버릴 수 있어요. 샌드박싱은 단지 가상 머신이나 컨테이너가 아니에요. 샌드박스 내부의 에이전트는 여전히 당신의 접근 token을 가지고 있어요, 여전히 열린 인터넷을 가지고 있어요. 실제 샌드박스는 네 가지 일을 해요. 하나, 그것은 당신의 비밀을 에이전트 외부에 유지하므로, 에이전트는 절대로 볼 수 없어요. 둘, 그것은 에이전트가 인터넷에서 또는 당신의 로컬 기반 시설 내에서 접근할 수 있는 것을 제어해요. 셋, 그것은 모든 것을 기록해요, 모든 명령과 모든 요청을요.

넷, 그것은 에이전트와 AI 모델 사이에 있어요. 그래서 당신은 에이전트가 뭘 물었는지, 모델이 뭘 반응했는지 볼 수 있어요. 실제 샌드박스는 제한된 네트워크를 가져요. 모든 아웃바운드 요청은 모든 요청이 허용 목록을 준수하는지 확인하는 프록시를 통과해요. 임의 끝점에 대한 요청은 거부될 거예요. 마찬가지로, 모든 것이 기록돼요. 그래서 뭔가 잘못되면, 당신은 로그에서 명확하게 볼 수 있어요. 에이전트는 절대로 당신의 비밀을 봐서는 안 돼요. 비밀은 샌드박스 외부에 존재해야 해요. 그래서 에이전트가 요청을 할 때, 예를 들어, GitHub에 대한 요청을 할 때, 그것은 실제 token 대신 token 자리표시자 값을 보내요, 에이전트가 도중에 잡아내고, 비밀 broker로부터 실제 값을 가져가고, 그것을 GitHub에 보낼 거예요. 응답은 프록시를 통해 샌드박스로 돌아와요.

그래서 에이전트는 그것이 요청한 것을 얻지만, token을 절대 알지 못해요. 만약 에이전트가 손상된다면, token이 누출될 리가 없어요, 왜냐하면 token이 에이전트에게 결코 노출되지 않았기 때문이에요. 마지막으로, 모델은 에이전트의 뇌예요. 만약 당신이 무엇이 들어가고 나오는지 볼 수 없으면, 당신은 감시 추적이 없어요. 그래서 모든 샌드박스가 같은 게이트웨이를 통해 그것의 모델 호출을 경로로 설정해요, 모든 프롬프트와 모든 응답이 게이트웨이에서 기록돼요. 그래서 예를 들어 언제, 샌드박스 A가 비정상적으로 행동하기 시작할 때, 당신은 추측할 필요가 없어요 뭐가 일어났는지. 당신은 샌드박스 A의 추적을 열 수 있어요, 당신은 명확하게 볼 수 있어요 에이전트가 뭘 물었는지, 모델이 어떻게 반응했는지. 그래서 현실은 에이전트가 손상될 거라는 거예요. 유일한 질문은 언제 그것이 손상될 때 그것이 도달할 수 있는 것이 뭔지예요.

그래서 당신은 완벽한 에이전트를 구축하려고 할 수 있어요, 또는 당신은 그것을 샌드박스에 넣고 잘 잘 수 있어요. 그래서 선택을——현명하게 선택하세요. 감사합니다. 감사합니다 Van. 다음으로 우리는 Vashant Kameeshwaran이 있어요, 그는 Grapile의 공동 창립자예요, 그리고 Rohan도 있어요, 그도 Grapile에서 왔어요. 그들은 500만 개의 vibecoded PR을 분석한 것에서 배운 것에 대해 논의할 거예요. 음, 일단 그들이 준비되면, 우리는 그 둘의 이야기를 들을 거예요. 좋아요. 안녕하세요. 음, 나는 Vishant이고, Greile의 공동 창립자이자 CTO예요. >> 안녕하세요. 나는 Rohan이에요. 나는 Greile의 연구원이에요. >> 오늘 우리는 500만 개의 vibecoded PR을 분석한 것에서 배운 것에 대해 논의할 거예요. 그래서 Reptile에서, 우리는 pull request를 검토하고 테스트하는 AI 에이전트를 구축해요. 우리는 매달 Nvidia, Coinbase, Meta 같은 회사를 위해 40억 줄의 코드를 검토해요.

Reptile은 매일 100,000개의 버그를 식별하고 수정해요. AI 에이전트는 지난 몇 년에 많이 발전했어요. 2023년에, 우리는 여전히 짧은 코드 조각을 우리를 위해 생성할 수 있는 상당히 간단한 에이전트를 사용하고 있었어요. 2024년에, 우리는 작은 다중 파일 변경을 수행할 수 있는 에이전트의 상승을 보기 시작했어요. 2025년 이래로, 우리는 완전 agentic 코딩의 새로운 시대에 들어갔어요. AI 에이전트는 이제 만들 수 있어요——직접 사양에서 PR로예요. 하지만 이것은 우리에게 궁금하게 했어요, 이 완전 vibecoded PR들이 실제로 좋아요? 어떻게 산업에서 그들이 채택돼요? 그들이 어디에서 성공하거나 실패해요? 그래서 우리의 데이터베이스에 500만 개 이상의 PR이 있어요. 그래서 우리는 이 질문에 답하도록 잘 장비되어 있어요. 음, 먼저 우리가 알아야 할 것은 PR이 viboded인지 여부를 어떻게 알 수 있는지예요.

음, 그래서 우리는 알아내기 위해 세 가지 주요 신호에 의존해요. 음, 첫째는 GitHub author 필드예요. 그래서 음, 보통 bots는 당신의 commit에 자신을 공동 작가로 추가할 거예요. 이것은 bot이 PR을 viboded했는지 알아낼 수 있는 매우 확실한 방법이에요. 그러나 말이에요, 이것은 상당히 희소한 신호예요. 우리 데이터베이스의 약 1%의 PR만 이런 식으로 식별될 수 있어요. 그래서 명백하게 1%보다 더 많은 PR이 viboded돼요. 우리는 더 강한 신호가 필요해요. 이를 위해, 우리는 PR 설명 자체를 봐요. 음, 보통 bots는 PR 설명에 메모를 추가할 거예요, PR에 그들이 기여했다고 말하면서, 이것이 bot 코딩 PR의 또 다른 유용한 표시예요. 음, 이것이 더 빈번한 신호예요. 우리 데이터베이스의 약 20%의 PR이 이런 식으로 식별될 수 있어요.

마지막으로, 최근에 Codeex나 Cursor를 사용해본 경우 이들이 생성한 모든 분기는 분기의 접두사에 그들의 이름을 가질 것임을 알 것입니다. 따라서 이것도 매우 쉬운 신호입니다. 인간이 이러한 이름으로 분기를 만들 가능성이 낮기 때문입니다. 음, 이 세 가지 신호를 모두 함께 고려하면, 4월에 작성된 PR의 약 27.6%에 완전히 AI로 작성되었다는 강력한 증거가 있음을 발견했습니다. 이것은 매우 흥미로운 수치입니다. 하지만 이 수치의 역사를 보면(다중 파일 에이전트 시스템이 시작된 이후) 훨씬 더 흥미롭습니다. 보시다시피 계속 빠르게 상승해왔고, 앞으로도 계속 빠르게 상승할 것으로 예상합니다. 완전한 에이전트 기반 소프트웨어 엔지니어링이 미래입니다. 따라서 이것이 정말 우리의 미래라면, 이는 한 가지 질문을 제기합니다: 이런 PR들은 좋은가요?

음, 알다시피, 에이전트 시스템에 의존하기 때문에 코드 품질이 눈에 띄게 하락할 것인가요, 아니면 그들이 실제로는 인간보다 더 잘 코드를 작성할 수 있고 우리가 인정하기를 너무 두려워하는 것인가요? 따라서 이 질문에 답하기 위해, 우리는 먼저 자신에게 물어봐야 합니다. 좋은 PR이란 무엇인가요? 우리는 이를 여러 가지 다른 방식으로 정량화하려고 노력했습니다. 우리가 살펴본 첫 번째 지표는 이러한 PR들의 되돌림 비율입니다. 음, 일반적으로 PR이 되돌려지면 프로덕션에서 파괴적인 변경을 유발했거나 하위 문제를 야기했음을 의미합니다. 따라서 저자별 되돌림 비율의 분석을 살펴본 결과, 일부 에이전트는 실제로 인간 기준선보다 낮은 비율로 그들의 PR을 되돌릴 수 있음을 발견했습니다. 즉, Cla와 Codeex입니다.

우리는 또한 PR에서 변경된 파일의 수로도 분석했습니다. 흥미롭게도, PR이 클수록 AI 에이전트 PR이 인간보다 더 적은 빈도로 되돌려짐을 발견했습니다. PR 품질의 또 다른 매우 흥미로운 신호는 그것이 받는 코멘트입니다. Vishan이 Grapile에서 언급했듯이, 우리는 풀 리퀘스트를 검토하고, 이러한 풀 리퀘스트를 검토하는 과정에서 Grapile은 마치 인간처럼 당신의 코드에 코멘트를 남깁니다. 이제 Grapile은 또한 이러한 코멘트를 P0에서 P2까지의 등급으로 평가합니다. 여기서 P0는 심각한 코드 검토 변경사항이고, P2는 작은 문제입니다. 물론, 당신이 상상할 수 있듯이, PR이 많은 P0들이나 많은 심각한 버그들을 받는다면, 그것은 단지 소수의 작은 문제들만 받거나 Reptile으로부터 아무 코멘트도 받지 않는 PR보다 더 낮은 PR 품질을 나타냅니다.

따라서 이를 지표로 사용하기 위해, 우리는 각 봇이 생성한 오류의 심각도를 분석했고 이를 인간 기준선과 비교했습니다. 보시다시피, 대부분의 봇들은 평균적으로 인간보다 더 적은 심각한 오류를 생성합니다. 이것은 흥미롭습니다. 이는 평균적으로, 프로덕션 다운타임을 야기할 수 있는 코드 검토 변경사항을 피하고자 한다면, 봇들이 실제로 더 신뢰할 수 있다는 것을 의미합니다. 그렇긴 하지만, 전체 심각도 분포를 살펴보면, 인간 기준선과 비교했을 때 모든 심각도 수준의 오류를 피할 수 있는 봇은 일부에 불과합니다. 따라서 다시 한 번 말하자면, 봇들이 코드 작성에 있어서 전반적으로 인간보다 더 나은지 더 나쁜지는 여전히 명확하지 않습니다. 우리가 살펴본 세 번째 지표는 이러한 PR들이 병합되기 위해 몇 라운드의 검토가 필요한지입니다.

여기서 우리는 검토 라운드를 기본적으로 봇이 PR을 열고, 인간이 주석 형태로 해당 PR에 피드백을 남기고, 그 다음 봇이 돌아와서 이러한 문제를 해결하기 위해 변경을 수행하는 것으로 정의합니다. 이것은 우리가 두 가지 다른 것을 이해하는 데 도움이 됩니다. 하나는 봇이 처음부터 얼마나 잘 좋은 코드를 작성할 수 있는지이고, 두 번째는 그들이 얼마나 잘 피드백을 통합하고 새로운 오류를 도입하지 않으면서 변경을 할 수 있는지입니다. 우리는 다시 봇 작성자별로 분석했고, 일부 봇이 실제로 인간보다 더 빠르게 그들의 PR을 병합할 수 있음을 발견했습니다. 즉, Devon과 Claude인데, 이 지표에서 가장 좋은 성능을 보였습니다. 따라서 지금까지 우리는 봇이 인간보다 코드 작성에 더 능숙한지를 판단하기 위해 여러 가지 다른 지표를 살펴봤고, 정말로 결론을 내릴 수 없었습니다.

일부 봇은 특정 지표에 따라 인간보다 코드 작성에 더 능숙하지만, 다른 지표에서는 성능이 좋지 않습니다. 승자는 다소 불안정합니다. 그것은 당신이 무엇을 측정하는지에 달려 있습니다. 음, 그렇다면 올바른 질문은 에이전트가 전반적으로 인간보다 코드 작성에 더 능숙한지 여부가 아니라, 아마도 물어야 할 질문은 봇들이 어떻게 오류를 생성하는가입니다. 그들이 인간과 다르게 보입니까, 그리고 어떤 방식으로입니까? 따라서 이 질문을 더 자세히 조사하기 위해, 우리는 인간 기준선과 비교했을 때 각 봇이 생성한 다양한 유형의 오류의 분석을 살펴봤습니다. 따라서 구체적으로, 봇과 인간의 오류율을 비교할 때, 여기서 빨간색은 봇이 인간과 비교했을 때 그 유형의 오류를 더 많이 생성함을 나타내고, 파란색은 그들이 더 적게 생성함을 나타내며, 색의 강도는 그 변화의 크기에 해당합니다.

이제 보시다시피, 각 봇이 생성하는 오류의 종류는 봇마다 크게 다릅니다. 예를 들어, Cursor 백그라운드 에이전트는 N+1 쿼리 오류에 더 쉽게 빠지는 반면, Claude 에이전트는 테넌트 확인 누락 오류에 더 쉽게 빠집니다. 단일 지표의 모든 측면에서 명확하게 우승하는 봇은 없습니다. 각 봇의 형태가 보이는 것이 다릅니다. 이제 우리가 여기서 배운 것은 봇이 생성한 오류의 유형이 인간과 다르다는 것입니다. 우리가 이전에 살펴본 모든 지표보다 반드시 더 좋거나 더 나쁜 것은 아니지만, 확실히 다릅니다. 따라서 우리가 아직 언급하지 않은 한 가지는 봇들이 단순히 당신이 더 빠르게 코드를 출시할 수 있게 한다는 것입니다. 따라서 형태가 다르고 크기가 더 크더라도 품질이 대략 같다면, 우리는 AI 코드 에이전트가 실제로 좋다고 말할 수 있을 것 같습니다.

이들은 당신이 더 많은 코드를 작성할 수 있도록 합니다. 단지 당신이 그들이 생성하는 오류의 유형에 주의를 기울여야 할 뿐입니다. AI 에이전트는 그 어느 때보다도 더 많은 코드를 작성하고 있습니다. Rohan이 언급했듯이, 그들이 생성하는 오류의 형태는 인간과 다릅니다. AI 코딩이 미래에 확장되면서 당신의 코드 검증 시스템도 또한 적응하고 AI 에이전트의 미래를 위해 확장할 필요가 있습니다. Reptile에서, 우리는 수천 개의 회사들이 AI 코드 검토를 사용하여 그들이 증가하는 AI 코드 규모를 관리하도록 돕고 있습니다. 우리는 다양한 모델의 장단점을 이해하는 데 많은 시간을 소비합니다. 이렇게 함으로써 우리는 그들을 직렬로 사용하여 더 많은 오류를 포착하고 모두를 위해 더 나은 품질의 코드를 만들 수 있습니다. Gretell이 하고 있는 작업에 대해 더 자세히 알아보는 데 관심이 있다면, 우리의 웹사이트 guptell.com을 확인해주세요.

음, AI 코딩과 AI 코드 검토의 미래가 어떤 모습일 수 있는지에 대해 저희와 더 자세히 논의하고 싶으시다면, 우리의 부스에 와서 저희를 찾아주시기 바랍니다. 우리는 기꺼이 더 자세히 논의할 것입니다. 매우 감사합니다. 매우 감사합니다. 다음으로, 우리는 Sonar의 연구 고문 Yunong Zang을 초대합니다. Yunong은 코드 품질 파이프라인에서의 AI 에이전트, 즉 배포, 보호 및 측정에 대해 논의할 것입니다. 음, Yunong, 무대는 당신의 것입니다. 좋습니다. 음, 모두에게 좋은 아침입니다. 음, 저는 Sonar의 연구 고문이며, 미국의 어느 대학의 마지막 해 박사 학생이기도 합니다. 음, 따라서 오늘 저는 당신의 코드 품질 파이프라인에서의 AI 에이전트에 대해 논의할 것이고, 음, 구체적으로 우리가 어떻게 보호하고 있는지와 당신이 이러한 코딩 에이전트가 수행한 변경 사항을 어떻게 검토하는지에 대해 논의할 것입니다.

음, 따라서 음, 여기의 관점은 제 자신의 것이며, Sonar의 어떤 관점도 반영하지 않으며, 음 표준 면책 조항입니다. 따라서 음, 여기 음은 매우 높은 수준의 다이어그램입니다. 따라서 코드가 어떻게 만들어지고 어떻게 저장소에 병합되는지 생각해보면. 음, 이것들은 대략 매우 높은 수준의 세 가지 단계입니다. 에이전트가 코드를 작성할 것이고, 이제 거의 항상 에이전트가 코드를 검토할 것입니다. 처리할 코드가 너무 많기 때문입니다. 그러면 인간이 그들을 병합할지 여부를 결정할 수 있습니다. 음, 따라서 오늘 저는 이 파이프라인의 두 가지 측면에 대해 논의할 것입니다. 첫째, 에이전트가 코드를 작성할 때, 우리가 Sonar에서 Sonar Remediation Agent라고 하는 에이전트를 어떻게 구축했는지, 음, 이것은 Sonar Cube 문제를 수정합니다. 그리고 나서 저는 우리가 에이전트가 생성한 코드 검토를 더 신뢰할 수 있는 방식으로 어떻게 평가하는지에 대해 논의할 것입니다.

음, 따라서 음, 따라서 이것이 첫 번째 부분이고, 음 Sonar Cube Remediation Agent입니다. 따라서 음, 기본적으로 워크플로우는 Sonar Cube이며, 여러분 많은 분들이 알고 있듯이, 당신의 코드를 스캔하기 위한 매우 광범위하게 사용되는 정적 분석기입니다. 따라서 Sonar Cube는 당신의 PR의 모든 문제를 찾을 것이고, 그러면 당신은 Sonar Cube Remediation Agent를 호출하여 자동으로 패치를 생성할 수 있습니다. 따라서 이 에이전트는 당신의 기존 코드 위에 새로운 PR을 열 것이고, 그다음 개선된 변경사항을 제안할 것입니다. 따라서 오른쪽의 스크린샷은 음 이 에이전트가 어떤 모습인지를 보여줍니다. 따라서 당신은 이 PR을 열면 Sonar Cube에서 어떤 문제를 이미 수정했는지 알려주고, 그다음 음 이러한 패치를 하나의 코드 블록씩 제공하고 이 패치가 이 문제를 수정하는 방법의 설명을 알려줍니다. 음, 따라서 우리는 이미 이 오픈 베타를 출시했고, 우리는 음 고객들로부터 음 많은 피드백을 받았습니다.

따라서 음, 오늘 제가 더 많이 논의하고 싶은 한 가지는 우리가 이러한 에이전트들을 프로덕션에 배포할 때 어떻게 보호하는가입니다. 음, 이러한 에이전트들이 대량의 엔터프라이즈 코드에서 작동하기 때문에, 우리는 이러한 에이전트들을 배포하고 실행할 때 실제로 보안 문제가 없다는 것을 확인하고 싶습니다. 따라서 우리는 에이전트를 샌드박싱하는 것에 대해 들었으며, 이것은 매우 중요하고 음, 우리는 배포할 때 이를 사용합니다. 음 하지만 제가 말하고 싶은 것은 우리는 또한 심층 방어를 구축하고 싶다는 것입니다. 이는 우리가 샌드박스를 배포한 후 계층화된 보안을 구축한다는 의미입니다. 우리는 또한 에이전트 내부 및 에이전트가 코드를 발행한 후에 보안을 구축했습니다. 따라서 음 여기는 우리가 에이전트 내부에서 수행한 몇 가지입니다.

따라서 한 가지는 우리가 이 에이전트를 위해 매우 제한된 워크플로우를 구축하고 있다는 것입니다. 이는 우리가 Sonar 문제를 수정하는 매우 구체적인 시나리오를 처리할 것임을 알고 있기 때문입니다. 따라서 자유로운 터미널이 없으므로, 에이전트가 인터넷에 무작위로 액세스하고 임의의 명령을 실행할 수 없습니다. 우리는 또한 코드베이스를 공격 표면으로 취급합니다. 단지 MCP와 기술뿐만 아니라 코드베이스도 마찬가지입니다. 음, 그래서 누군가가 음 오픈소스 기여자가 음 당신의 저장소에서 PR을 열고, 그리고 이 사람의 동기가 순수하지 않다고 상상해보세요. 따라서 그들은 실제로 그들이 당신의 저장소에 보내는 PR에 악의적인 명령을 주입할 수 있습니다. 따라서 음 그것은 우리가 고려한 한 가지입니다. 따라서 우리가 실제로 이 에이전트를 실행할 때, 우리는 이러한 모든 명령을 음 다른 음 식별자로 대체하고, 그다음 에이전트가 완료된 후 다시 교환합니다.

음, 그리고 음, 우리 음 우리는 이 공급망 공격을 처리하고 싶습니다. 따라서 이는 음 내가 악의적인 행위자이고, pip 저장소 타이포스쿼팅을 하고 있으며 에이전트가 이러한 종류의 저장소를 가져오는 것을 피하고 싶어하는 시나리오를 위한 것입니다. 따라서 우리는 에이전트가 이러한 악의적인 라이브러리를 가져오지 않도록 많은 import 보호를 구축했습니다. 음, 그것이 에이전트 내부에서 일어나는 일이고, 완료 후 에이전트 패치를 검증하는 방법입니다. 따라서 음, 에이전트가 패치를 생성할 때, 우리는 다시 이 에이전트가 생성한 패치에서 Sonar Cube 분석기를 실행하고, 회귀를 발견하거나 보안 문제를 발견한다면, 에이전트는 이전 반복의 피드백을 받아 재시도하도록 요구되며, 품질 게이트가 통과할 때, 그것은 개발자에게만 전송됩니다. 따라서 그것이 제가 논의하고 싶었던 첫 번째 부분입니다. 음.

음, 따라서 이제 우리는 주제를 우리가 이 코드 검토를 어떻게 평가하는지로 전환하고 싶습니다. 따라서 이제 이것이 실제 병목 지점이 되었습니다. 에이전트들이 당신의 저장소에 많은 PR을 보내고 있고, 그러면 인간 음 불가능 음 이 모든 PR들을 검토합니다. 따라서 자연스러운 방법은 음 AI 검토 도구를 사용하여 이 PR을 검토하도록 돕는 것입니다. 하지만 이러한 도구는 많으며, 우리는 어떤 도구가 당신의 특정 사용 사례에 더 나은지 어떻게 알 수 있고, 우리는 그들을 어떻게 신뢰할 수 있게 평가할 수 있는지입니다. 따라서 이것은 우리가 조사하고 싶은 문제입니다. 음, 따라서 이것이 음 기존 방법이 수행하는 것입니다. 따라서 음 시나리오를 고려하면, 우리는 일부 역사적 PR을 가지고 있고, 인간이 그들에 대해 일부 코멘트를 했고, 그다음 우리는 이 AI 검토 도구를 실행하고, 우리는 AI 도구가 인간과 동일한 버그를 포착했는지 보고 싶습니다. 따라서 물론, 그들이 더 많은 유사한 버그를 포착한다면, 그들이 더 나을 것입니다.

그래서 이것이 사람들이 이전에 수행한 몇 가지 지표입니다. 하나는 우리가 텍스트 유사성을 확인할 수 있다는 것입니다. AI 검토 도구가 자연언어에서 생성한 의미체계가 인간과 비교했을 때 유사한지 확인할 수 있습니다. 하지만 아시다시피, 우리가 같은 문제를 가리키더라도 이 문제는 매우 다른 방식으로 표현될 수 있습니다. 따라서 이 지표 유사성은 때때로 작동하지 않으며, 그리고 어 우리는 또한 지역화를 고려할 수 있습니다. 이것은 PR을 취하고 우리가 이 봇들과 인간들이 댓글을 작성한 각 줄의 위치를 비교하는 것을 의미하며, 우리는 말합니다 어 만약 그들이 인간과 같은 위치에서 같은 명령을 수행한다면 봇이 좋습니다. 하지만 다시 말해서 이것은 의미체계를 당신에게 말해주지 않으며, 그것은 단지 위치일 뿐입니다. 음, 또한 다른 간단한 방법이 있으며, 당신은 LM을 판사로 사용할 수 있습니다. 어 당신은 언어모델에 이 두 개의 명령이 동일한지 물을 수 있습니다.

어, 그래서 그것은 때때로 작동하지만, 이것들이 정말로 신뢰할 수 있는지 말하기 어렵습니다. 어, 그래서 어 여기서의 간극은 우리가 검토가 실제 명령이 좋은지를 결정하는 어떤 방법을 원한다는 것입니다. 음, 그래서 음 이것이 우리가 한 것입니다. 그래서 우리 우리는 새로운 벤치마크를 구축했습니다 어 이름이 CRAP입니다. 그래서 그것은 또한 유사한 시나리오로 작동합니다, AI가 생성한 평론이 인간과 동일한 문제를 포착하는지 확인하는 것을 의미하며, 하지만 핵심 아이디어는 우리가 언어모델 구성요소를 사용하지 않았다는 것이며, 대신 각 인간 검토를 실행 가능한 테스트로 변환했습니다. 그래서 이것은 구체적인 예입니다, 왼쪽의 이 PR의 한 줄을 취합니다 어 만약 이것이 누군가 코드베이스의 내용을 변경한다면, 인간 검토는 좋습니다, 이것은 아마도 더 많은 입력을 일으킬 것입니다, 이렇게.

그래서 안전하게 거짓을 반환하는 대신, 그래서 이것이 구체적인 개선 코드입니다 어 인간 검토가 인간 검토가 이미 제안한. 그래서 어 이에 해당하여, 우리는 오른쪽에 테스트를 생성할 것입니다. 그래서 이 테스트는 기본적으로 이 검토 명령에 해당하며, 이것을 의미합니다 만약 이 검토 명령이 해결되면, 이 테스트는 통과할 것이고, 그렇지 않으면 이 테스트는 실패할 것입니다. 그래서 지금 지금 모든 이 PR들에 대해, 우리는 더 이상 인간 검토를 가지지 않습니다. 우리는 모든 이 실행 가능한 테스트를 가집니다. 지금 두 번째 부분은 우리가 실제로 이 입력을 기반으로 AI 검토자를 어떻게 평가하는지입니다. 그래서 우리는 AI 검토 도구에 PR을 보여주고 당신이 댓글을 작성해 달라고 요청하고, 그 다음 우리는 다른 코딩 에이전트를 취해 이 댓글의 기초가 되는 코드를 개선합니다. 지금 우리는 코드의 다른 버전을 가집니다, 그것이 AI 기반 명령을 기반으로 개선되었습니다.

그 다음 우리는 이 실행 가능한 테스트를 실행하여 이 업데이트된 버전의 코드가 좋은지 그리고 이 테스트들 중 몇 개가 통과했는지 확인합니다. 그래서 이 방법으로 우리는 AI 검토 도구가 인간 명령의 몇 %를 이미 포착했는지 말할 수 있습니다. 음, 그래서 음, 이것은 우리가 얻은 결과입니다. 음, 그래서 각 도구의 구체적인 숫자는 그렇게 중요하지 않습니다, 왜냐하면 이 검토 도구들은 매일 더 좋아지고 있고 이 언어모델들은 매일 더 좋아지고 있으며 이 숫자들은 어 2026년 초에 얻어졌습니다. 어, 그래서 내가 강조하고 싶은 부분은 오른쪽의 이 숫자입니다. 그래서 우리가 모든 이 검토 도구들을 함께 고려한다면, 그들은 인간 검토 어 인간 검토자들이 지적한 41.5%를 해결했습니다. 그래서 이것은 실제로 이 어 현재의 검토 도구들이 인간 검토자들이 이전에 지적했던 절반조차도 포착하지 못한다는 것을 의미합니다.

어 하지만 이것이 완전한 이야기는 아닙니다. 그래서 이 숫자 외에도, 우리는 실제로 모든 이 AI 생성 명령들을 살펴보고 그들의 품질을 살펴봤습니다, 왜냐하면 그들은 또한 인간이 식별하지 못한 다른 오류들을 지적할 수 있지만, 그들은 여전히 가치가 있습니다. 그래서 어 우리는 추가로 인간과 AI 생성의 모든 이 검토 평론들을 살펴보고 그들의 주위에 분류를 수행했습니다. 그래서 이 분류는 오류 수정을 넘어갑니다. 그래서 우리는 기본적으로 그들을 안전성, 효율성, 호환성, 견고성 등등 코드의 문서화 및 유지보수성에 이르기까지 배치했습니다. 그래서 어, 이 차트는 어 각 검토 도구가 인간 검토와 비교했을 때 어떻게 수행하는지를 보여줍니다. 그래서 우리는 AI가 실제로 코드의 견고성과 테스트에서 매우 잘 수행된다는 것을 볼 수 있습니다.

그들은 당신에게 코드를 더 많이 테스트해 달라고 제안할 것입니다. 그들은 코드에서 경계 케이스를 지적할 것이고 당신이 그들을 추가해 달라고 요청할 것입니다. 그래서 이것은 나의 개인적인 경험과 일치합니다. 그래서 AI는 내가 이전에 주목하지 않은 것들을 지적하는 데 매우 능숙합니다. 하지만 다른 한편으로, 인간 검토는 AI와 비교했을 때 유지보수성과 디자인에 매우 능숙합니다. 그래서 그래서 그들 그들은 논할 것입니다 만약 당신이 이렇게 많은 변경을 추가한다면, 이 코드는 더 이상 유지보수할 수 없을 것입니다. 당신은 해야 합니다 그리고 당신은 다른 방식으로 코드를 구조화해야 합니다, 왜냐하면 인간 검토자들은 AI 검토자들보다 코드베이스에 대해 더 많은 상황지식을 가지고 있습니다. 그래서 음, 여기서의 포인트는, 지금 어 우리는 여전히 AI와 인간 검토를 함께 사용해야 합니다. 아마도 AI 검토는 첫 번째 층으로 작동해야 하며, 그 다음 인간 검토는 AI 검토자들이 덜 능숙한 이 특정 범주들을 살펴볼 수 있습니다. 맞습니다.

그래서 어 맞습니다, 그것은 내가 논의하고 싶었던 모든 내용입니다. 음, 그래서 나 나 논의했습니다 우리가 어떻게 제어 및 안전을 더 많이 초점을 맞춘 에이전트들을 구축하는지, 그리고 AI와 인간이 지금 코드 검토 작업에서 함께 작동해야 하는지, 아마도 미래에 우리는 그들이 지금 부족한 측면에 초점을 맞춘 더 많은 AI 도구를 가질 수 있을 것이지만, 지금 나는 이것이 우리가 우리의 코드베이스 위에 계층화된 검토를 구축할 수 있는 솔루션이어야 한다고 생각합니다. 그래서 이 둘은 우리 논문의 QR 코드입니다. 그래서 우리는 이 주제들의 각각에 대해 연구 논문을 가지고 있습니다. 음, 만약 당신이 관심이 있으시다면 자유롭게 읽으세요. 어, 기꺼이 그 후에 채팅할 준비가 되어 있습니다. 매우 감사합니다. 다음으로, 우리는 싱가포르 본토 Featherless의 Eugene Chia를 초대하고 있으며, 그는 개방형 소스 모델이 지금 나타났으며 싱가포르가 구축할 시간이 되었다는 것을 논의할 것입니다. 사과합니다. 기술적 어려움에 대해 사과드립니다. 음, 나에게 AGI가 실제로 정말로 해결되었을 때는 어 무엇입니까,

이 것들은 해결될 것이고, 프린터처럼 이것은 발생해서는 안 됩니다. 좋습니다. 좋습니다. 안녕하세요, 저는 Eugene입니다. 나는 개방형 소스 모델에 대해 이야기하고 싶습니다, 왜 그들은 여기에 있으며, 왜 싱가포르는 직접 구축해야 합니다. 음, 시간이 제한되어 있으므로, 음, 나는 아마도 영어에 약간 기울어질 것입니다. 나는 아마도 당신보다 빠르게 말할 것이고, 나는 단지 데모를 시작하려고 합니다. 이 실시간 데모의 경우, 나는 단지 매우 빠르게 간단한 웹 게임을 만들 것입니다. 음, 하지만 더 흥미로운 것은, 나는 최고의 최첨단 모델을 사용하지 않을 것입니다. 나는 최고의 개방형 소스 모델을 사용하지 않을 것입니다. 나는 Qwen 27B 및 Gamma 43B를 사용할 것입니다, 그들은 당신의 노트북에서 실행할 수 있습니다.

좋습니다, 보시다시피, 음, 나는 Cline을 사용하고 있으며, 그것은 VS Code에 통합된 개방형 소스 코딩 에이전트 중 하나입니다. 음, 당신은 무엇이든 사용할 수 있습니다, 음, 이것이 이 데모의 포인트는 아닙니다. 포인트는 정말로 당신이 오늘 실제로 것들을 구축하는 데 사용할 수 있는 모델들이 이것들입니다. 그래서 이것을 기다리려고... 좋습니다, 좋습니다. 계획 완료입니다. 그것이 계획 완료. 나는 그것을 심지어 확인하지 않았습니다. 좋습니다, 그래서 이것들이 모델입니다, 맞죠? 그리고 더 중요한 것은, 당신은 당신의 노트북에서 실행할 수 있습니다. 그래서 이것이 MM Studio와 Gamma 31B의 예입니다, 음, 그것은 나의, 이 노트북에서 실행 중입니다. 당신은 Mac 노트북에서 실행할 수 있습니다. 당신은 최고 끝조차 필요하지 않습니다. 음, 이것이 동일한 Qwen 27B입니다, 제외하고는 만약 나는 클라우드에서 그것을 실행할 수 있으면 아마도 더 빠를 것입니다. 그래서 음, 나는 그것을 클라우드에서 실행하도록 할 것입니다. 맞습니다. 맞습니다.

그래서 나의 배경에 대해 조금. 나는 Eugene입니다. 음, 나는 AI 모델 창작자입니다. 음, AI 모델을 만든 전 세계 수백 개 미만의 팀 중 하나입니다. 음, 특히 동남 아시아에서, 정말로 우리 몇 개만. 음, Featherless AI의 창립자 및 CEO, 최근 우리의 A 라운드 자금 조달을 실시하였습니다, 1.2억 달러의 평가, Airbus Ventures 및 MD Ventures가 주도합니다. 나는 또한 RWKB 개방형 소스 프로젝트를 공동으로 주도합니다, Linux Foundation 아래 첫 번째 AI 모델, 나는 싱가포르에서 태어났고 자랐으며, 반복 기업가입니다. 음, 나는 초기 단계 회사, 엔터프라이즈 소프트웨어, 은행, 개방형 소스 공간에서 십 년 이상 일했습니다. 나는 기본적으로 매달 동쪽과 서쪽 사이를 날아다니고 정기적으로 왕복합니다. Featherless AI는 무엇입니까? 우리는 전체 개방형 소스 모델 컬렉션에 대한 즉각적인 액세스를 제공하는 플랫폼입니다. 오늘 30,000개의 모델이 있습니다.

미래에 우리는 모든 200만 또는 심지어 300만 개의 모델을 지원하고 싶습니다. 그때까지, 우리의 원칙은 우리가 당신을 위해 어떤 모델을 사용하고 싶은지 결정하는 판사를 선택해야 하지 않는다는 것입니다. 당신은 스스로 결정할 수 있어야 합니다. 그래서 이것이 우리가 모든 사람에게 액세스를 제공하기 위해 확장하고 있는 것이며, 당신은 또한 Hugging Face 및 Open Router를 통해 우리에게 액세스할 수 있습니다. 이것이 흥미로운 이유도 있습니다, 당신이 사용자 선택 모델, 전체 모델 컬렉션을 합니다, 음, 그것은 여전히 30,000의 초기 단계입니다, 우리가 확장하고 있습니다. 당신은 사람들이 선택권이 있을 때 실제로 사용하는 모델을 관찰할 수 있습니다. 그래서 이것이 기본적으로 이 대화의 배경입니다, 예를 들어 사람들이 개방형 소스 모델로 무엇을 하는지?

왜냐하면 궁극적으로, 맞죠, 그것은 정말로 내가 더 흥미롭다고 생각하는 그 통찰력들을 얻는 것에 관한 것입니다. 그래서 이 질문에 답하기 위해, 나는 이것을 두 가지 주요 부분으로 나누겠습니다. 첫 번째는 어떤 개방형 소스 모델 클래스를 사용합니다. 이것은 보통 사람들이 개방형 소스 AI 영역에 처음 들어올 때 흥미로운 것을 발견할 때입니다, 왜냐하면 그들이 좋아합니다, 나는 Qwen를 사용해야 합니까 아니면 Deep Seek와 같은 것입니까. 하지만 이것은 아마도 내가 보여주기 가장 어려운 지표 중 하나입니다, 왜냐하면 매번 나는 슬라이드를 만들 때마다, 그것은 다음 주에 구식이 됩니다. 이것이 12월이었을 때, 그 당시 우리의 대부분의 트래픽은 Deep Seek에 의해 지배되었으며, 엔터프라이즈 고객의 경우, 그것은 Administr Nemoi에 의해 지배되었습니다.

나는 이것을 매우 흥미로운 패턴이라고 생각합니다, 왜냐하면 소비자들은 즉각적인 최신 최고를 테스트하고 실험하는 것을 좋아하는 반면 엔터프라이즈는 규모를 크게 실행하는 것을 좋아합니다, 그래서 그들은 효율성에 초점을 맞춥니다. 하지만 곧 그것이 교체되었고, 그 다음 며칠 전처럼, Gamma가 차트에서 폭발하기 시작했습니다, 이것은 내가 대화 자체를 위해 업데이트해야 하는 자신의 업데이트된 버전 차트입니다. 아, 이런. 좋습니다, 좋습니다. 그것이 실행 완료입니다. 좋습니다. 음, 그래서 이것은 어 Ivan과 Google Tig 팀에 대한 환호입니다. 그들은 Gamma 31B에 훌륭한 일을 했습니다. 그래서 이 모델들은 그 다음 무엇에 사용됩니까? 음, 아, 실시간 데모 문제, 하지만 괜찮습니다. 우리가 점점 더 많이 듣는 것처럼 개방형 소스 프로그래밍 에이전트 사용 사례처럼 우리 트래픽의 거대한 막대를 나타냅니다.

다른 주요 것은 AI 동반자, 치료 및 역할 놀이이며, 실제로 에이전트 프로그래밍 사용을 초과했습니다, 하지만 에이전트 프로그래밍 사용은 많은 사용자가 많은 에이전트를 실행할 것입니다, 그 중 AI 동반자 공간은 일반적으로 기업 고객이 될 몇 가지이며, 그 회사는 수천 개의 사용자 코딩 사용 사례를 가질 것입니다, 이것들은 우리가 가진 메타데이터를 기반으로 합니다, Cline 및 Clot code 등, 우리는 이 종류의 사용 사례를 볼 수 있습니다, 그 다음 5% chbtt 아, 다시. 우리가 완료 데이터에 대한 어떤 프롬프트도 감지하지 않으므로, 우리는 이 숫자를 대략 추론합니다.

그래서 이것을 넘어 흥미로운 것은 무엇인가, 맞죠, 여기에 나 음 여기에 나는 모델 클래스로 나타낼, 하지만 당신이 미세 조정 모델로 나타낼 때, 당신은 아마도 미세 조정을 들었을 것이고, 당신의 개인적인 사용 사례 또는 기업 사용 사례를 위해 모델을 전문화하기 위해, 당신은 차트에서 차이를 볼 수 있습니다.

가장 흥미로운 것은 통상적으로 널리 사용되는 모든 인기 모델의 상위 3분의 1 또는 절반이 아니라 하위 절반이라는 것을 알게 되었습니다. 왜냐하면 이 추론 시장이 조 달러 규모의 시장이 되려면, 이것이 흥미로워지는 지점이기 때문입니다. 우리가 AI 모델이 특정 지역을 지원하기 위해 미세 조정으로 지원되는 것을 보는 곳이 바로 여기입니다. 예를 들어, 우리는 자랑스럽게도 우간다의 첫 번째 언어 모델인 Sambar AI의 제공자 중 하나이거나, 농업 언어 모델인 Denu AI 모델입니다. 우리는 또한 의료 사용 사례도 봅니다. Open Hands의 경우 싱가포르에서도 훈련되었으며, Cisco 기본 모델처럼 보안과 관련된 것들도 있습니다.

따라서 이 추세에서 제가 흥미로운 점을 발견하는 것은, 더 중요하게는 오픈소스 모델이 현재의 Sonnet 및 Mini 라인을 뛰어넘고 있으며, 노트북에서 Opus 수준의 지능을 실행하고 있다는 것입니다. 긴 컨텍스트 비용이 하락하고 있습니다. 저는 시간이 조금 부족해서 더 빠르게 진행하겠습니다. 기본적으로 오픈소스 모델이 Sonnet과 일치하고 AI 모델의 Opus에 가까워지고 있습니다. 네, 여전히 약간 뒤떨어져 있지만, 거의 다 왔습니다. 하지만 이것이 더 흥미로운 부분입니다. 제가 실행해 본 두 개의 모델은 GPT-4 코딩 사용 사례를 초월했습니다. 물론 그들은 GPT-5가 아닐 수 있지만, 이들이 노트북에서 실행된다는 것을 기억하세요. 기본적으로 오늘 보는 최고의 모델들이 내년에는 당신의 노트북에서 실행될 수 있을 것입니다. 이것은 오픈소스 분야에서 계속 반복되는 패턴입니다. 그래서 저는 이 부분을 넘어가겠습니다.

그래서 이것이 바로, 맞죠, 이것은 모든 AI 엔지니어들에게 강조하고 싶은 중요한 것입니다. 왜냐하면 실시간 데모를 봅시다. 좋습니다. 좋습니다. 그래서 이것이 그 중 하나입니다. 흠, 보겠습니다. 이것은 Gamma 31B여야 하지만, 예를 들어 Qwen 27B를 열어보겠습니다. 이것도 또 다른 것임을 볼 수 있습니다. 이것이 노트북에서 실행될 수 있다는 사실은 주목할 만합니다. 왜냐하면 현재 노트북에서 실행될 수 있는 이 모든 모델들은 UI, API 또는 다른 어떤 것이든 할 수 있기 때문입니다. 물론 몇 번의 재시도가 필요할 수 있습니다. 하지만 우리가 싱가포르를 세계의 AI 중심 또는 동남아시아의 중심으로 만들고 싶다면, 문제는 모델이 아니라 우리 자신입니다. 우리는 단지 구축을 시작하면 됩니다. 이것이 저는 싱가포르의 모든 사람들이 시작하기를 원하는 것입니다. 그저 구축하세요. 장애물이 없으니까요. 네, 그렇습니다. 감사합니다.

매우 감사합니다. 매우 감사합니다, Eugene. 흠, 다음으로 우리는 Max Buckley가 있습니다. 그는 XAI의 지식 연구 책임자입니다. Max는 말할 것입니다. 흠, 그의 주요 강연 제목은 「2025년 11월 24일, 다음은 무엇인가」입니다. Max, 당신의 차례입니다. >> 안녕하세요. 흠, 저는 EXA에서 온 Max입니다. 흠, 저는 지식 연구 책임자이며, 현재 설립 중인 취리히 사무소도 담당하고 있습니다. 이것은 더 실존적인 대화이므로 저는 실제로 EXA에 대해 이야기하지 않을 것입니다. 흠, 이것은 타이핑 오류가 아닙니다. 여러 번 물어봤지만 타이핑 오류가 아닙니다. 2025년 11월 24일, 다음은 무엇인가? 흠, 2025년 11월 24일이 무엇인가요? 그것은 Claude 4.5 Opus가 출시된 날입니다. 제 입장은 이것이 역사상 일들이 바뀐 날로 기록될 것이라는 것입니다.

따라서 제 제안은 사회 뒤의 게임 이론이 변하고 있다는 것이며, GenAI가 이를 주도했습니다. 흠, 저는 몇 년 전 ChatGPT의 역사적 예와 더 최근의 Opus 예를 사용할 것입니다. 하지만 기본적으로 우리가 소유한 기관은 어떤 것이 비싸다는 가정을 바탕으로 지어졌으며, 이러한 비용이 어떤 것을 작동하게 합니다. 맞죠. 하지만 우리가 이러한 비용을 제거하면, 그 주변에 지어진 시스템이 작동하지 않을 수 있으며, 붕괴될 수 있습니다. 따라서 작업 증명은 이러한 역사적 예 중 하나입니다. 맞죠? 우리는 많은 시스템을 가지고 있는데 사람들이 노력을 기울여 노력을 기울였다는 것을 증명하도록 요구합니다. 이렇게 함으로써, 알다시피, 학교에서 사람들을 공부하게 할 수 있습니다. 실제로 당신의 회사 직책에 지원하고 싶은 사람들을 발견할 수 있습니다.

알다시피, 당신은 또한 누군가가 신뢰할 수 있는지 여부를 알 수 있습니다. 이제 저는 이메일이나 LinkedIn 메시지 같은 메시지를 받는데 그것이 매우 잘 작성되어 있다면, 저는 이 사람이 정말 설득력 있다고 생각하지 않습니다. 정말로 저와 대화하려고 노력했습니다. 저는 이 사람이 단지 LLM을 사용했다고 생각합니다. 그리고 이전에는 정반대가 사실이었습니다. 이제 타이핑 오류가 있는 무언가를 받으면, 누군가는 모델이 타이핑 오류가 있는 텍스트를 생성하도록 하거나 의도적으로 편집하여 더 많은 타이핑 오류가 있도록 합니다. 제가 게임 이론 관점에서 이것을 말하는 이유는 당신이 이것을 선택 취소할 수 없기 때문입니다. 당신의 대학이 「우리는 Gen AI 프로젝트를 허용하지 않습니다」와 같은 어떤 주장을 제기했다면, 알다시피, 그것은 단지 당신의 학생들이 오류를 편집하고 강조 대시를 제거해야 한다는 의미입니다. 따라서 당신은 이러한 변화를 선택 취소할 수 없습니다. 그들은 당신에게 찾아옵니다.

흠, 이제 코딩에서도 유사한 전환이 일어나고 있습니다. 맞죠? 지난 약 8년 동안 우리는 탭 완성, 한 줄을 완성하는 것에서, 함수 완성에서, 파일을 생성하도록 요청할 수 있는 것에서, 이제 당신은 이 코딩 에이전트가 있습니다. 당신은 이 높은 수준의 프롬프트를 제공할 수 있으며, 그것은 수 분에서 수 시간 동안 실행되고 전체 것을 구축하고, 테스트하고, 검증하고, 완료될 때 다시 당신에게 돌아옵니다. 이것은 상당한 전환이며, 완전히 전개되지 않은 것입니다. 흥미로운 점은 모델 자체조차 이 전환을 인식하지 못한다는 것입니다. 따라서 Claude를 사용하면, 과거가 사실이었을 때의 시간 추정을 계속 사용할 것입니다. 따라서 당신이 Claude에 큰 사양을 제공하고 「이것은 미친 생각입니다. 이 연구 논문을 구현해봅시다」라고 말하면,

Claude는 당신에게 이 프로젝트에 12주가 필요하다고 말할 것입니다. 그러면 당신은 마크다운을 Claude Code에 복사하고, 그것은 12주를 실행합니다... 흠, 아니, 그것은 30분을 실행하고 완료됩니다. 알다시피, 분명히 이 세상이 얼마나 많이 바뀌었는지 아직 이해하지 못한 것입니다. 저는 이 초기 추정이 잘못되었다고 생각하지 않습니다. 저는 Google에서 일했으며, 정말 뛰어난 엔지니어들이 몇 명 있었습니다. 초급 엔지니어에게 배정하면, 그것은 정말로 12주가 걸릴 것입니다. 그것은 12주의 체크인과 반복, 진행입니다. 이 IT 리터러시 개념을 기억하세요? 제 말은, 아마도 저는 잘못된 관중에게 설교하고 있을 수도 있지만, 과거의 상황은 많은 사람들이 컴퓨터를 두려워하거나 어렵다고 생각했거나 어려워했다는 것입니다. 그 뒤의 이유는 컴퓨터가 매우 말 그대로라는 것입니다. 맞죠?

세미콜론을 놓쳤거나 타이핑 오류 같은 것이 있으면, 컴퓨터는 단지 「그것을 찾을 수 없습니다. 그것은 작동하지 않습니다. 당신은 운이 없습니다」라고 말합니다. 그리고 IT 리터러시는 사람들, 평범한 사람들, 컴퓨터 사용에 익숙하게 도움을 주는 것에 관한 것입니다. 예를 들어 「네, 당신은 세미콜론을 놓쳤지만, 걱정하지 마세요. 당신은 그것을 넣을 수 있고, 그것은 여전히 작동할 것입니다. 아니, 불법적인 작업은 실제로 범죄가 아닙니다. 걱정하지 마세요.」 하지만 다시 한 번, 코딩 에이전트가 구동하는 것 중 하나는 제가 「코딩 에이전트」라는 단어가 잠재력을 과소평가한다고 생각하는 여기의 전환입니다. 코딩 에이전트, 또는 단지 당신의 컴퓨터에서 실행되는 에이전트는 컴퓨터에 자연어 인터페이스를 제공합니다. 보통 사람이 이제 이 하나의 장애물을 가지고 있습니다. 즉, 터미널을 어떻게 열 수 있을까? Claude Code는 어떻게 시작할까?

이제 그들은 이전에 할 수 없었던 방식으로 컴퓨터를 사용할 수 있습니다. 그들은 자연언어로 그것과 대화할 수 있습니다. 그것은 그들이 하고 싶은 무엇이든 하는 방법을 통해 그들을 안내할 수 있습니다. 그들은 네트워크에서 프린터를 어떻게 설정합니까? 그들은 알다시피, 스크린샷을 어떻게 촬영합니까? 카메라가 보이는지 여부를 디버그하려면 어떻게 해야 합니까? 맞죠? 이것은 그들이 이전에 할 수 없었던 것입니다. 오픈소스는 다음입니다. 저는 다음이라고 말했는데, 의미는 이미 일어나고 있다는 것입니다. 제 말은, 이 방에 있는 일부 사람들이 이러한 측면 중 일부에 대해 이야기했습니다. 맞죠? 하지만 알다시피, 오픈소스는 엔지니어에게 열려 있던 것입니다. 이제 그것은 컴퓨터를 가지고 있고 문해력이 있는 모든 사람에게 열려 있다는 의미이며, 이것은 상당히 더 많은 개인입니다. 물론, 이것은 새로운 문제, 새로운 도전을 가져옵니다. 그래서 네, 이전에 사실이었던 것들, 이것들은 지난해 말 이전의 세상의 가정이었습니다.

따라서 이전에 상황이 소프트웨어 개발은 비싸다는 것이었습니다. 오직 소수의 사람들만이 코딩할 수 있습니다. 이 사람들은 매우 능숙합니다. 그들의 시간은 매우 귀합니다. 흠, 따라서 알다시피 우리는 기본적으로 모든 기능에 대해 기회 비용을 가집니다. 우리가 올바른 것에 대해 일하고 있는지 확인하기 위해 특별히 설계된 전체 조직의 부분이 있습니다. 어떤 올바른 정의를 통해. 알다시피, 어떤 프로젝트를 해야 하고, 어떤 프로젝트를 우선순위로 해야 하고, 우리가 버그 수정에 얼마나 많은 투자를 해야 하며, 새로운 기능 추가에 얼마나 많은 투자를 해야 하는지에 대한 끝없는 논쟁이 있습니다. 마찬가지로 소프트웨어 개발은 느립니다.

따라서 작은 기능도 알다시피 몇 시간 걸릴 수 있고, 아마도 며칠 걸릴 수 있으며, 알다시피 큰 기능은 몇 주를 걸릴 수 있고, 몇 달을 걸릴 수 있으며, 시스템의 정말 큰 재구축은 여러 사람이 몇 년 걸릴 수 있습니다. 물론 이것의 좋은 점 중 하나는 로드맵이 이것과 상당히 잘 조정될 수 있다는 것과 같습니다. 맞죠. 로드맵은 분기별이 될 수 있습니다. 왜냐하면 효과적인 작업은 분기별이기 때문입니다. 저는 Google에서 일할 때 기억합니다. 알다시피, 우리는 아마도 누군가에게 그들의 분기에 4개, 5개, 6개 포인트 배정을 할 것입니다. 그것은 4개, 5개, 6개의 것들이었습니다. 그들은 그 분기 동안 일할 것입니다. 일반적으로 그들은 그 중 70%에서 80%를 할 것입니다. 흠, 그래서 이 두 가지 때문에, 당신은 무자비하게 우선순위를 정하고 싶습니다. 그리고 이것을 하기 위해 설계된 다양한 시스템이 있습니다. 맞죠?

알다시피, 우리는 수백 개의 문제, 요청, 기능 및 아이디어를 제출한 영업 팀을 가지곤 했습니다. 그러면 당신은 제품 관리자가 이러한 수백 개 또는 수천 개의 아이디어를 30개로 필터링할 것입니다. 이 30개는 엔지니어링 관리자에게 갈 것이고, 그들은 이것들에 대해 논쟁할 것입니다. 그리고 나서 「우리는 처음 16개를 할 것입니다」라고 말하는 선을 그을 것입니다. 이 16개는 팀의 엔지니어에게 배정될 것입니다. 따라서 제가 말했듯이, 흥미로운 점은 우리 모든 프로세스, 습관 및 조직 차트가 이것이 사실이라고 가정한다는 것입니다. 따라서 이 모든 것이 이러한 변화와 함께 변해야 합니다. 네, 기본적으로 전체 것이 희소 경제학에 기반합니다. 알다시피, 모든 코드의 한 줄은 매우 가치가 있으므로, 우리는 어떤 방식으로든 사물들을 우선순위를 정해야 합니다. 흠, 알다시피, Software as a Service 같은 것들이 흥미롭습니다.

우리 모두 이것을 들었고, 지금 그것은 어떤 위험에 있습니다. 흥미로운 점은, 알다시피, 훌륭한 엔지니어 팀이 있다면, 이론적으로 경쟁자나 당신이 원하는 다른 소프트웨어 서비스의 작동 일일 복제본을 구축할 수 있습니다. 하지만 문제는 당신이 하고 싶습니까? 당신은 몇 명의 사람과 수백만 달러를 수 년 동안 투자하여 기본 버전을 구축하려고 시도하고, 그 다음 판매 및 사람들을 전환하도록 설득하는 도전에 직면하고 싶습니까? 이제 이것이 훨씬 더 쉬워졌으며, 이것은 사람들이 해자가 더 이상 코드가 아니며 이제 당신의 브랜드와 당신의 시장 진입 채널이 될 것이라고 깨닫게 합니다.

저는 기계학습과 데이터의 해자가 더 길 것이라고 생각합니다. 왜냐하면 경계가 어디에 있는지 정확히 파악하기 어렵기 때문입니다. 따라서 결정론적인 것보다 역공학이 더 어렵습니다. 이러한 희소성 사고도 변해야 합니다. 전문적 판단에 의해 30개의 아이디어를 3개로 축소한 다음, 이 3개를 구현하는 이 생각, 알다시피, 우리는 더 이상 이렇게 할 필요가 없습니다. 이제 우리는 모든 30개를 구축할 수 있으며, 좋은 평가를 수행하고, 벤치마킹하고, 어떤 것이 실제로 가치가 있는지 볼 수 있으며, 그 다음 나머지를 되돌릴 수 있습니다. 우리는 우리가 되돌린 이 것들을 그렇게 많이 보유하지 않을 것입니다. 왜냐하면 우리는 3개월을 들여 그것을 구축하지 않았기 때문입니다. 그리고 우리의 진급 사건은 그것에 달려 있지 않습니다. 따라서 네, 소프트웨어 공급은 폭발할 것입니다. 제 말은 이것이 독창적인 아이디어는 아니라는 것입니다.

흠, 최근에 GitHub의 최고 운영 책임자로부터 트윗이 있었는데, 현재 운행 속도로 따르면, GitHub 커밋 볼륨은 전년도 동안 14배 증가했습니다. 이는 2025년을 초과했으며, 2025년은 이미 2024년보다 4배 증가했습니다. 따라서 현재 운행 속도로 14배이고, 여전히 증가하고 있습니다. 따라서 더 많을 것입니다. 특히 흥미로운 점은 새 도구의 한계 비용이 거의 0이라는 것입니다. 따라서 이제 당신이 어쩌면 일부 데이터를 라벨링하거나 문제를 디버그해야 하는 작업을 배정받으면, 그 작업을 위해 빠르게 새로운 맞춤형 사용자 인터페이스를 조립할 수 있고, 그 후 다시 사용하지 않을 것입니다. 이것은 미친 것입니다. 왜냐하면 이 사용자 인터페이스가 Claude가 20분 동안 작성해야 할 수 있지만, 데이터 라벨링이나 이미지 스크리닝 또는 다른 무엇이든 10배 효율성을 높일 수 있기 때문입니다. 맞죠?

예를 들어, 인간으로서 당신은 시각적 데이터를 처리하는 데 탁월하지만, 반드시 텍스트나 다른 무엇이든 처리하는 데 탁월한 것은 아닙니다. 이제 우리는 이 모든 틈새 응용 프로그램을 구축할 수 있으며, 분기별로 그것을 합리화할 수 있는 것이 없습니다. 흠, 따라서 병목은 시장 진입과 코드 검토로 전환될 것입니다. 왜냐하면 이제 당신은 무엇이든 구축할 수 있으며, 다른 사람도 할 수 있기 때문입니다. 따라서 사람들은 더 경쟁할 것이고, 사람들이 자신의 아이디어를 사용하게 하고, 자신의 아이디어를 보게 하고, 자신의 목소리를 듣게 하기 위해 경쟁할 것입니다. 코드 검토는 이미 논의되었으므로, 저는 지금 자세히 다루지 않을 것입니다. 하지만 기본적으로, 알다시피, 코드 검토는 우리가 생성하는 코드의 양 때문에 단지 다시 고통받을 것입니다. 물론 인공지능도 이 문제를 해결하는 데 도움이 될 수 있습니다. 따라서 저는 현재 가치가 있고 투자할 것이라고 생각하는 것이 통계입니다. 따라서 통계는 Google 같은 대회사에서 항상 매우 가치가 있었습니다.

항상 있었습니다, 알다시피, 어떤 팀, 어떤 사람들이 실험 평가를 위한 통계 도구를 구축했으며, 많은 엔지니어들이 이 도구에 의존할 것입니다. 그들은 단지 선택합니다. 이제 그것은 더 광범위하게 분포된 기술로서 더 유용할 것입니다. 왜냐하면 모두가 많은 다양한 방식으로 다양한 것들을 평가할 수 있기 때문입니다. 여기의 평가는 다양한 것일 수 있습니다. 그것은 성능 분석일 수 있습니다. 그것은 벤치마크, A/B 테스트, 사용자 행동 메트릭스가 될 수 있습니다. 흠, 아이디어와 취향은 또 다른 중요한 것입니다. 따라서 기본적으로 무엇을 구축할지 아이디어, 아이디어를 갖는 것이 더욱 중요해질 것입니다. 그리고 물론 이러한 아이디어를 반복하는 것입니다. 따라서 제 마지막 포인트는 단순히 지식의 구체적 가치이며, 저는 그것이 변할 것이라고 생각합니다.

우리는 깊이 있는 기술 전문 지식에서, 당신이 어떤 것에 대해 정확히 정확한 구문을 자세히 아는 것에서, 무엇이 존재하고, 어떻게 사용하고, 언제 사용할지 아는 것으로 이동할 것입니다. 왜냐하면 이 모델들이 있으면, 만약 당신의 프롬프트가 상당히 일반적이면, 그들은 일반적으로 약간 일반적인 응답을 줄 것입니다. 하지만 당신이 올바른 단어로 그들에게 프롬프트를 하면, 그것은 이 이상한 잠재력을 해제합니다. 예를 들어, 제 마지막 예는 통계입니다. 당신이 「내 변화를 벤치마크해주세요」라고 말하면, 그것은 일반적으로 n이 1과 같은 것을 수행할 것입니다. 한 번 실행하고, 두 번 실행하고, 어느 것이 더 빠른지 확인합니다. 당신이 「통계를 사용하세요」라고 말하면, 갑자기 그것은 p 값과 t 통계량 및 모든 이 다른 것들과 큰 샘플 크기에 대해 말하기 시작합니다. 그것은 미친 것입니다. 네. 따라서 그렇습니다. 네. 따라서 기본적으로 문제는 더 이상 당신이 그것을 구축할 수 있는지 여부입니다. 문제는 무엇이 존재해야 하는가입니다. 감사합니다.

XAI에서 온 Max에게 매우 감사합니다. 다음은 Mark Doyle입니다. 그는 Stripe의 소프트웨어 엔지니어입니다. 흠, 당신이 무대로 가갈 때, Mark는 Minions에 대한 작은 강연을 공유할 것입니다. 흠, 정확히 영화 Minions는 아니지만, Minions이며, 이것은 Stripe의 일회용 엔드투엔드 코딩 에이전트 플랫폼입니다. 흠, 당신은 그들이 어떻게 구축했는지, 왜 구축했는지, 뒤의 이유 및 코딩 에이전트에 대한 몇 가지 생각에 대해 논의할 것입니다. 안녕하세요. 흠, 여러분의 인내심에 감사합니다. 저는 거의 나가려고 합니다. 흠, 희망을 품고 당신이 이것을 유지할 수 있기를 바랍니다. 흠, 정말 흥미롭습니다. 흠, 저는 Stripe의 코딩 에이전트 플랫폼에서 일합니다. 흠, 제 이름은 Mark입니다.

흠, 아마도 흠 에이전트 코드 작성과 흠 전체 소프트웨어 엔지니어링 라이프사이클과 코딩 에이전트와 관련된 무엇이든, 저는 아마도 그것에 관여했습니다. 흠, 단지 우리가 오늘 논의하려고 하는 것에 대해 이야기하기 시작하기 전에, 즉 일회용 코딩 에이전트. 따라서 흠, 프롬프트에서 직접 PR까지, 일회용, 단지 Stripe의 이 장소에 문제 프레임을 제공하기 위해. 흠, 우리는 Stripe에서 세계 GDP의 약 2%를 처리합니다. 따라서 우리가 최전선에 있고 인공지능의 최전선에 있고 이러한 모델을 사용하려고 노력하고 있음에도 불구하고, 흠, 우리는 우리 사용자와 고객 및 전체 글로벌 경제에 대해 정말 큰 의무가 있습니다. 알다시피, 품질 표준과 안전 표준을 유지합니다. 흠, 따라서 이것은 확실히 우리가 이 모든 것들을 구축할 때 염두에 두고 있는 첫 번째 것입니다.

그렇긴 하지만, 우리는 Stripe 엔지니어의 91%가 매일 인공지능으로 코드를 작성합니다. 따라서 100%의 Stripe 직원이 소프트웨어 작성 라이프사이클의 어딘가에서 인공지능을 사용합니다. 흠, 하지만 매일 우리는 91%의 엔지니어가 인공지능과 함께 코드를 병합하고 있습니다. 지난 1년 동안, 우리는 완전히 인공지능으로 생성된 풀 요청 수가 500% 증가한 것을 보았습니다. 흠, 따라서 오늘은 네, 우리는 단지 어떻게 우리가 이를 달성했는지에 대해 논의하려고 할 것입니다. 흠, 일회용 에이전트는 어떻게, 알다시피, 이를 우리에게 가능하게 했는지. 흠, 일회용 코딩 에이전트는 업계의 상당히 잘 알려진 용어이며, 저는 생각합니다. 하지만 우리가 내부적으로 많이 사용하는 것은 흠, 당신이 프롬프트 또는 Slack 스레드에서 모두 풀 요청을 입력할 때 PR을 만드는 것입니다. 흠, 상호 작용 없이.

따라서 우리는 Stripe에서도 Claude Code, Codeex, Cursor와 같은 도구를 가지고 있습니다. 흠, 나는 믿습니다. 흠, 우리도 이것들을 사용합니다. 하지만 우리는 이것들을 일종의 코파일럿 도구로 생각합니다. 이것은 엔지니어가 도구와 함께 앉아 있을 때의 경우입니다. 알다시피, 반복적인 방식으로 협력하여 작업합니다. 일회용 코딩 에이전트는 특별히 우리가 엔지니어가 대략적으로 풀 요청이나 그들이 구현하려고 하는 것이 어떻게 보이는지 알고 있다고 생각하는 시나리오를 위한 것입니다. 우리는 그들이 도구와 함께 오랫동안 앉아 있을 필요가 없습니다.

따라서 우리는 엔지니어가 많은 다양한 작업 세션을 관리하고, 다양한 기계의 다양한 에이전트에 연결할 수 있다고 생각합니다. 아마도 약간 낭비일 수 있습니다. 아마도 그들은 미리 에이전트와 계획 세션을 할 수 있고, 그 다음 이 일회용 경험을 시작할 수 있고, 코드 검토 단계에 들어가기 전에 어떤 참여도 필요하지 않습니다. 흠, 따라서 네, 우리의 목표는 우리의 엔지니어를 위해 시간을 절약하는 것입니다. 알다시피, 우리는 그들이 새로운 개발 환경을 시작하고, 분지를 만들고, 풀 요청을 만드는 데 시간을 들이길 원하지 않으며, 그들이 이미 대략적으로 그들이 무엇을 코딩할 것인지 알고 있을 때입니다. 우리는 모든 이 작업을 에이전트에게 주고 싶으며, 단지 코드의 실제 작성이 아닙니다. 흠, 따라서 저는 우리의 일회용 에이전트 중 하나를 사용하는 예를 제공할 것입니다.

따라서 여기서, 저는 우리의 Stripe MCP 도구 중 하나의 문제를 조사하고 있습니다. 이것은 단지 우리가 어떻게 하는지를 보여주기 위한 매우 간단한 예입니다. 흠, 우리는 Slack에 이 에이전트를 가지고 있으며, 흠, 우리는 「이봐, 이 문제를 봤어. 여기 무엇이 문제일 수 있을까?」라고 말할 수 있습니다. 흠, 에이전트는 바로 돌아올 것입니다. 그것은 우리의 코드를 읽고, 우리의 문서를 읽고, 「오, 봐, 이것이 당신이 찾던 문제인 것 같습니다」라고 말할 것입니다. 이 경우, 그것은 단지 말 그대로 3줄 또는 3글자의 차이였습니다. 이것은 매우 직설적인 변화입니다. 이제, 저는 이 시나리오에서의 개발자 역할이 흠, 이 변화가 매우 간단하다는 것을 알고 있습니다. 예를 들어, 기본적으로 누구든 그것을 구현할 수 있습니다. 당신은 엔지니어일 필요도 없을 수 있습니다. 이 변화를 하기 위해.

따라서 우리는 우리의 엔지니어가 이제 다음 10분을 분지를 만들고, 에이전트를 시작하고, 다시 에이전트에게 문제를 설명하고, 이 컨텍스트를 복사 붙여넣기하는 데 시간을 들이길 원하지 않습니다. 우리는 단지 그들이 말 그대로 「이봐, 이 문제를 고쳐. 일단 당신이 돌아오면 풀 요청이 나오고, 저는 그것을 승인할 수 있고, 흠, 또는 저의 동료가 그것을 승인하고 병합할 수 있습니다.」라고 말할 수 있기를 원합니다. 흠, 이 경우, Devbox는 단지 미니언과 같으며, 이것은 우리가 일회용 에이전트라고 부르는 것입니다. 흠, 그리고 개발자는 그 후 언젠가 이런 응답을 볼 것으로 예상할 수 있습니다. 미니언은 돌아와서 「이봐, 우리의 프로세스가 완료되었습니다. 흠, 내가 작성한 코드를 보러 가세요.」라고 말합니다. 그래서 개발자는 그 중 어떤 부분에도 관여할 필요가 없습니다.

그리고 이것은 우리가 이렇게 하고 싶은 이유의 철학적 측면 같은 것이며, 우리가 엔지니어를 위해 시간을 절약하고 있다고 생각하는 이유입니다. 이제 저는 우리가 실제로 이 결과를 어떻게 달성했는지 설명할 수 있습니다. 따라서 흠, 우리는 이전 메시지에서 에이전트를 인스턴스화할 때 우리가 이 메시지를 본다는 것을 보았습니다. 에이전트가 「이봐, 잠깐, 나는 당신의 작업을 처리하고 있습니다」라고 말하는 메시지. 우리는 당신이 알다시피 그 메시지에서 진행하여 실제로 엔지니어가 검토할 수 있는 풀 요청을 얻는 방법은 무엇입니까? 따라서 우리는 정말 운이 좋은데, 우리는 항상 dev box에 투자해 왔습니다. 이것은 원격 개발자 환경입니다. 따라서 Stripe 엔지니어는 노트북에 코드를 작성하지 않습니다. 그들은 원격 개발자 환경에 코드를 작성합니다. 우리는 아마도 우리가 왜 이것들이 필요한지에 대해 전체 강의를 할 수 있습니다. 스트라이프는 초대형 단일 코드베이스입니다. 세계에서 가장 큰 git 저장소 중 하나입니다.

그것은 약 3억 줄의 코드에 가깝습니다. 따라서 예를 들어, 우리의 저장소를 클론 다운하면, 약 90GB입니다. 흠, 우리의 코드를 생성하는 데 매우 긴 시간이 걸립니다. 따라서 우리는 이런 원격 개발자 환경을 가질 필요가 있습니다. 따라서 당신이 새 분지나 무언가를 원할 때마다, 당신은 바로 얻을 수 있습니다. 우리는 수영장을 가지고 있습니다. 그들은 이미 준비되어 있습니다. 그리고 우리는 정말 운이 좋습니다. 우리는 이들에게 이미 좋은 많은 해 투자했습니다. 왜냐하면 사실 지금 그들은, 알다시피, 정말로 에이전트들을 위해 좋습니다. 에이전트들은 그곳에서 편안하게 할 수 있습니다. 그들은 모든 도구를 가지고 있습니다. 흠, 이것들은 우리가 오늘 업계에서 보는 경량 샌드박스가 아닙니다.

이것들은 상당히 큰 것들입니다. 예를 들어 개발자 기계는 많은 코어를 가지고 있으며, 64에서 128GB의 메모리, 상당히 큰 기계, 상당히 유능한 기계입니다. 흠, 규모 엔지니어링 작업처럼. 흠, 각 미니언은 자신의 dev box를 가지고 있으므로, 그들은 거기서 자신의 집을 가지고 있으며, 흠, 그들은, 알다시피, 보안 관점에서는 안전하게 격리되어 있습니다. 흠, 샌드박스 등입니다. 둘째, 이것은 단지 좋은 코드 쓰기 환경입니다.

따라서 일단 우리가 미니언에 몇 가지 계산 자원, dev box, 예를 들어 실행할 컴퓨터를 주면, 그것은 파일 시스템 같은 것을 필요로 합니다. 그것은 쉘이 필요합니다. 우리는 dev box로 그것을 주었습니다. 우리가 먼저 해야 할 일은 이 거대한 코드베이스에서 실행하도록 도움을 주는 것입니다. 우리는 프롬프트 또는 Slack 스레드를 전달하며, 우리가 수집할 수 있는 모든 컨텍스트입니다. 따라서 예를 들어, 흠, 제가 보여준 예에서, 그것은 Slack 스레드였으며, 다른 에이전트가, 알다시피, 흠, 코드베이스를 검색했고, 일부 컨텍스트를 주었으며, 아마도 또한 언급된 티켓이 있을 수 있으며, 언급된 풀 요청도 있을 수 있으며, 동료의 일부 다른 컨텍스트도 있을 수 있습니다. 우리는 모든 그러한 정보를 수집하며, 우리는 이 분석기 에이전트에게 전달합니다. 당신이 여기서 보는 그 분석기 에이전트, 알다시피, 모든 그 컨텍스트를 수집하고, 좋습니다라고 말하고, 이것은 우리가 에이전트에게 지시해야 할 곳이라고 생각하며, 코드베이스의 올바른 부분이며, 그 다음 우리는 시작합니다. 흠, 실제 구현 단계. 따라서 일단 우리가 우리가 코드를 어디에 쓸 것인지 알아낸 후, 또는, 흠, 대략 어떤 종류의 작업인지, 단지 전체를 요약합니다. 흠, Slack 스레드의 전체 내용 또는 우리가 미니언을 시작하는 곳의 내용 무엇이든, 무엇이 되든 프롬프트가 되며, 흠, 우리는 이 미니언 루프를 시작할 수 있습니다. 따라서 미니언 루프는 우리가 항상 풀 요청을 생성하고 에이전트가 중간에 멈추지 않도록 보장하는 프로세스입니다.

이것이 minion 루프가 어떻게 보이는지입니다. 우리는 맨 위의 이 흰 화살표에서 시작하여 제가 방금 설명한 그 컨텍스트를 가져옵니다. 알다시피, Slack 스레드의 모든 내용을, 이 코딩 에이전트에 전달하는 것입니다. 흰 상자에서 보시는 것이죠. 이것은 단지 일반적인 코딩 에이전트입니다. 알다시피, Claude Code나 Codeex를 매우 익숙하게 사용하시는 것처럼, 프롬프트와 대화 컨텍스트를 가져오고, 알다시피, 목표를 향해 나아가려고 시도합니다. 그것은 한 번의 회전을 하고, 목표를 향해 나아가려고 시도합니다.

알다시피, 그것이 목표를 향해 나아간 후에, 우리는 lint를 실행하게 합니다. 우리는 테스트와 타입 체크를 실행하게 합니다. 그 다음 우리는 멈추고, 인간에게 돌아가지 않습니다. 이것이 단일 턴 에이전트와 알다시피, co-pilot 에이전트 사이의 어떤 차이점입니다. 여기서 우리는 결과를 LLM 판단자에게 전달합니다. 화면 아래 보이는 이 주황색 상자죠. LLM 판단자는 말 그대로 원래 저자가 minion에게 준 프롬프트와 현재의 git 차이분 또는 이미 생성된 출력을 가져옵니다. 우리는 단순히 묻습니다. 이 작업이 완료되었습니까? 그래서 그것은 그것의 컨텍스트가 모두 이 정보 대화로 오염되지 않습니다. 코딩 에이전트가 제시할 수도 있는 모든 그런 것들, 알다시피, 변명들, 왜 그것이 작동을 멈췄는지 또는 왜 이 작업이 불가능한지 따위 말입니다.

알다시피, 실제로 그것은 단지 알다시피, 편견 없는 판단자입니다. 이 작업이 완료되었는지 아니면, 알다시피, 실패했는지를 말합니다. 알다시피, 작업이 완료되었다면, 좋습니다. 우리는, 알다시피, pull request를 만들 수 있고, 그다음 엔지니어에게 돌아가서 말할 수 있습니다. 알다시피, 그것이 당신의 검토를 위해 준비되었습니다. 알다시피, 저는 여기서 완료했습니다. 만약 그것이 완료되지 않았다면, 알다시피, 우리에게는 진단 에이전트가 있습니다. 그것이, 알다시피, LLM 판단자의 출력을 봅니다. 코딩 에이전트 세션에서 일어난 일들을 봅니다. 그리고 원래 프롬프트를 봅니다. 그리고 말합니다: 「오, 알다시피, 이것이 완료되지 않았습니다. 특정 테스트가 실패했거나 이것이 완료되지 않았기 때문입니다. 아직 완료되지 않았습니다. 실제로 당신이 잘못된 것을 구현했기 때문입니다. 알다시피, 당신이, 알다시피, API 엔드포인트를 만들었지만 프론트엔드를 연결하지 않았습니다. 이것들은 코딩 에이전트가 명백히 놓칠 수 있는 것들입니다.」 알다시피, 그다음 우리는 진단 에이전트로부터 그 컨텍스트를 가져와 루프에 다시 집어넣습니다.

그래서 우리는 필요에 따라 이 루프를 여러 번 실행합니다. 우리는 진단 에이전트로부터의 입력을 짧게 유지하려고 노력합니다. 알다시피, 그래서 그것이 컨텍스트 윈도우를 날려버리지 않습니다. 하지만 우리는 진단 에이전트, LLM 판단자, 그리고 코딩 에이전트를 포함하는 이 루프를 계속 실행합니다. pull request 같은 것을 얻을 때까지 계속 실행됩니다. pull request가 반드시 항상 정확한 것은 아닙니다. 하지만 이제 Stripe에서, 우리는 약 65%의 minion pull request를 한 번에 성공적으로 병합합니다. 그래서 65%의 시간, Stripe 엔지니어가 그 중 하나를 시작할 때, 그것이 병합되고, 어떤 인간의 개입도 없습니다. 그래서 그것이 상당히 좋아집니다. 모델이 더 나아지면서, 알다시피, 우리는 이것이 점점 더 효과적인 것을 봅니다. 알다시피, 보통 엔지니어는, 만약, 알다시피, 한 번에 성공하지 못한다면, 엔지니어는 뛰어들고 싶어 할 것입니다. 알다시피, 그리고 약간의 변경을 할 것입니다.

그래서 그것에 기초하여, 우리에게는 웹 인터페이스가 있습니다. 알다시피, 당신은 대화를 계속 지시할 수 있습니다. 당신은 또한, 알다시피, 화면의 맨 위에서 여기, 예를 들어, minion이 생성한 상자를 열 수 있습니다. VS code나 터미널에서요. 이것은 엔지니어가 minion에서, 예를 들어, 한 번에 실패하는 경우를 인수인계할 수 있게 합니다. 그래서 그것이 좀 우리가 이 작은 코딩 에이전트를 어떻게 처리하는지, 그것에 머물 곳을 주고, 그다음 이 한 번에 통과하는 pull request를 생성합니다. 알다시피, 우리는 Stripe에서 매주 이것들을 사용하여 약 3,000개의 pull request를 병합합니다.

알다시피, 그것은 정말로, 같은, 맞습니다. 알다시피, 우리 엔지니어들이 정말 작은 문제를 해결하는 시간을 절약하는 것은 매우 가치 있습니다. 더 크고, 더 큰 작업도 마찬가지인데, 이것들은 엔지니어가 이미 에이전트가 한 번에 통과할 수 있다고 믿는 작업들입니다. 또는 알다시피, 에이전트가, 엔지니어가 미리 많은 컨텍스트를 제공할 수 있어서 한 번에 통과하는 PR이 가능해지는 작업들입니다. 알다시피, 그래서 만약 당신이 이러한 종류의 시스템을 구축하고 있다면, 아마 우리가 당신에게 가져갈 수 있는 몇 가지 교훈이 있을 것입니다. 알다시피, 우리는 프롬프트가 정말 좋다는 것을 배웠습니다. 그래서 우리의 모든 에이전트에서, 예를 들어, LLM 판단자, 알다시피, 실제 코딩 에이전트 자체 등등, 우리에게는 매우 상세한 프롬프트들이 있습니다. 당신이 상상할 수 있는 것처럼요. 우리는 우리의 전체 코드베이스에 수천 개의 Claude와 agents.md 파일을 가지고 있습니다. 그들은 매우 가치 있습니다.

하지만, 만약 당신이, 알다시피, 이러한 종류의 루프를 쓰고 있다면, 예를 들어 minion 루프처럼, 그리고 당신이 계속해서 이렇게 보이는 프롬프트를 만들고 있다면: 제발 제발 당신이 커밋하기 전에 테스트를 실행하십시오. push하지 말고 실행하십시오. 예를 들어 비싼 CI 실행처럼, 알다시피, 당신이 스스로 테스트를 실행하기 전에, 또는 알다시피 제발 어떤 방식으로든 당신의, 알다시피, 커밋 메시지를 포맷하십시오. 당신, 알다시피, 모두 대문자로 소리치는 대문자로 쓰십시오. 당신은 정말로 코딩 에이전트를 뭔가 하도록 설득하려고 하고 있습니다. 그 경우에, 우리, 알다시피, 정말로 결정론적 지침이 이에 훨씬 더 낫다고 생각합니다. 그래서, 당신이 결정론적으로 만들 수 있는 것은 무엇이든 하십시오. 알다시피, 그것이 정말로 정말로 에이전트를 성공하도록 도와줍니다. 알다시피, 에이전트와 뭔가에 대해 논쟁하려고 하는 것은 보통 그리 좋지 않습니다. 그것은 좀 코드 냄새 같습니다. 알다시피, 특히 그것이 안전에 관한 것이라면.

알다시피, 네, 이 종류의 루프에 대해 결정론적 지침을 작성하는 것은 절대적으로 중요하며, 그것이 전체 프로세스를 더욱 신뢰할 수 있게 만듭니다. 만약 당신이 자신의 워크플로우를 구축하고 있다면, 이러한 모두 대문자로 된 컨텍스트 파일들에 의존하는 것이 괜찮을 수도 있지만, 대규모로 실행할 때, 수천 명의 개발자가 수천 개의 minion 인스턴스를 실행할 때, 이것이 우리에게 정말로 유용했습니다. 우리의 두 번째 요점은 개발자 도구가 항상 매우 중요하다는 것입니다. Stripe에서, 우리는 항상 우리 규모의 회사를 위해 개발자 도구에 많은 자원을 투입할 수 있는 운이 좋았습니다. 예를 들어, Stripe는 Sorbet을 오픈 소스화했습니다. 이것은 Ruby용 정적 분석 타입 체커입니다. 그것은 JavaScript의 TypeScript와 유사합니다.

Stripe는 수년에 걸쳐 우리의 개발 속도를 높이기 위해 많은 이러한 종류의 도구들을 구축했습니다. 하지만 지금은 이전보다 훨씬 더 큰 영향력을 미칩니다. 그래서 이제 우리는 이 도구들이 필수가 되었다고 봅니다. 만약 당신이 에이전트를 실행하기 위한 좋은 계산 기초가 없다면, 예를 들어 우리에게는 개발 상자 같은 것이 있고, 당신이 정적 타입 체크, linting을 하지 않는다면, 이러한 모든 것들이 전문 개발자로서 우리가 소유하기를 기대하는 것들이라면, 당신의 도구가 더 좋을수록, 당신이 할 수 있는 에이전트 개발이 더 많아집니다. 그래서 만약 당신이 이것들을 하지 않는다면, 이미 단순히 「오, 제 엔지니어가 매주 1시간을 낭비합니다」라는 뜻이 아닙니다. 당신은 수천 개의 에이전트 사이클의 실패를 잃고 있습니다. 또는 말하자면, 이전보다 훨씬 더 오래 걸리는 시간을 낭비하고 있습니다.

그래서 이제 우리는 더 나은 linters, formatters, 분석 도구들, 이러한 모든 비-LLM 관련 것들, 주로 정적 분석을 구축하는 데 더 집중하고 있습니다. 그것이 우리에게 정말로 가치 있습니다. 마지막 요점은, Slack에 구축하는 것이 우리에게 정말로 가치 있었습니다. 당신이 이전에 내 강연에서 본 것처럼, 우리는 이 devbox 또는 minion Slack 메시지를 가지고 있습니다. 우리는 거기서 minion을 시작할 수 있습니다. 이것이 우리의 모든 엔지니어들이 AI를 사용하는 법을 배우도록 하는 데 정말로 가치 있었습니다. 비엔지니어도 그것들을 시작할 수 있습니다.

그래서 이 공개적으로 구축하고 우리 엔지니어들과 공유하는 과정이, 알다시피, 아마도 당신이 Twitter에서 AI의 최신 소식을 따라잡지 못했다면, 당신은 아마도 편집기를 열고 수동으로 변경하거나 탭 자동 완성 같은 것을 사용할 수도 있을 것입니다. 하지만 이제 우리의 모든 엔지니어가 다른 엔지니어들이 공개적으로 일하는 것을 보고 있고, 이 minion들을 단순히 태그하고 있습니다. 「이봐, 이것을 해봐.」 이것이 우리의 큰 조직이 AI를 사용하여 많은 작업을 완료하도록 수용하는 데 도움이 되는 데 정말로 도움이 되었습니다. 알다시피, 네, 회사 내에서 공개적으로 일하는 것도 정말로 유용합니다. 마지막으로, 우리는 회의의 다른 곳에 부스가 있습니다.

그래서 당신이 오셔서 minion들에 대해 저와 대화하고 싶으시거나 질문을 하고 싶으시다면, 그렇게 하십시오. 또한, 만약 당신이 minion들과 함께 일하거나 이 플랫폼에서 일하는 것이 재미있다고 생각한다면, Stripe가 채용 중입니다. 우리는 실제로 내 팀을 위해 특별히 EM 또는 엔지니어링 매니저를 채용 중입니다. 그래서, 만약 이것이 정말로 흥미로우신 것 같다면, 당신은 우리와 함께 일하러 와야 합니다. 저는 정말로 당신과 함께 일하고 싶습니다. 우리는 여기에 일종의 상품도 가지고 있습니다. 만약 누군가 관심이 있으시다면 말입니다. 당신은 나중에 우리 부스에 와서 확인할 수 있습니다. 하지만, 매우 감사합니다. 정말 감사합니다, Mark. 알다시피, 점심 시간 전의 마지막 강연입니다. 나는 대부분의 사람들이 배고팠다는 것을 알고 있지만, 강연이 끝날 때까지 점심 시간을 기다려야 합니다. 그래서 저는 당신이 Liha에게 강연할 시간을 주시기를 바랍니다.

Liho 당신이 말씀하신 것처럼, 알다시피, Lihao는 similar이라는 회사에서 일하는 소프트웨어 엔지니어이며, 카드 게임을 하는 것에서 ERP 소프트웨어를 운영하는 것까지 논의할 것입니다. 당신의 컴퓨터가 클릭하고 입력하는 방법을 배워야 하는 이유는 무엇입니까? similar는 컴퓨터 사용을 정말로 잘하는 도구를 개발하고 있습니다. Leha가 그것이 어떻게 작동하는지를 당신에게 보여줄 것입니다. Leha, 계속 진행해 주세요. >> 감사합니다. 정말 감사합니다. 그래서, 당신은 하루 중 화면에서 커서를 이동하는 데 몇 시간을 생각하십니까? 누군가 아십니까? 5시간. 그래서, 알다시피, 몇 개월 전에, 우리는 일단의 친구들과 함께 실험을 했습니다. 그들 중 일부는 당신들처럼, 맞죠? AI 엔지니어, 빌더들, 우리는 또한 의사, 관리자, 회계사도 가지고 있습니다. 우리는 그들을 추적했고, 그들이 커서를 이동하는 데 얼마나 많은 시간을 소비했는지 봤습니다. 맞죠? 이것이 우리가 발견한 것입니다. 하루 5시간.

우리는 사람들이 터치패드에서 손가락을 5시간 이상 하루에 이동하고 있습니다. 이것은 당신의 깨어 있는 시간의 3분의 1 이상입니다. 맞죠? 생성하는 것이 아니라, 생각하는 것이 아니라, 이동하고, 클릭하고 있습니다. 죄송합니다. 클릭, 네비게이션, 맞죠? 탭에서 스크롤하고, 알다시피, 메뉴에서. 그래서 우리는 이 디지털 공간에 많은 작업을 투입했지만, 우리가 그것과 상호 작용하는 방식은 여전히 매우 수동입니다. 개인용 컴퓨터. 우리는 1981년에 개인용 컴퓨터를 가졌습니다. 맞죠? 갑자기 우리는 이전에 수 시간이 걸렸을 것을 몇 분 안에 완료할 수 있었습니다. 맞죠? 이것은 거대한 비약이었고, 우리는 파일 캐비닛과 파일에서 스스로를 해방했습니다. 하지만 지금 우리를 봅시다. 40년 후. 우리는 여전히 클릭하고, 스크롤하고, 네비게이션하고 있습니다. 맞죠? 하루 5시간. 우리는 단지 한 종류의 육체 노동을 다른 종류로 바꿨을 뿐입니다. 그래서 우리는 다음 도약이 필요합니다.

그래서, 컴퓨터와 상호 작용하는 진정으로 효율적인 방법은 무엇입니까? 당신이 컴퓨터와 상호 작용할 필요가 없다면 어떻게 될까요? 컴퓨터가 스스로 실행할 수 있다면 어떻게 될까요? 그것은 화면을 볼 수 있고, 작업을 이해하고, 그다음 직접 할 수 있습니다. 이것이 우리가 similar에서 구축하고 있는 것입니다. 우리는 그것을 자율 컴퓨터라고 부릅니다. 맞죠? 이것이 나를 흥분시키는 것이고, 이것이 우리가 구축하고 있는 것입니다. 그래서 제 이름은 Liha입니다. 저는 similar의 기술 부분입니다. 알다시피, 우리는 자율 컴퓨터를 위한 기반 시설을 구축하고 있습니다. 네. 지난 12월에, 우리의 연구 에이전트 agent S3는 OS world에서 인간을 초월하는 성능을 달성했습니다. 이것은 컴퓨터 사용의 표준 테스트입니다. 그래서, 자율 컴퓨터가 어떻게 보이는지는? 당신에게 보여드리겠습니다. 이것이, 이것이 우리의, 알다시피, 제품입니다.

그래서 왼쪽에 당신은 화면을 볼 수 있습니다. 우리는 이 채팅 인터페이스를 가지고 있고, LLM은 작업을 이해하려고 합니다. 그것은 카드 게임을 하려고 합니다. 그래서 그것은 화면을 보려고 하고, 무엇이 일어나고 있는지 이해하려고 하고, 다음 최선의 움직임을 보려고 하고, 마우스를 이동하고 카드를 드래그하는 방법을 알아내려고 합니다. 네. 오른쪽은 실행 중인 기계입니다. 그래서 바라건대, 약 1분 정도 안에, 만약 그들이 격려를 한다면, 바라건대 Sai가 첫 번째 움직임을 할 것입니다. 네. 그래서 당신은 그것이 실제로 마우스 커서를 제어할 수 있고 카드를 왼쪽에서 오른쪽으로 드래그할 수 있다는 것을 볼 수 있습니다. 하지만 이것은 단지 하나의 애플리케이션, 하나의 작업, 규칙이 매우 명확합니다. 맞죠? 하지만 당신의 실제 업무 일을 상상해 보세요. 업무에서, 당신은 무엇을 합니까? 맞죠? 당신은 이메일, Slack을 가지고 있습니다. 알다시피, 당신은, 죄송합니다, 등등.

그래서, 업무에서, 당신은 이메일, Slack을 가지고 있습니다. 당신은 스프레드시트, PowerPoint, QuickBooks, SAPs를 가지고 있고, 당신의 회사가 퇴역을 거부한 일부 레거시 시스템을 가지고 있습니다. 맞죠? 그래서 이러한 도구들 중 일부에는 API가 있습니다. 맞죠? 그래서 이것이 우리가 지난해 많은 활동이 있었던 곳입니다. 우리는 API 또는 CLI 에이전트를 가지고 있습니다. 우리는 알다시피, 도구 호출, 함수 호출을 가지고 있습니다. 좋습니다. 이 부분은 이미 해결되었습니다. 이러한 애플리케이션 중 일부는 브라우저에 있습니다. 맞죠? 그래서 당신은 브라우저 사용 에이전트에 대한 강연을 들었습니다. 그들은 알다시피, 당신을 위해 네비게이션하고 당신의 브라우저를 보는 것을 처리할 수 있습니다. 좋습니다.

하지만 다시 한 번, 다른 모든 것들이 있습니다. 당신의 데스크톱 애플리케이션, 당신의 레거시 시스템, 당신의 전용 도구 -- API가 없고, 브라우저도 없고, 그래서 없습니다. 유일한 방법은 실제로 화면을 통해서입니다. 맞죠? 그래서 그것이 컴퓨터 사용입니다. 그래서 API에게 화면을 보는 방법을 가르칩니다. 그것 위에 무엇이 있는지 이해합니다. 그리고 당신처럼 그것을 운영합니다. 자율 컴퓨터가 완전합니다. 우리는 API와 CLI 에이전트, 우리는 브라우저 에이전트와 컴퓨터 사용 에이전트를 가지고 있습니다. 이것들이 사용자를 위해 원활하게 함께 작동하고 브라우저에서 모든 작업을 처리합니다. 그래서 이것이 우리가 similar에서 구축하고 있는 것입니다. 그것을 구축할 때, 저는 우리가 직면한 세 가지 주요 과제를 공유하고 싶습니다. 신뢰성, 신뢰, 그리고 확장성. 그래서 신뢰성부터 시작해 봅시다. 사용자에게. 신뢰성은 한 가지를 의미합니다. 맞죠? 그것이 매번 작동합니다. 두 가지가 참이어야 합니다.

에이전트는 화면을 보고 정확하게 그것을 운영해야 합니다. 그것이 기초입니다. 그리고 그것은 여러 번의 회전 중에 그렇게 할 수 있어야 합니다. 그래서 100번 반복에서, 그것이 일관성입니다. 그래서 당신은 기초와 일관성을 가지고 있습니다. 기초부터 시작해 봅시다. 맞죠? 맹인이 화면을 보는 방법은? 당신은 스크린 리더를 사용합니다. 맞죠? 그래서, 그것은 접근성 트리를 읽습니다. 이것은 각 요소의 구조화된 지도, 이름, 종류, 상태입니다. 이것이 우리의 출발점이지만, 충분하지는 않습니다. 많은 경우 일부 애플리케이션에는 완전한 트리가 없습니다. 때때로 버튼이 메뉴에 숨겨져 있습니다. 알다시피, 드롭다운 목록 안에, 당신은 동적으로 표시되는 요소를 가지고 있고, 일부 애플리케이션에는 거의 전혀 트리가 없습니다. 그래서 우리는 시각적 접지로 그것을 지원해야 합니다. 그래서 우리는 전문적인 모델을 가지고 있습니다. 이것이 실제로 시각적으로 화면을 보고 요소가 어디에 있는지 알아낼 수 있습니다. 맞죠?

하나는 텍스트를 읽을 수 있고, 하나는 버튼과 요소를 찾을 수 있습니다. 트리에 간격이 있을 때, 시각적 것이 그것을 채우려고 합니다. 그래서 우리는 접근성 트리와 시각적 접지를 결합했습니다. 이제 접지가 당신에게 개별 행동의 정밀성을 줍니다. 하지만 연속적으로 천 번은 어떻습니까? 연구에서, pass at K라는 행렬이 있습니다. 이것은 에이전트가 K번 시도할 수 있다면, 당신이 얼마나 많이, 알다시피, 몇 번 그것이 맞는지 얻을 수 있다는 뜻입니다. 맞죠? 당신이 최소한 한 번 맞게 얻는 한. 그래서, K가 5라면, 세 번째 시도에서 성공했다면, 그것이 하나의 pass입니다. 하지만 이것이 사용자가 원하는 것이 아닙니다. 사용자가 원하는 것은 제가 K의 pass라고 부르는 것입니다. 맞죠? 당신은 매번 맞아야 합니다. K번 연속. 오류 없음. 사용자가 백 개의, 알다시피, 리드를 가지고 있고 각각에 개인화된 LinkedIn 메시지를 보내고 싶다고 가정하세요.

만약 LLM이 모든 단계의 모든 작업을 운영한다면, 같은 작업에서 100번 시도할 때마다 약간 다를 수 있습니다. 100가지 다른 행동. 그래서 우리는 다른 패러다임이 필요합니다. 그래서 우리가 사용하는 것은 신경 기호적 접근입니다. 그래서 신경적으로, LLM은 화면을 관찰하고, 무엇을 할지 추론합니다. 그다음, 그래서 이것이 생각입니다. 기호적으로 단지 클릭하지 않고, 그것이 프로그램 코드를 씁니다. 그것이 실행입니다. 맞죠? 마치 뇌가 요리법을 쓰고 기계가 그것을 따르는 것처럼. 그래서 이것이 그것이 강력해지는 곳입니다. 처음에는 그것이 LLM 추론을 호출합니다. 하지만 두 번째 시간을 할 때, 100번, 그것은 단지 코드를 재생합니다. 당신은 LLM 추론이 필요하지 않습니다. 비용이 없습니다. 본질적으로 무료입니다. 그래서 이 모든 것 뒤의 언어는 Simulang입니다. 우리의 컴퓨터 사용 도메인 특정 언어. 읽을 수 있고, 수정할 수 있습니다. 이번 주 개발자들에게 출시되었습니다.

그것이 신뢰성입니다. 이제 신뢰에 대해 말해 봅시다. 당신의 컴퓨터에서 무엇이든 할 수 있는 AI 에이전트. 맞죠? 당신은, 알다시피, 이메일을 보낼 수 있고, 파일을 삭제하고, 구매를 할 수 있습니다. 이것은 정말로 강력하지만, 또한 매우 위험합니다. 만약 그것이 지시를 잘못 이해하거나 그것이 환각을 생산한다면, 그것은 재앙이 될 수 있습니다. 그래서 이것은 더 이상 무작위 사용자에게 일어나는 것이 아닙니다. 그것은 Meta의 AI 정렬 이사에게 일어났습니다. similar에서, 신뢰는 우리의 아키텍처에 구축되어 있습니다. 가드레일은 계획 에이전트로부터 분리된 시스템입니다. 무엇을 할지에 대한 결정을 내리는 그것은 안전한지에 대한 결정을 내리는 것과 같은 것이 아닙니다. 그래서 당신은 같을 수 없습니다. 당신은 모델이 판사이자 참여자가 되도록 할 수 없습니다. 그래서 계획 모델이 혼란스러워지거나 환각을 생산해도, 가드레일 시스템이 위험이 발생하기 전에 그것을 포착합니다. 세 번째 과제는 확장성입니다.

우리는 Similar에서의 임무는 사용자 생산성을 100배 증가시키는 것입니다. 당신은 어떻게 100배를 달성합니까? 100개의 손가락을 가지고, 100배의 속도로 입력함으로써, 당신은 100개의 자율 컴퓨터가 필요합니다. 하지만 모든 사람이 100개의 Mac mini를 설정하고, 그들을 사고, 설정하고 싶어 합니다. 맞죠? 하지만 모든 사람은 여러 자율 컴퓨터를 가지고 있음으로써 얻는 생산성 이득을 원합니다. 따라서 Similar에서, 우리는 이 문제를 해결하기 위한 기반 시설을 구축하고 있습니다. 당신이 웹사이트에 등록할 때, 이것이 우리의 제품입니다.

알다시피, 당신은 100개를, 어, 우리는 당신을 위해 기계를 만듭니다. 맞죠? 이것이 당신의 기계이고, 당신은 무엇이든 하고 싶은 것을 할 수 있습니다. 당신은 당신의 애플리케이션을 설치할 수 있습니다. 당신은 당신이 원하는 대로 설정할 수 있습니다. 그다음 당신은 Similar에 제어권을 맡깁니다. 그래서, 알다시피, 당신이 하나를 만들 수 있다면, 당신은 다섯 개를 만들 수 있습니다. 당신은 심지어 100개를 만들 수 있습니다. 맞죠? 당신은 하나가 회귀 테스트를 하게 할 수 있습니다. 당신은 다른 하나가 다른 것을 하게 할 수 있습니다. 세 번째는 통화 후 CRM 업데이트를 할 수 있습니다. 당신은 마지막 하나가 보고서를 실행하게 할 수 있습니다. 당신은 이 모든 것들이 병렬로 실행되게 할 수 있습니다. 그래서 내가 왜 루프에 있습니까? 네. 그래서 100배 생산성은 더 열심히 일함으로써가 아니라 100대의 컴퓨터가 당신을 위해 일하게 함으로써입니다. 신뢰성, 신뢰, 그리고 확장성.

이 세 가지 과제들, 이것이 우리가 하고 있는 것입니다. 맞죠? 이 모든 것 뒤에는 놀라운 엔지니어링이 있습니다. 알다시피, 분산 시스템 에이전트, 대규모 신뢰성이 있으므로, 우리는 채용 중입니다. 관심이 있으시다면, 우리와 함께 가입하세요. 그래서 제발, 개인용 컴퓨터는 우리를 종이에서 해방시켰습니다. 자율 컴퓨터는 우리를 인간의 노동에서 해방시킵니다. 이것이, 우리는 Similar이고, 저는 거리 건너편 4층의 부스 주변에 있을 것입니다. 우리 곧 만나요. 감사합니다. >> 감사합니다, Lihao. 이것으로, 우리는 당신이 항상 기대해 온 것에 도달합니다. 그것은 점심 휴게시간입니다. 어, Hopscotch, Cayenne, 그리고 Beastro에 뷔페 점심이 있습니다. 그래서, 당신은 음식을 얻기 위해 여러 장소가 있습니다. 어, 우리는 시간보다 앞서 있습니다. 그래서 우리는 1:30에 다음 강연을 정확히 시작할 것입니다. 어, 첫 번째는 Cursor의 Rio Louu입니다. 어, 그는 디자인 책임자입니다.

그래서 당신은, 어, 그 강연을 놓치고 싶지 않습니다. 어, 그리고 정시에 돌아오십시오. 어, 어. 어, 모두 하루 종일 머물러 주셔서 정말 감사합니다. 곧 만나요. 안녕 모두. 아니, 제가 공지하겠습니다. 좋습니다. 안녕 모두. 점심 휴게시간 후 돌아오신 것을 환영합니다. 어, 모두 음식을 먹으셨기를 바랍니다. 어, 사람들과 대화할 수 있었고, 어, 그리고 어, 우리가 곧 해야 할 다음 어, 일련의 강연들을 위해 에너지로 돌아오셨으면 합니다. 우리는 Capitol Theatre에서 합니다. 지금, 저는 매우 매우 다음 연사를 환영하게 되어 흥분합니다. 어, 이것이 Rio입니다. 그는 Cursor의 설계 책임자입니다. 하지만 저는 작은 이야기를 공유하고 싶습니다. 제 경우에는, 이 모든 것이 2년 전, 2024년 중반에 시작되었습니다. 저는 완전한 비엔지니어로서 cursor를 사용하여 코딩하는 방법을 배웠기 때문입니다. 당신들 어, 그 도구를 사용해 본 적이 있는지 모르겠습니다. 당시에는 단지 탭과 인라인만 있었습니다. Composer 모델 다중 파일 오케스트레이션이 나오기 전에.

어, 그것이 저가 배운 것입니다. 하지만 어, Cursor 팀은 경험을 설계하는 데 많은 생각을 투입했습니다. 어, 저 같은 자문가 사용자와 신입 사용자 모두에게 말입니다. 그리고 많은 설계 패턴은 이제 어, 모든 다양한 종류의 코딩 에이전트 사용에 걸쳐 표준화된 설계 패턴이 되었습니다. 그래서 저는 Rio를 환영하게 되어 정말로 흥분합니다. 어, 무대로. 어, 그는 다음 Cursor 설계에 관한 강연을 할 것입니다. >> 요요 >> 요. 안녕. 안녕 모두. 제 이름은 Rio입니다. 어, 먼저 제 컴퓨터를 깨워보겠습니다. 좋아. 좋아. 좋아. 모두 오후입니다. 저는 Rio입니다. 저는 Cursor에서 설계를 이끌고 있습니다. 어, 오늘 저는 우리가 Cursor를 어떻게 설계했는지를 공유할 것입니다. 설계자와 엔지니어를 우리의 근원으로 되돌리기 위해. 소프트웨어를 만드는 것이 경직된 역할, 도구, 또는 프로세스에 갇혀 있는 것보다 더 놀이처럼 느껴질 때.

또한 우리의 설계 프로세스가 어떻게 더 매끄러워졌는지를 공유할 것입니다. 우리가 Cursor를 사용하여 Cursor를 설계하기 때문입니다. 나는 소프트웨어 제작의 미래에 대한 우리의 비전으로 끝날 것입니다. 처음에, 소프트웨어 설계와 엔지니어링은 같은 것이었습니다. 분할이 없었습니다. 소프트웨어를 상상한 사람이 그것을 만들었습니다. 설계와 코드는 같은 공예였습니다. 재료는 코드 자체였습니다. 생각과 제작은 같은 루프에서 일어났습니다. 이것이 Bill Atkinson입니다. 그는 초기 Macintosh 팀에 있었습니다. 그는 QuickDraw를 만들었습니다. 2D 그래픽 엔진입니다. 그는 또한 Mac Paint와 Hypercard를 설계하고 코딩했습니다. 그는 행 선택 이동 모드를 발명했고 우리가 여전히 대부분의 그래픽 설계 애플리케이션에서 볼 수 있는 많은 것들을 발명했습니다. 그는 68K 어셈블리 언어로 픽셀 완벽한 UI를 만들었습니다. 개념에서 설계, 구현에 이르는 모든 세부 사항이 그의 것이었습니다. 그는 설계자였습니까 아니면 개발자였습니까?

이것이 Alan K.입니다. 그는 Xerox Park에서 Smalltalk와 Dynabook을 발명했습니다. 기본적으로 전체 개인 컴퓨팅의 미래를 설계했습니다. 그는 그것을 구현하는 코드를 썼습니다. 그는 유명한 말씀이 있습니다. 미래를 예측하는 가장 좋은 방법은 그것을 발명하는 것입니다. 그는 그의 아이디어를 증명하기 위해 작동하는 시스템을 만들었습니다. UI에서 상호 작용 모델에서 런타임으로, 모두 공예였습니다. 그들은 설계자였습니까, 개발자였습니까? 그들은 모두 빌더였습니다. 그 당시 질문은 의미가 없었습니다. 설계는 코드였고, 코드는 설계였으며, 공예는 전체였습니다. 그다음 정말로 이상한 일이 일어났습니다. 특히 지난 10년 동안. 우리는 우리 자신을 나누었습니다. 우리는 전문 역할로 분열했습니다. 설계자는 비전을 가지고 있습니다. 제작 모델. 엔지니어는 모델을 구현합니다. PM은 규격을 작성하고, 회의를 하고, 모든 것을 실행합니다. 약속은 전문화가 우리를 더 빠르게 할 것이라는 것입니다.

하지만 현실은 우리가 느려졌다는 것입니다. 코드에서 더 멀어졌습니다. 우리의 도구들도 마찬가지입니다. 엔지니어들은 대부분 여전히 터미널과 IDE에 머물러 있습니다. 어, Vim, VS Code, Sublime이지만, 어, 코드는 여전히 사실의 소스입니다. 설계자들은 어떻게든 클라우드로 이주했습니다. 우리는 Photoshop으로 비트맵을 만들기 시작했습니다. 그다음 우리는 Sketch로 이동했습니다. 이것은 Mac 전용 애플리케이션으로, UI를 위한 벡터 제도입니다. 그다음 우리는 그것을 브라우저로 이동했습니다. 그리고 Figma에서 협력하게 했습니다. 설계자들은 아름다운 모형들을 만들었지만, 그들은 실제 것이 아닙니다. 그다음 PM과 협력도 조금 분산되었습니다. 아무도 업데이트하고 싶지 않은 Jira 티켓들이 있습니다. 규격을 위한 Google Docs가 있습니다. 그다음 우리는 주와 계획을 위한 개념을 하고, 다른 모든 것을 위해 Slack을 했습니다.

그 다음은 이 모든 것의 sassification과 어, 특별히 구축한 도구들인데, 이것이 실제로 어, 더 많은 분열을 만들었고, 간격이 어, 확대되었습니다. 선형 핸드오프가 표준이 되었습니다. 디자이너들이 Figma에서 일부 디자인을 했습니다. PM이 사양을 작성했습니다. 엔지니어가 티켓을 받았습니다. Figma와 매칭하기가 목표가 되었습니다. 하지만 이 어, 이 왕래하는 댓글들과 회의들이 정말 짜증났습니다. 우리는 이 긴밀한 반복 루프를 잃었습니다. 아이디어에서 모델, 사양, 티켓, 코드, 검토, 분할, 프로덕션까지 몇 주가 필요했고, 아이디어에서 현실까지 몇 주가 필요했습니다. 디자이너들은 실제 것, 즉 코드에 접근할 수 없었습니다. 엔지니어들은 티켓 없이 탐색할 수 없었습니다. 재료, 코드가 다른 사람의 일이 되었습니다. 우리는 이것이 진보, 전문화, 최고의 관행, 디자인 시스템이라고 말했습니다. 하지만 우리는 프로세스로 공예를 바꿨습니다. 우리는 조정으로 건설을 바꿨습니다.

우리는 원래 완전해야 하는 것을 분열시켰습니다. 코드는 인간과 기계 사이의 보편적 언어이며, 이것이 우리의 거래 재료입니다. 코드가 다시 한번 재료가 되었습니다. 코드는 사실의 출처입니다. 이것이 실제 것입니다. 이것은 모델이 아닙니다. 하지만 이제 에이전트가 코드를 작성하고 있으므로, 당신은 묻기, 지도하기, 개선하기를 통해 설계할 수 있습니다. 공예는 무엇을 구축할지, 그리고 그것이 어떤 느낌이어야 하는지를 아는 것이 되었고, 실제 재료를 사용하며, 다른 인간들과 에이전트들과 함께 그것을 실현하는 것입니다. Cursor는 도구와 건설자를 이 하나의 것으로 결합할 수 있으므로, 우리 모두가 함께 훌륭한 소프트웨어를 만들 수 있습니다. 우리가 어떻게 그곳에 도달할까요? Cursor 3을 입력하세요. Cursor는 처음에 VS Code에서 많은 복잡성을 상속받았습니다. 에이전트가 사람들이 Cursor를 사용하여 코드를 작성하는 주요 방식이 되었을 때, 지난 1년 동안 이 모든 것이 변경되었습니다. 이 유산 어, 에이전트 코더에게는 약간의 부채가 되어버렸습니다.

이 파일 중심 보기의 많은 것들이 이제 의미가 없습니다. 새로운 코더들의 경우, 그들은 여전히 많은 마찰을 느끼고 시작하면서, 모르는 모든 끔찍한 UI와 개념들로 폭격당합니다. 우리는 또한 이 로컬 파일 상태에서 작동하는 어, 에이전트와 상호작용하는 어, 것에서 어, 여러 에이전트가 다른 프로젝트에서 실행되는 것으로, 점점 어, 클라우드에서 실행되는 것으로의 전환을 보았습니다. 이 어, 파일 중심의 IDE 보기를 어, 새로운 계층 구조로 뒤집을 것입니다. 어, 에이전트와 그들의 환경을 중심으로 어. VS Code를 개조하기 위해, 레이아웃을 변경하고 어, 많은 UI 포크, 엣지 케이스 및 깨진 상태를 만들었습니다. 그것 어, 세상이 변하는 속도를 따라가지 못했습니다. 그렇다면, 우리가 이 파일 중심의 소프트웨어 보기 어, 에서 어, 각 인간과 그들이 하는 일에 맞춰지는 에이전트 네이티브 인터페이스 어로 어떻게 이동할 수 있을까요?

나는 생각합니다 어, 어, AI 도구를 구축하는 두 가지 주요 철학이 있으며, 구별 어, 정말 중요합니다. 한편으로는, 어, 당신은 검은 상자를 얻습니다. 당신은 당신이 원하는 것을 입력합니다. AI 어, 어, 당신이 볼 수 없는 곳에서 뭔가를 했습니다. 그것이 작동할 때, 당신 어, 실제로 뭔가를 배우지 못했습니다. 당신은 그냥 어, 생각을 건너뛰었습니다. 그것이 실패할 때, 당신 어, 정말 왜 그런지 모릅니다. 특히 새로운 코더로서, 당신은 어 발생했는지 이해하지 못하면서 계속 더 많은 토큰을 소모합니다. 당신은 볼 수 없고, 개입할 수 없고, 편집할 수 없습니다. 당신은 모든 어, 변경을 승인하거나 포기할 뿐입니다. 당신은 그냥 어, 모델의 산물입니다. 다른 한편으로는, 어, 당신은 유리를 얻습니다. 그것은 간단하게 시작하지만, 원한다면, 당신은 더 많은 것을 볼 수 있습니다. 에이전트 어, 스트리밍, 코드 어, 백그라운드에서 실행 중, AI 어, 당신과 함께 생각하는 방식이 있습니다. 당신은 어, 신화 빛을 리디렉션하고, 언제든지 멈출 수 있고, 당신의 방식으로 응시할 수 있습니다. 어, 그 두 픽셀 채우기를 편집 어, 원한다면.

당신 어, 반드시 어, 매 어, 변경을 읽을 필요는 없지만, 당신 어, 항상 할 수 있습니다. 경험 많은 코더들은 어, 에이전트 흐름을 어, 올바른 시간에 검토하도록 하고, 필요할 때 편집할 수 있습니다. 새로운 코더들은 어, Cursor로 새로운 소프트웨어 개념을 배울 수 있습니다. 그들 어, 물으면서, 구축하고, 수정하면서 배울 수 있으며, 그 다음 어, 시스템의 더 깊은 층을 볼 수 있습니다. 당신 어, 통제를 유지하고, 어, 직관을 구축하며, Cursor를 당신의 생각 방식으로 형성합니다. AI가 더 강해질수록, 유리 어, 더 중요해지지, 더 적어지지 않습니다. 어, 수 시간 실행되는 자율 에이전트는 읽을 수 있음을 필요로 합니다 어, 인간 어, 모니터링 및 개입. 다중 에이전트 어, 시스템 어, 검사 가능하고, 내구성 있는 계획을 필요로 합니다 어, 인간 어, 정의된 명확한 경계. 우리 어, 또한 필요합니다 어, 인간과 어, 에이전트의 공유 공간과 가소적 인터페이스 어, 함께 생각. 우리 어, 유리 방식을 선택했습니다 어, 인간과 에이전트를 위해 가져왔습니다 어, 집중, 읽을 수 있는, 맞춤화 가능한 어, 인터페이스.

매 어, 에이전트, 그들 어, 행동, 어, 아티팩트는 보이고 편집 가능합니다. 어, 계획 당신 어, 형성할 수 있고, 어, 에이전트 어, 상태 어, 당신은 어, 검사할 수 있습니다. 어, 제로 어, 숨겨진 마법 어, 무한 어, 통제. 하지만 그것 어, 간단하게 시작합니다. 당신 어, 할 수 어, 편집기가 닫힌 Cursor를 사용하여 어, 자동으로 열린 어, 파일 없이, 어, 방해 없이. 어, 그것 어, 약간의 작용 어, 으로 어, 다른 어, 도구 및 어, 워크플로우 어, 옆에 파트너로 작동합니다. 하지만 그것 어, 당신 어, 사용할 때 어, 당신 어, 원할 때 어, 복잡성을 표시합니다 어, 당신 어, 할 수 어, 보기 어, 더 많음. 당신이 어, 더 많은 프로젝트 어, 에서 어, 소프트웨어 제작의 다른 단계 어, 에서 어, 계획에서 어, 설계 어, 실행 어, 검토 어, Cursor를 사용할 때 어, 인터페이스 어, 어, 변환 어, 당신 어, 맞고 어, 당신 어, 당신이 잘하는 것에 집중합니다. 경험 풍부한 어, 개발자 어, 할 수 어, 어, 다중 에이전트 어, 검토 어, 변경, 및 어, 필요할 때 어, 정밀 어, 편집 어, 빠르게.

디자이너들은 빠르게 스케치하고, 브라우저에서 코드가 실행되는 것을 보고, 즉각적인 피드백으로 각 세부 사항을 주석 달고 조정할 수 있습니다. 제품 담당자들은 생각하고, 계획하고, 옵션을 탐색하고 트레이드오프를 생각하며, 전체 팀의 배경을 이해하는 에이전트와 함께 완전히 상호작용적인 협업 문서에서 일할 수 있습니다. 모든 것이 즉시 익숙하면서도 강력한 느낌입니다. 인간을 위한 설계이지, 어떤 모델을 위한 설계가 아닙니다. 우리는 당신이 조정하고 당신을 위해 Cursor를 맞춤화할 수 있게 했습니다. 코어는 간결하게 유지되지만, 플러그인과 기술 같은 확장 가능한 개념을 통해 맞춤화할 수 있습니다. 또한 당신의 작업에 맞춰질 수 있는 가상 인터페이스가 있습니다. 우리는 사용자 습관과 통제를 존중합니다. 우리는 절대 급격한 변화를 강요하지 않습니다. 우리는 아무것도 빼앗지 않았으며, 오히려 사람들에게 일을 완료하는 더 간단한 새로운 방식이 있다는 것을 보여줍니다 — 그렇게 하는 경향이 있는 사람들을 위해.

이제 우리가 어떻게 이것을 했는지 공유하겠습니다. 미친 일은 전체 새로운 인터페이스의 설계 작업이 약 1개월 내에 완료되었습니다. 모든 것은 우리가 올해 초에 시작한 탐색에서 시작된 무작위 프로토타입으로 시작되었습니다. 그래서 Lee, Rob과 나는 올해 초에 Baby Cursor 3을 시작했습니다. Baby Cursor는 우리의 프로토타입 환경의 이름이며, 사람들이 포크하고, 아이디어를 탐색하고, 다른 사람들과 공유할 수 있는 곳입니다. AI 도구를 설계할 때, 당신은 항상 많은 비결정성 상황을 마주치며, 정적 목업은 미묘함을 포착할 수 없습니다. 우리는 정말 직접 체험해야 했습니다. 따라서 목표는 Cursor를 설계하는 것이었으며, 이것이 가장 간단한 형태에서 전문 엔지니어와 소프트웨어 제작자가 좋아할 복잡한 제품까지 확장될 수 있습니다. 이 프로토타입의 새로운 버전에서, 우리는 그것을 완전히 기능적인 Electron 애플리케이션으로 만들었으며, Cursor CLI 위에 구축되었습니다.

나는 1개에서 여러 개의 에이전트, 1개에서 여러 개의 프로젝트, 0개에서 여러 개의 콘텐츠 탭 및 분할을 지원할 수 있는 간단한 레이아웃 아키텍처를 설계했습니다. 그것은 어떤 공간 제약에도 작동합니다. 것들은 항상 간단하게 시작하지만, 도구를 더 많이 사용할수록 성장합니다. Figma에서 이런 동적 상태의 모델을 만드는 것은 아마도 몇 개월이 걸릴 수 있으며, 실제로 코드에서 체험하는 느낌을 당신에게 주지 못합니다. 이러한 높은 수준의 정보 아키텍처와 흐름은 기본적으로 1주일 내에 완료되었습니다. 전통적인 설계 도구에서, 보드, 상태 및 내보내기 옵션을 복제하는 것이 매우 쉽습니다. 당신은 항상 마지막에 많은 상태 스냅샷을 가지며, 통합된 완전한 보기는 아닙니다. Cursor에서, Baby Cursor 3에서, 우리는 기본 기능 토글 시스템을 추가했으며, 우리의 설정은 파일 형태로 저장됩니다.

이것은 우리가 매우 큰 아키텍처 포크를 탐색할 수 있게 하며, 또한 각 미묘한 세부사항과 조합을 탐색할 수 있게 합니다. 그러면 당신은 사물이 어떻게 조합되는지 볼 수 있습니다. 매일 프로토타입을 사용하고 옵션을 탐색함으로써, 우리는 더 깊은 아키텍처 결정에 영향을 미치는 새로운 제약을 발견할 수 있었습니다. 한 가지 예는: 에이전트 사이를 탐색할 때 레이아웃이 어떻게 변합니까? 오른쪽의 탭이 그것들 사이를 탐색할 때 변합니까? 그들은 다른 에이전트에 바인딩됩니까? 그들은 각 작업 공간 또는 환경입니까? 아니면 그들은 모두 VS Code처럼 독립적입니까? 이것은 정말 언어로 설명하기 어렵지만, 당신이 실시간으로 느낄 수 있을 때는 쉽습니다. 우리는 그 다음 Baby Cursor를 회사의 모든 사람에게 사용하고 피드백을 얻기 위해 보냈습니다. 엔지니어들은 포크하기 시작했고 그들의 아이디어와 관점을 프로토타입에 추가했습니다.

그 다음 나는 그것들을 종합하고 팀의 피드백과 새로운 아이디어에 따라 더 반복했습니다. 우리는 프로토타입 구축을 통해 많은 것을 배웠습니다. 어떤 레이아웃이 다른 조건 아래서 실제 사용에서 합리적입니까? 어떤 다양한 기본값과 맞춤화 옵션을 노출해야 합니까? 우리가 복잡성을 간단하게 느끼게 하려면 어떻게 해야 합니까? 얼마나 많은 제어를 표시하고 얼마나 많이 숨길지? 진행 공개가 어떻게 작동해야 하는지 등등. 프로토타입에서, 나는 코드를 높은 수준의 사양으로 역공학했으며, 우리는 모든 옵션과 세부사항을 기록했습니다. 동영상과 스크린샷은 새로운 Cursor의 모델이 되었습니다. 그 다음 33개의 긴 토론 스레드의 RFC 이후, 그것을 현실로 만들 때입니다. 엔지니어링 팀도 이 프로토타입을 구축하는 속도에서 영감을 받아 더 급진적인 접근 방식을 취했습니다.

우리는 기본적으로 Cursor의 전체 UI를 처음부터 다시 작성하기로 결정했으며, 완전히 새로운 설계 시스템, 컴포넌트 라이브러리 및 깔끔한 기초를 채택했습니다. 엔지니어들이 이 작업을 할 때, 나는 더 많은 사이드바 그룹화 맞춤화, 입력 맞춤화, 미리보기 및 세부사항에 대해 프로토타입을 만들었습니다. 그 다음 나는 처음으로 Figma로 돌아갔으며, 우리가 결국 배송하지 않은 액체 유리와 모든 시각적 세부사항을 시도할 수 있습니다. 우리의 엔지니어링 팀은 이 두 달 동안 열심히 일했으며, React에서 전체 Cursor UI를 처음부터 다시 작성했으며 새로운 설계 시스템을 구축했습니다. 일단 것들이 조금 숙해지면, 우리는 새로운 Cursor를 사용하여 자신을 구축하기 시작했으며 여전히 약간 이상한 느낌의 것들에 대해 테스트했습니다. 디자이너들도 코드로 돌아갔습니다.

따라서, 우리는 작은 세부사항, 새로운 컴포넌트 세련화, 아이콘, 색상, 테마, 활력, 애니메이션 — 모든 모델이 볼 수 없는 작은 세부사항을 개발하고 있습니다. 설계 프로세스는 정말 매끄러워졌습니다. 그것은 더 이상 선형이 아닙니다. 우리는 단지 공예를 정교하게 할 최고의 도구를 사용합니다. 이런 프로토타입을 만들거나 목업에 더 많은 시간을 소비하든, 아니면 직접 코드에 들어가든. 올해 3월 말, 우리는 알파 버전을 배송했으며, 우리는 내부 및 실제 사용자와 함께 이 빠른 피드백 루프를 구축했습니다. 우리는 우리가 처음으로 배송한 성능과 품질에 집중했습니다. Cursor 3을 배송한 후, 우리는 Baby Glass를 구축했으며, 이것은 우리의 다음 세대 프로토타입 환경이며, 단일 프로토타입에서 Cursor를 현재에서 미래까지 시각화할 수 있습니다.

그것은 우리의 새로운 설계 시스템 위에 구축되었으며 Cursor 3의 실제 컴포넌트를 사용합니다. 우리는 그것을 웹으로 돌아갔습니다. 그래서 그것은 더 이상 Electron 애플리케이션이 아닙니다. 상태를 공유하고 다른 사람에게 링크를 보내는 것이 매우 쉬워졌기 때문입니다. 그래서 그들은 링크를 클릭하고 피드백을 줄 수 있습니다. 우리는 또한 미래의 마크업 및 버전 제어 시스템을 개선했으며, 이것은 우리가 Cursor를 현재 프로덕션 상태에서 우리가 향해야 하는 모든 단계의 더 미래의 마일스톤까지 시각화할 수 있게 합니다. 우리는 또한 더 나은 핸드오프 프로세스를 구축했으며, 이러한 Baby Glass 프로토타입이 엔지니어가 실제 코드베이스에서 기반이 될 첫 PR이 될 수 있습니다. 정말 멋져 보입니다. 그것은 데스크톱을 가집니다. 그것은 일부 배경화면, 테마를 가지고 있으며, 우리는 Baby Glass 내부에도 도구를 구축했으며, 당신은 목업과 동영상을 생성할 수 있습니다. 우리는 우리 웹사이트의 실제 데모에 그것을 사용할 계획입니다.

따라서 Glass를 만드는 것은 우리에게 소프트웨어 제작의 미래에 대한 많은 명확성을 주었습니다. 그것은 더 협력적이어야 하므로, 인간이 에이전트 팀과 동일한 배경과 도구에서 함께 일할 수 있습니다. 우리가 더 큰 목표를 달성하기 위해 에이전트를 사용할 때, 에이전트와 인간이 동일한 공간을 공유하는 것이 점점 더 중요해집니다. 그래야 그들이 구축해야 할 올바른 결정에 도달할 수 있습니다. 모든 사람이 빌더가 되면서, 다른 분야의 사람들, 단지 엔지니어일 뿐만 아니라, 최종적으로 한데 모여 동일한 목표에 대해 일할 수 있으며, 동일한 에이전트 설정, 도구, 지식 및 아티팩트를 갖습니다. 우리는 미래가 더 맞춤화되어야 한다고 생각합니다. 우리의 인터페이스와 도구는 우리가 누구이고 우리가 무엇을 하는지에 맞춰져야 하며, 반대가 아닙니다.

모든 사람과 모든 팀이 다르지만, 기본 개념과 도구는 동일하므로 당신은 당신의 워크플로우와 도구를 구축하고 연결할 수 있으며, 당신 자신과 당신의 팀을 위해 당신의 에이전트를 가장 미세한 수준까지 맞춤화할 수 있습니다. 우리는 미래가 더 자율적이어야 한다고 생각합니다. 더 많은 에이전트가 반복 워크플로우를 처리할 수 있으며, 수동 프로세스를 간소화하고 제거할 수 있으며, 인간이 시스템과 경계를 정의합니다. 우리는 문제 분류, 릴리스 노트, 보안 및 코드 검토 등을 자동화할 수 있습니다. 당신은 검증 루프로 당신의 시스템을 설계할 수 있으며, 진정으로 무엇이 올바른지 정의할 수 있으므로 에이전트가 당신을 위해 더 많은 일을 처리할 수 있습니다. 마지막으로, 우리는 더 야심찬 것들을 구축해야 하며 우리가 또 무엇을 할 수 있을지 생각해야 합니다. 더 많은 것을 만들고 더 많은 쓰레기를 추가하는 것이 아닙니다. 우리는 함께 더 나은, 더 간단한 소프트웨어를 구축할 수 있습니다.

더 많은 것을 추가하는 대신, 당신은 실제로 당신이 절약한 시간을 사용하여 깊이 있게 생각하고, 무엇이 가장 간단한 추상화인지, 당신의 사용자를 위해 구축할 올바른 것이 무엇인지 알아낼 수 있습니다. 미친 일을 하세요. 이것이 다른 사람들과 함께 불가능한 것입니다. 미래는 생각하고 구축할 수 있는 사람들에게 속합니다. 기다리지 마세요. 구축를 시작하세요. 검은 상자는 없습니다. 어, 정말 감사합니다, Rio. 그냥 모두에게 알려주려고, 만약 당신이 아직 확인하지 않았다면, Cursor는 Italier in Kinsky에 부스를 가지고 있습니다. 그래서 당신은 팀의 일부 멤버를 만날 수 있습니다. 좋습니다. 어 감사합니다. >> 감사합니다. >> 예. 좋습니다. 어 다음 발언자를 무대로 초대하고 싶습니다. 어 이것은 Ain입니다. 그는 Figma의 스태프 제품 디자이너입니다. 무대로 올라주세요.

그래서 Ain은 현재 Figma Weave에서 일하고 있으며 Figma Buzz 및 FigJam을 포함한 Figma의 많은 매우 인기 있는 제품 뒤에 있었습니다. FigJam은 내가 개인적으로 사용하는 것을 좋아합니다. 음, 그는 다중 모달 다중 인 AI 설계에 대해 연설할 것입니다. 그가 준비하는 동안, 음, 단지 몇 가지 빠른 공지사항. 첫 번째는 오늘 밤 우리가 실제로 전체 극장을 강연에서 파티를 개최하기 위해 나이트클럽으로 바꿀 것입니다. 예. 어, 그래서 어 그냥 당신의 배지를 가져가는 것을 기억하세요. 이것이 실제로 우리가 당신을 확인하는 방식입니다. 그래서 만약 당신이 참가자 어 당신은 그것을 바로 가져갈 수 있습니다. 어 Luma의 QR 코드에 대해 걱정할 필요가 없습니다. 어 그 다음 것은 우리가 Pullman에 데모 스테이지를 가지고 있다는 것이고, 현재 실제로 시작되고 있습니다.

어 하지만 당신이 어느 시점에 멈추고 싶다면, 일부 지역 스타트업들로부터의 몇 가지 데모를 보세요. 그들이 AI를 그들의 워크플로우 또는 제품에 어떻게 포함시키는지에 대해, 어 가보세요. 맞습니다. 더 이상의 지연 없이, Aen. 좋습니다. 모두 안녕하세요. 와, 이것은 내가 예상했던 것보다 많은 사람들입니다. 어, 좋습니다. 어, 나는 Ashang입니다. 나는 Figma의 제품 디자이너입니다. 오늘 나는 왜 우리의 AI 도구가 다중 인이고 다중 모달이어야 하는지에 대해 이야기하고 싶습니다. 따라서 우리가 오늘 가진 AI 도구는 개인의 속도를 10배로 높이는 데 중점을 둡니다. 하지만 나는 더 어렵지만 더 흥미로운 질문이라고 생각합니다. 우리가 함께 사람 그룹의 속도를 10배로 높일 수 있을까요? 실행이 저렴해지면, 협력과 정렬이 병목이 됩니다.

이것은 실제로 또 다른 AI 엔지니어의 연설로부터 온 것입니다. GitHub의 연구 엔지니어인 Maggie Appleton에 의해 수행되었으며, 나는 그녀의 틀에 정말 동의합니다. 왜냐하면 무엇을 구축할지와 구축하지 않을지 결정하는 것이 이제 그 어느 때보다 중요하기 때문입니다. 우리가 탐색, 계획, 정렬하는 방식이 변하지 않으면, 팀의 진행은 차단될 것입니다. 이것은 또한 Roy가 이전에 공유한 것과 매우 관련이 있습니다. 나는 단지 우리가 오늘 가진 도구가 이런 것들 중 어느 것을 정말 더 쉽게 만들지 않는다고 생각합니다. 오늘날의 대부분의 에이전트 도구는 왼쪽에 채팅, 오른쪽에 아티팩트입니다. 하지만 채팅은 단일 액세스, 하나의 스레드, 한 방향, 하나의 정보 소스입니다. 그것은 당신이 일회성 경향이 있게 만듭니다. 맞죠? 인터페이스에서 분기하고, 나란히 비교하는 아이디어 등을 하는 방법에 대해 알려주는 힌트가 거의 없기 때문입니다.

이것은 궁극적으로 발산하는 인터페이스가 아닌 수렴하는 인터페이스입니다. 나는 AI 도구를 설계할 때, 우리는 또한 발산을 위해 인터페이스를 구축해야 한다고 생각합니다. 왜냐하면 창의 과정은 외로우면서도 사회적이기 때문입니다. 최고의 아이디어는 아이디어 사이의 마찰을 통해 예리하게 됩니다. 따라서 나는 우리가 그것을 제거하고 우리를 고립시키지 않으면서 이 과정을 촉진하는 도구를 구축해야 한다고 생각합니다. 따라서 예, 이것은 AI 도구의 발산 인터페이스에 대한 몇 가지 생각입니다. 몇 년 전, 나는 Jambot이라는 작은 위젯을 구축하는 것을 도웠습니다. 음, 그것은 Jam에 존재했으며, 당신이 Hatcht를 사용하여 시각적, 비선형 및 다중 인 방식으로 아이디어를 탐색할 수 있게 했습니다. 이것은 LM이 아직 모두 텍스트에 관한 것이었을 때, 당신이 0에서 1로 코드를 배송할 수 있기 전이었습니다.

뒤돌아보면서, 나는 캔버스를 이 정말 매력적인 가소적 매체로 봅니다. 추가 차원은 다중 인 존재와 분기 반복을 더 자연스럽게 느끼게 할 수 있습니다. 따라서 이 연설의 다음 부분은 작은 데모이며, 나는 당신이 나와 함께 참여하기를 즐거워합니다. 만약 당신이 노트북을 가지고 있다면, 이 링크를 입력하고 당신의 이름을 입력하면, 당신이 안에 있기를 바랍니다. 어, 나는 Wi-Fi가 약간 불안정하다는 것을 알고 있으며, 음, 이 데모는 순수하게 Claude 코딩을 통해, 나는 모릅니다. 어, 이렇게 많은 사람들을 요청하도록 시도한 적이 없습니다. 당신들은 내가 예상했던 것보다 훨씬 많습니다. 따라서, 행운을 빕니다. 하지만 어, 할 수 있으면 시도해 보세요. 안녕하세요, 안녕하세요, 안녕하세요. 나는 여기를 확대하겠지만, 그것은 주소 표시줄의 동일한 URL입니다.

일단 들어오면, 슬라이드가 있는 캔버스를 보고 Flappy Bird 같은 작은 게임이 많이 사전 로드되어 있습니다. 따라서 여기에서 게임을 클릭하여 재생할 수 있습니다. 나는 상단에서 이 같은 것을 선택할 것입니다. 오, 친구들. 좋습니다. 나는 정말 그것이 깨지지 않기를 바랍니다. 하지만 좋습니다. 아, 나는 이미 잃었습니다. 좋습니다. 이것은 정말 어색합니다. 어 만약 당신이 여기의 메모에 맴돌면 어 당신은 이 프롬프트 상자를 볼 수 있어야 합니다. 당신은 요소를 추가하는 것처럼 할 수 있습니다 어 미학을 변경하고, 메커니즘 등을 변경합니다. 예를 들어, 내 친구 Annie가 어제 내 새에 괴물 친구를 추가하도록 제안했습니다. 무슨 일이 일어날지 봅시다. 이것이 흐를 때, 나는 또한 배경을 은하로 변경하면 어떻게 될지 궁금해합니다. 좋습니다. 이제 나는 Asia가 기본적으로 내 프롬프트를 채택하고 있는 것을 볼 수 있습니다. 그것은 계획을 다시 쓰고 있으며, 또한 코드를 다시 쓰고 있습니다.

나는 상단에 이것을 가지고 있습니다. 좋습니다. 그것은 너무 빠르게 내려갑니다. 당신이 알다시피, 하지만 좋습니다. 좋아요. 어, 나는 당신들이 다른 것들도 만들었는지 볼 것입니다. 따라서 어, 나는 무슨 일이 일어났는지 확실하지 않지만, 어, 나는 정말 내가 진공에 걸리지 않기를 바랍니다. 하지만 여기에서 나는 계속 반복할 수 있어야 합니다. 당신 모두에게 약간 부드러운 충돌의 기회가 있습니다. 따라서 죄송합니다. 하지만 나는 새에 모자를 추가할 수 있다는 것을 좋아합니다. 새에 모자를 추가하고 등등계속합니다. 그래서 이제 당신은 우리가 실행 코드의 가장 원시적인 버전에서 조금 협력하고 있다는 것을 볼 수 있습니다. 나는 또한 새로 고침을 하고 그것이 내 문제처럼 있는지 확인할 것입니다. 좋습니다. 그것은 정말 자신을 엉망으로 만들었습니다. 죄송합니다.

하지만 나는 마음을 사로잡은 것은 이것이 간단하지만 약간 시각적인 버전 기록 표현을 가지고 있다는 것이며, 반복을 하도록 매우 초대하는 느낌이 맞습니다. 그리고 협력이 실시간으로 발생하는 것을 볼 수 있습니다. 상상해 보세요. 진정한 소프트웨어 프로토타이핑이 실제로 이렇게 협력적인 느낌이 들었다면. 이 개념 자체는 내게 매우 흥미롭게 느껴집니다. 이제 이 공간을 다중 인으로 만들면서, 어 나는 그것이 또한 경계 사례와 같은 것을 도입한다고 생각합니다. 어 우리가 다중 인과 에이전트 사이의 더 나은 공동 창작을 활성화하기 위해 고려해야 할 것들입니다.

따라서 오늘의 대부분 AI 도구, 우리는 우리를 위해 자동화되어야 하는 작업에서 에이전트가 행동하도록 합니다. 이것은 좋습니다. 맞죠? 하지만 협력 탐색에서, 우리는 인간과 에이전트가 임흥 협력 파트너로 의존합니다. 공간은 허용하는 것처럼 느껴져야 합니다. 맞죠? 우리는 서로의 일을 만질 수 있고 실시간으로 같은 것을 반복할 수 있어야 합니다. 따라서 예를 들어, 좋습니다. 이것은 정말 실패하기 쉽습니다. 그래서 나는 만약 모든 것이 부서진다면 대비하기 위해 로컬 버전을 가지고 있습니다. 따라서 다시 시도하겠습니다. 내 새에 괴물 친구를 추가하세요. 좋습니다. 따라서 당신이 입력할 때, 당신은 아마도 나도 편집할 수 있는 선택지가 있음을 볼 것입니다. 이것은 당신이 무언가를 약간 무시할 수 있게 할 것입니다. 맞죠? 이것은 충돌 편집의 가능성을 도입합니다. 예를 들어.

따라서 만약 나가 여기에서 좋아하는 것처럼 좋아하는 것 같은 중세 테마를 만들길 원한다고 말하고, 나는 편집을 클릭하면, 이제 만약 누군가가 동시에 같은 것에 대해 일하고 있다면, 맞죠. 따라서 예를 들어 당신이 여기에서 시각적 스타일을 편집 중인 경우, 두 개의 패러렉스 레이어가 있습니다. 예를 들어, 누군가가 같은 아티팩트를 만질 수 있고 그것을 다시 쓸 수 있는 기회가 있습니다. 이것은 허용되어야 합니다. 맞죠. Google Docs 또는 Figma처럼. 왜냐하면 공간은 공동 창작을 장려하기 위해 가능한 한 인정할 수 있어야 하기 때문입니다. 여기에서 나는 정말 그것이 흐르기를 바랍니다. 하지만 만약 그것이 아니면 어 나는 운명입니다. 어 하지만 여기의 원시 계획은 당신도 내 옆에 변경을 하는 에이전트 커서를 볼 수 있을 것입니다. 어, 그것이 나의 편집을 대체하는 출력을 출력하기 때문입니다. 맞죠?

나는 여기서 그것이 나에게 실제로 다시 쓰어야 하는지 물어야 한다고 생각합니다. 또한 흐르는 출력도 표시합니다. 따라서 나는 비교할 수 있으며 그것이 다시 쓰도록 허용해야 하는지 또는 하지 말아야 하는지를 결정할 수 있습니다. 그것은 최소 예제일 것입니다. 맞죠? 나는 그냥 이것을 사용할 것입니다. 그것은 최소 예제일 뿐입니다. 맞죠? 하지만 나는 그것이 AI를 다중 인으로 만들기 위해, 당신은 정말 이 구현된 존재를 설계해야 한다는 것을 얻는다고 생각합니다. 따라서 여기의 재현은 그것이 할 수 있는 것에 대한 기대를 설정해야 합니다. 이 경우, 그것은 이미 나에게 그것이 편집 중인 문서를 보여줄 수 있어야 합니다. 그것은 자신의 텍스트 포인터와 함께 나타날 수 있어야 합니다. 또한 시각적으로 그 변경 범위를 표시해야 합니다. 또한 다른 사람과 충돌 편집을 처리하는 방법을 표시해야 합니다. 인간 또는 에이전트 여부.

나는 실제로 많은 방식으로 오늘 인간을 위한 구현된 존재를 설계하는 것과 유사하다고 생각합니다. 어 나는 그것을 생각합니다. 정말 유사합니다. 어 문서 또는 캔버스에서 커서를 설계하든지. 어, 따라서 그것은 단지 AI를 다중 인으로 만드는 것에 대한 데모입니다. 하지만 나에게, 이것은 방금 시작입니다. 나는 다음 프론티어가 실제로 다중 모달이기도 하다고 생각합니다. 이것은 정말 인간과 에이전트가 더 풍부한 방식으로 자신을 표현할 수 있도록 통신 채널을 확대하는 것에 관한 것입니다. 세 가지 방향이 있습니다. 나는 여기를 흥미롭게 생각합니다. 첫째, 나는 우리가 정말 다중 모달 모델을 구축해야 한다고 생각합니다. 며칠 전, 어, 이것은 사고 기계 실험실에서 나왔습니다.

나는 그들이 어떤 것에 대한 연구를 공유했다고 생각합니다. 「상호작용 모델」이라고 부르는데, 그것은 자체로 다중 모달이며, 미술 용어 b이므로 항상 실시간 상호작용입니다. 나는 그들이 그것을 설명하는 방식이 마음에 듭니다. 「턴 기반 AI」는 이메일을 통해 에이전트와 이야기하는 것과 같으며, 대면하지 않습니다. 따라서 이것은 모델 수준에서 경계를 밀고 있으며, 솔직히, 이 연설보다 훨씬 멋집니다. 당신은 절대 가보셔야 합니다. 만약 당신이 모델 빌더라면, 그것을 일어나게 하세요. 두 번째로, 나는 에이전트가 더 풍부한 디지털 매체에서 이동할 때, 우리가 「구현된 존재」를 더 잘 구축해야 한다고 생각합니다. 내가 앞서 말했듯이, 커서와 같은 간단한 것을 예로 들어봅시다. 당신은 위치, 움직임 및 클릭과 같은 상호작용을 통해 많은 것들을 표현할 수 있습니다.

따라서 이는 커뮤니케이션 채널이며, 우리가 신체 언어를 통해 서로의 의도를 이해하는 것처럼, 에이전트를 위해 신체 언어를 설계해야 합니다. 하지만 현재에도, 맞죠, 우리는 인터랙션 모달리티로 많은 것을 할 수 있습니다. 따라서 Guey는 이미 사람들이 더욱 풍부하고 직관적인 방식으로 의도를 전달하도록 도와왔으며, 우리는 이들을 구축하는 데 수십 년간의 경험을 가지고 있습니다. 따라서 우리가 어떻게 동시에 멀티터치, 펜, 음성 등의 입력을 처리할 수 있는지 상상해보세요. Diana Lou의 이 인터페이스 실험처럼, 또는 우리는 당신의 인터페이스에서 얼마나 많은 「확실성」을 구축할 수 있는지 생각해야 할까요. 당신은 「확실성」을, 당신은 당신의 인터페이스에서 구축할 수 있습니다, 맞죠?

예를 들어 이 예시인 Figma Weave, 노트형 워크플로우 도구는 리치 미디어 콘텐츠를 생성할 수 있습니다. 고백하자면, 저는 이 도구에서 일했습니다만, 이러한 노트형 AI-네이티브 도구 카테고리는 흥미로운데, 그 이유는 모델과 우리가 이미 알고 있는 UI 디자인 패턴을 융합하고 창의적 탐색을 위한 필요한 정밀성과 제어력을 제공하기 때문입니다. 여기서부터 당신은 깊이 있게 파고들 수 있습니다. 따라서 제가 방금 공유한 내용이 당신에게 영감을 주기를 바랍니다. 당신의 에이전트가 여러 협력자(인간이든 에이전트이든)와 어떻게 상호작용할 수 있는지, 그리고 그들이 어떤 패턴을 사용할 수 있는지에 대해 생각해보세요. 음, 저는 확실히 이 분야의 진전을 주시하겠습니다. 대화하고 싶으시면 Twitter에서 저에게 연락하실 수 있습니다.

이것이 여러분께 공감한다면, 올해의 config를 놓치지 마세요. 이것은 Figma의 설계 컨퍼런스입니다. 거기에도 당신에게 관심 있을 만한 업데이트가 있습니다. 그래서, 그 정도면 될 것 같습니다. 감사합니다. 매우 감사합니다, Ain. 음, 저는 우리의 다음 연사자를 소개하게 되어 기쁩니다. 이는 Saleem, Menllo Research의 로봇 엔지니어입니다. 무대에 올라오세요. 음, 잘 모르시는 분들을 위해, Menllo Research는 Azimoff의 뒤에 있는 회사입니다. 이것은 오픈소스 휴머노이드 로봇이며, 당신은 이를 훈련하고 커스터마이즈할 수 있습니다. 그들은 우리 물리 AI 트랙에서 발언할 첫 번째 사람들이 될 것입니다. 음, 이것은 정말로 흥미로운데, 왜냐하면 우리는 음, 당신 알다시피, 새로운 토론을 도입하고 싶고, AI를 단순히 대규모 언어 모델로 보는 것이 아니라, 당신이 어떻게 진정으로 이를 이해하고 실제 물리 세계와 상호작용하게 할 수 있는지입니다.

따라서 um Saleem은 논의할 것이며 음 그의 주제는 「노이즈는 당신이 필요로 하는 모든 것——엔지니어링 시뮬레이션에서 오픈소스 휴머노이드 로봇 실현까지」입니다. >> 여기서부터 슬라이드를 볼 수 있으신가요? 감사합니다. >> 음 모두 안녕하세요. 음 저는 Sim입니다. 저는 Melo Research에서 일합니다. 이는 싱가포르에 등록된 회사입니다. 저는 에이전트 로봇에 대한 지식을 설명하고 싶고, 기본적으로 어떻게 no-code 방식으로 실제 세계를 프로그래밍하는지를 말하고 싶습니다. 음 Melo는 실제로 풀스택 팀입니다. 음 우리는 세계 곳곳에 분포된 27명을 가지고 있습니다. 우리는 음 싱가포르에 사무실이 있으며, Syndam Square에 위치하고 있습니다. 이것은 실제로 매우 좋은 곳입니다. 음 우리는 베트남 호치민시에 사무실이 있으며, 우리는 음 샌프란시스코에 다음 달에 사무실을 열 예정입니다. 음 우리 팀은 기본적으로 27명 중 25명이 엔지니어입니다. 음 저는 Salem입니다. 음 저는 — 저는 2025년에 Menllo에 합류했습니다.

저는 이전에 캘리포니아 팔로알토의 Tesla에서 6년 동안 소프트웨어 엔지니어로 일했습니다. 저는 기본적으로 로봇 쪽의 작업을 주도하기 위해 Menllo에 왔습니다. 음, 아시다시피, 우리는 풀스택 로봇을 만듭니다, 하드웨어에서 음 하드웨어에서 음 최상위 음 애플리케이션 계층까지. 그래서, 제 저는 당신들이 이미 조금은 ESO에 대해 들었다고 추측합니다. 기본적으로 오픈소스 휴머노이드 로봇입니다. 이것은 세계상 유일한 오픈소스 휴머노이드 로봇이며, 실제로는 음 당신 알다시피 약간 바이럴했고, 우리는 그만큼 예상하지 못했습니다. 우리는 음 음 여러 국가에서 바이럴했습니다, 독일에서. 독일에 한 기사가 있고, 일본에서. 그래서 음 그래서 우리는 기본적으로 DIY 키트를 만들기로 결정했습니다, 기본적으로 상자 같은 것인데, 그 안에 휴머노이드 로봇의 모든 다양한 부품이 있으며, 그러면 우리는 온라인 매뉴얼이 있어서, 당신은 집에서 로봇을 구축할 수 있습니다.

음 당신 알다시피, 우리는 그것을 출시하여 예약을 받았습니다. 저는 2일 내에 음 100만 달러의 예약을 받았다고 생각합니다. 음, 사람들은 휴머노이드 로봇 분야에 매우 흥분했으며, 특히 휴머노이드 로봇을 사용하는 방법을 배우는 것처럼, 음, 그들이 어떻게 작동하고 어떻게 행동하는지 배우는 것 말입니다. 음, 그래서 많은 사람들이 우리에게 묻습니다, 당신 알다시피, 왜 당신들은 하드웨어를 구축하나요? 하드웨어는 어렵습니다. 음, 저는 나중에 하드웨어를 포함하지 않는 것이 더 어려울 것 같습니다. 음, 그래서 오픈소스 참조 휴머노이드 로봇 설계로서. 그래서 이것은 설계를 포크할 수 있는 누구나 집에서나 제조 음 환경에서 휴머노이드 로봇을 구축할 수 있다는 것을 의미합니다. 그래서 우리의 목표는 기본적으로 전 세계에 분산된 제조 파트너 네트워크를 만드는 것이며, 그들은 그것을 구매하고 싶은 사람들을 위해 esop를 만들고, 우리는 참조 설계를 소유합니다.

거의 마치 음 Android 같은 것처럼, 저는, Samsung과 Huawei 같은 것들이 하드웨어를 구축하는 것 같고, 당신은 기본적으로 오픈소스 참조 설계를 가집니다. 음, 이것은 매우 흥미로운데, 왜냐하면 우리가 DIY 키트를 출시하여 판매할 때, 우리는 실제로 음 200개 이상의 공장에서 우리에게 연락을 받아 로봇을 구축하고 싶어했기 때문입니다. 그들은 세계 곳곳에서 왔습니다. 일부는 터키에서, 일부는 독일에서, 물론 미국에서도. 음, 심지어 일부는 나이지리아에서. 음, 그래서 세계 곳곳에서 그들은 실제로 음 as를 구축할 수 있고, 우리는 오픈소스 참조 설계를 소유합니다. 음 Esimov는 또한 우리가 내부에서 구축한 것을 포함하며, 로봇 처리 유닛 같은 것을 말합니다. 이것은 우리에게 매우 중요한데, 왜냐하면 그것은 음 기본적으로 전체 로봇을 제어할 수 있는 컨트롤러입니다.

로봇은 약 35개의 모터, 8개의 카메라, 음 2개의 마이크로폰, 1개의 스피커로 구성되어 있으며, 모두 몸통 내에 앉아있는 단일 보드에 연결되어 있습니다. 그리고 이 보드도 매우 음 유용한데, 예를 들어 그것은 로컬에서 그 안에 모델을 실행할 수 있습니다. 이것은 매우 중요한데, 아시다시피, ESMO 법칙을 대표합니다. 세 가지 ESO 법칙이 있으며, 이 법칙들은 기본적으로 누구를 해치지 않고, 당신의 음 명령을 따르고 자신을 보호하는 것입니다. 그리고 보편적 안전을 정의하는 것은 매우 어렵습니다, 맞죠, 중동에 사는 사람의 안전은 다릅니다. 싱가포르에 사는 사람의 안전은 다릅니다. 마치 저는 터키 사람이고 독일 사람입니다. 저는 음 저는 이중 국적입니다. 그래서 마치 제 두 나라의 안전 요구사항은 다릅니다. 그래서 우리는 실제로 안전을 제조업체의 책임으로 만들기로 결정했습니다.

우리는 것을 as를 구축하는 사람, as를 개발하는 사람들의 분산형 합의를 통해 안전이 무엇을 의미하는지를 결정할 수 있도록 하고 싶습니다. 그래서 그것은 거의 합의와 같습니다. Bitcoin을 생각해보세요. 모든 이런 다른 것들을 생각해보세요 거의 블록체인 음 기술처럼, 사람들이 무엇이 안전한지를 결정하고, 기본적으로 기능 안전 모델, 컴퓨터 비전 모델을 만들며, 언제든지 그것이 잘못된 일을 하려고 할 때 로봇을 인수할 수 있습니다. 그 음 as 법칙에 관계없이 음, 이것이 기본적으로 그것을 한 장치에 구워넣는 것이 매우 중요한 이유입니다. 그래서 그것은 클라우드에서 실행되지 않으며, 그것은 단지 장치에서 로컬로만 실행됩니다.

githash는 CRC에 구워지고 당신은 모든 것을 읽을 수 있습니다, 마치 음 그 단일 보드처럼, 제조업체는 반드시 사용해야 하며, 그렇지 않으면 그들은 as를 구축할 수 없습니다. 그래서 어떻게 no-code 방식으로 현실을 프로그래밍하는 것처럼에 대해, 음 no-code 프로그래밍은 흥미로운데, 왜냐하면 당신 알다시피 음 Open Claw의 시대처럼, 사람들은 기본적으로 그들의 워크플로우를 자동화할 수 있고 모두가 AI 엔지니어 같은 느낌을 받습니다, 맞죠? 마치, 당신 알다시위, 사람들은 기본적으로 매일 아침 이메일을 요약할 수 있고, 그러면 아마도 그들은 OpenAI에 지원할 수 있다고 생각하고, 단지 왜냐하면 마치 그들이 이 모든 힘을 가져서, 맞죠? 단지 no-code 프로그래밍 것. 그리고 저는 우리가 Meno에서 진짜로 하고 싶은 것이 하드웨어 쪽 외에도, 마치 소프트웨어 쪽처럼, 우리는 원하고 음 우리는 원하고 기본적으로 모든 소프트웨어 개발자를 로봇 엔지니어로 변환하는 것입니다.

Open Claw와 나머지처럼 모든 소프트웨어 개발자를 AI 엔지니어로 변환하는 것 기본적으로, 맞죠? 그리고 우리가 이것을 어떻게 하는지는 기본적으로 우리는 시스템 설계를 가지고 있는데, 소프트웨어 쪽처럼, 에이전트처럼. 에이전트는 기본적으로 당신들이 가져올 수 있는 것입니다. 이것은 우리가 제공하는 것이 아닙니다. 이것은 CL을 실행할 수 있고, 이것은 codecs를 실행할 수 있습니다. 이것은 당신의 모든 당신이 소유한 다양한 외부 도구에 연결할 수 있습니다. 음 이것은 우리가 그것을 부르는 것처럼, 대뇌, 느린 사고의 대뇌. 그러면 우리는 음 기술과 로봇 제어를 가지고 있으며, 로봇 내부에서 실행됩니다. 그래서 기술은 기본적으로 어떤 작업을 어떻게 수행하는지를 의미합니다. 컵을 어떻게 집을지, 악수를 어떻게 할지, 어떻게 걸을지. 음 그리고 로봇 제어는 음 기본적으로 실시간 운영 체제입니다.

이 명령들이 로봇을 통해 넘어지지 않도록 합니다. 음 그것 내부에는 일부 안전 메커니즘이 있습니다. 그리고 단지 당신에게 당신 알다시피 예시를 주기 위해, 로봇이 자율적으로 실행될 때의 조종실 같은 것. 그래서 기본적으로 당신 알다시위 당신이 A 박스를 B로 로드하고 싶을 때, 맞죠, 먼저 로봇은 내부에서 이 인식 및 계획 에이전트를 실행합니다, 그것은 음 다양한 음 장애물을 감지할 수 있고 다양한 음 다양한 시나리오를 감지할 수 있으며 음 그것이 보는 것에 따라. 음 두 번째 일은 실제로 음 당신은 시뮬레이션 훈련을 통해 기술을 얻을 수 있습니다, 거의 Open Claw 기술처럼. mmd 파일, 맞죠, 당신은 기술을 훈련할 수 있습니다 컵을 집을 수 있게, 음 당신 알다시위 앞으로 이동 locomate 앞으로 실행 음 점프 음 이들은 다양한 유형의 모델 훈련을 통해입니다, 하지만 거의 기술으로 추상화된 것처럼.

이것은 VA가 물건을 집을 수도 있습니다. 이것은 Walt 행동 모델입니다, 또는 이것은 단지 역운동학 같은 것일 수도 있습니다, 맞죠? 그리고 이제 당신은 계획을 세울 수 있고, 그리고 당신은 실행할 기술을 가지고 있습니다. 그리고 마지막 단계는 기본적으로 당신은 그것을 당신의 에이전트에 집어넣기만 하면 됩니다. 그래서 이제 당신의 에이전트는 기본적으로 당신은 음 당신은 비디오 및 오디오 스트림을 당신의 에이전트로 보내지 않습니다. 당신은 단지 텍스트와 기술만 보냅니다, 그리고 로봇은 거의 이러한 작업을 실행하는 MCP 서버입니다. 그리고 당신이 할 수 있는 다음 단계는 기본적으로 당신은 칸반 보드를 만들 수 있고, 당신은 당신의 공장이나 당신의 가정에서 실행되는 로봇 팀에 티켓을 할당할 수 있습니다. 그리고 흥미로운 부분은 그것들 음 제가 앞에서 언급했던 로봇 처리 유닛입니다. 당신은 그 로봇 처리 유닛들을 어떤 유형의 로봇에도 연결할 수 있습니다. 일부 기술은 실제로 이전가능합니다. 일부 기술은 아닙니다.

그래서 당신은 모든 안전 법칙을 실행하는 이러한 로봇 처리 유닛들을 어떤 유형의 로봇에도 연결할 수 있으며, 기본적으로 우리의 스택을 통해 당신은 그것들을 거의 함대 조정자처럼 보이는 군집 지능처럼 뭔가에 연결할 수 있고, 그러면 당신은 기본적으로 당신 알다시위 당신의 전체 환경을 제어할 수 있습니다. 로봇은 오픈소스이며, 그 기술은 커뮤니티에서 훈련됩니다. 안전 법칙은 커뮤니티에서 훈련되고, 로봇은 제조 파트너에 의해 구축됩니다. 그래서 저는 그것이 그것이 그것이 일종의 음 Melo가 여기 음 싱가포르 주변에서 달성하려고 시도하는 목표라고 생각합니다, 그리고 누구든 당신 알다시위 우리에게 합류하는 것에 관심 있는 사람. 우리는 실제로 음 Melo Park에서 사무실을 개설했는데, 우리의 이름이 말하는 것처럼, 맞죠? 음 이것에 관심 있는 누구든지 우리에게 합류할 수 있습니다. 음 그리고 싱가포르에서 이것에 관심 있는 누구든지도 음 우리는 대화할 수 있습니다.

음 어떤 종류의 기술 세트가 필요한가요? 로봇에는 특정한 기술 세트가 없습니다. 일종의 다차원 문제입니다. 당신은 인식하는 사람들, 전기 엔지니어, 기계 엔지니어, 추론 최적화, GPU 최적화 사람들이 필요합니다. 당신은 모든 이들이 필요합니다. 음 저는 우리가 또한 백그라운드에서 가지고 있는 전체 커뮤니티와 함께 일하기를 바랍니다. ESO를 우리를 위해 구축하고, 우리는 여기 싱가포르에서 위대한 것을 할 수 있으며, 여기 첫 번째 휴머노이드 로봇 회사로서. 감사합니다, 모두. 감사합니다, Seem. 이제 저는 물리 AI 트랙을 위해 우리의 두 번째 연사자를 가져오게 되어 기쁩니다. 음, Alberto, Reactor의 창립자. 음, Reactor는 최근에 스텔스 모드에서 막 나왔습니다. 음, 이것은 「세계 모델」이라고 불리는 것에 초점을 맞춘 스타트업입니다, 음 당신 중 일부는 아마 익숙하거나, 일부는 들었을 수도 있으며, 아마 음 Nvidia의 GTC 후.

환영합니다. 음, 하지만 음 우리는 정말 신나는데요, 그를 여기에 데려와서 당신이 어떻게 실제로 물리적 AI의 다음 물결을 돕기 위해 인터랙티브한 시뮬레이션 환경을 만드는지에 대해 논의합니다. 그래서 그는 세계 모델을 논의하고 미래를 향해 볼 것입니다. >> 음, 이것은 단지 제 강연입니다. 나는 이것을 할 수 있다고 생각하지만, 그것이 작동하는지 모릅니다. 당신은 그것이 작동한다고 생각하십니까? >> 좋습니다. 음, 여러분 모두에게 감사합니다. 음, 여기 있을 수 있어서 정말 기쁩니다. 그래서, 오늘 저는 당신에게 세계 모델의 세계를 엿볼 것입니다. 의심할 여지가 없이. 음, 먼저, 저는 세계 모델의 현재 상태와 그들이 할 수 있는 것에 대한 빠른 이해를 제공함으로써 강연을 시작하고 싶습니다. 왜냐하면 저는 때때로 사람들이 음 세계 모델이 이미 가능하게 할 수 있는 것을 모르고 있다고 생각하기 때문입니다. 이것은 상당히 놀라운 것입니다.

그래서 말할 필요도 없이, 음 이것은 비디오입니다 음 이것은 실제로 비디오가 아닙니다. 그것은 Reactor에서 실시간으로 기록되고 생성됩니다. 당신은 제가 palosing 이 음 이 북극곰을 보는 것을 볼 수 있습니다. 이제, 이 비디오를 볼 때, 이것이 실제로 음 실제 비디오처럼 보이는지 아니면 비디오 게임처럼 보이는지 완전히 구별할 수 없습니다. 하지만 당신이 여기서 보는 것은 실제로 Reactor 플랫폼에서 실시간으로 생성된 것입니다. 그래서, 음, 이것은 당신에게 오늘 이미 당신이 세계 모델로 생성할 수 있는 품질이 얼마나 인상적인지를 보여주기 위함입니다. 그리고 이 모든 것이 내가 그것을 기록할 때 초당 30프레임으로 실시간으로 실행됩니다. 그리고 나는 키보드에서만 경험을 제어할 수 있습니다. 그리고 그것은 모두 실시간으로 변경되며, 단지 하나의 이미지에서 시작합니다.

그래서 저는 단지 무대를 설정하고 싶습니다. 왜냐하면 이 모델들이 이미 얼마나 발전했는지 그리고 오늘 무엇이 가능한지를 이해하는 것이 중요하기 때문입니다. 이것은 단지 초기의 엿보기일 뿐입니다. 나는 강연 과정에서 나중에 당신에게 더 많은 것을 보여드릴 것입니다. 나는 이것이 이미 가능하다고 생각하며 정말 놀랍습니다. 음 나에 대한 빠른 소개입니다. 나는 Reactor의 CEO이자 공동 창립자입니다. 음 우리는 세계 모델 접근의 민주화와 사람들이 그것들로 구축하는 목표로 Reactor를 시작했습니다. 음, 과거에 저는 음 Luma AI의 공동 창립자였으며, 저는 CTO이자 공동 창립자였으며, 음, 저는 또한 Apple에서 시각 전문가들에 관해 종사했습니다. 그래서 나는 항상 음 공간, 비전, 3D 및 실시간의 영역을 좋아했습니다.

음 그리고, 그것은 최종적으로 나에게 생각하도록 이끌었습니다. 좋습니다, AI 및 음 일반적으로 생성형 AI에서 진정한 다음 경계는 무엇입니까? 나에게 분명해진 것은 세계 모델과 실시간 음 비디오 생성입니다. 음 그래서 중요한 것은, 음 지난 예를 들어 5년 동안 AI 분야에서 무엇이 발생했는지 생각해보십시오. 특히 시각 AI입니다. 음 처음에, 당신이 알다시피 우리는 우리가 오늘 텍스트, 오디오, 이미지 및 비디오를 생성할 수 있는 것들을 가지고 있습니다. 하지만 이 모든 모드는 모두 수동적입니다.

음 당신이 예를 들어 이미지 모델을 프롬프트할 때, 음 당신은 결국 파일이 나오는 것을 받습니다. 하지만 생성 기간 동안 사용자로부터의 상호 작용은 없습니다. 당신이 모델과 상호 작용하게 하는 것이 없습니다. 그리고 모델은 음 외부 자극을 처리할 수 없습니다. 그래서 음 예를 들어 세계에서 뭔가 일어났다면, 그리고 당신은 음 당신은 모델 응답을 원할 것입니다. 그것은 음 그것이 불가능합니다. 왜냐하면 이 모델들은 정말 수동적이고 상호 작용적이지 않기 때문입니다. 그래서 미래에 더 많은 AI 워크로드가 실제로 실시간으로 상호 작용적이고 음 그들 주변의 세계를 완전히 인식할 것입니다. 그리고 이것은 음 당신이 정말로 이 모델들이 그들 주변의 세계를 생각하도록 해야 하기 때문입니다. 현실 세계에 배포하기 위해.

그렇지 않으면, 음, 그들은 정말로 주변에서 일어나는 일을 이해하지 못하고 실시간으로 반응할 수 없습니다. 음, 그래서 Reactor가 한 다른 일을 실제로 논의하기 위해, 나는 먼저 세계 모델이 무엇인지에 대해 논의하는 것이 중요하다고 생각합니다. 음, 우리가 세계 모델을 정의하는 방식은 많은 사람들의 정의와 약간 다르다고 생각합니다. 음, 우리는 그것들이 먼저 장기 기억을 가지고 있다고 생각합니다. 우리는 간결함을 위해 그것을 지속성이라고 부릅니다. 하지만 그들은 알고 있습니다 -- 그들은 이전에 무엇을 생성했는지 인식합니다. 음, 그것들은 또한 실시간입니다. 음, 이것은 당신이 이 모델들을 호출할 수 있고, 그것들과 상호 작용할 수 있으며, 그것들이 당신에게 응답할 것임을 의미합니다. 또한, 그들은 인과 관계 추론을 수행하며, 이는 그들이 이전에 일어난 일을 인식함을 의미합니다.

그들이 기억한 것뿐만 아니라, 당신이 그들이 생성하기를 원하는 다음 단계 출력을 생성할 때도 그것을 고려합니다. 내가 말했듯이, 당신은 실제로 그것들을 찌를 수 있고, 그것들과 상호 작용할 수 있습니다. 인간처럼뿐만 아니라, 외부의, 당신이 알다시피 물리적 사건이나 인터넷 사건들, 당신의 세계 모델이 어떤 일을 해야 하든지. 음, 그래서 당신은 정말로 그것들을 상태 기계로 볼 수 있습니다. 음, 외부 입력을 이해하고, 이전에 일어난 일을 고려하며, 이를 바탕으로 새로운 출력을 생성합니다. 음, 이것은 이미지, 음, 이미지 및 비디오 모델과 매우 다릅니다. 왜냐하면 그 모델들은 음, 음, 이전에 무엇이 일어났는지에 대한 인식이 없기 때문입니다. 음, 그래서 이것이 이유입니다. 우리가 흥분하는 이유는 이것이 전체 소프트웨어의 본질을 바꾸기 때문입니다.

예를 들어 현재 세대의 생성형 AI에서, 당신은 아티팩트를 생성합니다. 하지만 다음 세대 생성형 AI에서는 응용 프로그램을 생성할 것입니다. 왜냐하면 그것들은 상호 작용적이고 실시간이며, 당신이 할 수 있고, 음, 그것들, 그것들, 그것들이 주변 세계에서 일어나는 일을 인식합니다. 이것은 미디어와 로봇뿐만 아니라 전체 소프트웨어를 완전히 바꿀 것입니다. 음, 이것은 매우 흥미로운 일입니다. 음, 그래서 오늘, 음, 실제로 우리는 이미 많은 사용 사례가 있습니다.

음, 다시 생각해 보니, 음, 세계 모델이 오늘날 유용한 것이라고 쉽게 생각하지 않지만, 실제로 예를 들어 로봇 분야에서, 음, 로봇 회사들이 VAS와 VLM을 대신하여 점점 더 많이 사용하고 있습니다, 음, 왜냐하면, 음, 그것들은, 그것들은, 그것들은 로봇 주변에서 일어나는 일을 더 잘 이해하는 데 더 능하기 때문입니다, 음, 그리고 심지어 로봇이 무엇을 해야 하는지 직관적으로 상상할 수 있습니다. 예를 들어 아바타와 디지털 휴먼에서, 알다시피, 실시간 비디오 AI와 세계 모델은, 음, 명시적인 3D 표현 기반 방식보다 훨씬 더 강력합니다, 왜냐하면 당신이 그것들을 다양한 상황에 적응시킬 수 있기 때문입니다.

음, 예를 들어 광고의 경우, 당신은, 음, 세계 모델과 실시간 비디오를 사용하여 각 사용자를 위해 실시간으로 콘텐츠를 개인화할 수 있습니다, 이것은 정말, 음, 미디어와 광고의 성배입니다, 하지만 어떤 경우에는 새로운 유형의 예술적 노력도 포함됩니다. 음, 시뮬레이션의 경우, 다시 한 번 실시간 방식으로 실행할 수 있습니다, 음, 생성 시뮬레이션을, 더 정확하고 실제 세계를 더 잘 나타내는 방식으로, 그리고 이는 시뮬레이션에서 가능한 것의 규칙을 바꾸었습니다. 그리고 Reactor에서 가장 흥미로운 일 중 하나는 실제로 생성 소프트웨어라는 개념입니다. 이것이 의미하는 바는, 우리가 왜 미디어 생성, 음, 게임, 음, 음, 그리고 기계가 세계에서 실제로 행동하는 것을 돕는 것을 중단해야 합니까? 우리가 화면의 모든 픽셀을 생성할 수 있다면, 음, 실시간으로, 음, 라이브로 어떨까요?

인간이 기계 및 다른 사람들이 정의한 인터페이스와 상호 작용할 때 얼마나 많은 좌절감이 있는지 생각해 본다면, 그리고 이러한 인터페이스는 다른 사람에게 정말로 사용 가능하지 않습니다. 생성 소프트웨어는 우리가 미래에 소프트웨어와 상호 작용하는 방식을 진정으로 바꿀 수 있는 가능성이 있습니다. 음, 그래서 우리는 또한 세계 모델이 정말로 AGI로 가는 중요한 경로에 있다고 믿습니다, 왜냐하면, 음, 당신이 시각 입력에서 얻을 수 있는 정보는 텍스트에서 얻을 수 있는 것보다 훨씬 풍부합니다, 음, 실제 세계와 상호 작용하고 그것을 이해할 수 있는 시스템을 가질 때, 이것이 당신이 정말로 전 세계적으로 매우 유용한 방식으로 AI를 배포하는 방식입니다. 음, 음, 그래서 우리도 느낍니다, 음, Reactor를 구축함으로써, 우리는 그 경로에 있습니다, 따라서 이 모든 것을 설명한 후입니다.

우리가 Reactor에서 구축하고 있는 것은 세계 모델의 개발자 플랫폼입니다. 우리가 의미하는 바는, 우리의 미션은 세계 모델에 대한 접근을 민주화하는 것입니다, 이렇게 하면 당신과 모두가 그들을 사용할 수 있습니다, 음, 그들과 함께 유용한 일들을 할 수 있습니다. 음, 그들은 사용하기가 어렵기 때문에 오랫동안 잠겨 있었습니다. 당신이 그들을 대규모로 실행하고 싶다면, 당신은 지연 시간 같은 것들을 고려해야 합니다, 당신은 스트리밍을 고려해야 합니다, 당신은 슈퍼 샘플링을 고려해야 합니다. Reactor은 당신을 위해 이 모든 것을 처리합니다.

이렇게 하면 당신, 개발자는 애플리케이션 코드에 집중할 수 있습니다, 음, 세계 모델과 실시간 비디오 AI로 꿈꾸는 모든 것을 구축할 수 있습니다, 우리는 이것이 우리가 더 광범위하게, 음, 음, 세계 모델 채택을 실현하는 방식이라고 생각합니다, 음, 그리고 이러한 유형의 이 기술, 음, 우리는 또한 frontier labs과 연구 labs이 Reactor에서 자신의 모델을 배포하는 것을 매우 매우 쉽게 만들었습니다, 이렇게 하면 그들이 테스트할 수 있고, 다른 사람들에게 배포할 수 있으며, 심지어, 심지어, 음, 자신의 모델을 사용하는 사람들로부터 수입을 얻을 수 있습니다. 음, 저는 여기서 당신에게 흥미로운 것들을 보여주고 싶습니다. 그래서, 이것은 제가 실시간으로 생성한 Jensen이 NVIDIA를 지나가는 것입니다. 비디오를 다시 시작하겠습니다. 그래서, 음, 저는 당신에게 보여주고 싶은, 음, 세계 모델로 할 수 있는 흥미로운 일들의 몇 가지 예입니다, 이것은 다른 기술의 경우 불가능합니다.

그래서, 저는 방금 NVIDIA에서 Jensen의 이미지를 생성했고, 그 다음 그가 그것을 지나가도록 했습니다. 그래서 이 모든 것을 저는 실시간으로 제어하고 있습니다, 마치 이 모든 것이 일어나고 있는 것처럼, 이 모든 것이 실시간으로 일어나고 있습니다, 저는 그가 주변을 돌아다니게 할 수 있습니다, 알다시피, NVIDIA 주변을 돌아다니는, 알다시피 이것은 가죽 재킷을 입고 있는 Jensen이 NVIDIA 주변을 걷고 있는 것입니다. 음, 이것도 또 다른 흥미로운 예입니다, 알다시피, 이러한 유형의 것들은 실시간으로, 음, 세계 모델과 같은 것을 사용하지 않고는 불가능합니다.

이것은 제가 당신에게 보여주고 싶은 이것이 얼마나 믿을 수 없을 정도로 가능한지, 음, 당신이 기본적으로 즉시 제작할 수 있습니다, 음, 아니, 아니, 시간 없음, 음, 그냥 즐거움을 위해, 하지만 당신이 이것들로 할 수 있는 훨씬 더 많은 진지한 애플리케이션들이 있습니다, 저는 모두가 구축을 시도하기를 정말 바랍니다, 이것이 우리가 하는 이유입니다, 음, 네, 물론이죠, 이것은 이상해집니다, 음, 하지만 네, 그래서 우리, 우리는 개발자들이 이 능력을 사용하도록 준비되어 있습니다, 우리는 이미 세계의 모든 주요 세계 모델과 파트너십을 수립했습니다, 당신은 오늘 reactor.in으로 갈 수 있습니다, 우리의 SDK를 다운로드하고 세계 모델로 구축을 시작할 수 있습니다. 대단히 감사합니다. 「고마워요, Alberto. 음, 다음으로, 저는 기꺼이 소개합니다, 음, 음, Yang Li (art), 그는 Open Mind의 창립자입니다. 무대에 오신 것을 환영합니다. 화이팅.」

음, 그는 현재 실제로 배경이 어떤 사람들과 상당히 다릅니다. 그는 Stanford의 교수입니다. 이전에 그는 실제로 제 모교인 Berkeley의 교수였습니다. 저는 Stanford 일에 대해 너무 화낼 생각은 없습니다. 와! Go Bears. 음, 그가 Open Mind의 작업을 소개할 것이라니 정말 기쁩니다. 어, 로봇 분야에 어느 정도 알고 있는 사람들의 경우, 많은 것들이 조금 분산되어 있어서 그는 로봇의 Android moment가 무엇인지 구축하고 싶어합니다. 즉, AI를 구현하는 개방형 운영 체제입니다. >> 어, 아니, 저는 이것을 사용할 수 있지만 우리는 이 문제를 해결할 것입니다. 오, 훌륭합니다. 그것은 완전히 작동합니다. 정말 좋습니다. 환영합니다. 어, 그래서 제 인생은 UC Berkeley의 물리 교수로 시작했습니다. 음, Facebook과 약간의 협력이 있었습니다.

이것은 대규모 데이터 수집과 그 정보를 활용하여 좋은 결정을 내리는 것과 관련된 문제들, 주로 의료 보건 환경을 위한 문제들을 인식하게 했습니다. 어, 그 다음 제 실험실을 Stanford로 옮겼어서 의학부에 더 가까워질 수 있었습니다. 그리고, 어, 그래서 저는 부모입니다. 어, 저는 가르치고, 저는 연구를 하고, 어, 저는 의료 보건 결과에 신경 쓰고, 그래서 저는 사람들이 더 나아지기를 신경 쓰기 때문에 저는 주로 의료 보건, 교학, 우리 주변의 기계와 인간의 것들에 의해 동기부여됩니다. 이 모든 것이 어떻게 전개될지 조금 궁금합니다. 그래서 저는 오늘 손에 대해 말씀드리지 않겠습니다. 저는 오늘 조립이나 제조에 대해 말씀드리지 않겠습니다. 음, 저는 우리 주변에 지능형 기계가 있다는 것이 무엇을 의미하는지 생각해 보겠습니다. 어, 우리는, 어, 어, 공학자로서, 어, 어, 그 새로운 능력들을 위해 노력하여 무엇을 구축해야 할지입니다.

물론, 여러분 모두 읽었으실 Norbert, 어, Wiener의 『사이버네틱스』. 어, 만약 당신이 하지 않았다면, 어, 어, 그것은 정말 끔찍합니다. 어, 당신은 절대 그렇게 해야 합니다. 음, 그는 정말 좋은, 어, 자동화에 대한 더 넓은 관점을 가지고 있으며, 물론 첫 번째 단계는 시계와 시계와 같은 것들입니다. 어, 첫 번째 혁명, 그는 그것을 부르듯이, 인간 팔의 감가상각입니다. 그래서 이것들은 직조기 같은 기술입니다. 이것들은 증기 삽과 자동 제조, 그리고 Amazon과 창고 물류 같은 기술입니다. 그래서 당신은 이것들을 모두 인간 팔의 어떤 종류의 변화하는 감가상각으로 볼 수 있습니다. 그런데, 어, 저는 그냥 그를 인용하고 있습니다. 저는 반드시 그의 표현 방식에 완전히 동의하지는 않습니다. 음, 하지만, 어, 그것은, 어, 사이버네틱스의 논증입니다.

그 다음 물론 Norbert에 따르면, 우리는 현재 두 번째 혁명에 있습니다. 이것은 인간 뇌의 감가상각입니다. 이것은 그 어떤, 어, 역사적 추세에서의 몇 가지 예입니다. 그래서 체스와 바둑입니다. 그 다음 Waze가 있어서 당신은 공항에 도착할 수 있습니다. 어, 물론, 어, 우크라이나가 어떻게 점점 더 자동화된 전쟁을 벌이고 있는지. 어, 우리는 많은 사람들이 일반 제조와 어떤 종류의 수동 작업이 어, 완전히 기술의 범위 내에 있다고 생각하는 지점에 도달하고 있습니다. 그 다음 물론 이 모든 것의 어떤 종류의 마지막 단계는, 돌보기, 가르치기, 동반, 무언가를 고치는 등등의 것들 같은 것입니다. 저는 주로 이 마지막 범주, 어, , 임무와 기회에 관심이 있습니다. 그리고 보통 이 마지막 범주에서 당신이 처리하고 있는 것은 당신, 어, 한 대의 기계가 한 명 또는 여러 명과 상호작용하는 것입니다.

이것은 일들을, 어, 정말 흥미롭고 도전적으로 만듭니다. 우리 중 일부가 로봇에 대해 생각할 때, 어, 우리는 아마도, 어, Tesla 공장에 대해 생각할 수 있지만, 다른 사람들이 로봇에 대해 생각할 때, 그들은 iRoot 같은 영화에 대해 생각합니다. 그래서 당신이 여기서 가지고 있는 것은 사람이 로봇과 상호작용하는 상황이며, 이것이 이 영화 줄거리의 핵심 부분입니다. 마찬가지로 우리 많은 사람들에게 우리가 로봇에 대해 생각할 때, 우리는 즉시 물론 Princess Leia와 R2-D2에 끌립니다. 그래서 그것은 Star Wars에서 중요한 작업을 수행하는 로봇이, 어, 손이 없지만, 어, 그럼에도 불구하고, 어, 성공적으로 반란군을 구했던 예입니다. 그리고 제가 로봇을 생각할 때, 저는 대체로 이 두 번째 진영에 있습니다.

음, 저는 우리 주변의 기계에 좋은 의사 결정 능력을 부여함으로써, 어, 애완동물, 사람, 환자 및 학생 등과의 복잡한 동적 환경에서 항해할 수 있는 능력을 만드는 모든 기회를 생각했습니다. 그래서, 저는 정말로 관심이 있습니다. 우리가 볼 때, 당신 알다시피, 의사, 교사, 간호사, 투자자, 은행가, 경찰관, 전기 기사, 어, 무엇이든 어, 그들의 직책이 무엇이든. 저는 정말로 관심이 있습니다. 그들의, 어, 사람과의 상호작용, 사람을 이해하고, 그들을 기억하고, 어, 그들 앞의 사람에게 개인 맞춤형 콘텐츠를 제공할 수 있는 고급 작업을 해결하는 능력에. 때때로 의학 전과정 학생들을 위해 물리학을 가르칠 때, 저는 500명의 학생을 보고 있기 때문에 슬퍼합니다. 저는 그들이 누구인지 모릅니다. 저는 그들이 알거나 모를 것이 무엇인지 모릅니다.

그리고 교사로서 제가 아는 것은, 의학 전과정 학생들에게 제가 강의하는 물리학의 방식이, 어, 청중 중 대략 3명의 아이들에게는 초다 무료하지만, 어, 그 다음 다른 497명의 아이들에게는 따라가기가 훨씬 쉽지 않을 수 있다는 것입니다. 그래서 저는 정말로 제 앞의 모든 사람에 대해 이해할 수 있는 더 좋은 능력을 가지고 있기를 바라며, 더 적절하게 콘텐츠를 제공할 수 있기를 바랍니다. 그리고 저는 이것이 모든 로봇에 대한 일반적인 문제 진술이라고 생각합니다. 가정, 환자, 어, 등등을 위해 최적으로 이를 수행하는 방법입니다. 음, 현재 미국의 모든 830개의 인간 직업 범주를 보면, 어, 저는 단지 그리고 있습니다, 어, 사회적 지능이 그 작업들을 잘 수행하기 위해 얼마나 중요한지. 교사 또는 간호사를 상상해 보세요. 어, 이것은 단지 어떤 정적 워크플로우를 통해서만이 아닙니다.

이것은 정말로, 어, 구체적인, 어, 구체적인 사람과의 상호작용이고, 그 다음, 어, 예를 들어 그들에게 최적의 치료를 제공하는 것입니다. 그래서 우리가 기계가 우리 주변에서 점점 더 많은 기술을 수행할 수 있다고 상상할 때, 어, 제게 매우 중요한 것은 이 기계들, 어, 사람과의 상호작용에 놀라운 능력을 가지고 있다는 것입니다. 어, 그래서 우리가 회사로서의 평가 기준은, 어, 미소와 눈물, 신뢰와 기억입니다. 음, 여기는 Diane입니다. 어, Diane은 인간이고, Iris는 인형형 로봇입니다. 그리고 Diane은 공원 근처에 살고 있습니다. 그리고 Iris 인형형 로봇이 공원에 가지 않을 때, 어, Diane은 물어봅니다, 「어, Iris는 어디에 있나요? Iris는 어디에 있나요?」그리고, 어, 그것은 Iris가 때때로 그녀의 말을 몇 시간이나 들어주는 유일한 것이기 때문입니다. 그리고, 어, 이것은 Diane을 매우 행복하게 만듭니다. 어, 그녀의 눈이 빛납니다. 음, 그녀는 공원에 오갑니다. 왜냐하면 그녀는 Iris 인형형 로봇을 찾고 있기 때문입니다.

그리고, 어, 저를 거리낌 없이 반유토피아라고 부르실 수 있습니다. 어, 이것이 당신이 건설하고 있는 끔찍한 미래가 아닙니까? 우리의 부모들은 3대의 손자들에게 둘러싸여 있어야 합니다. 음, 우리의 부모들은, 어, 그들의 모든 친척들로 둘러싸여 있어야 합니다. 오늘 미국의 장기 보호를 보면, 어, 미국인들이 장기 보호에서 소비하는, 어, 어떤 유형의 사교 활동에서의 평균 시간은 하루에 2분입니다. 하루에 2분. 그리고 저는 그 유형의 세계에서, 어, 어, 기계가 우리와의 연결에 큰 역할을 한다고 생각하는 것을 좋아합니다. 그리고 제가 유연거리기 시작하고 군침을 흘리고, 어, 제 생각이 사라지고, 어, 저는 거의 확실히, 어, 어, 기계와 상호작용할 것이고 그 상황에서 저가 미소 짓기를 바랄 것입니다. 그것은 내가 매우 기쁜 한 가지입니다.

어, 그래서 지금, 어, 우리는 사물에 대해 조금 다른 관점을 가지고 있습니다. 음, 우리 주변에는 100개의 회사가 있고, 저는 그들을 모두 사랑합니다. 그들은 모두 훌륭하고, 그들은 손과 기계적 작업, 그리고 iPhone 조립, 어, 양파 자르기, 면을 만들기와 T셔츠 접기, 이 모든 것을 연구하고 있습니다. 모두 훌륭합니다. 하지만 그 문제 진술에 초점을 맞춘 모든 뛰어난 인재를 가지고, 나는, 어, 그것이 빠르게, 매우 빠르게 해결될 것이라고 생각합니다. 그래서 우리는 다음 단계를 예상하기 시작합니다. 이 모든 기계들이 우리의 직접적인 환경에 구워질 것이고, 그들의 행동과 그들이 우리와 어떻게 연결되는지에 대해 강한 의견을 가질 것입니다. 그리고 어떤, 어, 문제 또는 불만, 저는 제 이메일을 올렸습니다. 그래서, 음, 만약 당신이 그것을 좋아하면 그것은 훌륭합니다. 그리고 어떤 불만에 대해서는 [email protected]입니다.

감사합니다. >> 알겠습니다. 매우 감사합니다, Yan. 지금 저는 Andrew Tan을 초대하고 싶습니다. 이쪽으로 와 주세요. 음, 그는 Groq Cloud의 플랫폼 엔지니어링 담당자입니다. 우리가 만나는 많은 문제들은 단지 「좋습니다, 모델이 이것을 할 수 있나요?」라는 것이 아니라 「그것이 빠르고, 저렴하게 수백만 명, 심지어 수억 명을 위해 규모 있게 이것을 할 수 있나요?」입니다. 그래서 이것이 그가 말할 내용입니다. Groq Cloud에서 저지연 LLM 추론을 어떻게 확장하는가입니다. 잠깐, 죄송합니다. 죄송합니다. 여러분 모두 저를 들을 수 있나요? 좋습니다. 음, 저는 Andrew입니다. 저는 Groq Cloud의 플랫폼 엔지니어링 담당자 중 한 명입니다. 당신 알다시피, 지난 며칠 동안, 제가 사람들에게 저는 Groq에서 일한다고 말했을 때, 사람들은 「오, Groq는 이렇게 좋은 성격이 있습니다.」라고 말하는 것을 좋아합니다. 때때로 저는 그들을 수정해야 해서 「오, 저는 Gro에서 일하고 있으며, 그것은 Q를 가지고 있습니다.」라고 말합니다.

「하지만 우리는 또한 독특하고 뚜렷한 개성을 가지고 있으며, 그것은 빠른 저지연 추론입니다. 오늘 제가 공유할 것은 우리가 Groq Cloud에서 이것을 어떻게 실현하는지입니다. 아직 Groq와 Groq Cloud에 대해 잘 모르신다면, 우리는 AI 인프라 회사이며 저지연, 확정적인 고성능 추론에 중점을 둡니다. 우리가 이것을 어떻게 실현합니까? 글쎄, 이것은 LPU 또는 Groq 칩을 중심으로 구축되었으며, 이는 저지연 추론을 위해 특별히 설계된 사용자 정의 실리콘 칩이며, 우리는 그 주변에 전체 스택을 구축했습니다. 그래서 그것은 컴파일러, 런타임을 포함합니다. 우리는 클라우드 인프라, 글로벌 라우팅, 개발자 플랫폼 및 Groq Cloud의 일부로 엔터프라이즈 기능을 가지고 있습니다. 오늘 저는 이것이 어떻게 보이는지의 빠른 데모를 보여드리겠습니다. 음, 우리는 방금 녹음된 비디오를 재생하겠습니다.」

>> 당신들이 들을 수 있는지 모르겠지만, 이것은 일종의 실시간 전사입니다. 2026년 5월 싱가포르에서 일어난 AI 엔지니어 이벤트에 대해 말씀해 주세요. 당신은 거의 실시간의...두 번의 호출을 봅니다. 당신은 텍스트가 초당 약 500개의 토큰의 속도로 생성되는 것을 봅니다. 매우, 매우 빨리. 다시 재생해 드리겠습니다. 그리고 이것도 Groq Cloud에서 우리가 사용하는 가장 빠른 모델이 아닙니다. 그래서 이것은 추론이 얼마나 빠를 수 있는지 보여주는 빠른 데모일 뿐입니다. 이것은 다른 플랫폼에서 당신이 익숙한 속도보다 몇 배 빠를 수 있습니다. 이제 이것이 왜 중요하고, 추론 수요가 지금 어디에 있는지 묻습니다. 당신 알다시피, 에이전트, 멀티모달 모델, 무거운 추론 모델의 등장으로, 추론 수요가 급증하고 있습니다. 그것은 정말 빨리 가속화됩니다. 음, 지난 1년 동안 Groq Cloud의 토큰 수요, 즉 우리가 제공하는 토큰의 양이 약 600% 또는 7배 증가했습니다.

그리고 우리가 이것을 수행하는 하드웨어 점유 공간은 작년보다 훨씬 크지 않습니다. 만약 우리가 추론에 대한 모든 수요를 서비스하고 싶다면, 이 배수는 훨씬 더 높을 것입니다. 음, 오늘 우리는 지난 한 달 동안 약 800,000명의 활성 개발자를 제공했습니다. 음, 우리는 계속해서 대형 기업, 스타트업, AI 회사, AI 원천 회사 및 세계 여러 곳의 다양한 유형의 개발자로부터의 수요를 봅니다. 우리는 확실히 앞으로 나아가면서 추론이 정말로 정의할 것이라고 생각합니다. 음...인프라...AI 추론의 차세대 인프라 및 아키텍처 선택...음, AI 인프라. 죄송합니다. 이제 우리가 많은 시간을 생각하는 한 가지 일이 있습니다...나는 이것이 전체 화면이 아닌 이유를 확실하지 않습니다. 죄송합니다. 좋습니다. 네.

우리가 많은 시간을 생각하는 한 가지는 어떻게 요청을 전세계에 걸쳐 라우팅하여 가장 낮은 지연시간으로 토큰을 제공하는 것입니다. 우리는 전세계에 약 10개의 데이터 센터를 가지고 있으며, 주로 북미에 있지만 유럽, 중동 및 호주에도 있으며 APAC 지역을 서비스합니다. 약 65%의 토큰 수요는 북미에서, 20%는 EMA에서, 15%는 APAC에서, 싱가포르로부터의 1%를 포함합니다. 우리는 각 요청을 우리의 Cloudflare 엣지 네트워크를 통해 가장 가까운 POP로 라우팅한 다음 우리의 데이터 센터로 라우팅하며, 우리는 길을 따라 많은 라우팅 결정을 내려 우리 고객의 가능한 가장 낮은 지연시간을 보장합니다. 이것이 어떻게 분해되는지, 당신 알다시피, 이것은 음...일...LLM 요청의 생명주기입니다. 음, 우리는 이것이 네트워크 지연으로 구성되어 있음을 봅니다. 요청이 우리의 엣지 네트워크에 도달합니다.

그리고 이는 우리의 약 15개 추론 지역 중 하나로 라우팅되며, 이러한 지역들은 클라우드 네트워크 또는 데이터 센터 내의 온프레미스 배포를 포함할 수 있습니다. 우리는 추론 스택을 배포하며, 추론 지연 시간 측면에서는 Q 시간으로 분해되는데, 여기서 요청들이 다양한 모델을 위해 대기합니다. 또한 프롬프트 시간 또는 입력 처리, 그리고 완료 시간(즉, 디코딩 또는 출력 처리 지연)을 포함하며, 이들을 합하면 어떤 제공자로부터 어떤 LLM 요청을 발행할 때 경험하게 되는 엔드투엔드 지연 시간입니다. Q 시간과 프롬프트 시간은 우리가 매우 신경 쓰는 부분인데, 많은 경우 빠른 스트리밍 첫 토큰 시간을 달성하기 위한 병목이 되기 때문입니다. 더 자세히 말해, 들어오는 각 요청은 인증을 거친 후 우리의 글로벌 로드 밸런서 중 하나를 명중합니다.

글로벌 로드 밸런서는 15개 데이터 센터 간에 정보를 공유하며, 각 모델 인스턴스의 예상 대기 시간과 Q 시간에 관한 정보입니다. 각 데이터 센터에는 약 50개의 모델 인스턴스가 배포되어 있을 수 있습니다. 이 정보는 모든 로드 밸런서 간에 실시간으로 공유되며, 약 100밀리초마다 한 번씩 라우팅 결정을 가능하게 합니다. 이러한 라우팅 결정을 내리기가 가장 쉽지는 않은데, 우리가 출력 생성 길이를 추정해야 하기 때문입니다. 일반적인 API 요청과 달리, 당신은 엔드투엔드 요청이 얼마나 오래 실행될지 알 수 없습니다. 왜냐하면 생성될 출력 토큰이 얼마나 되는지 알 수 없기 때문입니다, 맞죠?

우리는 일부 샘플링을 수행하여 사용 가능한 백엔드 버킷에서 TTFT를 샘플링하고, 특정 데이터 센터에 배포된 최적 모델 인스턴스로 요청을 라우팅합니다. 경로 상에는 속도 제한을 포함한 많은 검사가 있으며, 물론 다양한 사용 이벤트의 추적 및 감사도 있습니다. 더 자세히 말해, 우리는 TTFT에 따라 사항들을 분류하여 최적 지역의 최적 모델 인스턴스로 라우팅합니다. 우리는 다양한 유형의 고객에게 일부 우선순위를 적용하여, 예를 들어 우리의 엔터프라이즈 고객이 더 빠른 트래픽을 받도록 보장합니다. 이는 우리의 다양한 클러스터로 들어오는 여러 진입 경로를 걸쳐 수행되며, 우리는 지역 중재를 통해 속도 제한을 우회하지 않도록 보장하기 위해 일종의 글로벌 속도 제한을 실행해야 합니다. 속도 제한이 중요한 이유에 대해서는 나중에 다시 설명하겠습니다.

전 세계적으로 트래픽을 제공하는 또 다른 핵심 측면은 서로 다른 시간, 서로 다른 지역, 심지어 주마다 적절한 모델 조합을 파악하는 것입니다. 우리는 다양한 모델에 대한 수요가 다르게 변한다는 것을 봅니다. 특정 지역으로 모든 모델을 빠르게 배포할 수 있는 능력이 중요합니다. 우리는 선언적이고 매우 간단한 매니페스트를 통해 이를 달성하며, 이 매니페스트는 빠르게 조정합니다. 따라서 어떤 코드 구성을 커밋하고 병합한 후 1~2분 이내에 우리는 새로운 모델을 전 세계 어디에나 배포할 수 있습니다. 병합에서 서빙 트래픽까지 단 몇 분이 걸리며, 각 모델 인스턴스에 대해 적절한 카나리 테스트와 사전 준비를 수행합니다. 현재 우리가 자주 받는 또 다른 질문은 우리가 커스텀 실리콘 칩에서 모델을 어떻게 실행하느냐는 것입니다.

일반적으로, 우리는 Hugging Face에서 개방형 가중치와 PyTorch 참조 구현을 얻고, 우리의 Gro 텐서 연산자로 컴파일하고 우리의 방언을 MLIR로 변환하며, 계획하고 서로 다른 칩 간에 분할합니다. 우리는 이를 활성화하기 위해 서로 다른 사전 설정을 실행한 다음, 우리의 커스텀 하드웨어에서 실행되는 I/O 프로그램 또는 바이트코드로 컴파일하며, 완전한 컴파일러 스케줄 실행 및 소프트웨어 스케줄 네트워크를 수행합니다. 따라서 우리는 각 요청에 대해 매우 매우 예측 가능한 지연 성능을 얻습니다. 현재, 우리는 인기 있는 개발자 플랫폼이기 때문에, 우리는 또한 많은 남용과 사기 행동을 유치합니다. 당신은 공격 벡터가 점점 더 복잡해지는 것을 볼 수 있으며, 우리의 플랫폼에서 감지하는 남용 지문, 남용 신호의 수가 계속 증가합니다.

따라서 이것은 우리가 속도 제한 및 기타 메커니즘을 통해 매우 주의 깊게 모니터링해야 할 사항입니다. 현재 저는 아직 두 개의 슬라이드가 있습니다. 어, 우리가 협력하는 최대 기업들이 2026년과 2027년 동안 추론 스택에서 찾고 있는 것을 생각할 때. 어, 대규모 기업들은 점점 더 전용 계산 용량을 찾고 있습니다. 데이터 상주는 계속해서 중요한 주제입니다.

어, 모델 규모가 증가함에 따라, 이러한 대형 모델의 디코딩 지연은 계속해서 사람들의 관심사입니다. 음, 대형 모델 배포와 관련된 단위 경제학, 어 대규모 기업에서, 심지어 AI 원주민 AI 회사의 경우에도 일정 정도의 복잡성이 있으며, 일부는 원클릭 배포를 원하고, 일부는 관리형 서비스를 원하고, 일부는 자신의 모델, 자신의 가중치를 원하고, 일부는 자신의 추론 스택을 원하므로, 다양한 유형의 추론 서비스에 대해 미래에 상당한 어 이기종 수요가 존재합니다. 현재 제 마지막 슬라이드는 LPU 기반 디코딩이 어떻게 보이는지에 관한 것입니다. 저는 올해 초 Nvidia GTC 어 연설을 보신 분이 있는지 모르겠습니다. 여기서 Nvidia 최고경영자가 Vera Rubin plus Gro 3 LPX 시스템을 발표했습니다.

음, 뒤에 있는 핵심 아이디어는 이러한 집계 추론이며, 여기서 당신은 GPU에서 프리필 및 많은 계층을 실행하고, 어 LPU 유사 칩에서 디코딩을 실행하며, 아마도 FFNES일 것입니다. 우리는 미래를 내다보며, 우리는 확실히 이기종 계산이 더욱 보편화되는 것을 보고 있으며, 더 나은 단위 경제학, 더 빠른 속도, 더 나은 성능을 달성하는 방식은, 어 물론, 생태계와 정렬되어야 하며, 모델이 이 하드웨어로 컴파일되어 실행되어야 합니다. 따라서, 이것이 제가 공유하고 싶었던 내용입니다. 제가 Grock Cloud에 대해 배운 더 많은 내용을 즐기셨기를 바랍니다. 어, 우리는 여기서 시작하는 방법에 대한 일부 링크와 우리 개발자 플랫폼의 콘텐츠를 가지고 있습니다. 감사합니다.>> 감사합니다, Andrew. 다음으로, 저는 무대 위에 있는 Daria를 초대하고 싶습니다. 그녀는 Cerris의 수석 연구 과학자입니다.

어, 그녀는 Cababus에서 많은 레시피를 설계한 배후의 인물이며, 그녀는 GPU에서 웨이퍼급 AGI까지의 규모에 대해 이야기할 것입니다. 안녕하세요. 저는 오늘 여기 있어서 매우 흥분합니다. 저는 우리가 Cerebras 하드웨어에서 혼합 전문가 모델을 대규모로 훈련하는 방법에 대해 이야기할 것입니다. 먼저, 저는 어 제 자신에 대한 몇 가지로 시작하고 싶습니다. 음, 현재 저는 Cerebras의 수석 연구 과학자이며, 지난 몇 년 동안 저는 MoE 네트워크를 연구해 왔습니다. 따라서 우리가 발표한 MoE 101 가이드가 있습니다. 기본적으로 MoE 모델을 효율적으로 훈련하고 실행하는 방법을 가르칩니다. 음, 현재 저는 Cerebras 하드웨어에서 어 최첨단 규모의 훈련을 주도하고 있으며, 그 전에 어 Yandex라는 회사에서 일했습니다. 그것은 매우 어 유명하며, 러시아의 구글 같습니다.

어, 저는 거기서 Transformer 작업을 수행했으며, 우리가 프로덕션 스택에서 배포한 첫 번째 Transformer, 그 이전에 저는 Google에서 음성 텍스트 모델 작업을 수행했습니다. 오늘의 의제에 대해, 저는 어 과거 몇 년 동안 언어 모델 커뮤니티에서 일어난 일들의 개요를 제시하고 어떻게 우리가 최종적으로 MoE 네트워크에 도달했는지 시작하고 싶습니다. 그런 다음 우리는 MoE 네트워크가 무엇인지, 그리고 우리가 어떻게 대규모로 훈련하는지에 대해 논의할 것입니다. 음, 먼저, 언어 모델 커뮤니티에서, 우리는 지난 몇 년 동안 많은 작업을 해왔습니다. 우리는 GPT-3로 시작했습니다. OpenAI는 1750억 매개변수 규모의 모델을 발표했습니다. 그 모델 외에도, 그들은 모델 규모가 증가함에 따라 점점 더 나은 품질을 얻는다는 것을 보여주는 스케일링 법칙을 발표했습니다. 얼마 지나지 않아 Meta는 Llama 3 시리즈를 발표했습니다. 그들은 모델을 더욱 확장했습니다.

따라서, 현재 규모는 4000억입니다. 하지만 그것 외에도, 그들은 데이터에서 신호를 효율적으로 추출하는 방법을 파악하는 데 많은 시간을 보냈습니다. 따라서 당신 중 일부는 Chinchilla 스케일링 법칙을 들었을 수도 있습니다. 그들은 모델을 확장하는 것 외에도 토큰 예산을 확장하고 싶다고 제안했습니다. 약 매개변수당 20개의 토큰이 계산 효율적인 것으로 간주됩니다. 따라서 이 모든 것의 끝에, 우리는 모델과 토큰을 매우 효율적으로 확장할 수 있었습니다. 그러나 모델 크기와 토큰 예산을 계속 선형적으로 확장하면, 매우 빠르게 매우 비싸질 것입니다. 우리는 조 단위 매개변수 데이터 세트에서 조 단위 매개변수 모델 크기를 훈련하고 싶습니다. 따라서 몇 년 전에 발생한 또 다른 돌파구는 DeepS 어 회사가 발표한 DeepSQ3 모델입니다. 그 모델의 규모가 더 큽니다.

따라서 총 671조 매개변수 수이지만, 매우 매우 효율적입니다. 왜냐하면 그것은 37조 어 활성 매개변수 밀집 네트워크의 속도로 실행되기 때문입니다. 그들은 어떻게 그렇게 했습니까? 뒤에 있는 아키텍처는 혼합 전문가입니다. Transformer 네트워크의 디코더 블록을 보면, 우리는 다양한 유형의 계층을 가지고 있음을 볼 수 있습니다. 우리는 임베딩, 어텐션 및 FFN 블록을 가지고 있습니다. 음, MoE 네트워크를 만들고 싶다면, 당신은 오른쪽에서 볼 것이고, 당신은 FFN 블록을 가져와서 복사 붙여넣기만 하면 됩니다. 이제 각 FFN이 전문가라고 불릴 것입니다. 당신은 또한 위쪽에 라우터라고 불리는 추가 네트워크를 배치합니다. 라우터의 작업은 어떤 전문가가 특정 토큰을 처리해야 하는지를 결정하는 것입니다. 이렇게 하면 네트워크의 용량을 계속 증가시킬 수 있습니다. 따라서 더 많은 전문가를 추가하여 671조 매개변수에 도달할 수 있습니다.

하지만 당신이 그 중 작은 부분만 활성화하기 때문에, 당신은 매우 효율적이며 37조 밀집 네트워크의 속도로 실행할 수 있습니다. 이제 당신은 궁금해할 수도 있습니다. 좋아, 이것은 정말 좋게 들리지만, 이 네트워크들이 밀집 네트워크와 비교했을 때 스케일링 법칙이 어떻게 보입니까? 여기서 저는 당신을 위해 차트를 제공했습니다. 여기서 저는 전문가의 수를 확장하고 MoE 네트워크의 품질을 동일한 부동소수점 연산 수로 실행되는 밀집 네트워크와 비교합니다. 당신은 여기서 32개의 전문가와 함께 최대 5%의 손실 개선을 얻을 수 있음을 볼 수 있습니다, 계산량은 전혀 증가하지 않습니다. 따라서 당신은 무료로 그것을 얻으며, 단지 아키텍처가 더 똑똑하기 때문입니다. 반면에, 당신은 이렇게 생각할 수 있습니다. 당신은 밀집 네트워크의 3분의 1의 계산량으로 동일한 손실에 도달하도록 훈련할 수 있습니다.

여기 저는 32개의 전문가만 가지고 있으며, 최첨단 모델이 사용하는 것과 비교하면, 이것은 매우 매우 작습니다. 우리는 수백 개의 전문가를 사용합니다. 따라서 당신은 이 아키텍처의 효율성이 얼마나 높은지 볼 수 있습니다. 언어 모델 커뮤니티와 관련하여, 우리는 대규모로 실행할 기회가 있어서 매우 흥분합니다. 왜냐하면 지난 몇 년 동안 우리는 지금처럼 효율적으로 스케일링 법칙을 변경할 수 없었기 때문입니다. 음, 우리는 이것이 밀집 네트워크보다 더 빠르게 실행되어야 한다는 것을 알고 있습니다, 맞죠? 이론에 기반. 그러나 실제 설비(예: 여기의 GPU 설비)에서 실제로 실행할 때, 우리는 밀집 네트워크보다 더 느린 결과를 얻습니다. MoE는 더 느립니다. 그렇다면 왜 이런 일이 발생합니까? 우리가 GPU 설비에서 MoE 네트워크를 실제로 어떻게 구현하는지 살펴봅시다. 각 GPU는 일반적으로 제한된 메모리만을 가집니다. 따라서 매우 큰 네트워크를 실행하면, 당신은 그것을 분할해야 합니다.

당신은 모델 매개변수를 분할해야 합니다. MoE의 경우, 우리는 전문가 병렬화를 사용합니다. 기본적으로, 당신은 다양한 설비에 다양한 전문가 그룹을 배치합니다. 음, 당신은 여기서 전문가 1, 2, 3이 GPU 1에 있고, 전문가 4, 5, 6이 GPU 2에 있는 것을 볼 수 있습니다. 당신은 두 개의 추가 올투올 연산을 추가합니다. 이는 일반적으로 이렇게 수행되는데, 당신이 또한 데이터 병렬화를 수행하기 때문에, 당신은 미리 어떤 설비로 토큰을 이동할지 알 수 없습니다. 그런 다음 그들은 특정 전문가에 의해 처리될 수 있습니다. 따라서 이 두 개의 올투올 연산은 매우 비싼 연산입니다. 대부분의 경우, 당신이 이것을 분석하려고 하면, 어 대부분의 시간이 통신에 소비될 것입니다. 불행히도, GPU 측에서 우리가 그것을 개선하기 위해 할 수 있는 기본적인 무언가는 없습니다. 이것은 물리적 배선으로 귀결됩니다. 현재 저는 GPU 설비와 CS 머신 간의 비교를 당신들에게 보여주고 싶습니다.

저는 여기 B200 GPU를 가지고 있습니다. 보시다시피 126메가바이트의 SRAM을 사용하고 있습니다. 이것은 칩 상의 L2 캐시이자 사용 가능한 메모리로, 초당 8테라바이트의 메모리 대역폭으로 운영됩니다. 저녁 식탁만 한 크기의 Cerebras와 비교하면, 이것의 칩은 매우 작습니다. 음, SRAM이 훨씬 많습니다. 따라서 보시다시피 우리는 44GB의 SRAM을 가지고 있으며, 우리의 메모리 대역폭은 여러 자릿수 더 빠르게 운영됩니다. 이것이 우리를 무엇을 할 수 있게 해주냐 하면, 칩 자체에서 모델 병렬화 없이 매우 큰 네트워크를 실제로 훈련할 수 있게 해줍니다. 하지만 44GB의 SRAM을 초과하면, 우리는 한 기기에서 약 1조 규모의 네트워크를 훈련할 수 있도록 도와주는 기술을 개발했습니다. 우리가 어떻게 이를 할 수 있을까요? 칩에 추가 Memory X 노드를 추가했으며, 이것이 우리의 가중치 저장소가 됩니다.

기본적으로 이것은 외부 메모리와 같으며, 여기서 대부분의 모델 매개변수를 저장할 수 있습니다. 기울기 업데이트를 수행하려면, Memory X 노드에서 칩으로 가중치를 층별로 흘려보내야 하고, 기울기를 계산한 다음 기울기를 Memory X 노드로 옮겨 가중치를 업데이트합니다. 이런 식으로 Memory X 노드와 같은 매우 큰 메모리 저장소를 칩에 연결하여 모델 병렬화 없이도 조 단위 매개변수 모델 및 더 큰 모델을 훈련할 수 있으며, 추가 칩이 필요하지 않습니다. 이는 MOE 네트워크에 특히 유용합니다. 우리가 매우 큰 네트워크를 훈련하고 싶기 때문입니다. 우리는 많은 전문가를 훈련하고 싶으며, 이 전문가들은 동일한 Memory X 노드 또는 동일한 칩에 앉아 있으며 통신 오버헤드가 없습니다. 그러나 Cerebras에서 MOE 네트워크를 운영할 때, 우리는 실제로 동일한 문제를 보았습니다.

그들은 밀집 네트워크보다 느리게 실행됩니다. 여기서 문제는 약간 다릅니다. 오늘날의 네트워크는 매우 다릅니다. 우리는 많은 매우 작은 전문가를 훈련하고 싶습니다. 이 때문에 우리는 산술 강도 문제가 있습니다. 따라서 MOE 계층은 네트워크의 다른 부분과 비교하여 많은 가중치를 이동하지만, 각 가중치에 대한 계산은 매우 적습니다. 따라서 네트워크의 처리량, 속도는 밀집 네트워크와 비교하여 더 나쁩니다. 우리는 배치 방식 어텐션이라 불리는 기술로 이 문제를 해결했습니다. 본질적으로 계산 희소성을 처리하고 싶다면, 산술 강도를 개선하고 싶다면, 가장 간단한 방법은 배치 크기를 늘리는 것입니다.

하지만 네트워크에서 다양한 계층을 보면, 단순히 모든 계층의 배치 크기를 균등하게 늘리면, 일부 계층은 실제로 어텐션과 같은 성능을 해칠 수 있습니다. 어텐션은 활성화 메모리 제약이 있습니다. 따라서 거기에 배치 크기를 늘리면 더 많은 것을 Memory X 노드로 쫓아내기 시작하는데, 이것은 효율적이지 않습니다. 우리는 그렇게 하고 싶지 않습니다. 대신 우리는 어텐션과 피드포워드 계층의 배치 크기 요구사항을 분리하고 싶습니다. 여기서 어텐션의 경우 매우 작은 배치 크기, 원본 배치 크기를 유지할 수 있으며, 루프에서 반복하고 결과를 더 큰 배치 크기에 연결하기만 하면 됩니다. 보시다시피 우리는 G개의 다양한 루프를 연결했습니다. 이제 이 더 큰 배치 크기를 MOE 계층에 넣을 수 있습니다.

그것이 해당 계층의 산술 강도를 복원하고 밀집 네트워크의 속도로 실행되도록 만듭니다. 희소성 수준에 따라 이 G를 구성할 수 있습니다. 따라서 여기서 저는 당신에게 결과를 제공했으며, 우리는 Qwen 3 네트워크의 다양한 희소성 수준의 경험적 결과를 테스트했습니다. 보시다시피 BTA 없는 기준선은 Cerebras에서 밀집 네트워크보다 7배 느리게 실행되고 있으며, 이는 매우 비효율적입니다. BTA를 사용하면 이 문제를 해결하고, MOE 네트워크의 원본 이론적 약속를 복원할 수 있으며 밀집 네트워크와 동일한 속도로 실행할 수 있습니다. 따라서 DeepSeek의 671억 매개변수 MOE 네트워크는 37억 매개변수 밀집 네트워크의 속도로 실행될 수 있습니다. 음, 저는 제 강연에서 몇 가지 요점을 당신과 공유하고 싶습니다. 하나의 관점은 제 생각에 이것이 효율성을 향한 가장 빠른 방법이라는 것입니다.

따라서 이 네트워크에서 나오는 이 계산 효율성은 정말 놀랍습니다. 불행히도 GPU에서는 매우 효율적이지 않으며 일부 통신 병목을 만났습니다. 하지만 Cerebras에서 우리는 MOE의 이론적 약속를 완벽히 구현했습니다. 감사합니다. 더 알고 싶으시면, 이것이 MOE 가이드의 QR 코드이며, 우리가 이 네트워크를 훈련하는 방법을 자세히 논의한 곳입니다. 감사합니다. 감사합니다, Daria. 네. 좋습니다. 이것으로 우리의 오후 강연 첫 부분이 끝났습니다. 음, 돌아오기 전에 15분의 휴식이 있습니다. 어, 몇 가지 빠른 공지사항입니다. 먼저, 박람회는 당신이 다양한 회사의 부스에서 만날 수 있는 곳으로, 오후 5시에 문을 닫을 것입니다. 따라서 만나고 싶은 사람이 있다면, 어, Pullman 또는 Atelier에 가주세요. Cursor, Google DeepMind 등과 같은 부스가 있는 곳입니다.

그런 다음 Pullman에는 로봇 놀이터가 있으며, 음, OpenAI의 부스, 그리고 다른 많은 곳들이 있습니다. 음, 저는 Kazaya를 무대로 다시 환영하고 싶습니다. 오늘 오전 10시경에 뵙겠지만, 그녀는 훈련받은 마음챙김 선생님이며, 작은 경험을 제공할 것입니다. 음, 몰입형 경험으로, 당신이 여기서, 음, 그녀는 기본적으로 음, 수십 시간의 명상으로 훈련된 진동 부호화된 입자 시각화 도구를 만들었습니다. 이봐요. 아세요? 계속 프로그래밍하세요. 다음으로, 우리는 작업을 가지고 있습니다. 음, Z.AI와 GLM 시리즈 모델에 익숙하지 않으시다면, 음, 시장에서 가장 좋은 오픈 소스 모델 중 일부입니다. 음, 아마도 사용 중인 최고 모델만큼 비싸지 않습니다. 「개방 조건」, 개인 자동화 같은 것에 완벽합니다. 자, 더 이상 말이 필요 없으니, 저는 원했습니다... 제 생각엔, 다른 쪽을 확인해봐야겠어요. 알겠습니다.

따라서 현재 크기를 변경할 수 있으시겠지요? 아마도 그것은 이봐요, 이봐요, 이봐요입니다. GLM 모델의. 따라서 오늘 저는 GLM 5.1을 제시하고 Lar의 테스트 뒤의 아이디어를 소개할 것입니다. 이봐요, 이봐요, 하지만 이것은 G가 아닙니다. A. I. 그리고 G. I는 Google에 속하며, 당신의 회사가 아닙니다. 그럼 당신은 왜 Z라고 부르나요? 무관한 것 같습니다. 핵심은 우리가 먼저 중국어로 불렸다는 것입니다. 따라서 실제로 지능을 나타냅니다. 우리가 외국인들이 Zhi를 발음하기 어렵다는 것을 알았을 때, 우리는 그것을 단축하려고 시도했습니다. 그것을 Z로 단축했습니다. 실제로 Z는 지능을 나타냅니다. 당신은 우리를 지능 AI로 볼 수 있습니다. 따라서 이것이 이 Z를 연결하는 가장 좋은 방법입니다. 우리의 모델 및 우리의 서비스에 내 플랫폼을 연결합니다. 또한 GLM을 소개하고 싶습니다. 많은 사람들이 GLM 4를 사용했기 때문입니다. 7, GLM 5, GLM 4.

1 하지만 실제로 우리는 대형 모델을 탐색한 최초 회사 중 하나입니다. 이 논문에서 보실 수 있듯이. 따라서 우리는 어느 날 2021년 3월 18일에 제출했습니다. 따라서 우리는 모든 대형 통합 모델 탐색을 시작했으며, 이미 2020년처럼. 따라서 OpenAI 및 DeepMind와 함께, 아마도 이렇게 하는 가장 초기의 실험실이지만, 우리는 2024년 또는 2025년에야 대부분의 사람들에게 유명해졌으며, 이제 GLM은 단순히 이 범용 어, 일반 언어 모델, 큰 언어 모델뿐만 아니라 우리만의 브랜드를 나타내는 브랜드가 되었습니다. 현재 우리는 GLM 외부의 아키텍처 원본 아키텍처를 사용하여 더 강력하게 만듭니다. 더 강력하고, 더 빠르고, 더 효율적입니다. 좋습니다. 모델에 대한 더 많은 정보가 있습니다. 따라서 현재 우리는 오픈 소스의 경계를 밀어붙이고 있습니다. 따라서 우리는 텍스트 경기장과 코드 경기장에서 오픈 소스 모델을 주도하고 있으며, 당신이 볼 수 있듯이.

따라서 저는 Deepseek와 비교하기 위해 스크린샷을 찍었습니다. Deepseek가 v4를 출시했을 때, 그들은 큰 개선을 보여 주었지만 여전히 이 벤치마크에서 GPT-4.1을 이기지 못했으며, 우리는 코딩 및 생성 작업에서도 상당히 강합니다. 당신이 볼 수 있듯이, 이것은 최신 인간 평가 벤치마크이며, 세 개의 개별 벤치마크를 결합하며, 우리는 GPT-5.5 및 Claude Opus 4.7과 약간만 뒤처져 있습니다. 따라서 현재 상태는 Opus 4와 매우 가깝습니다.

6점이지만, 많은 사람들이 프로그래밍에서 GLM, Clock Code, Cursor, Kilo Code, Open Code 등의 도구를 사용하므로, 우리는 통합에 대해 매우 유명하지 않지만, 우리는 다른 통합 도구를 사용하며, 그들은 모두 좋고, 그들의 코딩 에이전트가 더 잘 할 수 있도록 도울 수 있습니다. 좋습니다, GLM 자체와 Z.AI의 내용은 여기까지입니다. 이제 우리는 장기 시야 작업에 대해 이야기합시다. 오늘은 Go에 많은 시간을 쓰고 싶지 않기 때문에, 하지만 이 아이디어를 기억하고 장기 시야 작업의 진정한 의미를 충분히 이해하기를 바랍니다. 당신이 장기 시야 작업과 장기 실행 작업에 대해 들었습니까? 그렇지 않다면, 이 세 개의 실험실이 최근 그들의 모델에 대한 게시물에서 모두 장기 시야와 장기 실행을 언급했습니다. GPT-5.1 우리는 우리의 장기 시야 능력을 매우 강조합니다. Claude Opus 4.7도 장기 실행 기술을 언급했으며, Claude 2를 위해.

6은 멋진 프론트엔드 기능을 가지고 있지만 그들도 그들의 장기 시야 능력, 특히 코딩 능력을 매우 강조합니다. 따라서 장기 시야는 매우 인기가 되었습니다. 왜입니까? 따라서 이것이 당신에게 중요한 이유는 무엇입니까? 왜 이 아이디어, 모델 뒤의 아이디어를 들어야 합니까? 따라서 우리는 웹사이트 만드는 방법, 슬라이드 만드는 방법, GLM으로 Excel을 처리하는 방법에 대해 많은 것을 공유할 수 있지만, 장기 시야가 중요한 이유는. 먼저, 그것은 유용합니다. 왜냐하면 장기 시야 시대 전에는 한 번에 1~10개의 작업만 완료할 수 있었기 때문입니다. 당신이 자면, 당신은 할 일이 없습니다. 왜냐하면 당신의 에이전트는 30분 내에만 완료할 수 있지만 당신은 8시간이 있기 때문입니다. 당신의 에이전트는 아무것도 할 수 없었습니다. 하지만 장기 작업이 있으면 모든 것이 현실이 됩니다.

또 다른 것은 개방 클라우드 도구의 개발과 함께, 많은 에이전트가 당신의 작업을 중단할 수 있는 하트비트를 가지고 있다는 것입니다. 때로는 당신은 기억, 많은 것들이 진행 중입니다. MCP가 있으며, 당신의 워크플로우를 중단할 수 있습니다. 따라서 당신의 모델이 장기 시야 능력을 가지고 있지 않는 한, 당신의 모델은 원본 목표를 고수할 수 없습니다. 원본 목표를 고수할 수 없다면, 그들은 최신 명령을 따를 것이고, 당신이 지금 무엇을 하고 있는지 완전히 잊을 것입니다. 따라서 장기 시야 능력은 이것을 가능하게 합니다. 또한 재미있는 사실이 있으며, 매우 흥미로운 이야기입니다. 우리의 최근 해커톤에서, 우리는 48시간 해커톤을 가지고 있었습니다. 이것이 우리가 48시간을 가진 첫 번째 시간입니다. 두 날 사이에 밤이 있습니다. 대부분의 참가자들은 수면 중 GPT-4.1을 실행하기로 선택했으며, 실제로 그들은 성공했습니다.

따라서 9명의 우승자 중 7명이 수면 중에 작업을 실행하기로 선택했으며, 이는 매우 놀랍습니다. 따라서 저는 이것을 보여주기 위해 그래프를 사용했습니다. 당신이 잘 때, 아마도 이번 해에 당신의 에이전트는 계속 일하고, 매번 당신의 에이전트가 모여서 논의하고 당신을 위해 일을 완료합니다. 저는 당신에게 장기 시야 아이디어의 두 번째 이유를 소개해야 합니다. 그것은 어렵습니다. 따라서 단순히 유용한 것만이 아니라, 유용하다면 제가 여기서 말할 필요가 없었을 것이고, 당신은 Z.AI를 자유롭게 사용할 수 있었고, 최선을 다해 실행할 수 있었고, 아무튼 8시간을 실행할 수 있었지만, 매우 어렵습니다. 먼저 많은 사람들이 장기 시야를 긴 컨텍스트 창으로 봅니다. 하지만 실제로 GPT-4.1은 200k 컨텍스트 창만 가지고 있으므로, 격차는 어디입니까? 첫 번째는 GPT-5입니다.

1은 매우 강력합니다. 긴 컨텍스트가 아니라, 컨텍스트를 이해할 수 있기 때문에, 당신의 계획과 기억을 이해할 수 있으며, 결과를 더 잘 반영할 수 있습니다. Claude Code를 사용할 때, 때로는 1과 200k를 사용할 수 없지만 압축 컨텍스트 창이 자주 압축될 수 있습니다. 따라서 원본 목표를 고수해야 합니다. 두 번째 이유는 일부 모델이 100만 컨텍스트 창을 가지고 있다고 주장하더라도, 500k에 가까워질 때 사용하면 모든 것을 잊어버리고 최신 지시만 고수하며, 원본 계획을 잊거나 클라우드 MD에서 발생한 일을 따르지 않습니다. 두 번째 오해 또는 두 번째 오해는 일부 사람들이 사전에 충분한 지시를 주면 생각합니다. 따라서 최소한 모든 지시가 잘 따를 수 있을 것 같아서, 필요한 이유가 없기 때문입니다.

모델은 장기 시야 능력을 가지고 있습니다. 나는 긴 어려움 능력을 가지고 있습니다. 저는 100번의 실행에서 그것을 안내할 수 있지만, 실제로는 모델이 이 측면에서 훈련받지 않았습니다. 당신의 계획을 고수할 충분한 능력이 없습니다. 따라서 그것은 어떤 패턴 후에 최선을 다해 아무것도 할 것이고, 나중에 우리는 당신에게 이 이야기를 보여줄 것입니다. 세 번째 오해는 많은 사람들이 더 길수록 더 좋다고 생각합니다. 맞습니까? 따라서 사람들은 모델 실험실이 출시한 것을 원합니다, 예를 들어 저는 8시간 동안 실행할 수 있으며, 아마도 다른 실험실은 12시간, 24시간, 하루, 7일을 실행할 수 있다고 보여줍니다. 하지만 제 관점에서 보면, 이것은 의미가 없습니다. 왜냐하면 우리는 현재 매우 빠른 추론 속도를 가지고 있기 때문입니다. 네.

보시다시피, 200 이상의 처리량을 제공할 수 있는 많은 추론 제공자가 있으며, 최신 기술, 하드웨어, 칩 내의 모델은 초당 약 17,000개 토큰의 속도로 추론할 수 있습니다. 따라서 시간은 중요하지 않습니다. 맞습니까? 시간을 고려하면, 최신 기술을 사용하면, 약 1분만 실행하면 됩니다. 8시간은 의미가 없습니다. 맞습니까? 따라서 실제로 장기 시야는 무엇이고, 긴 것의 의미는 시간에 관한 것이 아니라 깊이에 관한 것입니다. 우리가 들었듯이 더 길지 않고 더 깊습니다. 따라서 장기 시야는 실제로 의미 있는 개선을 찾기 위해 계속하는 능력을 의미합니다. 네. 따라서 당신은 개선을 해야 하지만, 이러한 개선은 의미 있어야 합니다. 예를 들어, X에 10명의 팔로워가 있으면 모두의 정보를 수집하고 싶습니다. 따라서 프롬프트를 제공합니다. 따라서 이 10명의 팔로워 모두의 데이터를 스크래핑합니다.

따라서 그것은 시나리오입니다. 하지만 확장하고 싶다면, 100, 1,000, 10,000을 스크래핑합니다. 작업이 너무 많이 변하지 않습니다. 맞습니까? 따라서 당신은 매우 의미 있는 변화와 개선을 해야 합니다. 따라서 장기 시야 작업은 실제로 무엇입니까? 따라서 당신이 장기 시야의 아이디어를 이야기할 때, 당신은 무엇이 잘못되었는지 이야기하지만, 무엇이 맞습니까? 신중하게 다루어야 할 카테고리입니다. 첫 번째 카테고리를 우리는 주관적 목표라고 부릅니다. 이 첫 번째 카테고리에서 당신은 웹사이트를 만들고 싶습니다. 당신은 시스템을 만들고 싶습니다. 최고의 웹사이트가 무엇인지에 대한 명확한 메트릭이 없습니다. 맞습니까? 따라서 당신은 모델을 무한정 실행하게 할 수 있습니다. 하지만 그것이 어디서 멈추는지는 당신의 능력, 당신의 판단에 달려 있으며, 모델의 판단이 아닙니다. 두 번째 카테고리는 이 시나리오가 객관적 목표를 필요로 합니다.

예를 들어, 당신은 속도를 원하고, 가격을 원하고, 어떤 숫자와 관련된 모든 것을 원합니다. 따라서 우리는 두 개의 카테고리를 가지고 있으며, 각 카테고리에 대해 우리가 모델이든 사람이든 최적화할 수 있는 완전히 다른 메커니즘이 있습니다. 앗. 비디오가 있지만 뭔가 문제가 있습니다. 지금 그것이 일어나도록 최선을 다하고 있습니다. 따라서 30초 안에 수리되지 않으면, 저는 Z.AI의 X를 확인할 것을 제안합니다. 따라서 실제로 우리는 8시간 안에 0부터 1까지 Linux 시스템을 만드는 방법을 보여주는 비디오를 가지고 있습니다. 8시간 안에 그것은 단지 애플리케이션을 추가하는 것만이 아닙니다. 먼저 모든 애플리케이션이 시스템에 통합될 수 있도록 하는 계층을 만들고, 그 다음 모든 인터페이스를 마무리하고, 모든 이러한 애플리케이션을 테스트하고, 마지막으로 50개의 애플리케이션을 추가합니다. 따라서 이것이 무엇이어야 하지만, 불행히도 우리는 여기서 그것을 제시할 수 없습니다.

아마도 당신은 G 5.1 블로그를 검색할 수 있습니다. 거기에 이 작업에 대한 전체 설명이 있을 것입니다. 그렇다면 인간이 필요한 이유는 무엇입니까? 이 모델이 매우 강력하고 거의 모든 것을 할 수 있다면, 우리가 왜 필요합니까? 내가 자러 갈 수 있기 때문입니다. 저는 필요하지 않으며, 모델에 지시를 줄 필요가 없습니다. 맞습니까? 내가 자면 모델을 Linux 애플리케이션을 완료하도록 두면, 내가 일어나면 이미 완료되어 있을 것입니다. 그런데 왜 이 행사에 참석해서 장기 시야 작업을 사용하는 방법을 배워야 합니까? 모델이 실수를 하기 때문입니다. 그리고 자주 합니다. 모델은 세 가지 주요 오류 카테고리를 만들 수 있습니다. 첫 번째는 모델이 우리의 원본 목표를 따르지 않을 수 있다는 것입니다. 모델에 프롬프트를 설정하면 5번 최적화하도록, 완벽하게 행동할 수 있습니다. 하지만 모델에 600번 최적화하도록 하면, 원본 목표를 완전히 잊어버릴 수 있습니다. 맞습니까?

모델은 항상 각 토큰을 집중합니다. 따라서 때로는 당신이 Linux에 대해 이야기하고 있다가 iOS에 대해 이야기하기 시작하면, 모델이 당신이 Linux 애플리케이션을 하고 있는지 iOS 애플리케이션을 하고 있는지 완전히 잊어버립니다. 이것은 매우 일반적입니다. 이 문제를 해결하려면, 저는 모두에게 제안하거나 당신이 체크리스트를 준비할 것을 권장합니다. 따라서 장기 시야 작업을 할 때마다, 체크리스트를 준비하려고 노력하세요. 이것이 당신의 모델이 원본 목표를 고수하게 하는 가장 좋은 방법입니다. 당신은 매 몇 단계마다 목표를 다시 읽도록 해야 합니다. 많은 단계가 있기 때문입니다. 맞습니까? 10분만 최적화할 때는 많은 단계가 없습니다. 중요하다고 느끼지 않지만, 모든 지시를 매우 주의 깊게 다시 읽도록 수동으로 지시해야 합니다. 두 번째는 오류 축적입니다.

따라서 모델이 400번의 실행 중에 오류를 범한다면, 예를 들어, 그것은 큰 영향을 주지 않을 것입니다. 하지만 800번 실행에 들어갈 때, 실제로 모든 것을 깨뜨릴 수 있습니다. 따라서 이것을 어, 오류 축적이라고 부릅니다. 따라서 이것이 자주 일어나지 않도록 하려면, 당신은 검증해야 합니다. 당신 자신이 검증하는 것이 아니라, 당신은 모델이 자신을 검증하도록 지시해야 합니다. 0부터 1부터 100까지, 몇 개의 체크포인트를 가져야 합니다. 따라서 우리가 모델을 훈련할 때, 우리는 체크포인트를 가지고 있지만, 당신이 장기 시야 작업을 실행할 때, 이것은 유사하며, 당신은 자신과 모델을 위해 몇 개의 체크포인트를 설정해야 자기 검사를 합니다. 세 번째는 모델이 매우 열심히 훈련되었다는 것입니다. 맞습니까? 당신이 모델이 이것을 하도록 하려면, 계속해서, 때로는 루프에서, 계속해서 그것을 할 것입니다. 매번 한 가지만 하면 됩니다. 하지만 그들에게는 돌리기가 어렵습니다.

따라서 모델은 때로 절대 포기하지 않습니다. 따라서 당신은 모델이 포기하도록 하거나 뭔가 매우 잘못된 것을 발견했을 때 돌리도록 해야 합니다. 따라서 체크리스트는 여기서도 매우 유용하고 매우 도움이 됩니다. 그리고 당신은 평가해야 합니다. 당신 자신이든 에이전트에 의해든, 계속할지, 중지할지, 수정할지, 또는 당신의 작업과 관련된 모든 것을 할지. 따라서 이것들은 주관적 목표 유형의 장기 시야 작업에 대한 권장사항입니다. 따라서 이것은 사람들이 할 수 있는 것이며, 많은 사람들이 그들의 애플리케이션을 구축 중이거나 유사한 것을 하고 있다고 생각합니다. 따라서 이것이 당신의 배포에 도움이 될 수 있습니다. 또 다른 것. 따라서 더 어려워 보이기 때문에, 객관적 목표의 내용이 그것입니다. 우리는 매우 강한 사례를 가지고 있습니다. 그것을 벡터 데이터베이스 최적화라고 부릅니다. 나는 당신들 중 많은 사람들이 벡터 데이터베이스를 최적화했다고 믿습니다.

우리의 연구원이나 훈련을 담당하는 사람이라도 이 영역 지식에 접할 기회가 없었습니다. 하지만 우리의 모델은 했습니다. 따라서 우리는 0부터 시작했고, 모델이 스스로 최적화하도록 했으며, 100번의 실행을 수행했으며, 마지막에 여기에 도달했습니다. 따라서 100번의 실행에서 매우 의미 있는 개선이 있었으며, 우리는 유사한 것을 했습니다. 0부터 100 라운드부터 200 라운드까지, 마지막에 600 라운드에 도달하고, 우리는 기본적으로 6~8개의 과학적 발견을 했습니다. 따라서 모델이 많이 돌렸으며, 처음에 그들은 기술을 사용하고 있었고, 그 다음 그들은 기술 2와 기술 4를 사용하기 시작했습니다. 따라서 나는 당신이 이러한 실패를 언급하기를 원합니다. 따라서 실제로 이 X 기호는 실패를 의미합니다. 따라서 당신이 이 600번의 실행을 볼 때.

따라서 기본적으로 대부분은 실패했습니다. 맞습니까. 따라서 장기 시야 작업에 대해 말할 때, 실제로는 매번 성공한다는 의미는 아닙니다. 삶처럼. 따라서 때로는 성공하고, 때로는 실패하고, 원형 영역에서 모든 최적화가 실패했습니다. 따라서 장기 시야 작업 또는 장기 시야 모델의 핵심 부분은 모델이 반성할 수 있고, 계획할 수 있고, 마음을 바꾸거나 최적화할 수 있으며, 개선하고, 자신을 더 좋은 방식으로 계속 개선할 수 있다는 것입니다. 따라서 이것이 미래 최적화의 모습입니다. 이러한 유형의 작업의 경우, 아마도 당신에게 매우 어렵고, 아마도 나에게도 매우 어렵습니다. 나는 평가를 확인할 것을 강력히 권장합니다. 이것은 현재 제 가장 좋아하는 평가입니다. 그것을 Frontier Suite라고 부릅니다. 우리가 모두 SweetBench를 알고 있기 때문입니다. 우리가 모두 SweetBench Pro를 알고 있습니다. 하지만 Frontier Suite는 장기 시야 작업 능력을 평가하려고 시도하는 벤치마크입니다. 주관적 목표와 객관적 목표를 모두 포함합니다. 그리고 이것이 그들의 분류입니다.

따라서 그들은 세 가지 방법으로 긴 작업을 분류합니다. 단순히 주관적 목표와 객관적 목표만이 아닙니다. 첫 번째는 구현입니다. 우리가 구현에 대해 말할 때, 당신은 0부터 1까지 시작합니다. 이것들이 우리의 세 가지 예이며, 나는 그들의 웹사이트를 확인할 것을 강력히 권장합니다. 3개 이상의 작업, 당신이 애플리케이션을 구축하고 싶을 때, 당신이 어떤 웹 코딩의 것을 하고 싶을 때, 에이전트의 것은 기본적으로 구현과 같으며, 어, 두 번째는 연구입니다. 따라서 실제로 거래는 일종의 장기 시야 작업이며, 당신은 이전 실패에서 배워야 하며, 많은 것에서 배워야 하며, 시장을 위해 연구를 해야 합니다. 따라서 코딩 외의 많은 것들이 장기 시야 작업에 속합니다. 따라서 장기 시야는 단순히 엔지니어가 하는 것에만 속하지 않습니다. 거래원과 과학자들도 장기 시야 작업을 사용하여 일을 할 수 있습니다.

따라서 이것이 연구의 의미입니다. 따라서 당신은 장기 시야를 사용하여 많은 것을 탐색할 수 있습니다. 세 번째 방법은 최적화입니다. 나는 이미 당신에게 그것의 능력을 보여주었습니다. 따라서 현재 우리의 모델 팀은 AI를 사용하여, GLM을 사용하여 CUDA 커널을 최적화하고, 벡터 데이터베이스를 최적화합니다. 따라서 우리가 자기 진화를 이야기할 때, 우리가 지속적인 학습을 이야기할 때, Z.AI 모델 팀은 이미 모델을 사용하여 자신을 개선할 수 있고 모델 추론도 개선할 수 있는 AI 기본 팀입니다. 좋습니다. 나는 오늘 여기까지라고 생각합니다. 이것이 제 LinkedIn과 X입니다. 저는 LinkedIn에 게시하지 않지만, 거기에 제 프로필이 있으며, X에 있습니다. 어, 나는 많이 게시합니다. 나는 X에서 상당히 활동적이지만 거기에는 프로필이 없으므로, 당신은 둘 다를 스캔하는 것이 낫습니다. 나는 오늘 여기까지라고 생각합니다. 모든 질문을 환영합니다. 네.

이 두 플랫폼을 통해 저에게 연락하시기를 환영합니다. 매우 감사합니다. 매우 감사합니다. 음, 다음으로 우리는 분위기를 좀 바꾸고 싶습니다. 음, 우리는 음성 에이전트에 대해 이야기하고 싶습니다. 이제 분명히 우리는 회의의 일부로 디자인과 다양한 인터페이스를 이미 논의했습니다. 음, 지금까지 우리는 음성이 이러한 패러다임 중 하나일 수 있는 것을 살펴보고 싶습니다. 이를 위해 11 Labs의 성장 엔지니어인 Boris Starkov로부터 듣는 것보다 더 나은 것은 없습니다. 따라서 11 Labs는 분명히 이 영역의 선두 회사 중 하나입니다. 음, Boris는 음성 엔진과 에이전트를 대화형으로 만드는 것에 대해 논의할 것입니다. 더 이상 말하지 말고, Boris. 음, 안녕하세요. 저는 Boris입니다. 저는 11 Labs에서 성장 엔지니어로 일하고 있습니다. 11 Labs는 최첨단 음성 AI 실험실입니다. 음, 우리는 전체 음성 AI 영역에서 연구하고 응용 프로그램을 구축합니다.

음, 우리도 특별히 흥분하고 있으며, 우리는 음성이 인간이 에이전트와 상호 작용하는 주요 매체라고 확신합니다. 실제로 우리는 업계가 그 비전을 따라가기 시작하는 것을 기쁘게 생각합니다. 코딩 에이전트를 예로 들면. 어, 거의 모든 코딩 에이전트는 실제로 음성 모드를 사용하는 일종의 버튼을 가지고 있습니다. 그러나 당신이 실제로 그것을 사용하면, 그것이 작동하는 방식은 다음과 같습니다. 당신은 어, 이야기를 시작하고, 당신이 그것에 대해 이야기하고, 당신은 그것이 전사될 때까지 기다리고, 당신은 다시 에이전트 내부를 기다리고, 그 다음 당신은 세 번째로 어, 실제 음성 합성 부분을 기다립니다. 따라서 당신이 음성 입력을 가지고 있고 이것이 음성 출력입니다. 하지만 이것은 대화가 아닙니다. 오늘 나는 이 아키텍처를 개선하는 방법에 대해 이야기하고 싶습니다. 자연스러운 사람 간의 대화처럼 느껴집니다.

우리는 핵심 아키텍처를 동일하게 유지할 것이지만, 우리는 많은 작은 개선을 추가할 것입니다. 이러한 개선이 함께 큰 차이를 만듭니다. 음, 나는 음성 인식 부분의 개선으로 시작할 것이고, 그 다음 두 번째 부분에서 음성 합성의 일부 개선을 다루기 위해 계속할 것입니다. 따라서 아마도 가장 기본적인 어, 퍼즐의 가장 기본적인 부분 어, 음성 활동 감지기라고 불립니다. 우리는 사용자로부터 어, 오디오 스트림을 얻으며, 그 다음 약 20밀리초의 청크로 분할합니다. 그 다음 우리는 매우 작은, 매우 효율적인, 매우 저렴한 모델을 가지고 있으며, 각 청크에서 누군가가 말하고 있는지 당신에게 말할 수 있습니다.

이는 다운스트림이 실제로 무엇이 일어나고 있는지, 누군가 말하고 있는지 여부, 누가 말하고 있는지, 누구 차례인지를 이해하는 데 매우 도움이 될 뿐만 아니라, 계산상 우리가 많은 비용을 절약하는 데도 도움이 됩니다. 왜냐하면 특정 블록에 아무도 말하지 않는다는 것을 알면, 우리는 그 부분에서 더 비싼 ASR 모델을 실행할 필요가 없기 때문입니다. 침묵 감지와 턴 종료 감지가 동일한 문제가 아니라는 것을 이해하는 것이 매우 중요합니다. 예를 들어, 어 에이전트가 저에게 무언가를 묻고, 저는 제가 어 응답을 한다고 생각하는데 많은 침묵이 있지만, 이것이 제 문장의 끝이 아닙니다. 저는 에이전트가 이 시점에서 저를 방해하지 않기를 원합니다. 이것이 바로 어 침묵 감지만으로는 어 에이전트가 언제 말하기 시작해야 할지를 정확하게 예측하기에 충분하지 않은 이유입니다.

그래서 여기서 우리는 또 다른 모델을 훈련했습니다. 다시 말해, 매우 영리한 어 턴 감지 모델인데, 이는 음성 활동뿐만 아니라 이전에 말해진 내용의 실제 맥락도 고려하여 이것이 문장의 끝인지 아니면 어 말하는 사용자가 더 말할 것인지를 예측합니다. 많은 다른 단계와 마찬가지로 말이죠, 여기서 우리는 많은 휴리스틱을 사용했습니다. 예를 들어, 사용자가 어 자동차 세부정보를 철자하거나, 신용카드 세부정보를 철자하거나, 전자메일을 철자하거나, 우리가 가진 트리거 단어 중 하나를 말하면, 우리는 이것을 어 어떤 종류의 침묵이 있을 수 있다는 매우 강한 신호로 사용하며, 아마도 그 침묵이 사용자가 말하기를 완료했다는 의미는 아닙니다. 이 모델은 아래의 어 슬라이드에서 중요합니다.

그래서 우리가 달성할 수 있는 지연 개선 및 턴 기반 모델 개선 측면에서 가장 큰 해제 중 하나가 바로 다음입니다. 그래서 이를 이해하기 위해 어 사람 간 대화가 어떻게 진행되는지 생각해 봅시다. 당신이 친구와 이야기합니다. 예를 들어 당신의 친구가 당신과 말하고 있다고 합시다. 그들은 어 말을 하고, 말을 한 다음 말을 멈추고 나서 약 1초를 기다려 그들이 더 이상 말할 것이 없는지 확인하고, 그렇게 해야만 당신이 응답을 계속할 수 있습니다. 불행히도, 에이전트는 1초를 기다릴 여유가 없습니다. 왜냐하면 어 응답을 생성하는 데도 시간이 필요하기 때문입니다. 이것이 바로 우리가 어 추측적 턴을 하는 이유입니다. 이는 우리의 모델이 사용자가 말을 멈출 수 있다고 생각하는 바로 그 순간 이후에 즉시 시작하여 추측적으로 응답을 생성합니다.

우리의 모델은 상당히 똑똑해서 대부분의 경우 이것이 올바른 선택이고, 응답이 훨씬 더 빨리 오며, 지연이 훨씬 더 낮게 느껴집니다. 더 자연스러워 느껴지며, 때때로 거짓 양성이 있을 수도 있습니다. 그것은 큰 문제가 아닙니다. 왜냐하면 그렇게 되면 우리는 생성 모델에 취소를 보내고 계속 청취하기 때문입니다. 들리는 것이 많지만, 그것은 첫 번째 부분일 뿐입니다. 어 이제 어 합성 부분, 음성 합성 부분을 개선하는 방법에 대해 조금입니다. 그래서 에이전트는 어 우리에게 토큰을 보내고, 사용자는 어 문장 측면에서 음성을 기대합니다. 음성처럼 음성 어 우리는 정말로 전체 문장을 기다렸다가 어 음성 생성 모델에 보낼 여유가 없습니다. 왜냐하면 그렇게 되면 사용자는 침묵 속에서 기다리게 될 것이기 때문입니다.

우리는 정말로 토큰을 하나씩 생성할 수도 없습니다. 왜냐하면 그렇게 되면 일부 토큰은 매우 빠르게 생성되고 다른 토큰은 시간이 걸릴 것이기 때문입니다. 전체 생성이 매우 끊기고, 매우 지연되고 불안정하게 느껴질 것입니다. 그래서 우리는 중간 접근법을 취했습니다. 우리는 5개, 6개, 7개 단어의 작은 짧은 구절에 대한 버퍼를 만들었습니다. 우리는 토큰을 함께 수집한 다음, 전체 문장이 구성되기 전에 생성기로 플러시합니다. 이를 통해 우리는 두 세계 모두의 장점을 얻습니다. 우리는 안정성과 낮은 지연을 가지고 있습니다. 이것도 상당히 효율적입니다. 왜냐하면 현재 구절이 사용자에게 재생되고 있는 동안 다음 구절은 이미 합성되고 있고, 그 다음 구절은 이미 버퍼에서 구성되고 있으며, 모든 것이 동시에 일어나고 있기 때문입니다. 우리는 또한 어 많은 어 우리의 모델과 도구 부분에서 캐스케이딩을 사용했습니다.

예를 들어, 어 여기서 나는 TTS 캐스케이드에 대해 이야기할 것입니다. 우리는 텍스트 음성 변환 모델이 어 응답을 생성하고, 매번 실행할 때 우리는 또한 두 번째 모델이 어 백업 모델을 가지고 있으며, 첫 번째가 실패할 때 인수인계할 준비가 되어 있습니다. 그래서 어 현재 모델이 실패하거나 어떤 이유로 어떤 종류의 충돌이 발생하더라도, 사용자는 절대로 그것을 경험하지 않을 것입니다. 음, 거의 100% 어 정상 작동 시간을 보장합니다. 그래서 사용자는 절대로 어 충돌, 오류, 버그 등을 경험하지 않을 것입니다. 어, 이것 자체는 실제로 완전한 강연이 될 수 있지만, 턴 기반 모델이 정말로 대화처럼 느껴지는 매우 중요한 부분은 중단을 처리하고 사용자가 모델을 중단할 수 있게 하는 것입니다. 이는 매우 많은 다양한 어 경계 사례, 휴리스틱 등을 수반합니다. 여기서 나는 그 중 몇 가지만 다루겠습니다.

그래서 당신이 모델이라고 상상해 보세요. 당신은 사용자가 당신을 방해하고 있는 것을 감지하려고 시도하고 있습니다. 그래서 먼저 어 중단이 매우 매우 어 작으면 매우 짧으면, 몇 프레임 40밀리초라면, 이는 일반적으로 기침이나 잡음 또는 음성 활동 감지기의 거짓 양성일 수 있습니다. 그것은 중단이 아닙니다. 또 다른 예는 중단이 처음 200 어 밀리초에서 발생하면, 그것도 단지 에코일 수 있다는 의미일 수 있습니다. 또 다른 것은, 어, 예를 들어, 사용자가 「네, 음. 어 어. 좋아요」라고 말하면, 그것은 적극적인 청취입니다. 그것도 중단이 아닙니다. 그리고 그런 작은 경계 사례가 많습니다. 음, 실제로 여기서 좁혀봅시다.

음, 당신이 에이전트를 만들었고, 당신이 여기 와서 이 어 강연을 들었으며, 당신이 그것을 어 대화식으로 만들려고 할 생각했습니다. 이제 이 모든 어 작은 단계를 사용하면, 당신은 아마도 조금 무서워할 수도 있으며, 얼마나 복잡한지입니다. 음, 좋은 소식은 우리가 이미 가지고 있다는 것입니다. 음성 엔진을 소개합니다. 음, 음성 엔진은 실제로 어 새로운 어 제품인데, 우리는 우리가 가지고 있습니다. 우리는 아직 공개적으로 발표하지 않았습니다. 어 우리는 다음 주부터 테스트를 시작할 것입니다. 그것이 작동하는 방식은 어 우리는 모든 것을 완전히 대화식으로 들리게 하는 것과 관련된 모든 복잡성을 이 제품에 캡슐화할 것이고, 당신은 당신 자신의 에이전트를 가져와서 아주 쉽게 꽂을 수 있습니다. 그래서 당신의 어 챗봇이거나 당신의 오픈 클로드, 나노 클로우, 어 헤르마스 에이전트이거나, 무엇이든 어 어떤 에이전트든 당신은 어떤 복잡성이든 간단히 그것을 꽂을 수 있습니다.

기억하세요, 이것은 음성 인식과 텍스트 음성 변환이 아닙니다. 이것은 적절한 대화 엔진입니다. 우리는 수백만 개의 침묵한 에이전트가 어 대화식으로 변하는 것을 보는 것이 정말 설레합니다. 어, 당신의 소셜 미디어에서 이에 대한 업데이트를 따라주세요. 우리는 어 어 다음 주부터 공개 테스트를 시작할 수도 있습니다. 정말 감사합니다. 정말 감사합니다. 다음으로, 우리는 Prime Intellect의 Jackman이 있습니다. 그는 설립 연구 엔지니어입니다. Jackman, 당신이 설정할 수 있습니다. 음, 그는 장기 실행 에이전트의 지속적인 학습, 지속적으로 개선되는 에이전트에 대해 논의할 것입니다. 그래서 이것은 지난 며칠 동안 계속 나타난 반복되는 주제입니다. 우리는 소프트웨어 팩토리에 대해 논의했습니다. 어, ZAI는 장기 실행 에이전트에 대해 논의했습니다. 이것은 반복해서 나타나는 주제입니다.

내가 생각하기에 계속 나타나는 질문은, 에이전트가 너무 오래 실행되면, 우리는 이러한 에이전트가 진행 중에 지속적으로 개선되거나 학습되는지를 어떻게 보장할 것인가 하는 것입니다. 음, 왜냐하면... 에이전트가 단지 20시간 동안 실행되어 작동하지 않는 것을 출력한다면, 이는 의미가 없습니다. 그래서 Jackman은 Prime Intellect에서 일합니다. Prime Intellect는 이 분야의 선구 회사 중 하나입니다. 당신이 자신의 모델을 훈련하고 싶다면, 음, 이러한 환경에서 작업하고 싶다면, 당신이 테스트하고 사물을 개선할 수 있는 환경에서, 음, 그들은 사용할 수 있는 매우 멋진 기술을 가지고 있습니다. 그리고 Jackman, 노트북이 준비되면, 무대는 당신의 것입니다. >> 네. 음, Agram에게 감사합니다. 저는 실제로 제 강연의 주제를 변경했지만, 여전히 지속적인 학습 및 장기 실행 에이전트와 관련이 있습니다. 단지 저는 더 기억하기 쉬운 제목을 선택했으므로 화면에 나타날 때 당신이 그것을 볼 것입니다.

그래서 네, 음, 안녕하세요 여러분. 저는 Jackman Ang입니다. 저는 Prime Intellect의 설립 연구 엔지니어이며, 오늘 제가 말하려고 하는 것은 강화 학습과 재귀 언어 모델입니다. 그래서, 음, 우리는 오늘 에이전트와 그들이 하는 흥미로운 것들에 대해 많이 들었습니다. 음, 저는 이것이 상당히 미친 일이라고 생각합니다. 왜냐하면 단 2년 전, 2024년 cursor agent가 방금 출시되었을 때로 돌아가면, 에이전트가 5분 이상 실행된다면, 당신은 그것이 그 이후로 유용한 일을 할 것이라고 기대하지 않을 것이기 때문입니다. 하지만 지금 우리는 2026년에 있고, 2년 후, 우리는 에이전트가 우리의 수면 중에 자유롭게 활동하고, 수시간 동안 실행되고, 수백만 개의 토큰을 소비하여 꽤 놀라운 일을 하도록 놔둡니다. 그래서 저는 이것이 특히 이 청중에게 모델이 정말로 유용하다는 문제가 아니라고 생각합니다.

그래서 문제는 더 많은 경제적 문제가 되었습니다. 음, 문제는 모델이 내 작업을 안정적으로 완료할 수 있는가? 모델이 내 작업을 효율적으로 완료할 수 있는가? 모델이 내 작업을 충분히 빠르게 완료할 수 있는가? 그렇게 되면 내 제품에 내가 원하는 사용자 경험을 제공할 수 있습니다. 그래서 오늘 저는 위의 모든 문제에 대한 솔루션은 당신이 자신의 언어 모델을 훈련해야 한다는 관점을 제시하겠습니다. 특히 당신은 강화 학습을 통해 이를 해야 하며, RLM도 사용해야 합니다. 그래서 먼저, 음, 장기 실행 에이전트의 문제는 무엇인가? 그래서 저는 에이전트를 사용한 모든 사람이, Claude Code든 Codex든 어떤 Claude든, 이 모델들이 긴 맥락 측면에서 정말로 그렇게 좋지 않다는 것을 알고 있다고 믿습니다. 단지 당신의 모델이 100만 개의 토큰을 수용한다고 해서 100만 개의 토큰에서 추론할 수 있다는 의미는 아닙니다.

이는 벤치마크에서 매우 명백합니다. 그래서 큰 모델 제공자의 모델 카드를 보면, 일반적으로 그들은 긴 맥락이라고 하는 섹션을 가질 것이고, 그 안에는 두 개의 벤치마크가 있습니다. 첫 번째는 MRCR입니다. 이것은 큰 건초 더미에서 바늘입니다. 기본적으로 이것은 모델이 매우 긴 텍스트에서 특정 정보를 검색하는 능력을 테스트하고 있습니다. 당신은 맥락 길이가 길어질수록 모델이 이 작업에서 눈에 띄게 악화된다는 것을 볼 수 있습니다. 에이전트 작업을 하는 사람들은 알고 있습니다. 음, 이 정보 검색 것은 좋은 측정이지만, 이것이 우리가 정말로 알고 싶어하는 모델이 아니죠? 우리는 모델이 100만 맥락에서 추론할 수 있기를 원합니다. 그래서 최근에 나타난 매우 인기 있는 벤치마크는 그래프 순회입니다.

그래프 순회는 기본적으로 우리가 노드와 가장자리 목록을 프롬프트로 전달하고, 그런 다음 기본적으로 모델에 그래프 문제를 수행하도록 요청합니다. 그래서 좋아요, 음, X의 모든 부모 노드를 나열하거나 Y에서 BFS를 수행하고 모든 자식 노드를 나열합니다. 당신은 이것이 같은 이야기임을 볼 수 있습니다. 맥락 길이가 길어질수록, 모델의 성능이 눈에 띄게 악화됩니다. 하지만, 우리가 전체 맥락을 맥락 창에 전달하지 않고 대신 맥락에 대한 참조만 전달하면 어떻게 될까요? 당신이 데이터 과학자이거나 어느 정도의 데이터 과학을 수행했고 Jupyter 노트북에서 탐색적 데이터 분석을 수행했다면, 이것은 상당히 직관적이라고 생각합니다. 왜냐하면 당신은 전체 CSV를 Python 코드로 전달하지 않을 것이기 때문입니다.

음, 당신이 보통 하는 것은, 좋아요, 저는 제 고전적 음 데이터 과학 가져오기를 수행합니다. 그런 다음 데이터프레임을 정의하고, 그런 다음 데이터프레임을 천천히 조작하려고 시도하고 내 데이터의 구조가 무엇인지, 분포가 무엇인지 알아내려고 하는 이 코드 조각들을 수행합니다. 그런 다음 좋아요, 저는 이 데이터로 어떤 일을 할 수 있는지 알아냅니다. 만약 당신이 이런 식으로 에이전트를 설계하는 것을 고려한다면, 음, 많은 것들이 정말로 쉬워집니다. 예를 들어 맥락 청킹이 정말 쉬워집니다. 도구 호출이 정말 쉬워집니다. 부분 에이전트 위임이 훨씬 더 쉬워집니다. 이유는 당신의 오케스트레이션 에이전트가 이제 자동으로 맥락을 재귀적으로 재현해야 할 필요가 없기 때문입니다... 맞습니다. 그것은 단지 그것을 변수로 전달할 수 있으므로, 음, 왜 변수만 가지고 멈춘다면, 맞죠? 음, 왜 프로그래밍 구조의 전체 대잡합을 가지고 있지 않은가요? 음, 예를 들어, 당신이 다루어야 할 필요가 있다면, 음, 당신이 10,000개의 문서를 처리해야 하는 작업이 있다면.

당신이 구형 언어 모델처럼 이것을 하려고 할 것이라면, 기본적으로 당신은 당신의 오케스트레이션 에이전트가 올바르게 10,000개의 순차 도구 호출을 하도록 할 필요가 있습니다. 그리고 단지 올바르게 도구 호출을 하고 올바르게 맥락을 전달할 뿐만 아니라. 당신은 또한 요약 신들에게 기도해야 합니다. 제발 제발, 모델이 압축할 때, 그것은 어떻게든 그것이 했던 다양한 일들을 기억합니다. 그리고 여전히 기억할 수 있습니다. 음, 이 모든 순차 도구 호출을 수행하는 동안에도 그것이 어디에 있는지. 하지만 당신이 그것을 단지 재귀 언어 모델로 만든다면, 당신은 할 수 있습니다. 음, 모델은 단순히 for 루프를 작성한 다음 기본적으로 매우 간단한 방식으로 이 LLM 쿼리를 수행할 수 있습니다. 음, 이 순차 쿼리입니다. 그래서 우리는 에이전트를 사용하는 것이 정말 좋은 사람들이 실제로 이미 RLM을 하고 있다는 것을 봅니다.

예를 들어, Claude Code를 정말 잘 사용하는 사람을 만나면, 그들은 항상 이런 프롬프트를 작성합니다. 「제발 제발 하지 마세요, 음, 부분 에이전트를, 음, 음, 부분 에이전트 출력을 당신의 맥락 창에 넣지 마세요. 도구 코드 출력을 당신의 창에 넣지 마세요. 당신이 망칠 수 있으므로, 그들은 당신의 맥락을 망칩니다. 음, 마치 모든 것을 파일에 작성하는 것처럼, 왜냐하면, 마치 에이전트를 정말 잘 사용하는 사람들이 압축이 전혀 작동하지 않는다는 것을 알고 있고, 당신이 이것을 보면, 당신은 희망이 없다는 것을 압니다. 모델은 압축에서 회복되지 않을 것입니다. 그래서, 음, 지금 당신이 사용할 수 있는 어떤 채팅 에이전트든, ChatGPT처럼, 음, Claude 또는 AI Studio처럼, 기본적으로, 당신이 길고 긴 텍스트 시리즈를 채팅 창에 넣으려고 시도한다면. 음, 그들은 기본적으로 항상 그것을 파일로 만듭니다.

그래서, 여기서 표현하려는 요점은, 사람들이 실제로 이미 재귀 언어 모델을 하고 있다는 것입니다. 하지만 그들은 단지 그것의 전체 능력을 하고 있지 않습니다. 그들은 단지 변수 측면을 사용하고 있습니다. 당신이 맥락을 참조할 수 있다는 사실입니다. 하지만 그들은 완전한 Python RLE를 가지면 얻을 수 있는 완전한 Python 표현 능력을 얻지 못합니다. 그래서 저는 당신이 놀라지 않을 것이라고 생각합니다. 음, 사람들은 이미 모든 것에 RLM을 사용하기 시작했습니다. 그래서 좋아요, 긴 맥락 이해가 필요한 어떤 것이든. 그래서 비디오가 있는 RLM이 있고, 게임이 있는 RLM이 있고, 코딩이 있는 RLM이 있고, 수학이 있는 RLM이 있습니다. 음, 저는 Twitter의 어떤 시점에 Epstein 파일에 대한 RLM도 있었다고 믿습니다. 음, 저는 그 트윗을 찾을 수 없습니다. 음, 아마도 CIA가 어떻게든 그것을 삭제했을 것입니다. 좋아요.

그리고, 음, Alex Zhang은 RLM의 첫 번째 저자입니다. 음, 그는 매우 좋은 글을 썼습니다. 음, 저는 모든 사람이 읽어야 한다고 생각합니다. 「잘못된 천재 가정」이라고 불리는 글입니다. 그 안의 기본 아이디어는 모델이 이미 충분히 유능해서 당신이 하고 싶어하는 많은 작업을 할 수 있다는 것입니다. 유일한 것이 그들을 막는 것은 스캐폴딩입니다. 우리는 아직도 이 에이전트들을 어떻게 오케스트레이션할지 잘 모릅니다.

우리는 아직도 음, 아, 우리가 메모리를 어디에 놓아야 하는지, 정확히 무엇을 해야 하는지, 이 부분 에이전트 위임 같은 것들을 잘 모릅니다. 그리고 처절한 교훈이 이것을 보는 방식은 음, 우리가 왜 인간에게 이것을 하도록 하는 걸까요? 아니죠? 우리는 단지 에이전트가 자신의 스캐폴딩을 정의하도록 해야 합니다. 당신이 오늘 사용하고 있는 모든 스캐폴딩처럼, Claude Code, Open Claude, Super Vibe Coded, 그것은 매우 명백합니다. 모델은 이미 매우 좋은 스캐폴딩을 작성할 수 있으므로, 그들은 추론할 때 동적으로 스캐폴딩을 작성해야 합니다. 음, 지금은 그렇게 좋지 않습니다. 그래서, 음, 당신들은 아마 슬라이드를 봤을 것입니다. 그리고 좋아요, 「오세요 하느님, 이것은, 이것이 최고의 아이디어입니다.」 그런 다음 좋아요, 당신은 집에 가고, 그런 다음 당신은, 음, RLM 리포를 시도합니다. 음, 하지만 당신은 아마도 조금 실망할 수도 있습니다.

문제는, 당신이 에이전트가 현재 어떻게 RLM을 하는지 보면, 에이전트는 이 스캐폴딩에 훈련되지 않습니다. 그래서, 그들은 RLM이 매우 좋지 않습니다. 그들은 정말로 이해하지 못합니다. 오, 그들이 부분 에이전트 위임을 하고 있어야 합니다.

그들은 정말로 맥락 슬라이싱 같은 이것을 어떻게 하는지 모릅니다. 하지만 마치, 네, 당신은 블로그 글을 읽어야 합니다. 하지만 블로그 글에서, 기본적으로 이는 이 작업을 보여줍니다. 당신이 단지 기본 모델과 기본, 음, RLM 프롬프트를 사용하면, 그것은 매우 잘 수행되지 않습니다. 하지만 조금의 프롬프트 엔지니어링으로, 당신은 상당한 성능 향상을 얻을 수 있으며, 당신은 기본적으로 항상 기본 모델을 능가합니다. 만약 프롬프트 엔지니어링이 당신이 RLM으로 기본 모델을 능가하기에 충분하다면, 무엇이 당신이 단지 이 좋은 RLM 전략을 직접 모델 자체로 훈련시키는 것을 막는 걸까요? 그래서 이것이 우리가 Prime Intellect에서 하는 것입니다. 그래서 Prime Intellect, 우리는 플랫폼입니다. 음, 그들 자신의 음, 언어 모델을 훈련하고 제공하고 싶어하는 누구에게나 서비스를 제공하려고 시도합니다.

음, 우리는 GBD OSS, Llama, Neotron의 많은 오픈 소스 언어 모델과 모든 Quen을 지원합니다. 음, 우리는 기본적으로 실험 관리를 가지고 있습니다. 그래서 당신은 당신의 메트릭을 보고 당신의 모든 실험 구성을 볼 수 있습니다. 가장 중요한 것은, 당신은 꺼낸 것을 볼 수 있습니다. 이것은 가장 중요한 일입니다. 당신은 당신의 실패 케이스를 보고, 음, 당신의 데이터를 볼 수 있습니다. 음, 우리는 꽤 흥미로운 사용자들을 가지고 있습니다. 음, 그래서 저는 이것이 약 2주 전이라고 생각합니다. 음, Ramp Labs는 우리와 협력하고 있다고 발표했고, 그들은 기본적으로 그들이 작은 Quen 모델을 훈련했던 프로젝트를 수행했으며, Excel 에이전트의 검색 작업에서 Opus 4.6을 능가합니다. 그것은 정확성 측면에서 이 작업에서 Opus 4.6을 능가할 뿐만 아니라, 그들이 관심 있어 하는, 그들은 또한 더 저렴하게 할 수 있고, 그들은 또한 더 낮은 지연으로 할 수 있습니다.

모델 훈련의 또 다른 흥미로운 사용자 그룹은 데이터 공급자입니다. 그래서 Shan Chai라는 남자가 있습니다. 저는 당신이 실리콘 밸리의 데이터 공간에 있다면, 당신이 전에 그를 만났을 가능성이 있다고 생각합니다. 저는 그가 기본적으로 계곡의 모든 데이터 공급자, 모든 데이터 소비자와 이야기했다고 생각합니다. 그는 이런 관찰을 했습니다. 미래에 어느 데이터 실험실이 성공할지 구별하는 것은 그들이 내부 훈련 능력을 개발할 수 있는지 여부라는 것입니다. 왜냐하면 이 모델들, 음, 이 실험실들이 데이터를 구매하기 때문에, 그들은 바보가 아니죠? 그들은 음, 모든 데이터가 동일하지 않다는 것을 압니다. 그들이 백만 달러짜리 거래에 서명하여 많은 데이터를 구매하기 전에, 그들은 음, 이 데이터가 내 모델 능력을 개선할 것인가 하지 않을 것인가를 알고 싶어합니다.

당신에게 이것을 하는 매우 간단한 방법과 매우 확실한 방법은 단순히 보상 곡선을 보여주는 것입니다. 단순히 보여주는 것은, 만약 당신이 내 데이터에 대해 훈련했다면, 음, 그러면 당신의 보상이 올라가거나, 또는 만약 당신이 내 데이터에 대해 훈련했다면, 당신의 에이전트는 작업을 더 효율적으로 수행할 것입니다. 그래서, 만약 이 중 어떤 것이 당신에게 매우 흥미로운 소리가 난다면, 음, 당신이 우리를 확인하세요. 우리는 primeintellect.ai에 있습니다. 음, 당신들이 무엇을 구축하는지 보는 것을 기대합니다. 그리고, 음, 이것이 제 모든 것입니다. 당신들은 내내 훌륭한 청중이었습니다. 정말 감사합니다. 훌륭했습니다. 정말 감사합니다, Jackman. 그것은 정말로, 정말로 좋은 강연이었습니다. 음, 다음으로 우리는 Michelle Julia가 있습니다. 그녀는 Blue Labs의 공동 창립자이며, 그녀는 AI에서 감정적 지능을 논의할 것입니다. 분명히, 우리는 당신이 개인화된 AI에 대해 이야기하고 있다는 시간 동안 오래 있었으므로, 이것은 상당히 적절한 주제입니다.

하지만 Michelle도 조금 멋있습니다. 그녀는 Apple의 가장 젊은 특허 보유자 중 한 명입니다. 그래서, 당신이 Find My, Find My iPhone 또는 연락처 교환을 위해 Bump를 사용한 적이 있다면, 그 아래에서 실행되는 무선 시스템, 그녀는 그것의 특허 보유자입니다. 음, 하지만 오늘 우리는 그것에 대해 이야기하지 않습니다. 우리는 감정적 지능 AI에 대해 이야기합니다. 더 말할 것이 없습니다, Michelle 안녕하세요. 음, 안녕하세요 여러분. 저는 Michelle입니다. 저는 Blue Labs의 공동 창립자입니다. 우리는 감정적 지능에 초점을 맞춘 연구 실험실이며, 특히 포함된 감정적 지능입니다. 포함된 감정적 지능은 지속적인 관계를 항해하는 능력이며, 각 상호 작용이 미래 욕망 궤적의 형성 능력입니다. 그래서 이것은 정적인 상태가 아닙니다. 그것은 관계를 관리하고 직접 효용을 캡처하는 것을 최적화의 권형이 아닌 동등한 목표로서 대합니다.

그래서 우리의 연구는 AI 시스템이 인간처럼 이것을 할 수 있게 하는 아키텍처 주위입니다. 만약 당신이 한 걸음 물러서면, 우리가 정말로 초점을 맞추는 것은 AI가 인간처럼 들리고 느껴지도록 하는 것입니다. 특히 상업적 의사 결정 과정에서입니다. 그래서 이것은 우리가 오늘 초점을 맞추는 것입니다. 빠른 이야기로 이것을 설명하자 하겠습니다. 그래서 앞서 그가 언급했듯이, 한 명이 언급했듯이, 음, 저는 Blue Labs 이전에 Apple에서 일했습니다. 당신이 알다시피, 저는 가장 젊은 특허 보유자 중 한 명입니다. 당신이 Find My를 사용한 적이 있다면, 그것은 제가 특허를 가진 무선 알고리즘에서 실행됩니다. 당신은 상상할 수 있습니다. 저는 작은 키의 아시아 여성입니다. 협상에서, 방은 종종 이렇게 보입니다. 그래서 저는 모든 협상에 들어가는 것에 대해 조금 불안합니다. 제가 간 첫 번째는, 우리는 포르투갈로 비행했습니다.

그 전 날 밤 저는 이 호텔의 로비에 앉아 있었고, 저는 매우 불안했으며, 저는 당신이 알다시피 모든 기술 세부 사항을 넘겨 보고 있었습니다. 음, 우리가 이 외부 공급자들과 정확히 무엇에 대해 협상하고 있는가? Apple의 입장은 무엇인가? 우리가 그들과 기술을 어떻게 이야기할까? 그런 다음 제 경영자가 저를 앉히고 말했습니다. 「들어봐, 우리는 이것에 대해 논의할 시간이 한 시간이 있어. 먼저 기술 세부 사항을 잊어버려. 이들은 우리가 이 공급자와 지난 10년 동안 항상 가지고 있던 과거의 역사입니다. 그리고 이것이 모든 차입니다. 이 사람과 그 사람 간의 관계와 우리가 과거에 이 사람과 어떻게 협상했는지, 그리고 그가 무엇을 찾고 있는지, 그리고 그가 과거에 우리의 큰 보스와 어떻게 상호 작용했는지에 대해 당신에게 말해 드리겠습니다. 그리고 이것이 당신이 이 방에 들어가는 모든 역학입니다.」

그것은 단지 기술 사양을 기억하는 것보다 당신에게 훨씬 더 도움이 될 것입니다. 바로 그 순간이었습니다. 저는 깨달았습니다. 중요한 것은 반드시 단지 대화의 기술적 효용이 아닙니다. 대부분의 설정에서 인간은 세로 관계를 이해할 필요가 있습니다. 그래서 저를 Apple의 똑똑한 에이전트가 되기 위해서는, 저는 각 공급자에 대한 완전한 이진 맥락과 장기적으로 유익한 방식으로 그 관계를 전진할 수 있는 능력이 필요했습니다. 그것은 한 사람이 많이 떠받칠 수 있는 것이고, 더욱이 에이전트도 마찬가지입니다. 대부분의 인간이 실제로 직관적으로 이것을 합니다. 당신이 정말로 메커니즘에 대해 생각할 필요가 없습니다. 당신들 중 대부분, 당신이 알다시피, 작동 잘하고 좋은 상황에 있습니다.

하지만 이 효용 기반 대화와 관계에서, 관계 상태를 시간에 따라 모델링하고 균형을 맞추기가 어렵습니다. 수학적으로 증명하기가 어렵습니다. 그래서 저는 이 분야의 감정 지능의 해제가 정말로 우리를 AI의 채택으로 밀어부치는 것이 인간 전략과 유용한 모방의 핵심이라고 믿습니다. 우리는 이미 인간이 하는 일에서 유창한 언어 모델을 구축했지만, 전략적으로 무능합니다. 따라서 이 장기 관계 블록을 활용하여, 저는 진정한 기업 기능이 신뢰와 관계를 통한 거래와 협상의 능력의 고도로 미묘한 균형에 달려 있다고 믿습니다.

그래서 저는 이 분야에 대해 매우 흥분하고 있으며, 오늘 제 목표는 정말로 이 분야가 무엇인지, 오늘날의 최첨단 수준은 무엇인지, 사람들이 무엇에 대해 이야기하고 있는지, 그리고 어떤 열린 질문들이 있는지에 대한 간단한 개요를 여러분께 제공하는 것입니다. 이것이 여러분에게도 흥미롭다면, 나중에 Blue Labs이 하고 있는 일에 대해 더 많이 이야기할 수 있습니다. 그래서 우리는 사회적 사고 연쇄와 모달리티별 게임 이론, 인간 행동, 그리고 특성에 대한 상태를 논의할 것입니다. 저는 이들을 가능한 한 간결하게 다루려고 노력할 것입니다. 따라서 첫 번째는 작년에 「Nature Human Behavior」에 발표되었습니다.

기본적으로 그들은 AI 에이전트에게 게임을 하게 했으며, 여기서 당신은 「죄수의 딜레마」(이기적인 게임)와 「두 성별의 전쟁」(협력 게임)이 있습니다. 그들의 목표는 정말로 모델이 이 특정한 상태들에서 어떻게 수행하는지 보는 것이었으며, 이 특정한 상태들에서 그들이 발견한 것은 비대칭적인 결과입니다. 이 모델들은 이기적인 게임에서 상당히 잘 수행했습니다. 따라서 당신이 협력해야 할 때 그들은 협력하고, 배신이 이익일 때 배신하지만, 협력 측면에서는 매우 형편없이 수행합니다. 이것은 충격적입니다. 왜냐하면 대부분의 인간 상호작용은 협력 게임이기 때문입니다. 맞습니까? 포르투갈의 그 호텔 로비에 앉아 있을 때, 우리의 공급업체는 우리를 배신하려고 하지 않습니다. 우리는 그들을 배신하려고 하지 않습니다. 우리 모두 거래를 원합니다. 단지 어떤 종류의 거래인지일 뿐입니다. 따라서 이 미묘함을 포착하기는 매우 어렵습니다. 사회적 사고 연쇄도 정말로 협력률을 증가시켰습니다.

그래서 당신이 동시에 자신과 상대방을 모델링할 수 있을 때, 우리는 지수적 증가를 봅니다. 두 번째 부분은 Google DeepMind에서 나옵니다. 그래서 올해 출시되었으며, 그들은 인간, 최신 모델, 그리고 특정한 Beijing 에이전트(그들이 훈련한 맞춤형 에이전트)를 가지고 협상 게임을 했습니다. 이것은 저는 Gemini 1.5 Pro와 GPT-4라고 믿습니다. 그들이 발견한 것은 이 세 그룹의 사람들이 게임을 하는 캠프에서, 당신도 알다시피, 이것은 협상 게임이고, 당신은 거래 칩을 교환하고 있으며, Beijing 에이전트는 매우 공격적이었습니다. 그래서 그들은, 당신도 알다시피, 다소 강하게 플레이했습니다. 그들은 종종 거부당했지만, 남은 것의 80%를 얻었습니다. 그래서 이것은 정의된 공간 내에서 실제로 매우 좋습니다. 인간은 더 공정했습니다. 그들은 조금 주고 조금 받았습니다. 그들은 일종의 이 균형을 원했습니다. 대규모 언어 모델은 매우 양보적이었습니다.

그래서 마치, 오, 저는 거래를 하겠습니다. 저는 당신과 어떤 거래든 할 것입니다. 저는 실제로 당신이 나에게 준 것보다 당신에게 더 많은 것을 주겠습니다. 그래서 저는 이 거래를 할 수 있습니다. 따라서 모든 거래가 수락됩니다. 우리는 전체 게임에서 이 모델들이 자신을 평형을 맞추지 못하는 것을 봅니다. 따라서 여기서 적절한 반응은 정말로 제가 처음으로 당신을 만날 때, 사람으로서, 저는 조금 주므로 우리는 관계를 구축하고, 그런 다음 매우 큰 거래와 관련될 때, 저는 더 많이 Beijing 게임을 하고 싶습니다. 따라서 이것은 에이전트가 협상을 수행하는 정적인 성질을 강조합니다. 세 번째 부분, 그래서 이것은 흥미로웠습니다. 왜냐하면 그것은 계산 심리학에서 나오기 때문에, 반드시 CS에서는 아닙니다. 어, 하지만 이 발견들은 강조되었으며, 당신도 알다시피, 유사한 방향을 따라.

그래서 그것은 ACL에 의해 수락된 논문이었으며, 어, 고정된 심리 성격의 상태가 아니라 특성에 관한 것입니다. 기본적으로 연구원들은 언어 모델이 실제로 사용자가 누구인지를 얼마나 잘 포착하고 있는지를 묻고 있었습니다. 그들이 발견한 것은 사용자가 특정 시간에 누구인지가 사용자의 일반적인 상태보다 더 흥미롭고 중요하다는 것입니다. 따라서 이 시점에서 이 관계를 감안할 때, 저는 약간 불안해하고 있습니다. 왜냐하면 저는 이러한 유형의 사람들의 방에 있거나, 처음으로 이 사람들을 만나고 있습니다. 이 상태들의 변화는 실제로 사용자의 정책에 대해 기초 사용자보다 더 중요합니다. 예를 들어 저는 타고난 침착한 사람이거나 저는 이런 저런 유형의 사람입니다. 어, 죄송합니다. 성격 특성. 따라서 우리가 여기서 발견한 것은 우리가 성격을 모델링하는 정적인 방식이 실제로 개선을 위한 많은 공간을 남긴다는 것입니다.

그래서 이것이 의미하는 바는 모델이 변화하는 조건에서 조율할 수 없다는 것을 나타냅니다. 그들은 자신의 행동을 정적인 것으로 보고 있으며 본질적으로 양보적입니다. 맞습니까? 저는 모든 이 문제들을 지적하는 이유는 당신에게 보여드리기 위함입니다. 우리는 모델에 이런 이해의 감각과 감정적 관계의 감각을 부여하기 위해 훨씬 더 많은 일을 할 수 있습니다. 따라서 우리는 여러 연구 방향을 가지고 있으며, 저는 30초가 있으므로 이들을 매우 빠르게 다루겠습니다. 하나, 우리가 전략적 레지스터 사이에서 조절하도록 언어 모델을 훈련할 수 있습니까? 언제 밀어붙이고 언제 당기는지? 둘, 관계의 가장 적절한 건축 표현은 무엇입니까? 이진 임베딩, 반사적 기억 계층. 이것은 개방형 연구 주제입니다. 당신 중 누구든지, 만약 당신이 아이디어를 가지고 있다면, 당신은 이 실험들을 상당히 빠르게 구현하고 뭔가를 만들어낼 수 있습니다.

따라서 이것은 당신이 알다시피 우리가 무엇을 탐색하고 있는지에 대한 대략적인 추정입니다. 우리가 Blue Labs에서 탐색하기 시작한 것입니다. 우리의 이것에 대한 첫 번째 건축 시도는 Blue JST, 공동 상태 엔진입니다. 핵심 아이디어는 관계 구축과 유틸리티 우선순위를 공동 목표로 삼는 이중 보상 메커니즘입니다. 하나를 다른 것으로 축소하는 대신입니다. 제가 말했듯이, 이것은 개방형 연구입니다. 이것은 정말 흥미롭습니다. 당신도 알다시피, 우리는 모든 답을 가지고 있지 않지만, 이 중 어떤 것이든 당신에게 흥미롭다면, 우리는 채용 중입니다. 우리는 기꺼이 대화하고 싶습니다. 우리는 산업과 학계 전반에 걸쳐 적극적으로 협업하고 있으며, 연구는 우리 앞에 있습니다. 감사합니다. 감사합니다, Michelle. 다음으로, 우리는 Jackie Mock을 가지고 있습니다. 그는 RA의 응용 AI 책임자입니다.

이제 그는 세계 모델에 대해 논의할 것이며, 어, 우리가 어떻게 언어에서 물리 지능으로 이동하는지에 대해 논의할 것입니다. 어, 다시 한 번 우리는 물리 AI 구체화된 AI의 지형으로 진입하고 있으며, 아직 완전히 로봇 공학 측면이 아니지만, 더 많은 세계 모델 세계 구축 측면입니다. 어, Jackie가 준비되면, 우리는 준비될 것입니다. 안녕하세요. >>좋아요. 안녕하세요. 저는 우리가 언어에서 물리 지능으로 어떻게 이동하는지에 대해 이야기하고 있습니다. 어, 제 연설은 우리가 세계 모델에 이르는 경로에 관한 것입니다. 저는 Jackie입니다. 저는 REA에서 일하고 있으며, 저는 응용 AI의 책임자입니다. 어, REA는 비디오, 이미지 및 텍스트의 멀티모달 AI입니다. 어, 당신은 아마도 우리가 몇 년 전에 구축한 일부 모델에서 우리를 인식하고 있을 것입니다. 당시 우리는 순위표에서 상승하고 있었습니다.

어, 우리는 최근에 더 시각 모델과 다양한 모달리티에 집중하고 있습니다. 어, 실험실에서 우리는 우리가 이것들을 현실 세계의 상황에 어떻게 적용할 수 있는지를 이해하기 위해 노력하고 있습니다. 따라서 오늘날의 시각 측면에서, 어, 우리는 이미 어 많은 이 컴퓨터 비전 기술을 가지고 있으며, 많은 것들을 할 수 있습니다. 맞습니까? 이것은 해결된 문제입니다. 자동차를 감지하고 물체를 감지하고 항목을 추적할 수 있습니다. 이것은 컴퓨터 비전에서 나옵니다. 어, 우리는 이것들을 사용하여 비디오 내에서 일어나는 일을 더 확실한 방식으로 이해하는 데 도움을 줄 수 있습니다. 하지만 나중에 비디오에서 볼 수 있듯이, 기계는 실제로 그것이 실제로 보고 있는 것을 이해하지 못합니다. 그것은 히트맵을 보면 될 수도 있습니다. 그것은 경계 상자를 보면 될 수도 있습니다. 이것이 VLM이 나타나기 전에 컴퓨터 비전이 어떻게 보였는지입니다.

이제 우리는 VLM을 가지고 있습니다. VLM을 가지고 있으므로, 우리는 장면을 보고, 이 장면을 생각하고, 그런 다음 이 장면에 대해 행동을 취할 수 있습니다. 맞습니까? 우리는 이것에 CV를 적용하여 시간이 지남에 따라 다양한 것들을 점진적으로 이해할 수 있도록 도울 수 있습니다. 음, 하지만 이것은 기본적으로 우리가 LMS를 적용하는 방식입니다. 어, 하지만 우리는 CV를 대체하지 않습니다. CV도 일종의 한쪽에 있습니다. 음, AI를 프로덕션에 배포하는 방법에 대한 또 다른 예가 있습니다. 음, 여기서 당신은 탐지, 추적 및 식별과 같은 것들을 추가할 수 있습니다. 음, 여기서 우리는 여전히 CV를 매우 저렴한 단계로 사용하여 장면에서 일어나는 일을 이해합니다. 어, 그런 다음 우리는 추론을 위해 VLM을 사용하며, 그런 다음 우리는 이것을 사용하여 경고를 발행합니다. 어, 특정 사용 사례에 대해. 맞습니까? 혼자서 어떤 것도 불충분합니다. 혼자서 어떤 것도 아직 어, 물리적 눈이 아닙니다. 하지만 이것들은 우리가 가지고 있으며 언어 모델에서 나온 구성 요소입니다.

음, 그래서 BLM은 다음 토큰을 예측할 수 있습니다. 왜냐하면 우리는 이 시각적 공간을 가져와서 어, 어떤 임베딩에 인코딩할 수 있고, 그런 다음 우리는 다음 토큰을 생성하기 때문입니다. 따라서 우리는 이미지에 무엇이 있는지, 시간이 지남에 따라 비디오에 무엇이 있는지 설명할 수 있습니다. 그럼에도 불구하고, 출력은 여전히 주로 텍스트 기반입니다. 음, 우리가 모델을 구축한 또 다른 패러다임이 있습니다. 음, 우리는 다음 프레임을 예측할 수 있습니다. 맞습니까? 따라서 당신은 확산 모델을 봤습니다. 그들은 이미지나 비디오를 생성합니다. 음, 이것은 또한 현재 로봇 공학과 물리 AI가 사용하려고 하는 경로입니다. 어, 어, 로봇의 궤도를 생성하기 위해. 그리고 이 두 모델, 언어 모델과 이 비디오 모델은 아직 완전히 세계 모델이 아닙니다.

음, 우리에게는 어, 우리는 두 가지 접근 방식에서 모두 그릴 수 있습니다. 맞습니까? 두 가지 접근 방식 모두 실제로 우리가 세계 모델이 무엇인지에 대한 다음 아이디어를 구축하는 데 도움이 됩니다. 따라서 우리는 다음 동작을 예측하고 싶습니다. 이것이 가장 중요한 것입니다. 그것은 어떤 것을 어떤 것과 다르게 만듭니다. 음, 우리는 거기에 도착하는 방법에 대해 논의할 것입니다. 이것은 우리가 처음부터 모델을 훈련하는 방법의 예입니다. 따라서 이것은 기성 모델이 아닙니다. 이것은 처음부터 완전히 훈련된 확산 모델입니다. 비디오 생성에서 훈련되었습니다. 따라서 그것은 5초 길이의 영화 같은 영화와 영화 같은 장면을 만들 수 있습니다. 음, 하지만 로봇 공학에 적용될 때, 지금의 주요 장점은 그것이 제로 샷입니다.

따라서 이전의 기술에서도, 당신은 이전의 로봇 팔 기술 어, 로봇 팔 움직임을 가진 로봇을 훈련해야 했습니다. 음, 당신은 확산 모델을 가지고 있으며, 이제 팔이 목표에 도달할 수 있는 궤적을 추적합니다. 맞습니까? 가장 큰 개선은 이것이 로봇이 이전에 무엇이었는지 모르는 상황에서 일어나며, 우리는 상당히 놀라운 결과를 얻을 수 있습니다. 또한 다른 많은 실험실들도 로봇을 제어하기 위해 비슷한 일들을 하고 있습니다. 어, 하지만 차이는 어디에 남아 있습니까? 여전히 많은 것들이 있습니다. 우리는 개선하고 싶어합니다. 우리가 모델을 구축할 때, 가장 좋은 방법은 무엇이 깨졌는지 이해하고, 우리는 평가를 만듭니다. 맞습니까? 따라서 실제로 VLM은 물리학에서 꽤 형편없습니다. 따라서 한 가지 예는 그것이 환각을 만든다는 것입니다. 어, 물체가 사라질 수 있습니다.

물체가 작아질 수 있으며, 어떤 이유로 다음 세대에서. 음, 그것은 물리학을 따르지 않을 수도 있습니다. 맞습니까? 그래서 우리가 추가하고 있는 한 가지는 우리가 어, 평가 집합을 추가하고 있다는 것입니다. 우리의 맹점을 이해하기 위해 어, 우리가 가질 수 있는 다른 맹점을 위해, 우리가 오늘 많은 평가를 수행하더라도, 실제로 우리가 평가를 수행할 때 많은 맹점이 있으며, 어, 모델이 올바른 출력을 얻을 수 있더라도, 실제로 샘플링되었으며, 우리는 실제로 일부 데이터를 잃었습니다. 맞습니까? 이 모델들의 많은 것이 다른 BLM에 의해 판단되고 있습니다. 어, 그래서 BLM은 일종의 자신을 평가하고 있습니다. 그들이 개선되고 있는지 이해하기 위해, 이것도 간격을 만듭니다. 음, 그래서 이것이 우리의 이유입니다. 우리는 새로운 데이터 세트를 만들고 있으니까 실제 상황이 무엇인지 이해합니다.

따라서 당신은 제 뒤의 모든 이것을 봅니다. 어, 이것들은 모델이 잘 이해하지 못하는 장소입니다. 맞습니까? 그것은 공 게임입니다. 더 작습니다.

음, 그런 다음 당신은 만약 무언가가 떨어지면 같은 것을 가지고 있습니다. 이것이 올바르게 떨어지고 있습니까? 두 가지가 서로 충돌할 때, 그들은 어떻게 하겠습니까? 어, 움직임이 맞습니까? 물체가 자발적으로 움직인 적이 없습니까? 솔직히 말해서, 많은 모델은 지금 이것을 예측할 수 없습니다. 이것이 주요 것 중 하나입니다. 물리학 관련된 것 같은, 음, 우리는 우리의 평가에서 현실주의 기회가 무엇인지를 이해하기 위해 합성 데이터를 만듭니다. 오늘날의 최고 모델도 매우 잘 수행하지 못하는 것 같습니다. 맞습니까? 이유가 있습니다. 어, 하지만 저는 지금 이것을 지나갈 것입니다. 그것들 중 하나는 BLM이 모든 프레임을 보지 않는다는 것입니다. 이러한 대규모 언어 모델의 접근 방식, 당신도 알다시피, 많은 토큰이 그것들에 들어갑니다. 대부분의 시간 그것은 샘플링될 필요가 있습니다. 맞습니까? 우리의 실험에서, 우리는 조금 증명할 수 있습니다. 당신이 모든 프레임을 그것에 주면, 그것은 아마도 이해할 것입니다. 하지만 당신이 어, 그것에 어, 무작위 수의 프레임을 주면, 그것은 보간을 수행합니다. 실제로 무슨 일이 일어났는지는 이해하지 못할 것입니다.

그래서 그것이 실패하는 한 가지 방법입니다. 그것이 실패하는 또 다른 방법은 물체가 가장자리에 가까울 때입니다. 어, 그것은 실제로 사람이 사라졌는지 또는 그들이 장면을 떠났는지 볼 수 없습니다. 이것은 많은 어, 혼란을 일으킵니다. 왜냐하면 모델은 일종의 가정하고 사람이 사라졌다고 예측합니다. 비록 그들이 프레임별로 보지 못했음에도 불구하고. 또 다른 영역은 VLM이 정말로 텍스트로 돌아간다는 것입니다. 따라서 그것은 텍스트 세계에서 물건을 추론할 것입니다. 어, 우리는 그것에 더 많은 CV와 더 많은 보충 데이터를 주어야 합니다. 그래서 그것은 정말로 이해합니다. 어, 장면에서 무슨 일이 일어나고 있는지. 어, 그것은 법칙을 이해합니다. 하지만 텍스트 공간에서 이해합니다. 따라서 그것은 더 추론할 수 있습니다.

어, 그것이 우리가 오늘 배포가 실제로 CV 향상되는 것이 더 많은 이유입니다. 여기서 당신은 비디오를 보는 시각 모델을 가지고 있으며, 또한 어, CV 텍스트 설명이 있습니다. 오, 이 장면은 X 신원을 가지고 있으며, 많은 장면에서 추적되고 있습니다. 이것이 우리가 어떻게 조금 VLM 성능을 개선하는 데 도움이 되는 방법입니다. 따라서 우리에게는, 우리는 VLM을 사용하여 조금 물리학을 판단하는 데 도움을 주고 있습니다. 그들은, 하지만 결국 그들은 여전히 오늘 프레임을 건너뜁니다. 음, 우리는 그들을 사용합니다. 그들은 그들을 사용하여 위치와 일치시킵니다. 움직임이 아닙니다. 어, 그들은 물리학을 알고 있습니다. 단지 그들이 텍스트 기반 모델에서 배운 것입니다. 맞습니까? 우리는 곧 어, 평가 집합을 출시할 예정입니다. 다른 사람들이 그들의 모델을 개선하는 것을 돕기 위해. 어, 그래서 그들은 또한 다음 구체화 모델을 훈련할 수 있습니다.

우리에게는, 어, 요약하자면 우리가 회사로서 물리 AI로 향하는 방법, 어, 우리가 다음 모델을 구축할 때, 우리는 여전히 우리의 LM과 우리의 VLM을 사용하고 있습니다. 우리는 다음 토큰을 가지고 있습니다. 이것은 프레임워크에 포장될 것입니다. 이 프레임워크는 우리가 어, 감시하는 것을 제어하거나 어, 로봇을 제어하는 것을 돕는 것입니다. 음, 하지만 우리는 또한 경로를 만들고 있습니다. 여기서 우리는 확산 경로를 가지고 있습니다. 여기서 우리는 지금 로봇을 위해 이 제어 경로를 만드는 이 비디오 모델들을 가지고 있습니다. 음, 이들은 이 세계 모델을 만들기 위해 결합될 수 있습니다. 여기서 우리는 다음 동작을 생성합니다. 음, 다음 단계는 이 평가 집합입니다. 왜냐하면 이 평가 집합은 우리가 실제로 무슨 일이 일어나고 있는지 이해하는지 또는 우리가 실제로 맹목적으로 비행하고 있는지를 이해하는 것을 도울 것입니다.

음, 예, 이것이 우리가 시간이 지남에 따라 언어 모델을 진화시키는 방법입니다. 이제 우리는 어, 우리가 다음 세대를 지원하는 데 도움이 되는 것으로 전환하려고 합니다. 그것이 어, 물리 AI와 세계 모델을 만드는 것입니다. 이것이 제 연설입니다. 감사합니다. 정말 감사합니다, Jackie. 다음으로, 우리는 Gokul Shinasan을 가지고 있습니다. 그는 Antim Labs의 공동 창립자이자 대통령입니다. 이제 그는 시뮬레이션 게임과 로봇 공학의 미래에 대해 논의할 것입니다. 저는 그 중 일부로 정말 멋진 데모와 비디오가 있다고 생각합니다. 따라서 이것은 주목할 가치가 있습니다. 여러분 저녁입니다. 어, 저는 Gopal이라고 합니다. 저는 공동 창립자입니다. 실험실, 오늘 나는 어, 시뮬레이션 게임과 이들이 어, 로봇 공학에서 정말 중요한 주제가 될 것이 미래의 방법에 대해 논의할 것입니다. 좋은. 1950년대, 1960년대 이래로, 로봇 공학은 기본적으로 항상 우리 안에 있었습니다.

내 의미는 모든 것이 미리 프로그래밍되었다는 것입니다. 환경이 고정되어 있습니다. 어, 로봇이 무엇을 해야 하는지의 스크립트, 모든 것이 고정되어 있습니다. 따라서 환경은 로봇을 위해 특별히 구축됩니다. 물론 경제적 가치를 정말로 해제하기 위해 우리는 이렇게 할 수 없습니다. 환경이 로봇을 위해 구축되는 것은 아닙니다. 로봇이 기존 환경에서 작동해야 합니다. 그래서 어, 지난 10년, 15년 동안, 많은 작업이 로봇을 점점 더 일반적으로 만드는 데 들어갔습니다. 어, 이것은 많은 멋진 연구로 이어졌습니다. 그래서 우리가 오늘 보는 것은 많은 연구가 있음에도 불구하고, 로봇 공학 커뮤니티는 한 가지 문제에 답이 없다는 것입니다. 즉, 어떤 종류의 모델 아키텍처가 상당한 어, 일반성으로 이어질까요?

예를 들어, 만약 당신이 모든 최신 연구를 보면, 우리는 세계 행동 모델, u VLM, VAS, 어, 비디오 행동 모델을 봅니다. 물론 일부는 여전히 고전적인 알고리즘을 사용하고 있습니다. 이제 다양한 유형의 모델이 있으므로, 물론 우리는 다양한 유형의 데이터 수집 방법이 필요합니다. 어, 이 중 일부는 조종, 인터넷 규모의 비디오를 사용하여 비디오 행동 모델을 훈련하는 것입니다. 어, 시뮬레이션에서 합성 데이터, 그리고 어, UMI 스타일 어, 캡처. 따라서 이것들은 어, 로봇용 로봇을 훈련하기 위한 다양한 유형의 데이터 캡처 방법입니다. 그럼, 누군가 지금 질문할 수 있습니다. 좋습니다. 이렇게 많은 다양한 유형의 모델, 이렇게 많은 유형의 데이터, 정확히 무슨 일이 일어나고 있습니까? 로봇 공학은 단지 여러 다른 방향으로 분열될 것입니까? 그리고 어, 없음 어, 정말로 모든 것을 함께 연결할 연결선이 없습니다.

제가 논쟁하고 싶은 것은 이 모든 방법의 공통점은 시뮬레이션입니다. 내가 의미하는 바는 시뮬레이션이 어, 워크플로우의 일부가 될 것이다는 것입니다. 연구 개발 워크플로우와 배포 워크플로우 모두 포함하여, 당신은 아마도 그것을 피할 수 없을 것입니다. 따라서 어, 시뮬레이션이 사용될 몇 가지 장소는 합성 데이터 생성입니다. 어, 두 번째로 어, 당신은 환경의 디지털 쌍둥이를 만들 수 있으며, 당신은 이 디지털 쌍둥이에서 작동하기를 원합니다. 그런 다음 어, 당신은 알다시피 실제 물리적 로봇을 배포하러 갑니다. 어, 세 번째는 경계 경우 커버리지입니다. 이것은 자동 운전과 같은 것들에서 정말로 어, 잘 확립되고 광범위하게 사용됩니다. 물론 배포하기 전에 정책을 원형화할 수도 있습니다.

따라서 어, 이 모든 다양한 것들에 대해, 어, 당신은 알다시피, 시뮬레이션을 사용할 수 있는 장소, 어, 그것이 무처소 될 것이더라도, 시뮬레이션의 상태는 무엇입니까? 그것은 정말로 정말로 어렵습니다. 어, 당신 중 몇 명이 시뮬레이션을 구축해 본 적이 있거나 Isaac Sim이나 Mojo와 같은 시뮬레이션 소프트웨어를 사용해 본 적이 있는지 모르겠습니다. 하지만 정말 거대한 학습 곡선이 있습니다. 당신이 전문가가 되었더라도, 그것은 여전히 정말로 어렵습니다. 따라서 현재 슬라이드에 있는 것은 어, 자산을 만든 다음 배치하는 어, 워크플로우입니다. 따라서 어, 당신의 장면이 얼마나 복잡한지에 따라 당신은 여러 자산을 이것을 해야 합니다. 그리고 어, 당신은 알다시피 그것은 정말로 어렵고 며칠, 때로는 몇 주가 필요합니다. 그래서 이렇게 할 이유가 없습니다.

어, 따라서 현재의 에이전트 AI와 많은 어, 비전 기반 모델과 언어 모델을 사용하여, 우리는 실제로 파이프라인의 여러 단계를 자동화할 수 있으며, 또는 적어도 가능한 한 자동화에 가깝게 만들 수 있습니다. 따라서 우리는 Gizmo라는 것을 구축했습니다. 이것은 자연 언어 프롬프트에서 시뮬레이션까지의 도구입니다. 기본적으로 당신은 자연 언어 또는 이미지 형태의 프롬프트로 우리 시스템을 제공할 수 있으며, 그것은 많은 서브에이전트를 시작하러 나갑니다. 그것은 해야 할 모든 일을 할 것이며, 그 다음에 당신은 심이 있습니다. 당신은 완전히 구축된 3D 시뮬레이션이 있습니다. 이것은 현재 약 20분이 걸립니다. 어, 따라서 당신은 기본적으로 약 20분 내에 환경의 첫 번째 패스를 수행합니다. 당신이 말하게 두십시오. 루프 안의 일부 사람들의 작업이 필요합니다. 그것은 여전히 당신이 알다시피 몇 시간 내에 완료할 수 있습니다. 이제 이것은 며칠 또는 몇 주와 대조됩니다.

음, 그것이 현재 그것이 하고 있는 것입니다. 따라서 저는 우리 도구의 데모를 연주하려고만 할 것입니다. 따라서 그것이 도구의 데모입니다. 따라서 기본적으로, 당신은 어떤 것을 입력하고 당신은 시뮬레이션을 얻습니다. 따라서 음, 이것, 이것은 몇 가지 진지한 능력을 열어줍니다. 따라서 우리는 또한 API를 가질 것입니다. 따라서 이것은 당신의 코드 ex 또는 개방 발톱을 의미합니다. 당신이 워크플로우의 어느 부분에서 사용하는 것이 든 상관없이, 그것은 시뮬레이션을 시작하기로 결정할 수 있습니다. 음, 당신은 시뮬레이션 출력을 얻습니다. 따라서 이것은 또한 대규모를 활성화합니다. 이제 규모가 큰 시뮬레이션은 아직 불가능하지 않습니다. 왜냐하면 그들은 너무 어렵게 만들기 때문입니다. 음, 이것은 또한 정말 흥미로운 것을 활성화합니다. 예를 들어, 당신은, 당신은 기본적으로 로봇 학습을 위한 종료 종료, 종료 루프를 가질 수 있습니다.

예를 들어, 당신은 내가 지정한 장면의 포인트로 걷도록 사각형 동물을 훈련합니다. 또는 다른 것들, 즉, 그것이 에이전트가 필요한 모든 정보입니다. 전체 일을 실제로 완료하고 당신을 위해 훈련된 사각형 동물의 정책을 제공합니다. 좋아요, 따라서 어, 이것이 어, 로봇 공학이 해결되었나요? 물론 아닙니다. 어, 시뮬레이션 현실 차이가 여전히 존재합니다. 이것은 시뮬레이션이 어, 비록 그들이 유용하지만, 아직 100 % 정확하지 않다는 것을 의미합니다. 이것은 근본적으로 단지 물리학 문제입니다. 어, 접촉 물리학에 문제가 있으며, 또한 문제 어, 당신은 알다시피 우리는 재료의 속성을 근사합니다. 변형은 모델링이 정말 어렵습니다. 따라서 어, 이것은 로봇 공학 커뮤니티와 우리가 여전히 등반하고 있는 산입니다. 우리는 이 간격이 시간이 지남에 따라 점점 작아질 것으로 예상합니다.

좋아, 그래서 우리는 시뮬레이션에 대해 말했습니다. 게임에 대해 얘기합시다. 왜 게임이 중요한가요? 그래서 어, 시뮬레이션에서 당신은 조작만 훈련할 수 없습니다. 또는 항법 또는 운동. 사실 밝혀졌습니다. 합성 세계를 가질 수 있다면, 당신은 고급 인지도 훈련할 수 있습니다. 제가 고급 인지로 무엇을 의미합니까? 그것은 어, 탐사를 의미합니다. 목표가 명확하지 않을 때. 어, 당신이 계획을 가졌을 때 그리고 세계에서 일어난 일, 당신의 상태가 떨어졌습니다. 당신은 어떻게 회복합니까? 당신은 어떻게 다시 계획합니까? 어, 당신이 어, 당신이 세계에 완전한 정보가 없을 때, 당신의 의사 결정 품질은 어떻게 됩니까? 따라서 어, 이 모든 것은 정말로 중요합니다.

그것들은 로봇뿐만 아니라 LLM에도 중요하지만, 로봇의 경우 그들은 정말로 중요합니다. 왜냐하면 그들은 또한 공간 시간 기억에 근거해야 하기 때문입니다. 따라서 어, 내 의미는 모든 이 것들, 탐사, 어, 재계획, 및 어, 당신은 알다시피 장기 계획과 같은 모든 것이 공간 시간 기억에 근거해야 합니다. 따라서 우리는 에이전트를 훈련했으며, 나는 당신에게만 우리가 어떻게 했는지에 대한 매우 빠른 어, 개요를 제공할 것입니다. 따라서 우리는 20억 어, Quen 모델 VLM을 훈련했습니다. 따라서 그것은 기본적으로 컴퓨터를 사용하는 에이전트로 작동합니다. 여기서 그것은 키보드와 마우스를 제어합니다. 따라서 우리는 400시간의 어, 어, 프레임 행동 비디오 게임 데이터에 대해 pre-trained했습니다.

이것은 기본적으로 모델에 비디오 게임을 하는 방법에 대한 직관을 제공했으며, pre-training을 통해 그리고 우리가 약 60시간의 IF 데이터로 수행한 지시 미세 조정을 통해 모델을 게임을 완료하도록 안내합니다. 마지막으로, 이것은 우리가 아직 하지 않은 것입니다. 하지만 진행 중입니다. 즉, 모델을 훈련하여 추론 궤적을 출력한 다음 이 추론 궤적을 다음 단계의 지시로 사용합니다. 맞습니까? 마지막으로, 우리가 기억해야 할 한 가지 중요한 것은 비디오 게임을 하고 싶으니까 우리는 실시간 제어가 필요하다는 것입니다. 따라서 음, 예, 우리는 모델이 200밀리초 내에 입력을 받고, 그것을 처리하고, 출력을 디코딩해야 합니다. 따라서 이제 저는 여러분을 위해 우리의 에이전트를 시연할 것입니다. 보시다시피, 이것은 여전히 초기 작업이며, 완벽과는 거리가 멀지만, 바라건대 여러분이 그것을 즐기실 수 있기를 바랍니다. 열.

Heat, 그것이 제 시간입니다. 감사합니다. 정말 감사합니다, Gokul. 우리는 지금 오후 5시입니다. 우리는 최종 스프린트 단계에 있습니다. 모두가 여전히 강연을 듣고 있어서 매우 기쁩니다. 음, 우리는 조금 우회하여 일부 디자인 측면으로 들어갈 것입니다. 우리는 이제 다양한 플레이를 탐색할 것입니다. 따라서 우리의 다음 연사는 Lentil의 Weii Su입니다. 그녀의 강연 각도는 동양 철학과 동양 제품 건설 뒤의 지혜를 탐구하는 것입니다. 이것은 디자인과 인공지능의 관점에서 매우 흥미로운 강연이 될 것이지만, 보통 논의의 중심에 있지 않은 관점에서입니다. 따라서 항상 준비하세요. 거기로 돌아가고 싶으세요? >> 네. 네. 좋습니다. 여러분, 안녕하세요. 제 말이 들리나요? 좋습니다. 여기 있어주셔서 감사합니다. 음, 제 이름은 Wayi이고, GenZen이라는 초기 단계의 회사를 운영하고 있습니다. 우리는 마케팅을 확장하기 위해 인공지능 비디오를 만듭니다.

오늘 저는 약간 실험적인 태도로 진행할 것이고, 동양 철학과 이것이 우리의 미래 건설 방식을 어떻게 형성할 수 있는지에 대해 논의하는 데 시간을 보내고 싶습니다. 이것은 논의할 가치가 있는 주제처럼 느껴집니다. 왜냐하면 우리는 서방인들이 TikTok에서 중국인이 되고 중국을 추종하는 시대에 살고 있기 때문입니다. 따라서 TikTok에서 시간을 보낸다면 지난 몇 개월 동안 이 추세를 분명히 알아차리셨을 것입니다. 뿐만 아니라, 서방도 아시아에서 온 회사와 인공지능 모델에 점점 더 관심을 기울이고 있습니다. 제가 이 영화에서 강조하고 싶은 한 순간이 있습니다. 음, 이것이 바로 「유랑하는 지구」라는 영화입니다. 여러분 중 이 영화에 대해 들었거나 본 사람이 몇 명입니까? 좋습니다. 여러분 중 「삼체」에 대해 들었던 사람이 몇 명입니까? 더 많은 사람들이 있습니다. 아주 좋습니다.

음, 「유랑하는 지구」는 동일한 작가 Liu Cixin에 의해 창작되었으며, 이는 과학 소설 영화에서 매우 중요한 순간입니다. 왜냐하면 이것은 중국의 이야기 전통에 뿌리를 둔 대규모 할리우드 과학 소설 블록버스터를 성공적으로 만들려는 중국의 첫 번째 시도 중 하나이기 때문입니다. 이것은 2075년을 배경으로 하는 이야기입니다. 태양이 팽창하고 있습니다. 지구는 곧 거주할 수 없게 될 것입니다. 인류는 지구를 포기하기로 선택하지 않았고, 대신 지구 표면에 약 10,000개의 거대한 행성 엔진을 건설하여 지구를 태양계 밖으로 밀어내기로 단합했습니다. 이 계획은 2,500년이 필요합니다. 따라서 앞으로의 25개 세기 동안 그들은 모두 지하에 살기로 동의했습니다. 음, 이 영화를 보고 이러한 집단주의적 태도를 보는 것이 저에게 매우 강력한 영향을 미쳤습니다.

이것은 제 평생 동안 우리가 이야기의 한 버전과 미래의 한 버전을 받았다는 것을 깨닫게 해주었습니다. 주로 할리우드에 의해 만들어졌으며, 우리는 이것을 진정으로 깨닫지도 못했습니다. 따라서 오랫동안 서방의 서사는 우리가 어떻게 건설하고, 어떻게 생활하며, 무엇을 원하는지의 중심에 있었습니다. 만약 동방의 서사가 21세기의 중심에 있다면 어떨까요? 서방에서는 미니멀리즘이 보통 선호됩니다. 응용프로그램은 각 페이지에 하나의 행동 촉구를 포함하는 경향이 있습니다. 예를 들어, 미국에서는 Cash App이나 Venmo를 사용하여 친구에게 돈을 송금하고 결제합니다. 이것이 Cash App의 모습입니다. 한편, 이것은 중국에서 온 Alipay입니다. 자금을 송금하고 받을 수 있을 뿐만 아니라 청구서를 지불하고, 배달 음식을 주문하며, 심지어 대출을 신청할 수도 있습니다. 따라서 동방에서는 생동감이 보통 더 많이 축하됩니다. 사람들은 모든 옵션을 원합니다.

많은 경우 더 많은 것이 더 나은 것이고, 더 적은 것이 더 나은 것이 아닙니다. 서방의 이러한 신념은 또한 단일성에 초점을 맞추는 경향이 있습니다. 이 측면의 한 예는 Meta와 같은 서방 회사가 지난 십 년 이상 동안 하나의 수익 흐름의 성장에 집중해 온 것입니다. 보시다시피, 그들은 광고에 의존합니다. 한편, WeChat의 모회사인 Tencent는 수익 흐름을 다양화해 왔으며, 모든 계란을 한 바구니에 넣지 않았습니다. 이 두 소셜 미디어 회사를 함께 놓으면, 대조는 상당히 명백합니다. 또한 이것이 그들의 행동, 위험 처리 방식, 그리고 실험 방식을 어떻게 변경했는지 볼 수 있습니다. 동방은 다양성을 선호하고, 우리는 선택 가능성도 축하합니다. 따라서 저는 이 차이를 초래한 것이 무엇인지 궁금하지 않을 수 없습니다. 그렇지 않나요?

한 가지 관찰은 각 문화가 구현하는 철학이 매우 다르다는 것입니다. 서방에는 「성경」이 있는데, 중국어로 shenanzing이라고 불리며, 이것이 성전입니다. 동방에는 eing이라고 불리는 것이 있습니다 - 「역경」. 그것의 핵심 주장은 고정된 것이 없다는 것입니다. 모든 것이 운동 중에 있으며, 현인은 변화에 진정으로 저항하지 않습니다. 그들은 변화를 헤쳐 나가고 수용하기 위한 지도를 찾습니다. Eegene을 가지고, 개업자들은 동전을 던져 6개의 선을 생성하는 경향이 있습니다. 이들은 모두 64개의 옵션입니다. 음, 64개의 hexogs입니다. 그들은 인생의 지속적으로 변화하는 상황에 대한 지도를 제공합니다. 시간이 지나면서 그것은 중국 철학의 초석이 되었으며, 균형과 변환에 대한 생각을 반영합니다. 또한 관련이 있습니다. 이 시대에 우리 모두가 경험하는 변화 중 하나라고 생각하는 것인데, 그것은 내용이 합성적으로 생성되고 있다는 것입니다.

우리는 합성 생성된 내용을 인간이 만든 내용보다 더 많이 볼 것입니다. 제 생각에 우리 모두가 묻는 질문 중 하나는 우리가 무노력의 쓰레기로 빠져 있을 것인가입니다. 우리가 쓰레기가 대량 소수되고 모든 것을 잠식하는 것을 볼 것인가입니다. 그렇지 않나요? 이렇게 많은 소음이 있을 때 우리는 무엇을 할 것인가요? 음, 하지만 우리가 다른 각도에서 이 문제를 본다면, 이야기를 하는 도구들 - 카메라, 스튜디오, 배포, 전체 할리우드가 세운 장치는 누구나 들고 있을 수 있는 것으로 붕괴되고 있습니다. 이것은 또한 할리우드에 의해 무시되었던 공동체들이 이제 내용을 만들고 그들 자신의 조건에 따라 배포할 도구를 가지고 있다는 것을 의미합니다. 너무 틈새적이고, 너무 낯설고, 시장이 너무 작고, 캐스팅하기 너무 어려웠던 이야기들은 이제 실제로 그 속에 살고 있는 사람들에 의해 실제로 그것을 원하는 관객을 위해 만들어질 수 있습니다.

예를 들어, 중국의 furry 커뮤니티는 이제 자신들을 위해 인공지능을 사용하여 내용을 만들고 있습니다. 이 furry 애니메이션은 지난 2주 동안 100만 조회수를 받았습니다. 중국의 또 다른 비디오 창작자는 지난 7일 동안 모든 플랫폼에서 6,000만 조회수를 받은 인공지능 단편 영화를 만들었습니다. 마찬가지로, 우리는 GenZen에서 전통적으로 너무 틈새적인 산업에서 내용을 만드는 고객을 돕고 있습니다. 이것은 저에게 정말 흥미로운데, 왜냐하면 우리가 이러한 틈새 영역에 더 넓은 접근 권한과 인식도를 만들 수 있기 때문입니다. 지난 4개월 동안 우리는 YouTube Shorts, Instagram 및 TikTok에서 월 1,000만 전시를 제공했습니다. 예를 들어, 우리는 더 많은 egene 내용도 만들었습니다. 이에 대한 인식도를 높이기 위해 우리는 모든 사람이 읽기에 접근할 수 있도록 하는 응용프로그램을 만들었습니다.

전통적으로, egene 읽기를 수행하는 것은 초보자에게 매우 복잡하고 혼란스러운 과정일 수 있습니다. 따라서 이 도구는 당신이 가장 긴급한 질문을 빠르게 물을 수 있게 해줍니다. 관심이 있으시면, 응용프로그램 스토어에서 이 도구를 무료로 시도해볼 수도 있습니다. 음, 우리는 이번 주 무료로 제공합니다. 단지 당신이 시도해보도록 하기 위해서입니다. 응용프로그램 스토어에서 Egene Oracle을 검색하거나 이 QR 코드를 스캔할 수 있습니다. 우리는 또한 전통 중의학, 침술, 경혈점 주변의 내용을 만들고 확장했습니다. 이들도 역사적으로 무시되었던 주제들이며, 우리가 이제 접근할 수 있는 도구 덕분에 이러한 종류의 내용을 만들기가 더 쉬워졌습니다. 이 모든 것은 우리의 내부 agentic 비디오 워크플로우에 의해 지원되며, 우리는 내용 생산 프로세스를 단순화하고 최적화했으며, 이것이 차례로 제품 배달 전시 및 생산성 변환을 개선합니다.

여러 측면에서 우리는 인공지능 생성 내용을 우리가 중요하다고 생각하는 서사를 만드는 도구를 우리 모두가 가지고 있는 더욱 활기차고 다양한 미래로 향하는 교량으로 봅니다. 이것으로, 정말 감사합니다, 당신의 시간에 대해, 당신은 이 ID를 통해 Twitter에서 나를 찾을 수 있습니다. 음, 이것이 당신에게 흥미로우면, 당신도 스티커를 원한다면, 음, 그 후에 나를 찾아주세요. 정말 감사합니다. 정말 독특한 강연이었습니다. 이러한 슬라이드와 강연을 만드는 방법을 알아내야 할 것 같습니다. 정말 멋집니다. 다음으로, 우리는 Bland의 기술 책임자 Anun Jooshi를 가지고 있습니다. 음, 그는 음성 인공지능에 대해 이야기할 것입니다. 우리는 이전에 11 Labs의 강연을 했지만, 이 강연은 다른 방향으로 갈 것이며, 그것은 음성 인공지능이 모델 문제가 아니라는 것입니다. 우리는 Anun이 우리를 위해 더 많이 설명하도록 했습니다. >>안녕하세요.

당신들이 나를 들을 수 있습니까? 좋습니다. 아주 좋습니다. 나는 당신들이 모두 기분이 좋기를 바랍니다. 음, 나는 시작하기 전에 한 가지 말하고 싶습니다. 모든 연사들은 정말 훌륭했습니다. 그래서, 우리가 모두를 위해 박수를 칠 수 있을까요? 그래서, 나는 실제로 내 강연 제목을 바꿨습니다. 왜냐하면 나는 실제로 음성 인공지능이 모델 문제를 가지고 있다는 것을 깨달았기 때문입니다. 그래서 나는 그것을 바꿨고, 나는 기업 고객을 위해 음성 인공지능을 확대하면서 직면한 일부 문제에 대해 이야기할 것입니다. 음, 그래서, 나는 Anun입니다. 나는 실제로 싱가포르에서 자랐습니다. 2년 전 나는 Bland를 위해 샌프란시스코로 이사했습니다. 재미있는 것은, 나는 실제로 여기 초급 칼리지의 연극 아이였습니다. 음, 네, 나는 다시 무대에 설 것이라고 생각한 적이 없습니다. 하지만 여기 있습니다. 나는 이야기 전하기를 정말 좋아합니다. 음, 그래서 나는 이야기로 시작할 것입니다. 그래서, 2년 전, 나는 샌프란시스코에 있었습니다.

나와 내 CEO Isaiah는 커피를 마시러 갔고, 우리는 단지 둘러다니고 있었고, 그는 나에게 우리가 지금까지도 논의하고 있는 일들을 말했습니다. 음, 그는 나에게 앉으라고 했고, 그는 내 눈을 똑바로 바라보고, 표정 없이, 그는 나에게 이것을 말했습니다. 당신은 나를 믿지 않을 것입니다. 하지만 Pathways, 당신이 발명한 이 것은 수백만 명에게 영향을 미칠 것입니다. 수백만 명이 그것을 사용할 것입니다. 나는 그를 바라보았고, 나는 「이 남자는 미쳤다.」라고 말했습니다. 좋아, 그는 전형적인 창업자입니다. 그는 나를 행복하게 하고 싶어서 나가 더 열심히 일할 것입니다. 음, 그 당시 우리는 단지 오, 좋아, 슬라이드가 부족했는데, 하지만 나는 우리가 단지 Discord에 있었다는 것을 보여주고 싶었습니다. 그래서 나와 다른 엔지니어입니다. 음, 우리는 이야기하고 있었고, 우리는 단지 FDEEs였습니다. 우리는 엔지니어이고 우리는 제품 관리자입니다.

음, 우리는 단지 Bland Discord에서 익명의 사람들을 사용하여 우리 에이전트의 아키텍처를 알아내고 있었습니다. 음, 지금 생각해보니 정말 미쳤습니다. 우리는 실제로 매달 수백만 개의 전화를 지원합니다. 나는 아직도 지금 이 순간에 누군가가 우리 에이전트와 대화하고 있다는 것을 깨닫지 못했습니다. 그것은 너무 미쳤습니다. 음, 나는 오늘 아침 내 Slack 채널에 들어갔고, 팀 대화에서, 케이스 스터디가 나왔습니다. 우리의 한 고객 American Way Health에 관련된, 당신도 우리의 웹사이트에서 그것을 확인할 수 있습니다. 그들은 우리가 그들을 위해 매년 4.3억 달러의 수익을 잠금 해제했다고 말합니다. 나는 그것이 가능하다는 것을 몰랐습니다. 나는 우리가 그렇게 할 수 있다는 것을 몰랐습니다. 음, 네, 이 모든 것은 내가 상상할 수 있는 것을 훨씬 뛰어넘습니다.

음, 나는 나가 이 모든 것을 할 때 배운 교훈들과 일부 문제점들을 가지고 있을 행운이 있습니다. 만약 당신들이 음성 인공지능을 당신의 서비스에 통합하려고 시도한다면, 나는 당신들이 그것으로부터 배우기를 원합니다. 그래서 나는 당신들 모두가 음성 인공지능의 한 무리의 데모를 봤다고 확신합니다. 그들은 슈퍼 멋집니다. 하지만 어려운 것은 그것을 생산에 넣는 방법이고 기업 고객들을 위해 실제로 일하게 하는 것입니다. 음, 그래서 나는 일부 문제점들과 음성 인공지능을 기업 사용 사례에 적용하기 위해 내가 발견한 일부 발견들을 깊이 파고들 것입니다. 음, 좋습니다. 슬라이드는 다릅니다만 우리는 그렇게 진행합시다. 어, 나는 VO로부터 시작할 것입니다. 내가 깨닫지 못한 한 가지는 많은 기업 고객들이 처리하고 우리에게 불평하는 것이 음성 메일 감지의 정확성입니다.

음, 나는 우리의 현재 고객들이 매일 음성 메일 감지의 정확성을 보고하고 추적하려고 한다는 것을 깨닫지 못했습니다. 음, 그 이유는 대부분의 아웃바운드 전화 호출이 실제로 사람과 연결되지 않기 때문입니다. 대부분이 음성 메일로 들어갑니다. 이것이 다양한 상황에서 작동하는 강력한 시스템인지 확인합니다. 예를 들어, 통화 필터의 경우, 지금 iOS와 Google Voice는 모두 통화 연결 전에 체크가 있습니다. 예를 들어, 그들은 음 우리가 연결하기 전에 당신의 이름과 전화를 거는 이유를 말해주세요. 음, 또한 비프음이 발생합니다. 많은 사람들이 사용하는 것은 Twilio입니다. 이것은 응답 기계 감지 기능을 가지고 있으며, 본질적으로 단지 비프음 감지 모델입니다. 이것은 그렇게 좋게 작동하지 않습니다. 기업 고객들은 그것에 의존할 수 없습니다. 그래서, 나는 Bland에서 그것을 개선하기 위해 작업합니다.

나는 각 음성 청크의 멜 스펙트로그램을 보기 위해 CNN 모델을 구축하고 있습니다. 음, 나는 비프음이 다른 전화기의 다양한 길이와 주파수를 가지고 있다는 것을 깨닫지 못했습니다. 음, 일부 주파수는 또한 이중 주파수를 가지고 있으며, 이들은 소위 DTMF 톤이라고 불리는 것과 동일합니다. 이것은 통화 중에 휴대폰의 숫자를 누르거나 들을 때 발생하는 소리입니다. 음, 그래서 당신은 또한 거기서 거짓 양성을 유발하고 싶지 않습니다. 음, 그래서 그것은 우리가 알아내야 했던 어려운 것들 중 하나입니다. 그리고 우리는 지금도 당신이 음성 메일 감지를 테스트하고 벤치마크할 수 있도록 하는 웹사이트를 가지고 있습니다. 그래서, 만약 당신들이 음성 인공지능을 당신의 시스템에 통합하려고 시도한다면, 당신들은 음성 메일 감지 음 정확성이나 시스템이 얼마나 잘 작동하는지를 보고 있는지 확인하세요.

그래서, 다음은, 음, Slack 메시지의 슬라이드가 있을 것입니다. 나는 고객으로부터 받았습니다. 그 Slack 메시지는 「왜 내 에이전트가 같은 방식으로 작동하지 않습니까?」또는 「왜 내 에이전트가 어제처럼 작동하지 않습니까?」라고 말합니다. 나는 당신들 중 몇 명이 고객으로부터 이런 것을 말한 경험을 했는지, 또는 당신들이 당신들 자신도 아마도 경험했는지 모릅니다. 예를 들어, 나는 Claude를 사용하면, 나는 것들이 단지 변한다는 것을 싫어합니다. 음, 비즈니스의 관점에서, 때때로 고객들은 내게 올 때 내가 아무것도 바꾸지 않았습니다. 마치, 나는 새 코드를 푸시하지 않았는데 당신은 와서 나에게 내가 그들의 시스템을 부쉈다고 말했습니다. 음, 하지만 나는 이해합니다. 당신은 그들의 플랫폼과 그들의 에이전트에서 몇 시간을 보냈습니다. 어떤 것이 당신이 예상한 방식으로 작동하지 않을 때, 이것은 끔찍합니다.

음, 나도 내가 우리의 지식 기반 기능의 하이브리드 검색 알고리즘을 개선하려고 시도했을 때 망쳤습니다. 음, 우리는 우리 자신의 자기 호스팅 벡터 데이터베이스를 가지고 있고, 나는 단지 정확성을 향상시키고 싶었습니다. 음, 그것은 일부 고객에게 작동했지만 다른 고객들에게 회귀를 일으켰고, 이것은 끔찍합니다. 그것은 당신의 고객의 신뢰를 깨뜨리고, 이것은 끔찍하고, 그리고 그것을 다시 짓기 어렵습니다. Bland에서 우리가 구축하고 구축에 대해 자랑스러워하는 것은, 우리가 고객들이 금사리 배포를 배포하고 버전이 있는 에이전트 버전을 테스트할 수 있도록 허용한다는 것입니다. 그래서 일부 배경을 위해, Bland는 데이터 거주 등을 위해 각 기업 고객에게 전용 인프라를 제공합니다.

그리고 우리는 이것을 통해 그들이 별도의 컨테이너를 시작할 수 있도록 허용할 수 있습니다. 그곳에서 그들은 새로운 에이전트 버전을 테스트할 수 있고, 몇 개의 전화 번호를 그곳으로 라우팅할 수 있어서 그들은 모든 프로덕션 변화가 실제로 온라인이 되기 전에 테스트되었다는 것에 대해 더 많은 보증을 가지고 있습니다. 그래서 그것이 우리가 고객 신뢰를 다시 짓려고 하는 방법입니다. 그리고 이것은 기업 고객들에게 매우 중요하므로 그들은 에이전트를 마땅히 개선하는 데 초점을 맞출 수 있습니다. 이제 이것은 흥미로운 이야기입니다. 그래서 우리는 재산 500강 자동차 임차 회사와 함께 작업했고, 우리는 자동차 임차 디지털 ID를 수집하려고 했습니다.

음, 네, 그래서 우리는 단지 그들이 변경할 필요가 있는 다른 정보를 도울 수 있습니다. 우리는 생산에 들어갑니다. 우리는 좋아, 디지털이 실제로 그곳에 있는 것과 다르다는 것을 깨닫기 시작합니다. 우리는 우리의 파이프라인을 봤습니다. 전사 엔진은 올바릅니다. TTS는 마땅히 작동합니다. LM은 그 환각이었고, 숫자의 입력은 올바르지만 그것은 말하고 출력했습니다. 음, 나는 제시어 엔지니어링으로 그것을 해결하려고 시도했습니다. 작동하지 않았습니다. 음, 내가 토큰화기 레이어 수준으로 깊이 들어갔을 때, 나는 봤습니다. 좋아, 반복된 숫자들은 실제로 하나의 토큰으로 간주되지 않고 각 숫자는 별도의 토큰으로 간주됩니다. 이것이 토큰화기의 방식입니다.

음, 진정으로 문제를 완전히 해결한 해킹은 각 숫자 사이에 쉼표를 추가하는 것입니다. 이것이 작동하는 이유는 언어 모델이 이제 각 숫자를 별도의 토큰으로 볼 수 있고, 우리는 실제로 나중에 발견했습니다. 음, 논문이 발행되었습니다 음 당신은 sync와 Stro 2024를 찾을 수 있습니다. 이것은 음 우리가 문제를 해결한 후 발행되었습니다. 하지만 만약 당신들이 그런 것을 만난다면, 그냥 당신은 그것을 찾을 수 있다는 것을 알고, 쉼표를 추가하는 것이 음 문제를 해결하는 데 도움이 될 것입니다. 그것은 약 천 개 중 5번 발생합니다. 하지만 당신이 기업 고객과 함께 작업하고 있다면, 5번은 너무 많습니다.

그래서 이것은 나가 거기서 만든 약간의 개인적인 유감이며 음 많은 YC의 결정이므로 음 조언은 빠르게 움직이고, 빠르게 깨뜨리는 것이지만, 나는 내가 변화를 밀어낼 때 일부 결정에 대해 더 의도적이었기를 바랍니다. 네, 그렇게 많은 고객 고통을 일으키지 않을 것입니다. 그래서, 단지 단방향 문 결정과 양방향 문에 대해 더 의식적입니다. 그래서, Isaiah의 이야기로 돌아가서, 음, 그는 여전히 지금까지 그 나를 믿지 않았던 것에 대해 나를 놀립니다. 코드만으로 그렇게 큰 영향을 미칠 수 있다는 것을 아는 것은 슈퍼 강력합니다. 음, 나는 단지 당신들이 내가 배운 일부 교훈과 내가 만든 실수로부터 배우기를 원합니다. 그래서 당신들은 다른 서비스를 확대하거나 음성 인공지능을 통합할 수 있습니다 음 나가 할 수 있었던 것보다 더 크게 될 수 있습니다.

그래서, 감사합니다, 당신의 시간에 대해 감사합니다. 그리고 네, 내 LinkedIn은 여기 있으므로 만약 당신들이 손을 내밀고 싶다면입니다. 정말 감사합니다, Anon. 다음으로, 우리는 이 디자인을 볼 것입니다. 어, 우리는 평면 디자인 출력을 넘어, 단지 자동 완성을 넘어 이야기할 것입니다. 그래서, 우리는 어떻게 인공지능이 가져온 복잡한 디자인 문제와 기업 디자인 병목을 해결합니까? 이를 위해, 우리는 Oberllo의 인공지능 책임자 Lin New를 가지고 있습니다. 그녀는 그녀의 설치가 완료된 후 그녀의 생각을 공유할 것입니다. 음, 이것 음 정말 시간이 많이 걸리고 비싸며, 음 같은 마케팅 내용 음 브랜드와 규모를 만들 수 있습니다.

그래서, 만약 당신이 여기를 볼 수 있다면, 마케팅 채널이 증가할 때, 브랜드는 내용 창출에 대한 무자비한 수요에 직면합니다. 예를 들어, 당신이 음 마케팅 캠페인 또는 광고 음을 만들고 싶을 때 다양한 형식, 같은 Tik Tok, Facebook 음 Instagram 등등 또는 LinkedIn을 가로질러 입니다. 네. 그래서 우리는 많은 불평을 들었습니다 음 그리고 다양한 회사의 CMO, 설계 주책임자로부터 추천들이 있습니다. 크기 관계없이. 그들은 모두 전통 설계 도구가 느리고, 비싸고 전문 설계 기술에 의존한다는 것을 인정해야 합니다. 모든 사람이 큰 설계 또는 마케팅 팀을 여유 있게 가질 수는 없습니다. 그래서 우리는 Oberllo를 출시했습니다. 그래서 그것은 인공지능 파워 설계 플랫폼이며, 팀들이 즉시적이고 비용 효율적으로 규모에서 브랜드 내용을 만들 수 있게 합니다.

그래서 Canva와 다르게, 당신은 개인으로 rightway 사용할 수 있습니다만, 그것은 당신의 브랜드 특징, 당신의 브랜드 자산 또는 브랜드 목소리를 배울 수 없을 것입니다. 번영. 번영. 네. 그래서 당신이 알 수 있듯이, 그렇듯이, 음 우리가 인공지능 생성 이미지 모델을 사용하거나 비디오, 그렇지 않나요, 우리는 음 모델 붕괴의 문제를 가지고 있습니다. 당신이 계속 제시어하고 음 이 제목을 다른 색깔로 바꾸거나 로고를 바꾸거나 이렇게 것 같은 것을 바꿀 때입니다. 그래서 당신이 계속 음 이전의 음 생성된 인공지능 이미지를 사용할 때 당신이 제시어할 때 다음을 적응시키기 위해, 그것은 모델 붕괴를 초래할 것입니다. 그래서 우리 음 Oberllo에서 우리 음 그 평면 설계를 완전히 편집 가능한 장소로 바꿀 수 있었습니다. 당신은 그냥 것을 이동할 수 있고, 당신은 색깔을 바꿀 수 있고, 당신은 당신의 브랜드 자산에서 배운 색깔을 쌍으로 만들 수 있습니다.

그래서 여기 당신이 알 수 있듯이, 우리는 많은 음 작업 공간 또는 도메인을 가지고 있습니다. 모델은 음 그들 자신의 브랜드 지침 특징 등등을 기준으로 독점적으로 훈련될 것입니다. 네. 예를 들어, Oberllo, 나는 당신이 Funan Mo에 가면, 당신들은 그곳에 상점을 보게 될 것 같은데, 그들은 이제 우리의 고객 중 하나입니다. 네, 당신은 여기를 볼 수 있습니다. 어, 우리 음 많은 음을 사용했습니다 그들의 독점 음 훈련 음 데이터 그리고 우리의 설계 팀 같은 것입니다. 우리가 훈련한 것 음 모델은 인터넷에서 단지 그래빙하는 것이 아니라 당신은 알고 있듯이, 아주 개인적인 것 같은 것입니다. 네. 어, 그래서 이것은 우리 인공지능 조정 크기 설명 중 하나입니다. 만약 당신이 이전에 Canva에서 크기를 조정하려고 시도했다면, 당신은 음 때때로 그들은 단지 요소를 복사해서, 그냥 전체 캔버스를 늘릴 것입니다.

하지만 여기 당신은 그것이 영리하게, 당신은 알고 있습니다. 이 모든 음 요소들을 재정렬할 것을 볼 수 있습니다. 네, 당신은 그것을 볼 수 있습니다. 음, 그래서 그것은 단지, 당신은 알고 있고, 복사해서, 캔버스를 늘리는 것이 아닙니다. 네. 그리고 당신이 또 다른 음 또는 비디오 또는 또는 이미지 같은 것으로 미디어를 교체할 때, 그것은 모든 형식과 활동에 따라 변경할 것입니다. 네. 그래서 그것이 그 것입니다. 그 것은 음 당신이 마케팅 캐고리 또는 광고 한 기술 그리고 브랜드로 무엇을 하는지입니다. 여기 당신이 우리의 인공지능 스튜디오 음을 사용하는 방법입니다 우리가 가진 기능 음은 당신이 알고 있는 인원 주제와 제품 주제로 나누어져 있습니다. 어, 당신은 선택할 수 있습니다 음 최대 당신은 알고 있는 8개의 이미지 음 고급, 그리고 당신은 그냥 그들을 이름 붙일 수 있습니다. 당신이 그것을 Malo 자켓 또는 비슷한 것으로 넣을 것을 말해봅시다.

그리고 이제 당신은 광고 또는 이 모델을 사용하는 그림에서 생성하고 싶어합니다. 그런데 Rick Owen의 것을 입은 그녀라고 합시다. 네. 그리고 우리는 당신이 알고 있기 당신이 알고 있는 동시에 생성할 수 있습니다 음 다중 형식 또는 크기로입니다. 네. 이 모든 정보는 당신이 알고 있는 음 똑똑하게 음 당신의 브랜드 도메인에 저장됩니다. 당신이 알고 있는 제품을 나열하기 위한 설계 참조가 있는 경우 예를 들어 또 다른 예라고 합니다. 그래서 당신은 어딘가 설계 참조를 가지고 있고, 당신은 당신의 자신의 열차 제품을 가지고 있습니다. 당신은 당신이 알고 있기 당신은 그들을 하나하나 함께 넣고 싶습니다. 당신은 태그를 추가할 수 있고, 음 그것이 당신이 지칭하는 어느 주제인지 이해할 것입니다. 네. 네. 그래서 이것이 그 결과입니다. 여기 당신은 실제로 세련된 클릭할 수 있고, 만약 당신이 그 어떤 세부 사항을 바꾸고 싶다면, 그것은 완전히 편집 가능할 것입니다. 당신은 실제로 바꿀 수 있습니다 음 텍스트가 당신이 알고 있는 것이 아니라 다시 제시어하는 것 같은 비트입니다. 음, 당신은 실제로 열고 편집기로 들어갈 수 있고 더 많은 것을 할 수 있습니다. 네.

그래서 어 우리는 또한 짧은 형식 비디오 같은 것을 가지고 있습니다. 당신은 음 당신이 알고 있는 광고판에서 방송하거나 어떤 종류의 음 같은 동적 배너입니다. 네. 그래서 그것은 전부 음 우리의 어 Oberllo 플랫폼의 전체 개요입니다. 그리고 여기 당신은 그것이 이것은 브랜드 광고 세트라는 것을 볼 수 있습니다. 당신은 그냥 실제로 어 당신의 URL을 끌어당기거나 당신의 PDF 파일을 넣을 수 있거나, 음 Google Docs 또는 다른 어떤 것, 그것은 모든 당신의 색깔 스킴, 주요 색깔 색깔, 보조 색깔, 음 로고, 패딩 그리고 모두 그렇게 빼낼 것입니다. 네. 그리고 당신은 실제로 그것이 자동으로 당신의 이미지에 태그를 붙일 것이라는 것을 볼 수 있습니다. 무엇 종류, 어떤 종류의 제품, 그것이 여기를 표시하는 것처럼입니다. 그래서 우리는 다른 것 같은 것을 가지고 있습니다 진행 중, 아직 출시되지 않음. 하지만 당신은 여기를 확인할 수 있습니다. 음, 여기 우리의 monty monty 웹사이트입니다. 그래서 당신은 예를 들어 같은 것을 확인할 수 있습니다. 만약 설계자가 한 번에 10개 크기를 만들고 싶다면.

어, 그 또는 그녀는 실제로 이런 방식으로 초기 설계를 할 수 있고, 그 후 어 그들은 수집 표시를 할 수 있거나 또는 이렇게 제안된 설계입니다. 이것은 단지 매우 간단한 형식입니다. 하지만 그것은 매우 복잡한 배치일 수 있습니다. 어 더욱 복잡한 캠페인을 만들 수 있게 합니다. 네. 당신은 많은 다양한 크기를 선택할 수 있고, 그것이 자동으로 어 확장할 것을 볼 수 있습니다. 마치 당신이 Figma에서 본 것처럼, 무한 캔버스가 있습니까? 그래서 어 이것은 다중 조정 크기의 결과입니다. 이전에 만약 대리점 어 대리점이 어 1주에서 2주를 소비해야 했다고 상상해 보세요. 당신은 알고 있습니다. 이 모든 것을 재정렬하는 것, 이제 우리는 한 번의 클릭으로 할 수 있습니다. 네. 그래서 어, 로드하고 있는 것의 경우, 그것은 나중에 로드할 것입니다.

어, 누가 완료되면 먼저 표시될 것입니다. 음, 네, 참석해 주셔서 감사합니다. 네, 이것이 제 발표입니다. 정말 훌륭한 일입니다. Lynn, 정말 감사합니다. 마지막 두 강연입니다. 버티십시오, 여러분. 우리는 첫째 날 강연의 끝에 거의 다 왔습니다. 이 회의를 마치기 위해, 우리는 두 개의 강연이 더 있습니다. 첫 번째는 Stefania Duga가 진행하며, 그녀는 Sakana AI의 연구 과학자입니다. 그녀는 주권 AI에 관해 이야기할 것입니다. 그렇다면, 어떤 국가의 최첨단 모델을 현지화하려면 어떻게 해야 할까요? 이 경우 일본입니다. Sakana의 본부가 일본에 있기 때문입니다. 어, 어, Stefania를 준비시키겠습니다. 그러면 어, 우리가 시작할 수 있습니다. >> 안녕하세요. 안녕하세요. 마이크가 작동하고 있나요? 제가 준비하는 동안, 긴 하루였다는 것을 알고 있습니다. 당신은 많은 강연을 앉아서 들었습니다. 따라서 저는 당신에게 한 번 일어서도록 초대합니다. 모두 일어날 수 있으신가요?

우리가 호흡 운동을 할 것입니다. 숨을 들이마십시오. 내쉬십시오. 좋습니다, 협조해 주셔서 감사합니다. 훌륭합니다. 이제 우리가 시작할 준비가 되었습니다. 어, 잠시만 더 기다립시다. 음, 그래서 오후입니다. 제 이름은 Stefania Dugga입니다. 나는 Tokyo Sakana AI의 연구 과학자입니다. 오늘 저는 주권 AI에 관해 당신과 이야기하려고 합니다. 음, 제 의도는 반드시 어느 국가든 현지 모델을 구축하는 것이 아니라, 현지 기관이 전 지구적 능력을 보유하는 것에 관한 것입니다. 그리고 이를 생각해 보는 것입니다. 따라서 실제로, 주권 AI를 생각할 때, 세 가지를 고려하는 것이 중요하다고 생각합니다. 음, 데이터 — 어떤 데이터를 현지에서 유지해야 하는지, 어떤 모델이 현지 사용에 가장 잘 적응하는지입니다.

계산과 평가 — 어떤 종류의 계산 자원이 필요한지, 어떤 워크플로우가 현지에서 실행되는지, 어떤 워크플로우가 클라우드에서 실행되는지, 그리고 책임성 — AI 시스템을 기관에 도입할 때, 누가 책임을 유지하는지를 결정하는 것입니다. 따라서 저는 이 주제에 관심을 가지게 된 방식을 설명하는 개인 이야기를 당신과 공유하고 싶습니다. 음, 저는 루마니아 Transylvania의 작은 마을에서 왔습니다. AI 연구에 종사하기 전에, 저는 전 세계의 아이들, 가족, 그리고 교육자들을 위해 AI 문해력 워크숍을 주최했습니다. 싱가포르의 여기를 포함해서 말입니다. 이것은 어, 2013년 어린이 학술 해커톤에서 온 비디오입니다. 이 워크숍, 교실, 메이커 스페이스, 그리고 도서관에서 제가 배운 것은 사람들이 AI에 매우 관심이 있다는 것입니다. 그들은 그것을 사용하고 싶어하지만, 많은 경우 AI 모델과 시스템이 그들의 언어와 현지 필요에 적응하지 못합니다.

이것은 오늘날의 최첨단 AI 능력으로 변환됩니다. 우리는 커뮤니티와 사람들이 AI 시스템에 적응하기를 기대하며, 시스템을 현지 필요에 적응시키지 않습니다. 일본에서는, 이러한 현지화가 많은 과제를 야기합니다. 우리는 언어의 다양한 등급, 다양한 문화적 규범, 다양한 워크플로우, 과학적 관행, 안보 및 보안 정책을 고려해야 합니다. 따라서 현지화 과제는 기관 수준 그리고 다양한 측면에서 있습니다. 주권, 어, 저는 당신이 이것을 스택으로 생각하기를 원합니다, 그렇지 않으신가요? 그것은 데이터로 시작하고 우리가 필요로 하는 고유한 데이터의 종류를 파악합니다. 음, 그 다음 그것은 평가로 이동합니다. 우리가 중립성, 진실성, 국가별 벤치마크를 어떻게 확인하나요? 음, 그 다음 우리는 적응에 관해 이야기합니다. 이것은 주로 후기 훈련, 미세 조정, 도구 사용을 통해 발생합니다.

그 다음 우리는 라우팅 계층을 가지고 있습니다. 여기서 우리는 정책 인식 모델 선택 상호 작용이 필요합니다. 우리의 사용자는 누구인가요? 다양한 역할이 무엇인가요? 어, 다양한 사용자 경험 결정이 무엇인가요? 우리가 어떻게 이 모델과 제품을 사용자에게 제시하는지, 그리고 거버넌스 말입니다. 따라서 그 너머로도 물리 계층이 있습니다, 그렇지 않으신가요? 왜냐하면 스택의 다양한 측면이 사전 훈련에 대해 다양한 요구사항을 가지고 있기 때문입니다. 어, 우리는 많은 데이터와 막대한 계산이 필요합니다. 대부분의 경우 비용이 금지됩니다. 후기 훈련의 경우, 우리는 현지 규범과 선호도에 매우 신경 써야 합니다. 특정 프로젝트와 제품에서 우리가 이를 어떻게 특별히 고려하는지 보여주는 몇 가지 예를 당신에게 보여주고 싶습니다.

따라서 어, 지난 어, 음, 3월 24일, 우리는 첫 번째 소비자 제품인 Sakana Chat을 출시했습니다. 이 소비자 제품에서 어, 우리, 그것이 일본의 사람들에게 무료로 제공됩니다. 어, 그것은 웹 검색이 탑재되어 있습니다. 하지만 우리가 실제로, 그것은 일본의 누구나 사용할 수 있습니다. 우리는 실제로 다양한 상호 작용 방식을 지원합니다. 따라서 우리는 어, 표준 모드를 지원합니다. 어, 이것은 중립적인 기본값 일본어 등급이지만, 우리는 또한 케오 정식 모드를 지원합니다. 이것은 정식 배경에서 더 자주 사용됩니다. 우리는 방언 오사카 모드를 지원합니다. 이것은 실제로 어, 카이 방언으로 답변을 제공합니다. 사람들은 이것을 정말 높이 평가합니다. 우리는 매일 30,000명이 넘는 활성 사용자를 보유합니다. 이 특정 프로젝트에서, 우리는 후기 훈련을 주권 제어점으로 사용합니다. 따라서 우리는 Deep Seek, Llama, GPTOSs 같은 개방형 최첨단 모델로 시작합니다.

그 다음 우리는 평가와 선호도를 위해 고유한 어, 일본 데이터를 제공했습니다. 우리는 정책 전문가 패널과 함께 일련의 중립성 지표를 정의했습니다. 그 다음 우리는 이 개방형 가중치 모델에 이것을 사용하여 후기 훈련을 진행했으며, 우리가 Namazu라고 부르는 모델을 만들었습니다. 우리는 어, 평가했습니다. 우리는 후기 훈련 모델과 기본 모델 간의 평가를 비교했습니다. 우리는 후기 훈련 모델이 중립성과 사실적 정확성에서 원본 모델을 능가한다는 것을 보여주었습니다. 하지만 그것이 그들을 능가했다는 사실이 유일하게 중요한 것은 아닙니다. 우리가 또한 보여준 것은, 이러한 많은 기존 모델들이 단지 어, 더 민감한 질문에 답변하기를 거부한다는 것입니다. 예를 들어, 당신이 Deep Seek에게 「정부 어, 다양한 국가의 인터넷 검열에 관해 알려 주십시오」라고 물으면, 그것은 답변을 거부하거나 일반적인 하이레벨 어, 답변을 제공합니다.

어, 우리의 후기 훈련 이후, 우리는 Namazu가 실제로 다면적 어, 반응을 제공했다는 것을 보여주었으며, 구체적인 어, 뉴스 기사로 향하는 링크가 붙어 있습니다. 어, 이들 어, 신뢰할 수 있습니다. 제가 보여주고 싶은 두 번째 프로젝트는 AI Scientist의 작업입니다. 이것은 과학 능력에 초점을 맞춥니다. 주권의 한 형태로서 말입니다. 따라서 어, 이 프로젝트에서, 우리는 실제로 전체 연구 워크플로우를 지원하는 다중 에이전트를 사용합니다. 따라서 어, 에이전트는 아이디어 생성, 참신성 검사, 아이디어 채점부터 시작합니다. 그 다음 어어, 우리는 트리 기반 실험을 사용하여 이러한 다양한 아이디어를 테스트합니다. 그들을 위해 코드를 생성합니다. 제거 연구를 합니다. 마지막에 우리는 실제로 완전한 논문을 만들었습니다. 어, 결과를 제시합니다. 이 작업은 어, 지난 달 어, Nature에서도 특집으로 게재되었습니다.

음, 이것은 AI Scientist가 트리 검색을 어떻게 사용하여 어, 다양한 가설을 처리하고 그것들을 테스트한 다음 최고의 후보를 선택하는 방법입니다. 그리고 이 어, 시스템 생성 논문은 어, 첫 번째 어, 완전히 생성된 논문입니다. 작년 ICLAIR에서 어, 동료 검토를 통과했습니다. 어, 제가 보여주고 싶은 또 다른 예는 우리가 어떻게 다중 에이전트 조율을 사용하는지입니다. 따라서 이것을 위해, 매우 중요한 개념은 스위치 개념입니다. 어, 이 스위치는 자동으로 이 작업이 얼마나 어려운지에 따라 작업을 가장 적절한 모델로 라우팅하는 방법을 배웠습니다. 그리고 이런 식으로 우리는 비용과 안보를 최적화합니다. 라우팅은 주권의 한 형태로 볼 수 있습니다. 어, 특정 솔루션을 글로벌 솔루션과 격리하는 방식이 아닙니다.

따라서 만약 요청이 어, 일본 배경과 매우 관련이 있다면, 그것은 일본 후기 훈련 모델로 전송될 것입니다. 만약 당신의 어, 요청이 매우 민감하면, 아마도 그것은 로컬 안보 모델로 라우팅될 것입니다. 또는 아마도 어, 인간 검토를 요청합니다. 따라서 주권 능력으로서의 이러한 조율 아이디어는 우리에게 아키텍처 초점일 뿐만 아니라 연구 초점이기도 합니다. 어, 우리는 믿습니다. 어, 우리의 베팅은 가장 유능한 AI 시스템은 전문 에이전트의 집합이지, 단일 확장된 모델이 아니라는 것입니다. 그리고 우리가 실제로 보여준 것은 우리가 방금 출시한 Sakana Fugu에서, 우리는 특정 작업이 주어졌을 때 최고의 모델을 선택하도록 학습된 오케스트레이터를 훈련할 수 있습니다. 어, 하지만 이 오케스트레이터는 또한 자기 자신을 재귀적으로 호출하는 방법을 배워 더 어려운 작업을 처리할 수 있습니다.

그리고 이 작업은 어, 이제 베타 액세스가 가능합니다. 그리고 올해 ICLAIR의 두 논문에서 특집으로 게재되었습니다. Fugu의 평가에서, 우리가 본 것은 조합이 규모를 이긴다는 것입니다, 그렇지 않으신가요? 따라서 어, 우리는 Fugu를 비교했습니다. 그것은 최첨단 모델 풀을 조율합니다. 이것은 어, 현장 CodeBench, Sweep Pro, 그리고 다른 평가 벤치마크에서 이 집합의 어떤 단일 멤버보다 우수합니다. 어, 다음으로 저는 도메인 적응에 관해 이야기하고 싶습니다. 왜냐하면 우리는 모두 데이터 부족을 알고 있고, 우리가 현재 디지털화하지 않은 많은 데이터가 있습니다. 예를 들어 많은 암시적 지식이 있으며, 이것은 누락된 데이터 세트입니다. 따라서 우리가 은행, 병원, 예를 들어 의료, 정부 어, 다양한 기관과 협력할 때, 우리는 전문가 비판과 피드백을 우리가 개발하는 모델과 도구에 통합할 프로세스를 가져야 합니다.

예를 들어 어, 우리가 신용 메모에 대해 MUFG 및 SNBC와 같은 일본의 일부 주요 은행과 협력할 때, 우리는 어, 1,000개가 넘는 피드백을 요청했습니다. 이러한 피드백은 모델로 다시 피드백되었으며, 어, 모델은 그들의 전문 분석가를 위해 더 나은 신용 메모를 만드는 방법을 배웠습니다. 마지막이지만 덜 중요하지 않은 것은, 우리는 또한 일본 정부를 지원합니다. 따라서 우리의 팀은 어, AI 기반 정보를 사용하여 소셜 미디어를 분석할 수 있으며, 정보 조작 캠페인이 어떻게 시작되고 진행되는지 정확하게 보여줍니다. 아마도 가장 중요한 주권 AI의 형태는 주도적 아키텍처에 의문을 제기할 로컬 능력을 유지하는 것입니다.

따라서 우리의 CTM, Continuous Thinking Machine 작업에서, 어, 우리 팀은 실제로 어, Transformer 너머의 새로운 아키텍처를 제안했습니다. 이 아키텍처는 뇌에서 영감을 받았습니다. 여기서 추론은 시간에 따른 뉴런의 동기화에서 나옵니다. 따라서 어, 단일 전달 주의가 있는 것이 아니라, 어, 다중 주의 헤드가 있으며, 어, 이들 어, 조율되고 있습니다. 따라서 모델은 미로 풀기와 같은 매우 복잡한 작업을 수행하는 방법을 배웠습니다. 그것이 그것을 하는 방식은 인간에게도 해석 가능합니다. 왜냐하면 그들은 아래의 활성화를 볼 수 있기 때문입니다. 어, 우리는 또한 이미지 분류에 테스트했습니다. 여기서 우리는 실제로 주의 헤드가 시간에 따라 이미지의 정확히 어느 부분에 집중하고 있는지 볼 수 있습니다.

그리고 계산은 실제로 조정되었습니다. 어, 더 단순한 이미지의 경우, 그것은 분류를 결정하는 데 더 적은 시간이 걸립니다. 복잡한 이미지보다 말입니다. 따라서 이것들은 단지 우리가 Sakana에서 수행한 작업의 몇 가지 예입니다. 제가 오늘 공유한 대부분의 프로젝트는 오픈 소스입니다. 그들은 우리의 GitHub과 우리의 블로그에 있습니다. 어, 우리는 일본의 필요를 위해 AI 솔루션을 개발하고 일본에서 AI를 민주화하고 싶습니다. 저는 이 어, 주권의 스택 계층을 당신과 공유했습니다, 그렇지 않으신가요? 하지만 각 국가는 이 스택의 어느 계층을 그들이 원하는지, 그들이 할 수 있는지를 선택합니다. 따라서 어떤 단일 국가도 이 스택의 모든 계층을 소유하려고 시도하지 않습니다. 따라서 다양한 국가가 어떻게 다양한 소유권 결정을 내리는지를 보는 것이 중요합니다. 이것이 실천에서의 주권이 보이는 모양입니다. 이것입니다.

마무리하자면, 저는 당신에게 어린이로부터 부모로부터 연구자로부터 AI 엔지니어로부터의 이 메시지를 남기고 싶습니다. 어, 우리 모두가 대리인을 가지고 있다는 것을 인식하는 것이 매우 중요합니다. 로컬 대리인이 글로벌 능력보다 더 중요합니다. 어, 따라서 매우 감사합니다. Stefania, 정말 감사합니다. 오늘의 마지막 강연을 위해, 우리는 Swix 자신보다 더 나은 사람을 생각할 수 없었습니다. 어, Swix는 Cognition과 함께합니다. 하지만 그는 또한 전 지구적 AI 엔지니어 회의의 설립자입니다. 이것이 싱가포르에서 우리의 첫 번째 판이고, Swix가 싱가포르 출신이기 때문에, 그를 위해 오늘 우리를 위해 첫째 날 강연을 닫도록 하는 것이 완전히 이치에 맞습니다. 따라서 Swix, 당신이 준비가 되면, 무대는 당신의 것입니다. >> 좋습니다. 들을 수 있으신가요? 어, 저는 생각합니다. 저는 생각합니다. 그들이 라펠 마이크를 켜고 있는 것 같습니다. 어, 전환. 이것은 어디입니까? 좋습니다. 문제없을 것 같습니다. 괜찮습니다.

저는 필요가 없습니다. 네, 우리는 괜찮습니다. >> 좋습니다. 여러분 안녕하세요. 어, 지금 어떻게 지내세요? 회의 즐기세요. 네. 정말 좋습니다. 여러분 계신 거 정말 반갑습니다. 어, 혹시 모르실 분이 계시면, 저는 Sean이고 Swix라고도 불립니다. 저는 여기 세 가지 신분으로 왔습니다. 먼저, 저는 AI 엔지니어의 창립자입니다. 어, 둘째, 저는 Cognition의 자문가이자 선도적인 에이전트 실험실의 자문가이고, 그것이 뭔지 설명하겠습니다. 셋째, 저는 여기 싱가포르인으로서 왔습니다. 이 세 가지 신분이 모두 이 한 번의 강의에서 합쳐진다고 생각하며, 정말 여러분과 나누고 싶습니다. 어, 그래서 시작해 봅시다, 맞죠? 어, 이 클릭기가 전혀 작동하지 않는다고 생각합니다. 좋아요, 클릭기를 건너뛰겠습니다. 어, 그래서 먼저 우리가 하나의 회의로서의 이야기에 대해 조금 말하겠습니다. 어, 기쁘게 말씀드리지만, 여러분 알다시피 어 우리 어 이 회의가 이미 3살입니다.

어 그것이 진행 중에 있고 어 그것이 이미 세계 곳곳에서 런던에서 파리로 샌프란시스코로 뉴욕으로 마이애미로 어 지금 싱가포르로, 다음으로 멜버른으로 퍼져 있습니다. 어 우리는 상당히 성장했습니다. 어 우리는 이제 매월 150만 명의 고유한 개발자에게 서비스하고 있습니다. 어 어 9,000명 이상이 여러분이 직접 참석하신 것 외에도 오늘의 라이브 스트림을 보셨습니다. 어 우리는 정말로 세계 곳곳에서 개발자 커뮤니티를 발전시키고 어 AI 엔지니어링 산업에 서비스하기 위해 최선을 다하고 있습니다. 어 하지만 특히 싱가포르, 여러분 알다시피, 저는 항상 싱가포르 팬이었습니다. 저는 여기서 태어나고 자랐습니다.

저 어 저는 대학을 위해 외국에 나갔습니다 어 미국에, 하지만 어 저는 계속 매우 솔직하고 공개적으로 어 싱가포르를 옹호해 왔고, 어 특히 어 동료 싱가포르인을 위해, 하지만 또한 다른 사람들이 싱가포르를 처음 방문하려고 시도할 때, 저 어 저는 실제로 Stefania 같은 국제적인 친구들과 어 저는 많은 이러한 친구들을 싱가포르에 처음 방문하게 된 것이 정말 기쁩니다. 어 실제로 제 개인적인 경력의 시작 플랫폼은 싱가포르에 있었습니다. 어 저는 GSCOM Asia에서 연설했고, 여전히 제가 한 가장 좋아하는 연설 중 하나입니다. 어 그것이 정말 제게 가능성을 주었습니다 어 단지 제 자신의 경력뿐만 아니라, 또한 산업에 영감을 주고, 국가에 어 함께 영감을 줄 수 있는 능력 말이죠. 어 저는 또한 많은 싱가포르 밋업을 조직했으므로, 저 어 이것에 대해서는 어느 정도 새로운 것이 아닙니다.

어 여기 있는 저희의 몇몇 친구들은 Lihao와 Thor와 Thomas를 포함합니다. 어 여러분 중 몇몇이 본 사람들, 그는 어 엔지니어링과 회의 회로의 익숙한 면모입니다. 어 최근에 약 3, 4년 전 저는 샌프란시스코로 이사했습니다 어 그리고 Latent Space를 시작했습니다. 어 손을 들어 주세요 저는 혹시 누군가 Latent Space를 들어봤는지 모르겠고, 제 팟캐스트는 네 좋습니다, 매우 감사합니다 청청해 주셔서. 어 그것의 일부로서, 저는 AI 엔지니어라고 불리는 이런 것이 있을 거라는 깨달음을 얻었습니다. 어 저는 시작했고 어 저는 이것을 썼습니다 어 악명 높은 한 줄의 문장을, 저는 제 나머지 인생을 가지고 살아갈 것입니다.

어, 기본적으로 이렇게 말이죠, 연구 엔지니어와 풀스택 엔지니어 사이에 어떤 종류의 간격이 형성되었는데, 어, 이것이 정말 여러분이 오늘 모두 하고 있는 일 - AI 엔지니어 말입니다, 저는 이것이 거대하고 계속 증가하는 수요라고 생각합니다. 어, 혹시 모르실 분이 계시면, 혹은 이 회의에 오셨지만 블로그 게시물을 읽지 않으셨다면, 여러분은 아마도 어 읽어야 할 것 같습니다 AI 엔지니어의 정의가 뭔지 대략 같은 시간에, 저는 실제로 직접 몇 가지를 시작했습니다, 저는 단지 콘텐츠 크리에이터가 아니었고 저는 단지 커뮤니티 담당자가 아니었습니다. 어, 저는 또한 빌더였습니다. 어, 저는 단지 매우 좋은 빌더가 아니었고, 저는 이것에 대해 매우 솔직할 것입니다. 어, 저는 저 자신의 코딩 에이전트를 구축하기 시작했습니다. 그것은 초대박 인기가 되었습니다. 그것을 Small Developer라고 합니다. 어, 그것은 Claude One 위에서 구축되었고, 만약 여러분이 상상할 수 있다면 말입니다. 어, 세 가지 주요 Claude 버전이 지나갔습니다. 저는 이것 위에서 구축했습니다.

어, 저는 그것에 대해 매우 흥분했지만 결국 정말로 확장할 수 없었습니다. 그리고 모델 가중치가 하룻밤 사이에 저에게 다운그레이드되었습니다. 어, 저는 이것이 음모론이라는 것을 알고 있지만, 저는 제 것이 진짜라고 맹세합니다. 어, 이 모델이 하룻밤 사이에 더 멍청해졌습니다. 어, 그래서 저는 그것을 구축하는 것을 중단했지만, 어 전체 과정에서, 저 어, 저는 더 크고 더 나은 것으로 돌아섰습니다. 그래서 가장 초기의 AI 엔지니어로서, 저는 세 가지 유형의 AI 엔지니어가 있을 거라고 발표했습니다. 어, 저는 하지 않았고, 여러분 알다시피, 저는 어느 정도 확장하기 시작했고, 실제로 이것은 직업적 실수일 수 있습니다. 어, 그 이후 3년 동안 정확히 일어난 일은 완전히 이 순서였습니다. 어 2024년 우리는 더 많이 구축했고, 어 어떤 종류의 AI 코딩 도구, 2025년에는 더 많은 제품 같은 것들. 어, 2026년은 절대적으로 어떤 종류의 에이전트 배포의 해입니다.

어, 네, 이런 종류의 Karpathy Andre는 어느 정도 제 멘토이고, 어 그는 지난해 이것이 에이전트의 10년 시작이라고 말했고, 맞죠? 만약 여러분이 OpenAI의 설립을 2015년의 시작점으로 삼으신다면, 어 어 어, 그리고 지난 10년 동안의 스케일링을 고려하신다면, 그 다음 10년 동안 일어날 것은 아마도 배포일 것 같고, 어 그리고 에이전트 구축의 어 프레임워크와 스캐폴딩을 구축하는 것이겠죠. 어, 이것이 실제로 저를 Cognition으로 향하게 만든 경로입니다. 어 어, 그들은 세 가지 선택을 했고, 저는 Small Developer를 할 때 그것을 했기를 바랐습니다. 저는 2023년에 AI 엔지니어에 대해 썼습니다. 어, 이 세 가지 그리 명백하지 않은 선택은 코드를 선택하는 것, 어 동기와 비동기를 연결하는 것, 그리고 엔터프라이즈에 집중하는 것입니다. 저는 이러한 것들 각각이 지금 들리는 것처럼 초대박 명백하지 않다고 생각합니다.

2023년에, 여러분은 ChatGPT를 구축하고 싶었고, 여러분은 소비자 시장에 진입하고 싶었습니다. 어, 2023년에, 여러분은 아마도 자회귀 어 대규모 언어 모델을 하고 싶었을 것이고, 정말로 동기 어 동기 에이전트에 대해 생각하지 않았을 것 같고, 어 코드는 수많은 모달리티 중 하나였습니다. 어, 하지만 저는 어, 여러분 알다시피 어 비즈니스가 그것이 왕의 모달리티라는 것을 이미 보여주었다고 생각합니다. 그래서 코드를 선택하는 것 어, 저는 이것이 제가 Cognition에 대한 제 블로그 게시물에서 쓴 것이라고 생각하고, 저는 정말 코드를 소프트웨어의 에이전트로서, 코딩 에이전트로서 이야기합니다. 만약, 기본적으로, 소프트웨어가 세상을 먹고 있다면, 코드 에이전트는 소프트웨어를 먹고 있고, 그것은 실제로 많은 힘과 경제적 가치를 축적하기 시작했고, 아마도 여러분이 본 다른 모든 에이전트 데모보다 훨씬 짧은 시간에 그것을 할 수 있을 것 같습니다. 이러한 데모는 아마도 그다지 잘 작동하지 않을 것 같습니다.

두 번째 부분은 제가 어 「반동기 죽음의 계곡」이라고 불리는 또 다른 블로그 게시물에서 썼던 것입니다. 기본적으로 중간의 입장은 없습니다. 여러분은 여러분의 응답이 매우 매우 빠르기를 원하거나, 어 여러분은 비동기적으로 위임하고 싶습니다. 저는 어 응답 또는 대규모 언어 모델이 빠르게 진행되지만 충분히 빠르지 않을 때 어떤 종류의 불쾌한 계곡 효과가 발생한다고 생각합니다. 여러분은 어느 정도로 전화 저쪽에서 기다리고 있는데, 음성이든 코드든 또는 다른 어떤 상호작용 모드든 말입니다. 그래서 여러분은 기본적으로 단지 어 최고의 동기 실시간 어 경험 또는 최고의 비동기 경험을 원하고 있는 덤벨 방식입니다. 저는 이 두 가지를 충분히 걸쳐갈 수 있는 회사라면 어 초대박 잘할 것 같습니다. 어, 마지막으로, 엔터프라이즈. 어, 저는 이것이 어떤 종류의 추상화에서 의미가 있는 것이라고 생각합니다.

명백히, 여러분이 추구하고 싶은 것은 시티뱅크와 DBS와 골드만삭스 같은 큰 표지 클라이언트들 같은 것입니다. 어, 하지만 저는 그 이유를 정말로 높이 평가하지 않습니다. 그래서 저는 이것에 대해 좀 더 깊이 들어가기 위해 어느 정도 더 많은 시간을 보내려고 했습니다. 단지 여러분이 진정한 엔터프라이즈 집중이 정말로 의미하는 바를 이해하도록 하기 위해. 어, 엔터프라이즈 집중, 저 어, 저는 매우 간단한 용어로 진지한 고객에게 서비스를 제공하는 것이라고 생각합니다. 많은 AI 고객들이 진지하지 않습니다. 예를 들어 그들은 여러분의 도구를 시도하고, 그러면 그들은 여러분에게 피드백을 주지 않습니다. 그들은 여러분의 도구를 시도하고, 그들은 3개월 후에 새로운 핫한 것을 쫓아갑니다. 어, 엔터프라이즈는 여러분이 얻을 수 있는 가장 진지한 검토입니다. 어, 여러분 어, 그것이 무엇을 의미합니까? 어, 많은 도구들이 싱글 플레이어로 시작합니다. 엔터프라이즈는 즉시 멀티플레이어입니다. 수십만 명의 개발자, 수십만 개의 저장소 정도까지 말이죠.

어, 가격 책정 능력도 정말 흥미롭습니다. 어, 그것이 표준 월 20달러 계획으로 시작하지 않고 모색하는 대신 그것이 아니라, 그리고 최대 보조금을 찾는 대신, 그 다음 사람들이 보조금을 제거할 때 화내고 그 다음 다음 최고의 보조금으로 이동합니다. 어, 사람들은 결과에 대해 기꺼이 비용을 지불하고 싶습니다. 우리가 엔터프라이즈에 대해 이야기하고 있기 때문입니다. 어, 그리고 또한 하지만 저에게 가장 흥미로운 것은 첫 번째가 되는 것입니다 비싼 문제를 발견하는 것. 어, 이것은 아마도 어 엔터프라이즈 규모에서만 발견될 수 있을 것 같습니다. 어, 그래서 이것이 어떤 종류의 표준 Cognition 웹사이트입니다. 저는 여러분에게 제 버전을 보여주려고 합니다. 이것이 어, 희망하건대 더 기억에 남도록. 어, 전반적으로, 저는 이것을 「세부 사항의 Devon」이라고 부릅니다 어 이것은 어느 정도 정말로 좋은 말장난입니다. 어, 이것은 어 강연의 두 번째 부분의 주제입니다. 맞죠? 저는 Cognition에 대해 이야기하러 온 것이 아닙니다.

저는 Cognition에서 배운 것들에 대해 이야기하러 왔습니다. 혹시 여러분이 결국 에이전트 실험실을 구축하거나 에이전트 실험실에서 일하게 될지도 모르니까요. 왜냐하면 저는 이것이 어떤 AI 엔지니어든 가능한 가장 단독의 가치 있는 경험일 수 있다고 생각하기 때문입니다. 어, 참고로, 저는 「에이전트 실험실 논문」이라고 불리는 게시물에서 이것에 대해 썼습니다. 어, 이것은 저희가 뉴욕에서 한 11월 AI 엔지니어 정상회담입니다. 어, 저희는 한쪽에 에이전트 실험실을 나열하고, 다른 쪽에는 모델 실험실을 나열했습니다. 여러분은 YouTube에서 이러한 회의들을 볼 수 있습니다. 어, 만약 여러분이 에이전트 실험실 대 모델 실험실의 예시가 뭔지 보고 싶으시다면. 어, 하지만 만약 여러분이 한 가지 차트로 이것을 원하신다면, 이것이 바로 그것입니다. 어, 모델 실험실 어 훈련과 컴퓨팅으로 리소스 할당을 기준으로 따릅니다. 어, 배포로 더 적게 할당합니다. 명백히, 그 배포는 시간이 지남에 따라 증가합니다.

어, 에이전트 실험실은 리소스 할당 및 우선순위 측면에서 기본적으로 완전히 반대입니다. 맞죠? 어, 저는 이것이 대체로 옳다고 생각합니다. 제외하고는 그들이 서로의 영토를 침식하기 시작했다는 사실 말이죠. 예를 들어 저는 이것을 쓸 때, 지금은 더 명확해졌고, 모델 실험실들이 내부적으로 에이전트를 구축하고 있습니다 어 실험실, 어 OpenAI와 Anthropic도 어 엔지니어를 채용하고 있으며, 그 다음 에이전트 실험실들도 내부적으로 모델을 구축하고 있고, Cursor와 Cognition을 통해, 어 강화 학습 그들의 모델로 많은 계산을 투입하고 있습니다. 어, 만약 여러분이 어느 정도로 이러한 방식으로 그것을 분해하고 싶으신다면, 여러분도 그렇게 할 수 있습니다. 하지만 시간상 이것을 건너뛸 것입니다. 어, 저는, 어, 세부 사항이 제가 정말 노력하고 싶은 것입니다. 맞죠? 좋습니다.

그래서, 예를 들어, 어, 많은 사람들이 말할 것입니다. 어, 단지 여러분의 가장 좋아하는 코딩 에이전트 선택을 집어넣으세요. 저는 여러분을 이름으로 지칭하고 싶지 않습니다 어, 그것들이 그들을 화나게 하지 않도록. 어, 단지 그것을 컨테이너에 집어넣으세요. 어, 현실은 그것이 단지 컨테이너 포맷에 관한 것이 아니라는 것입니다. 어, 그것은 또한 단지 상태 있는 세션을 구축하는 것에 관한 것입니다. 어, 이것들은 모두 역사적으로 나타났던 모든 문제들입니다. 맞죠? 어, 그것은 그것에게 진정한 머신 시맨틱스를 주는 것에 관한 것이고, 그것에게 모든 진정한 컴퓨터가 사용하는 도구들을 주는 것에 관한 것입니다.

어, 이것은 흥미로운 실제 생활 상황의 예시입니다. 그곳에서 공유된 머신 어 만약 여러분이 여러분의 세션이 상태 있는 세션인 코딩 에이전트로 멀티테넌시를 구현하고 싶으신다면, 그것은 실제로 깨져 버립니다. 맞죠? 그래서 이것은 실제 사건입니다. 어, 이것들은 같은 근본 원인을 가진 실제 사건들입니다. 맞죠? 어, 실제 사건 예를 들어, 병렬 에이전트 세션들이 서로 간섭합니다. 왜냐하면 그들은 공유된 캐시를 가지고 있기 때문입니다. 어, 또는 에이전트와 자동 이상 모드가 전체 회사의 소스 코드를 개인 GitHub에 발행합니다. 그들이 왜 어, 비밀키를 어 섞여 있기 때문입니다. 맞죠? 어, 그들이 모두 공유하는 것은 기본적으로 여러분이 컨테이너 내에 격리 경계가 없다는 것입니다. 왜냐하면 컨테이너는 한 가지 일만 알고 있기 때문입니다. 어, 하지만 그것은 정말로 어, 그것은 정말로 에이전트 세션들 사이에서 문맥을 건너뛰거나 변경하기 위해 설정되지 않았습니다.

음, 기본적으로 궁극적으로 구축하게 되는 것은 에이전트 플랫폼인데, 이는 VM 또는 컨테이너 위에 있는 모든 것입니다. 음, 이것이 완전한 목록입니다. 저는 기본적으로 어느 정도 이것을 오픈소스화했습니다. 여러분이 에이전트 랩을 구축하고 싶다면, 이것들이 여러분이 반드시 거쳐야 하는 정확한 사항들입니다. 만약 여러분이 음, 구매를 고려하고 있다면, 이것이 음, 새로운 에이전트 랩을 처음 마주할 때마다 여러분이 평가해야 하는 것입니다. 음, 보안은 매우 매우 중요합니다. 물론 특히 여러분이 로컬에서 다중 사용자이고, 팀과 조직의 여러 계층이 있다면 말입니다. 음, 따라서 음, 에이전트는 절대적으로 많은 범위, 신원, 최소 권한이 필요하며, 이것들은 모두 여러분이 어느 정도 권한 모델 측면에서 다루어야 하는 것들입니다.

음, 둘째로, 인식은 GPT 래퍼입니다, 맞죠, 마치 그것이 모든 음 애플리케이션 레이어 사람들의 전부인 것처럼. 음, 저는 어느 정도 여러분이 자랑스럽게 GPT 래퍼가 될 수 있다고 생각합니다만, 여러분 음, 전체 게임의 이름은 그것을 두껍고 가치 있게 만드는 것입니다, 맞죠. 음, 따라서 현실은 그들이 실제로 장기적으로 모델 다양성을 고수하고 있다는 것인데, 이는 역사적으로 항상 매우 좋은 내기였습니다, 맞죠, 음, 모델 다양성은 이미 입증되었습니다 음, 시간이 지남에 따라 증가하는 경향이 있습니다, 음, OpenAI의 시장 점유율은 한때 70~80% 정도였고 이제 30개 이상의 백분율로 하락했습니다, 음, 음, 소스에 따라 달라집니다, 음, 그리고 음, 여러분은 단지 훈련하는 것뿐만 아니라, 여러분은 단지 다른 사람의 모델을 래핑하는 것뿐만 아니라, 여러분은 또한 여러분 자신의 도메인 특정 데이터와 사용 사례에 따라 훈련할 수 있는 능력이 점점 더 증가하고 있습니다. 음, 따라서 Cognition 음, 이 음, 이러한 달콤한 약탈 모델과 3.5 모델은 저도 참여했고, Cursor도 하고 있습니다.

음, 저는 충분히 능력 있는 다른 에이전트 랩도 음 음 구축할 수 있는 충분한 자원을 가질 것이라고 생각합니다, 그리고 여러분이 해야 합니다. 왜냐하면 여러분의 목적에 대한 적합성이 훨씬 더 좋을 것이기 때문입니다, 맞죠, 예를 들어 음 음 여러분의 대부분의 워크로드의 경우. 알았습니다. 음, 하나 더 인식. 음, 평가는 이러한 모호한 마케팅 개념입니다, 맞죠? 예를 들어, 음, 여러분 대부분은 그냥 음, SWE-bench를 봐라고 말합니다, 제 수치가 다른 수치보다 0.1% 높습니다. 제 모델이 더 낫습니다. 음, 현실에는, 음, 현실은 극도로 다차원적입니다. 음, 따라서 이것은 Cognition 내부에서 실행할 수 있는 모든 다양한 유형의 평가의 모든 예입니다. 음, SWE-bench에서는 요약할 수 없습니다. 물론 여러분은 각 음, 이 실제 삶의 사용 사례의 각각에 대해 다른 접근 방식을 가져야 합니다.

이들 각각은 뒤에 수십억, 수백억 달러를 가질 수 있습니다. 음, 따라서 저의 음, 매운맛 뜨거운 의견은 엔터프라이즈가 여러분이 얻을 수 있는 가장 어려운 평가라는 것입니다, 맞죠? 예를 들어 음 엔터프라이즈보다 더 어려운 강화 학습 환경을 저에게 보여줍시오. 음, Cognition 자체는 여러 조직, 여러 Slack 그리고 여러 음 IT 시스템을 가진 엔터프라이즈입니다, 그 모든 것들. 음, 그것은 지난 음 6개월 동안 정말 해결되었습니다. 제게 흥미로웠던 것은 6개월을 추가했고, 예를 들어 저는 그것이 좋다고 생각했습니다, 이제 저는 이제 좋은 다른 정의를 가지고 있습니다. 음, 흥미로운 것은 그것이 AR 성장과 관련이 있다는 것이고, 이 모든 것이 공개적으로 공개되었습니다. 따라서 저는 여러분에게 여러분이 모르는 것을 말하고 있지 않습니다. 음, 음, 새로운 것 저 음 음, 저는 나중에 보여줄 것입니다.

음, 하지만 저는 정말 음, 그것이 여러분이 추적해야 하는 것 중 하나라고 생각합니다, 예를 들어 여러분이 세상에서 얼마나 많은 문제를 해결하는 것에 대해 어떻게 정직한지에 대해, 음, 대 음, 흥미로운 데모를 하는 것 대. 음, 제 생각에 흥미로운 것 중 하나는 또한 소통입니다, 음, 어떤 종류의 결과 사람들이 지불합니다. 음, 랜딩 페이지에, 브로슈어에, 연설에서 이렇게 하는 것은 매우 어렵습니다. 음, 따라서 저는 기본적으로 전혀 노력하지 않았습니다, 예를 들어 저는 단지 사람들이 이것을 붙여넣기를 기대하기 때문에 저는 여기에 이것을 붙여넣었습니다, 하지만 저는 단지 음, 그것을 건너뛰겠습니다, 저는 여러분에게 더 로컬한 구체적인 이야기를 말할 것입니다, APAC 그리고 싱가포르에서 우리가 발견한 것에 대해, 왜냐하면 그것이 기본적으로 제가 오픈소스할 수 있는 이유입니다. 네. 알았습니다. 따라서 그것이 세 번째 부분입니다, 음, 왜 싱가포르, 음, 제가 왜 여기 있는가?

음, 저는 음, 요약할 수 있다면, 싱가포르 경제 발전의 음 이야기는 무역으로 시작했고, 그 다음 우리는 석유로 전환했고, 그 다음 우리는 금융으로 전환했습니다. 우리는 생물 분야에서 약간의 로맨스를 가졌습니다. 음, 암호화폐 측면에 대해 얘기하지 말도록 합시다. 음, 하지만 음, 다음은 무엇입니까, 맞죠? 따라서 저의 매운맛 의견은 우리가 모든 이러한 음 선도적인 선도적 인물을 가지고 있다는 것입니다. 흥미로운 사실, 누군가 Keo와 Sam Corp이 Catrium으로 합병되었다는 것을 알고 있습니까? 저는 방금 발견했습니다. 여러분 중 한 명이 알고 있습니다. 음, 따라서 어떤 진정한 싱가포르인이라도 「네, Sim Corp, Marine, Keo Corp」이라고 말할 것입니다. 무엇이 Catrium입니까? 음, 이것이 새로운 실체입니다. 어쨌든, 저의 제 어느 정도 장난스러운 답변은 명백히 싱가포르 경제의 네 번째 단계가 있다는 것입니다, 그리고 그것이 여기입니다. 음, 음, 저는 여기에 있습니다 왜냐하면 싱가포르가 Cognition의 아시아 본부로 선택되었기 때문입니다.

음, 어느 것이 예 음 매우, 초 흥미롭습니다. 음, 저는 여러분이 어느 정도 음 싱가포르인이라도, 저는 여러분이 이 여정을 거쳐야 한다고 생각합니다, 이는 어느 정도 우리가 항상 원했던 것입니다, 맞죠, 음, 우리는 항상 MNC, 여러분이 알고 있는 로컬 용어, 음, 여기서 그들의 기지를 선택하도록 원했습니다 단지 판매만 아닌, 어느 것이 판매는 좋고, 판매는 좋습니다, 음, 하지만 또한 공학을 위해, 또한 연구를 위해, 음, 저의 관점에서, 여러분은 해외에서 성공해야 하고, 음, 로컬에서 인정받고 잘 수행해야 합니다, 저는 이것을 Sununu 전략이라고 부릅니다, 음, 그것은 단지 GTM이 아닙니다, 따라서 음, 이 모든 인용구가 있습니다, 음, 저는 음, 저는 정말 이것들을 좋아합니다. 음, 음, Cornish는 Havana를 모집했거나 인수했습니다. 저는 Nathan도 청중 어딘가에 있다고 생각합니다 그리고 일부 다른 승무원. 안녕 Nathan. 음, 절대적으로 나중에 Nathan과 음 대화, 만약 여러분이 COG에 가입하고 싶다면. 음, 따라서 저는 음, 그것이 음, 이것이 작동합니다, 맞죠.

제가 모두 말하고 싶은 것은 저 저는 제 성인 생활의 싱가포르 기술 생태계의 일부였고, 우리는 이 정도의 외국 관심과 미국 관심을 가져 본 적이 없었습니다 음 이 지역, 싱가포르, 이 지역에서 공학과 연구에 기반한 지금까지. 따라서 이제 때입니다. 우리를 해봅시다. 알았습니다. 음 음, 저를 음, 따라서 저는 음, 따라서 저는 실제로 Nathan을 가지고 있습니다, 음, 누가 제 동료입니다, 음, 모든 음 통화 로그를 거쳤습니다, 음 음, 모든 작업의 것, 매우 많은 작업이 있기 때문입니다, 음, 발생합니다 배경에서, 여러분은 결코 보지 못했습니다, 왜냐하면 여러분은 이 사업에 있지 않기 때문입니다, 우리는, 따라서 저는 음, 저는 음, 일부 예시를 공유하고 싶습니다, 맞죠, 음, 음, 이것은 처럼 음, APAC의 순수한 수요의 예시입니다, 맞죠, 음, LM 토큰에 지출되는 매년 수백만, 수천만 달러. 알았습니다.

음, 음, 그들은 음, 그들이 여러분의 대출을 실행합니다, 여러분의 돈이 스프레드시트에 있습니다, 업무 분석가에 의해 야기되는 것은 그곳에 머물지 않을 것입니다. 맞죠. 상상해 봅시다, 처럼 여러분은 오면, 처럼 이 은행이 이런 식으로 운영된다고 상상해 봅시다. 네. 맞죠. 따라서 여러분은 체계화해야 합니다. 여러분은 음, 여러분은 코드를 작성해야 하거나 그렇지 않으면 음, 업무 분석가에 의해 수동으로 운영됩니다. 음, 정부도 마찬가지입니다. 음, 동일하게 음 음, 기술의 다른 부분. 음, 저는 음, 여러분은 알고 있습니다 음, 다시 한 번, 처럼 이것은 이러한 음, 우리가 이것들을 제시하는 정상적인 방식입니다. 이것들은 모두 고객으로부터의 실제 수치입니다, 아니요 아니요 회사로부터 아니지만, 저는 처럼 음에서, 단지 숫자 자체로부터 보기 어렵습니다, 처럼 좋은, 음, 이것은 배달 시간을 10배 가속화한다는 것을 의미합니까?

알았습니다, 제가 여러분에게 벤치마크를 보여 드리겠습니다. 벤치마크는 로컬 은행입니다. 여러분은 200만 줄의 코볼 코드를 가지고 있습니다, 문서가 없고, 또한 책임 있는 엔지니어가 없습니다. 여러분이 할 것은 무엇입니까? 음, 이것이 여러분이 정말로 AI 적용을 시작할 수 있는 곳입니다. 음, 제가 여러분에게 말하겠습니다, 이것은 싱가포르에만 고유한 것이 아니며, 또한 한 은행에만 고유한 것이 아닙니다. 이것은 모든 은행입니다. 이것은 모든 것입니다. 이것은 정말 큰 규모를 가진 모든 회사입니다. 음, 고객 수, 즉 엔터프라이즈 수준의. 음, 매년 수억 달러의 AI 예산, 온라인 600명의 개발자. 음, 여러분은 알고 있습니까, 해야 할 일의 양은 정말 극도로 놀랍습니다, 저는 그것을 위해 인간을 고용할 수 없습니다, 왜냐하면 그것이 너무 지루했기 때문입니다.

이것은, 이것은 또 하나의 또는 한 시스템입니다, 아무도 그것을 위해 일하고 싶지 않습니다, 어쨌든 맞죠. 음, 저는 지금 제가 공유하는 것이 이러한 새로운 이야기의 첫 번째라고 희망합니다. 만약 여러분이, 여러분이 알고 있습니다, 만약 여러분이 더 많은 질문을 물어 보고 싶다면, Nathan에게 물어 보십시오. 음, 하지만 저는 단지 Cognition이 생각해 낸 일부 해결책을 공유하고 싶습니다, 음, 이것들은 이미 일했습니다, 맞죠. 음, Devon은 playbook이라고 부르는 것을 가지고 있습니다, 기본적으로 보통 채팅 구조보다 훨씬 더 구조화되어 있으며, 기본적으로 한 playbook은 제 관점에서 수억 달러의 가치가 있을 수 있습니다, 왜냐하면 그것들은 구조화된 템플릿이고, 개방형 채팅보다 더 신뢰할 수 있는 방식으로 병렬로 처리될 수 있기 때문입니다 에이전트. 따라서 여러분이 아직 Devon playbook을 시도해 본 적이 없다면, 여러분은 절대적으로 해야 합니다, 왜냐하면 이 사람들은 이 것들로 은행을 개편하고, 수십억 달러를 벌고 있기 때문입니다.

음, 코드베이스 이해 다시 한 번은 이러한 패턴입니다, 왜 문서가 없을까요, 맞죠, 따라서 물론 여러분이 원하는 AI는 먼저 문서를 쓰는 것이고, 그 다음 그 문서를 사용하여 마이그레이션을 수행하는 것입니다, 따라서 음, Cognition은 깊은 wiki의 첫 번째 선구자입니다, 음, 저는 많은 사람들도 이것을 좋아한다고 생각합니다, 음, 갈색 들판 개발에는 수십억 달러의 수익이 있습니다, 네, 마지막으로 저는 음, 이것은 엔터프라이즈에서 표준 것이지만, 사람들과 판매원이 좋은 그 사람은 우리와 통화하지도 않을 것입니다, 우리가 사용자 정의 SSO를 가지고 있지 않으면, 이것은 음, 그렇게 초현실적이거나 그렇게 직관적이고 실제적인 느낌입니다. 왜? 왜냐하면 그들은 자신들의 GitHub과 GitLab을 잠그었기 때문에 그들은 책임 있는 엔터프라이즈입니다. 그리고 우리 다른 사람들, 우리는 단지 무심코 것들을 우리의 Obsidian과 우리의 음, 개인 개방 것들에 던집니다. 우리는 정말 그런 식으로 생각하지 않습니다.

하지만 여러분이 수백만의 신뢰와 수백만의 돈을 가지고 있을 때, 물론, 여러분은 이런 식으로 보안을 생각해야 합니다. 이러한 엔터프라이즈를 제공하는 모든 사람도 반드시 그래야 합니다. 따라서 이것이 제가 아시아의 에이전트에 대해 논의하고 있는 이유입니다. 알았습니다, 저를 다시 전환 시키십시오. 음, 저는 APEC에 관한 일부 학습을 공유했습니다. 지금 저는 단지 싱가포르에 대해 말하고 있습니다, 그리고 왜 저는 그것을 지능형 에이전트 국가라고 부르고 싶습니다. 우리는 아직 거기에 없습니다, 하지만 우리는 그 방향으로 가고 있습니다. 음, 우리는 우리의 사랑하는 프론티어 배포 장관으로 돌아가야 합니다. 음, Abishek, 저는 그가 청중 어딘가에 있다고 생각합니다, 누군가가 그에게 프론티어 배포 장관의 이름을 붙였습니다. 저는 이 이름이 약간 끈적인다고 생각합니다, 모든 사람이 약간 이렇게 합니다. 음, 그는 오늘 아침 그의 연설에서 세 가지를 말했습니다.

그는 우리가 배포, 민주화, 그리고 분권화에 이점이 있다고 말했습니다, 이는 다시 암호화폐에 관한 것이 아닙니다. 그는 실제로 단지 의도한 것은 음, 그는 AI가 어디에나 있기를 원했고, 공공 서비스에. 음, 저는 우리가 이 세 가지 모든 것에서 도움을 줄 수 있다고 생각합니다. 저는 이것이 실제로 매우 매우 좋다고 생각합니다, 그는 이것을 이해하고, 우리 다른 사람들도 할 수 있습니다. 음, 저의 관점에서, 깨달음 음, 싱가포르 자체는 이렇게 필요합니다, 음, AI 공학 인재 수요 대 공급의 약 4배, 이것은 정말 충격적이었습니다. 음, 여러분은 알고 있습니까, 이 차이는 계속 확대되고 성장할 것입니다, 맞죠? 처럼 이 위치의 수요 성장은 매해 40%입니다. 여러분은 위험에 처해 있는 많은 돈이 있습니다. 음, 이것은 LinkedIn 조사 이 분야와 정말 보고 이것. 따라서 저는 이것이 매우 신뢰할 수 있는 수치라고 생각합니다.

음, 따라서 저는 대담한 의견은 저는 정부에 대한 희망을 포기했습니다. 같은 저 음, 저는 방금 장관을 칭찬했지만, 음, 저는 기술 부문을 위해 정부가 뭔가를 하기를 기다리며 수년을 기다렸습니다. 음, 저는 장관 Josmin과 팟캐스트를 했고, 음, 우리는 함께 걷고 있고 미래에 대해 이야기했습니다. 아무것도 일어나지 않았습니다. 음, 단지 언제, 단지 언제 우리는, 언제 우리 싱가포르 사람들이, 우리 싱가포르 시민이 스스로 취한 결정, 맞죠? 처럼 음, 저는 싱가포르가 정부 주도 경제 발전의 역사를 가지고 있다고 생각합니다. 음, 저는, 저는 새로운 시대는 민간 부문이 먼저 공공 부문으로 주도할 것이라고 생각합니다. 따라서 우리가 이 일이 일어나도록 하자, 맞죠? 음, 저는 이 컨퍼런스는 예시입니다.

우리는 정부 승인을 기다리지 않았거나 음, 우리에게 지지를 주어 달라고 부탁했습니다. IMDA와 AI Singapore가 음, Pullman에서 우리를 지원하는 것이 좋고 다른 모든 전시 활동에서. 외무부가 우리를 지원하는 것이 좋지만, 우리는 그들이 필요하지 않습니다. 우리는 여기서 민간 부문을 위해 일하고, 스스로 자신들을 기술 부문으로 구축합니다. 이것은 모든 사람이 높은 에이전시를 가진다는 것에서 시작합니다, 특히 이 모든 조직자들이 옆에 서 있었던 조직입니다. 그들을 위해 박수를 치십시오. 그들이 이것을 만들었습니다. 이것은 그들의 부업 프로젝트입니다. 그들이 여러분을 함께 모았습니다. 음, 저는 분명히 그들을 도왔고 지원했습니다. 하지만 처럼 이 회의는 그들 없이 일어나지 않았을 것입니다. 따라서 음, 그것은 이 방에 있는 모든 사람에게서 시작합니다. 그것은 저에게서 시작합니다.

그것은 65 labs의 이러한 조직자들로부터 시작합니다, 지금 그것은 여러분으로부터 시작합니다. 음, 따라서 저는 정말로 AI Engineer를 떠날 때 여러분이 여러분의 생활에서 더 높은 에이전시가 되기를 희망합니다, 정말로 싱가포르를 더 높은 에이전시의 나라로 변환합니다. 매우 감사합니다. 알았습니다, 우리는 첫 번째 날 말의 끝에 도달했습니다. 음, 여러분이 마지막까지 견디어 주셔서 감사합니다. 이것은 정말 미친 것입니다. 여러분 자신을 위해 박수를 치십시오, 왜냐하면 여러분은 10시간의 프로그래밍을 견었기 때문입니다. 알았습니다, 모두가 밖으로 나가기 전에 마지막 공지입니다. 음, 우리는 여기에 밤 이후 행사를 가지고 있습니다. 우리는 약 9:30에 문을 열 것입니다. 나는 10:00에 DJ를 시작할 것입니다. 우리는 영국에서 날아온 DJ를 예약했고, 그가 11:30에 재생을 시작할 것입니다. 처음 500명은 무제한 음료를 무료로 얻을 수 있습니다. 따라서 여러분이 와서 술을 마시고 싶다면, 환영합니다. 의자가 제거됩니다.

이것은 춤 바닥이 될 것입니다. 음, 우리는 여러분이 와서 즐거운 시간을 보내기를 원합니다. 음, 만약 여러분이 회의 참석자라면, 여러분의 목걸이를 가져 오십시오, 왜냐하면 이것은 우리가 우리 입구를 우선 순위로 하는 것을 도울 것이기 때문입니다, 그것들을 잃지 마십시오, 왜냐하면 우리는 내일 새로운 목걸이를 인쇄하지 않을 것이기 때문입니다. 희망 지침 설정의 이 부분은 명확합니다. 모든 것이 좋다면, 매우 감사합니다, 우리는 내일 아침 일찍 또는 오늘 밤에 여러분을 볼 것입니다.

관련 영상

AI Engineer Singapore Day 2: Google DeepMind / Cloudflare / Arize 로봇 및 런타임 주제

2026-05-17 · AI Engineer Singapore · 08:00:00

AI Engineer Singapore Day 2 전체 진행: Google DeepMind, OpenClaw, Adaption, Arize, Cloudflare, Robot Company 등 팀의 주제 발표. Day 2는 로봇, 모델 관측성, 런타임 스택에 치중.

HSC Pipeline Engineering: RAG AI를 통한 공학 지식 기지 구축

2026-03-20 · HSC Pipeline Engineering · 05:00

HSC Pipeline은 AISG LADP 계획을 통해 로컬 배포 RAG AI 지식 기지를 개발하여 엔지니어링 지식 고립을 깨뜨리고 의사결정 효율성을 높입니다.

Ong Ye Kung이 AI, 유전자 검사, 초고령화 싱가포르의 준비에 대해 논의합니다

2026-03-04 · Ong Ye Kung · 30:36

보건부 장관 Ong Ye Kung이 의료 보건 분야의 AI 응용 및 초고령 사회에 대한 싱가포르의 대응 전략을 심층적으로 논의합니다.

YTL PowerSeraya: LLM을 통한 전력 시장 규칙 분석

2026-02-20 · YTL PowerSeraya · 05:00

싱가포르 전력 회사 YTL PowerSeraya는 LADP를 통해 전력 시장 규칙 전용 LLM을 구축하여 보고서 자동 분석 및 규칙 조회를 실현합니다.

Skybots: RPA에서 LLM 기반 지능형 고객 서비스로

2026-01-15 · Skybots · 05:00

회계 기술 회사 Skybots는 LADP를 통해 RPA를 LLM 기반 지능형 고객 서비스로 업그레이드하여 복잡한 회계 워크플로우 쿼리를 처리합니다.

양리밍, 중소기업・교육・사회에서 AI의 역할 논의

2025-11-19 · Josephine Teo · 06:17

양리밍이 AI가 어떻게 중소기업 전환을 촉진하고 교육 체계를 재구성하며 사회 전 계층에 이익을 제공하는지 탐색합니다.