AI 産業と応用 · 2026-05-17 · 08:00:00
AIE シンガポール Day 2:Google DeepMind / Cloudflare / Arize 等ロボット・ランタイム主題
コア観点
AI Engineer シンガポール Day 2 全編。Google DeepMind、OpenClaw、Adaption、Arize、Cloudflare、Robot Company などのセッション。Day 2 はロボティクス、モデル可観測性、ランタイムスタックに重点。
読みやすい字幕整形
字幕言語: ja · 取得日: 2026-05-21
波が夜を打ち、波が大海を打ち、それはそれを知ります。あなたは必要です。やあ、やあ、やあ。やあ、やあ、やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。熱。やあ、やあ、やあ。皆さん、このイベントに参加していただきありがとうございます。私は65 Labsの共同創始人です。皆さんのご出席に本当に感謝しています。現在は3日目の日曜日の朝であることを知っています。この部屋にいらっしゃる皆さんはすべて、睡眠不足を選択されました。セッションを見逃さないためです。本当に感謝しています。ありがとうございます。えっと、皆さんご存知ですか。我々は現在、最終スプリント段階にあると思います。皆さんがまだ気づいていなければ、私の声はほぼなくなってしまいました。しかし、他の主催者を見てください。今朝、私がSherryに代わってホストを務めている理由がまさにこれです。しかし、皆さんと一緒にいられることで、我々は本当に幸せです。過去数日間のエネルギーは本当に素晴らしかったです。
えっと、我々がシンガポールのAIを構築して統合し始めた時、これはまさに我々が望んでいた種類のエネルギーです。皆さんは本当に皆、素晴らしい仕事をされました。ですから、本当にありがとうございます。えっと、我々が開始する前に、スポンサー、スピーカー、そしてこのカンファレンスの魔法のような体験を作るのを手伝ってくださったすべてのボランティアに素早く感謝したいのです。皆さん全員に本当にありがとうございます。皆さんが彼らのために拍手をしてくださることを望みます。いいですね。皆さんは私を見に来たのではありません。ですから、無駄口をやめて、Ariseの Salanne をステージに招待して、彼女がAlexの構築について学んだ経験を共有してもらいたいのです。>> 皆さん、おはようございます。皆さんが朝の時間を私と一緒に過ごしてくださったことに本当に感謝しています。今はまだ早いです。見てみましょう。そうです。出発する時が来ました。わかりました。見てみましょう。
申し訳ありませんが、私はホットスポットを再接続する必要があります。すでにそれをしたと思っていました。いいですね。大丈夫です。皆さん、おはようございます。えっと、今日は私に参加していただき、本当にありがとうございます。私は、私のチームと私がAlexを構築することから学んだ経験の一部を共有できることに非常に興奮しています。Alexは私たちのAIエージェントです。我々はこの分野で一段落の間、働いてきました。詳しく説明する前に、自己紹介をしたいです。私はSalianです。えっと、Ariseの製品マネージャーです。私は技術的背景を持っています。私はデータサイエンスから始まり、今はチームのために製品を構築しています。私は非常に実践的です。私はAlexのPMであるだけでなく、コア貢献者でもあります。ですから、私は本当にエージェントを構築することの苦労を一手に理解しています。今、私は基本的に、この種の苦労を、本当に人々を助けることができるツールに変えています。ですからAriseは...えっと、私たちはエージェントを動作させます。私たちはいくつかのことについて非常に優れていました。
最初のものは可観測性です。えっと、これはあなたのエージェントの底層で何が起きているかを理解することです。2番目は評価です。これはあなたのエージェントがどのように機能しているかを理解する方法です。その後、我々はすべてのこのデータを使用して、あなたが改善して反復するのを支援します。もちろん、我々はスタック全体を通じてAlexを持っています。これはあなたがこれらすべてのことをするのを支援します。では、今日は何について議論しますか。えっと、まず、あなたたちにAlexが何かについて少し説明します。その後、我々が構築過程で学んだ四つの経験について説明します。ですから、集中力の維持、コンテキスト管理、良い行動の結晶化、そして実際のエージェントのデバッグです。ですから、Alexは...えっと、あなたのAIエンジニアリングエージェントフレームワークです。えっと、我々は本当にAlexを構築しました。あなたが自然言語であなたのAIアプリケーションを構築および拡張するのを支援するためです。
ええ、本当に Arise エクスペリエンスを改善しています。計画と推論を備えており、ええ、本当に重い作業負荷を通じてあなたの AI エージェントのために実行します。ええ、基本的に自然言語で何でも質問することができ、Alex があなたがそれを実行するのをお手伝いすることができます。データの分析をお手伝いすることができますが、プロンプトを繰り返したりメールを調整したりするようなワークフローを実行するのもお手伝いすることができます。これは本当に AIG、PM、および主題専門家にとっての力の乗数です。では、なぜ私はここでこれらすべてを皆さんにお伝えしているのでしょうか。まあ、ええ、私たちは Alex を構築するのに 3 年間を費やしました。これは本当に長い旅でした。当初は生成 AI の初期段階で開始し、今は Alex 2.0 に到達しています。
0で、推論および計画機能を備えています。私と私のチームは多くの経験を学びました。我々のこの業界とコミュニティの素晴らしい点は、私たちが経験を共有する機会があることだと思います。ですから、今日ここで私がやろうとしていることは、私たちの経験の一部をお教えすることです。皆さんが私たちのように苦労して学ぶ必要がないことを願っています。では、最初のレッスンはフォーカスを保つということです。すべてのエージェント構築者は、エージェントにいくつかのことをするよう指示する状況を経験したと思います。ええ、おそらく最初のタスクは成功しますが、その後、2番目と3番目のタスクを忘れてしまいます。これはすべての人が本当に解決したい問題だと思います。ええ、人々はしばしば私に聞きます。ええ、なぜこれが起こるのですか?ええ、人々はこれが幻覚の問題のようなもの、あるいは能力の問題でさえあると仮定しますが、実際にはそうではありません。
これはテンション問題です。つまり、最後に起こることは、エージェントに複数のタスクをリクエストする場合、ええ、通常起こることはそれが最初のものを見ることができるということですが、その後、残りはリクエストした他のすべてのデータの中で失われます。エージェントの場合、次に何をする必要があるかを理解すると、既に次に何をするかを忘れています。ですから、解決策は計画です。ええ、計画はあなたのエージェントが最初に何をする必要があるかを決定する方法であり、その後初めて実際に行動を起こします。ですから、Alex の場合、Alex がデータを取得する前に、それはまず明確なToDoリストを思いつき、ええ推論と段階的に進む必要があり、その後初めて実際にそのアクションを取ります。
ええ、我々は 3 つのツールを持っています。ええ、ToDoを書く、ToDoを更新する、ToDoを読むです。ええ、そして 4 つの状態があります。待機中、完了、ブロック、進行中です。実は、これらのすべてを最初から持っていなかったのです。最初にこれについて話しますが、完了ツールまたはプロンプトを使用するようなものだけでは、Alex が本当に複雑なタスクを完了するには十分ではないことが分かりました。ですから、これらのツール...ええ、これは我々が Claude のような我々のお気に入りのツールから借りたものです。ええ、これは複雑なタスクの管理に本当にゲームチェンジャーでした。進行中は実に我々が学んだことです。これは本当に重要なレッスンです。Alex を最初に構築したとき、我々は進行中を持っていませんでした。実に、待機中と完了のような状態しかありませんでした。
えっと、でも私たちは「進行中」ステータスを追加しました。そのため Alex はこのタスクが具体的に何であるか、つまり現在処理中のものを正確に知っています。ですから、これはエージェントに自分が達成しようとしていることを定着させるのに本当に役立ちます。そして、タスクを正しく完了する能力を本当に改善しました。私たちが行った別の本当に重要なアーキテクチャ上の決定は、計画を会話履歴の外に配置することです。えっと、会話履歴については何らかの切り詰めを行ったため、計画が切り詰められることは決して望みません。えっと、そうなると Alex はそれが達成しようとしていることを知らなくなるからです。えっと、実は私たちは LLM を呼び出すたびにこれを注入します。システム指示の後に、会話履歴のすべてのデータとは別に。これが実は Alex が見るものです。
つまり、現在の計画を見ています。すべてのステータスを見ており、その後、私たちは実際に完了状態で待機項目の更新を呼び出すことで Alex をガイドします。完了したときなど。ですから、再度、Alex が進行中であることを支援するということは、単に受動的なプロンプトを与えるだけでなく、本当に明確な少数ショット例であり、計画を実行するときに何をする必要があるかを説明しています。私たちは「完了ゲート」と呼ぶものも持っています。えっと、これは Alex がすべてのタスクを完了する前に完了したと言うのを防ぐものです。ですから、Alex が完了ツールを呼び出そうとする場合で、タスクが完了していない場合、実際には非常に明確なエラーが表示され、「おい、戻ってすべての待機項目を完了する必要があります」と言います。これは提案ではありません。これは一種の推し進めのようなものではありません。
これは Alex が受け取る明確な構造化メッセージであり、えっと、それは続行することができません。唯一の例外はブロック済み状態です。ブロック済み状態は、ループ内に人がいる場合に使用されます。えっと、Alex を使用する場合、多くの、えっと、人間の相互作用を要求する瞬間があります。ですから、プロンプトを作成する場合、少し差分を取得してから受け入れることができます。または、人間の参加が重要である注釈付き設定のようなもの。ですから、ブロック済み状態がある場合、これは Alex がタスクを完了する必要がない唯一の場合です。なぜなら、これが人間によってブロックされていることを理解し、その応答を待機しているからです。ですから、これらは計画から学んだいくつかの主要な教訓です。
ですから、コードの強制実行について。単なるプロンプト、少数ショット例ではなく、あらゆる種類の抽象指示に打ち勝ちます。常に待機項目を使用します。右。計画では機能しません。私たちはそれらの明確な関数を持つ必要があり、その後、エージェントに良い計画がどのようなものかを示す必要があります。ですから、その例のいくつかです。さて、コンテキスト管理です。えっと、コンテキスト管理は非常に重要です。これは Alex にとって交渉の余地がありません。えっと、私たちは大量のテキストデータを処理しています。ですから、Alex は Arise プラットフォーム上に構築されています。可観測性データは、大量のテキストデータを持つ AI アプリケーションにも適用されます。ですから、コンテキスト管理は非常に重要になります。えっと、実は私はロンドンでこの講演を行いました。ですから、ぜひご覧ください。しかし、コンテキスト管理は単なるコンテキストウィンドウの管理ではなく、実は戦略的にエージェントに何を表示するかを考える必要があります。
それはエージェントが必要とするものを記憶させ、必要としないものを忘れさせます。ですから、初期段階で、これは実は私たちが Alex に設定したシステムプロンプトです。これは私たちの実験比較に関するものです。えっと、私たちは、「二つ以上の実験を同時に比較しようとしないでください」と言いました。えっと、でもこれはかなり素朴です。えっと、問題は Arise 内の 1 つの実験は数百行であることができ、これはおよそ 100,000 トークンのようなものです。ですから、単一の実験を比較しようとすることさえ、えっと、申し訳ございません、えっと、私たちのコンテキストウィンドウを爆発させてしまいます。ですから、私たちは単にこれらのえっと、明確なプロンプトを持つことだけでは十分ではないことを知っていました。ですから、私たちは抽象化を思い付きました。その 1 つは大型 JSON と呼ばれています。
えっと、ですから、これが実際に行うことは、Alex がツールデータを返すとき、えっと、私たちはほとんどをサービス化されたメモリに格納し、エージェントに ID を提供します。これは後で必要に応じてさらにコンテキストを取得するために使用できます。ですから、これは本当に重要です。Alex はプラットフォームからデータを継続的に取得します。私たちはそれをすべて LM に表示することはできませんが、エージェントに次に何をすべきかを知るのに十分なコンテキストを提供することができる必要もあります。えっと、ですから、これが私たちがこのアイデア、値を圧縮するが構造ではなく、のようなものを思い付いた場所です。まず、私たちが行ったことは、切り詰めようとして、データの最初の小さな部分のプレビューだけを提供することです。ですから、単にデータの最初のような、ご存知、n トークンを取得します。でも問題は、Alex は実際にはデータの構造が何であるかを理解していません。
ですから、これはそれをクエリするのに本当に難しくします。なぜなら、通常 Alex はプレビューが必要で、その後、さらに何のデータをルックアップするかを決定する必要があるからです。えっと、ですから、私たちが行ったことは、構造ではなく値を圧縮することです。ですから、私たちはすべてのフィールド、すべての配列を保持しました。Alex はこれらのすべてにアクセスできますが、その後、私たちはそれらの中の大きな文字列を切り詰め、その後、大型 JSON のような抽象化を使用して必要に応じてさらにデータを取得できます。えっと。私たちはまた、Alex に小さな構成可能なツールの束を与えました。これは本当に重要です。ですから、Alex は 2 つのツール、えっと、jq にアクセスできます。これはコマンドラインで使用する同じツールのようなものです。そして GP JSON は、シリアル化されたデータに対して正規表現検索を行うことができます。えっと、このの重要性は、これらが本当に本当に小さなツールですが、それらは非常に強力です。Alex はそれらを一緒に使用できます。それらは構成可能です。
えーと、1つのツールの入力を別のツールの入力として使用します。えーと、つまり、Alex がデータをスライスして、集計し、本当に本当に強力なこれらのすべての機能を、本当に本当に小さいツールで実行しているだけです。ですから、何も超複雑ではありません。私は常にこれを UX プログラマーの方法として少し見るのが好きです。ツールを想像することができます。そして、あなたのエージェントがあなたのシェルスクリプトのようなものであると。ですから、あなたは本当に私の言うことを聞いてください。あなたのエージェントが使用できる小さいツールについて考えてください。それがそれを最も成功させる理由です。ですから、これらはコンテキスト管理のいくつかの経験です。えーと、各ツール出力にハードなトークン予算を与えます。私たちはすべてのツールで 10,000 のようなものをやります。えーと、制限なので、私たちはこの予測可能なコンテンツを持っています。えーと、私たちはそれが起こることを知っています。ですから、オーバーフローがないことを知っています。オーバーフローがない。
複数のラウンドになるだけです。えーと、値を圧縮して構造ではなく。えーと、ペーパーの上にある人工的な制限を使用しないでください。えーと、フィードバックループで良い例外を与えてください。そして、ツール応答は顧客データを含む可能性があります。ですから、ログを見るべきです。これは別の重要なものです。さて、良い動作を結晶化します。ですから、Alex の構築を最初に開始したときに、えーと、私はスプレッドシート、Google ドキュメントのようなテストに多くの時間を費やしました。えーと、しかし、私たちはすぐにスモークテストがスケーリングしないことに気づきました。えーと、変更するたびに、何かを壊すかどうかを知るのは本当に難しかったです。えーと、ですから、より良い解決策が必要であることを知っていました。私たちが本当に発見したのは、本番トレーシングがあなたのグラウンドトゥルースとして非常に強力であるということです。
最初に私たちは自分たちで黄金の答えを手書きしようとしました。しかし、本番トレーシングに良い例がありました。私たちはそれを活用することができました。ですから、あなたのデータを見て、実際にそれらをテストケースとして使用することは、Alex で私たちが学んだ最も強力な経験の 1 つです。Alex に関しては、私たちはいくつかの異なるタイプのテストを行いました。えーと、ですから、私たちは決定点テストを持っています。私たちはコンポーネントを見ています。えーと、オーケストレーターのような方法を通じて、そして私たちはえーと、結果は何ですか、そしてその後、本当にオープンな方法でテストします。これをオーケストレーターのような精密マッチではなく、私たちの出力で機能しません。ですから、タイムスタンプのような何かが含まれているかどうか探すようなもの、2000 ミリ秒、2 秒、2 秒のような何かを生成するのは多くの異なった方法があります。
ですから、私たちはこのオープンエンドのチェックを持っています。決定が正しいかどうかを判断するためにできます。特に言語モデルを使用している場合、出力は非決定論的であるので、これは本当に強力だと思います。別のものはトラジェクトリテストです。ですから、私たちが行うのは、私たちが少し以前に提及した本番選択のすべてをセーブします。私たちはそれらを行ごとにステップスルーします。私たちは法官として LM を使用して出力を評価します。えーと、評価プロンプトは本当に重要です。私が前に言ったように、これらの出力は決定論的ではありません。ですから、評価テンプレートがこれを処理できることを確認したいです。えーと、各ステップのために定義された成功です。えーと、これの第 3 レベルは CI とプロンプト検証です。ですから、私たちが行ったすべてが実際に Arise に存在します。えーと、これらを臨時テストとして実行します。
私たちはそれらを CI の一部として実行します。そしてその後、私たちはこれらの素晴らしい可視化を持っています。ですから、私は実際に来ることができます。そして、物事がどのように時間とともに機能しているかをチェックしてください。えーと、評価のパフォーマンスを統合しているかどうかを見てください。えーと、Arise でツール構築するのに本当にクールなことは、私たちが自分たちの製品を食べていることです。えーと、私のチームが行うすべてのこと。私はこれが私たちのユーザーをも助けることができることを知っています。そして、これは本当に、えーと、非常に強力でした。ですから、これらはいくつかの結晶化された行動からの経験です。良いユーザーセッションをキャプチャして、えーと、措辞ではなく事実と一致させます。意味的評価の法官として ELM。本当のAPI、シミュレーションではなく。えーと、統合エラーは本物です。えーと、そしてここでの私の最後のレッスンは、本当のエージェントをデバッグします。
私は Alex が問題を起こしたときの日々のワークフローとは何かのような多くの質問を受け取るのはこれだと思います。ですから、私たちはこのソフトウェアエンジニアリングの進化を見ています。誰がテレメトリデータを消費しているのか。私たちが最初に開始したとき、私たちは本当に人がループにいました。私は直接データを見ていました。その後、IDE に行きました。そして、私と私のエンジニアは、IDE に行き、変更して、それを観察します。私たちは少しこのソフトウェア 2.0 を見始めました。そこで、私たちはエージェント IDE を持っています。今、人間はまだ関わっていますが、反復するエージェントを使用します。今、私たちは本当にこのステージ 3 に入りました。そこで、私たちは実際に直接コーディング エージェントを使用できます。えーと、ホテルデータを読む能力を持つために。えーと、そして反復します。ですから、これは私たちが現在使用しているスタックの一種です。私たちはまだ Arise を使用しています。
私たちのすべてのトレースは評価に入ります。私たちのフィードバック。しかし、私たちには Arise スキルと呼ばれるものがあります。それは私たちのカーソルが可能にします。えーと、クラウドコードは Arise と直接対話します。そして、私たちのフィードバックループを本当に本当に速くします。えーと、エージェント構築者として、私たちはフィードバックループが本当に本当に重要であることを学びました。私は問題から修正までどのくらい速くできるかをやろうとします。えーと、Arise スキルは本当に私たちを助けました。ですから、えーと、これらは私たちの Arise スキルのいくつかの例です。これらはリアルタイムです。あなたが自分でそれらを試すか、ブース で私たちと話したい場合。えーと、基本的に、私たちの多くの Arise トレースと評価スキルを使用しました。それは単にエージェントが信号を得ることを可能にしています。えーと、Arise からトレースをプル、外部リソースやコードも見る、修正を提案してください。そして、私と私のエンジニアは単にそれをレビューすることができます。
ですから、これが Arise によって駆動される AI エンジニアリング サイクルです。私たち自身も使用しています。えーと、基本的に、私たちは常に最初の実験者です。Alex に有効であれば、他の人にも有効であることがわかります。ですから、私たちのスキルを活用している多くの異なるエージェントがあり、Alex を改善していることがわかります。ですから、これらはデバッグプロセスの実際の応用です。トレースを読み、完全なセッションをプル、失敗したノードを特定します。えーと、DataDog などの外部ソースからデータを読むこともできます。Alex は本当に UI に統合されています。または、APM トレースもますます重要になっています。えーと、そして G-Cloud ログのようなものもあります。えーと、ですから、メモリオーバーフローのような例を見つけました。えーと、ですから、私たちは問題から正確な根本原因まで迅速に到達でき、迅速に修正できたので、修正できました。
ですから、これはデバッグのいくつかの教訓です。えーと、スキルは単なるマークダウンです。それらは低コストで高価値です。あなたのスキル、あなたの工場に投資してください。えーと、セキュリティはプロンプトではなくラッパーである必要があります。えーと、エージェントデバッグはエージェント形のような問題で、あなたはそれが必要になる前に可観測性を持っています。えーと、可観測性がなければ、評価を本当に行うことはできません。可観測性がなければ、エージェントを本当に修正することはできず、それを成功させることはできません。ですから、えーと、これは私たちが確かに直接学んだものです。ですから、これらは今日学んで議論したいくつかの大きな教訓です。えーと、私は多くの材料をすぐに通り過ぎたことを知っています。ですから、質問がある場合、えーと、Pullman でのブースにいます。何かについても詳しく議論することを喜んでいます。えーと、しかし、非常に感謝しています。あなたが朝の時間を費やしてくれたことに本当に感謝しています。Salian さん、本当にありがとうございました。
えーと、次に、Rezaro の Tim のために準備しています。彼は評価のスケーリングについてあなたとお話しします。さて、皆さん、おはよう。えーと、今日時間をいただきありがとうございます。えーと、特に昨晩のアフターパーティから来た場合は特にそうです。ですから、今日は評価のスケーリングについて話します。多分、動機づけるために、Rezaro が行った作業についていくつかを共有させてください。ですから、Rezaro はテストと評価会社です。
医療、防御、セキュリティなどの任務関鍵的なユースケースと領域に取り組む企業と主に協力しています。私たちは彼らが開発または調達している AI システムをテストして評価するのを支援し、展開しているコンテンツが本番環境に進むために十分に良いことに確信を持つことができます。今日、私は過去数年のこの旅で得た経験のいくつかを共有します。存在する主要な問題、私たちはこれらの問題を克服する方法、および使用例特有のテスト評価のスケーリングを妨げる残りの障害があります。さて、このスライドから始めましょう。コブラ、スプリント速度追跡、AI ベンチマークに何が共通しているか。これらはすべてデバースインセンティブの例を示しています。正しい?
ですから、コブラの例に対して、これはあなたがコブラをキャプチャするように人々に刺激する場合であり、人々は実際にそれらを飼育します。これにより、実際により多くのコブラが野生で出現します。えーと、スプリント速度追跡と同じです。あなたが精通している場合、あなたがソフトウェアエンジニアであれば、マネージャーがあなたが配信できるストーリーポイント数を増やすことを要求している場合、結果は見ますが、最終的には、有意義な成果に変わりません。少なくとも私の見解からです。えーと、それからあなたはおそらくいくつかの AI ベンチマークを見たことがあります。最新のオープンソースモデルをテストしています。それらは通常、実際のユーザーテストと異なります。ベンチマークでの表示方法とは異なり、どのようにして結果が非常に良いかを実際に知りたいです。
ですから、ベンチマーク最大化と呼ぶ概念につながります。私は今、ますますポピュラーになっていると思います。人々は実際にベンチマークを操作してタスクで優れていることを示しています。しかし、現実世界のパフォーマンスに変わりません。一方、我々は「雰囲気コーディング」を持っています。正しい?または、「雰囲気テスト」と呼ぶでしょう。ですから、雰囲気テストはプロセスです。多分、あなたは例を示すプロンプトのカップルを持っています。いくつかのトリッキーな質問。イチゴの中に R はいくつありますか?または、たぶん、自転車に乗ったペリカンの画像を生成できますか?ですから、実際に私たちがこれらの例で見たのは、それが実際に悪くないということです。かなり有用です。
モデルが特定のシナリオまたはあなたが興味がある領域でどのように実行されるかについて、感覚を与えます。しかし、プロセスの探索的探索を奨励します。正しい?違うプロンプトを試して、あなたのユースケースで十分に良いものを実際に見つけることができます。しかし、私は話される通りに、えーと、あなたが実際にどのように判断するのか、自転車に乗ったペリカンのテストは何ですか。対象比較して、多分、トゥクトゥクに乗ったキャット?私たちが話しているのは、車の上の鳥だけですか?または、多分、私たちがテストしている他の何かのタイプのより高いレベルの概念?
ですから、ここで明確にするのに役立つのは、えーと、頭の中にテストケースがあったとしても、テストを評価している特定の関心の次元は何ですか?これが、ベンチマークテストと雰囲気テストの間の中間地帯です。ですから、質問は、雰囲気テストのアプローチをどのように構築して、感心なシナリオを識別し、その後、えーと、より具体的なユースケース評価のためにそれを構築してスケーリングしてください。ですから、これは行動設計領域の概念へと私たちを導きます。私たちは、えーと、テストしている問題制約空間の種類として定義します。これにより、評価している有意義なテストケースのセットを管理するのに役立ちます。
えーと、そこから私たちはシステムの期待される動作が何であるか、私たちが認識すべきエッジケースが何であるか、また、このシステムが対象外かもしれないケースが何であるか、および評価と検証についても定義することができます。ですね。これは完全に対象外であり、AIシステムによって使用・消費されるべきではありません。ですから、そこから私たちはその後、内部パイプラインとワークフローを導き出すことができます。私たちは実際に、さまざまな関心のあるテストケースにシナリオを変換し、えーと、データ品質チェックに関連付けられて、要件に適合しないかもしれないデータを除外するため、またえーとえーと、そこにギャップがある場合、データ品質を強化します。ですね?
ですから、私たちはギャップをカバーすることを強調してきました。そのためにギャップを埋めることができるようにです。そして、より重要な用例に取り組むとき、特に関心のあるエッジケースについて、テストケースが不十分な可能性があることがしばしばあります。ここで合成データセットまたは合成データ生成方法が、実際にテスト評価プロセスのギャップを埋めるのを支援するのです。
ですから、私たちはテストセットを強化する方法で合成データを生成する方法について、多くの強調を置きました。私は、このようにして問題をフレーミングすれば、実際に、より多くの場合、データがボトルネックであることが分かると思います。ですね。私たちは問題を評価からシフトさせることができます。正しいテストケースを生成する方法へと、デプロイの信頼を与えます。そして、使用する際の課題は、特に、より限定的で特定の用例に対するテストの種類に入るとき、合成データ生成方法は、えーと、今でもほぼ相対的に不、えーと、完全に予測可能ではない、ですね? それらはあなたが望む品質を生成に与えるとは限りません。ですから、ここでいくつかの例をお示ししてみます。
えーと、この例では、私たちは、えーと、VRMソリューションのようなものが、より良い燃料シナリオと設定でのパフォーマンスを評価しようとしました。ですから、右側にペンを持っています。ですね? えーと、ここでの問題は、この特定の用例でテストすることが十分に良いことをどのように知るのか、良いがどのように定義されるか、えーと生成されたデータセットについて、そしてさらに重要なことに、私は思います、私たちがこのテスト評価を定量化する方法についてです。そうすれば、私たちはその後、自動化された方法でそれをスケーリングすることができます。ですから、ここで私はえーと三つの異なる強化の例、三つの良い強化の例を持っています。ですね?
ですから、おそらく、ここで良い強化は、約束されたものに従うことです。あなたが生成するもの、三つの異なる気象シナリオにわたって、雨、雪、霧。えーと、私たちが主な関心の対象も良好に保持されます、視覚的なアーティファクトがない場合。ですから、これは良い生成のように見えます。一方、私が、あなたが生成画像に慣れていれば、あなたはしばしば、生成された画像が異なるタイプのアーティファクトを持つのを見ることが確かです。えーと、例えば、右側のあれについて、二つの追加の人が画像に追加されました。下側のそれらについて、そしてあなたが見るのは、えーと、いくつかのオリジナルタンクと、そのうち一つのタンクが車両に変換されています。そして、スコープストライプはおそらく、それほど写実的に見えません。
ですから、私たちは、見た感じが良さそう、見た感じが良い、見た感じが悪い、という視覚的チェック方法からどのように離れるか、より構造化された方法に入り、これらの欠陥を見つけ出すのです。ですから、私たちにとって、これは、より拡張可能な方法で自動的に、このような欠陥と不具合を識別することができるように、データ品質チェックをどのようにスケーリングするかについてです。そして、私は、できるだけ小さな決定論的モデルに頼ることで、このような洞察を提供することで考えています。ですね? 例えば、二つの生成された合成画像について、私たちは、えーと、主な関心のあるオブジェクトの、えーと、マップ構造に有意な変化があるかどうかについて比較することができます。
えーと、私たちはその後、えーと、新しい関心のある新しい対象が元の画像から生成された画像に作成されているかどうかについても比較することができます。これらはすべて、データ品質に関する非常に良い信号を提供し、このパイプラインの一部として、非常に小さな決定論的モデルを使用しています。パイプラインの一部として、私たちはその後、実際に、えーと、私たちのえーと品質基準を満たしているデータセットをフィルタリングすることができ、それで評価プロセスを実行します。私たちはその後、このプロセスを実際に、おそらく、このえーと強化されたフィードバックを使用して拡張することができ、えーと、実際に評価モデルを微調整するために、私たちは自動的に評価プロセスの後続のふるい分けと生成モデルをふるい分けることができるようにします。
ですから、一日の終わりに、私は思います、私たちが最終的に得るものは、異なる指標のアセンブルされた全体的なパイプラインであり、用例特定の関心領域を満たし、これは私たちに非常に再利用可能なツールボックスを提供します、データセットの生成をどのようにスケーリングするか、および自動化品質えーとチェックとフィルタリングについてです。ですから、私たちはこれがコーディング空間または数学推論空間の問題に非常に似ていることを見ています。あなたは検証と検証プロセスをできるだけ自動化したいのです。えーと、これはえーと人的監督と評価に必要なオーバーヘッドを減らすのに役立ちます。そして、人工フィードバックが入ってくる場合、これはえーと自動化モデルを改善するのに役立つはずです。そこで、このプロセスはその後、スケーラブルになることができます。
底層メトリクスはその後、えーと、生成されたデータセットの校正のためにも使用できます。なぜなら、私たちは、ユースケースごとに、えーと、特定のシナリオについて、実は各メトリクスのカットオフ値について、非常に非常に大きなえーと分布がある可能性があることを発見したからです。ですから、校正部分は、ここでは非常に重要な統計的懸念です。了解しました。ですから、ただ要約するために、えーと、私たちはえーと、ユースケース特定のシナリオおよびデータセットの評価をスケーリングについて談話しました。私は、ここでの主な課題は、実は、私たちが合成データ生成ルーチンをどのようにスケーリングするか、そして、デプロイの信頼を与えるために必要な品質チェックを追加することについてです。
えーと、これで、もし私に連絡したいのであれば、LinkedInで私に連絡することをお勧めします。評価について談話したいのであれば、私たちが行った評価作業、テストケース、評価についてもっと議論するのを喜んでいます。また、私はイベントの残りの時間を通じて関与し、ありがとうございました。素晴らしい一日をお祈りします。さようなら>> 本当にありがとうございました、Tim。えーと、それは素晴らしいプレゼンテーションでした。次に、Cloudflareの、Abishekがいます。彼はインドのETIチームをリードしています。えーと、彼は、ツール呼び出しが実際にどのようにあるべきかについて、私たちと談話するでしょう。ハイ皆さん、おはようございます。えーと、私はAbishekです。えーと、私はCloudflareで新興技術とインキュベーションチームをリードし、インド支社をリードしています。ですから、私たちはCloudflare内の小さなチームであり、えーと新製品、取り組み、および与えられた時点での多くのクールなものに取り組んでいます。ですね? えーと、私は今日、ツール呼び出しについて論議します。
私は、ここにいるすべての人が、この時点で何らかのツール相互作用を経験したと思います。えーと、MCPと相互作用し、ツール呼び出しが何であるかを知っている人は誰ですか?素晴らしい。ですから、みんな、私たちが何について談話しているかを知っています。良好です。標準的なツール呼び出し、ですね? えーと、あなたはこれを、モデルに推論を超えた能力を与えるためにこれをします。えーと、外部えーと外部APIツール機能とモデルを協力させる方法は?ですね、えーと、非常に標準的な例をあげてみましょう。えーと、私はAPI検索エラーをモニタリングし、えーと、あなたが知っている特定の条件に基づいて何かを行います。ですね? えーと、プロセスは非常に単純です。モデルはあなたに、ねえ私はこのツールを呼び出す必要があります、MCPサーバーに行く、ツールが呼び出される、あなたが結果を得る、それをモデルに手渡します。簡単に聞こえますね?
問題は、もったら、より複雑なことを始めるとき、これは非常に高額になります。ですから、実際の本番シナリオの例をあげてみましょう。ここであなたはモデルを持つかもしれません。または本質的にはエージェントであり、長時間実行されるタスクをしており、継続的に新しいバージョンが起こることをモニタリングしています。ですね?
えーと、特定のエラー率をモニタリングしたい、あなたが知っているログ。そして、その上に基づいて、ロールバックをしようとするか、確認しようとします。ねえ、私たちは良好です。あなたが知っている、さらなる発行、ですね。標準的な発行プロセス。私は、すべての人がこれがどのように機能するかを知っていると思います。この設定で、何が起こるかは、あなたが最終的にツール呼び出しの束を持つということです。これらの呼び出しは、一つ次々と一つ継続的に起こります。ですね。この特定のシナリオで、私は、私のモデルを持つでしょう。すべてのログをリストアップしてください。あなたが知っている、それからすべての私の指標を取得してください。条件チェックを実行します。えーと、何らかの知っています。条件、下一歩を決定します。私たちが直面した問題は、あなたがする各ツール呼び出しが、現在の会話の全体的な文脈、プラスツール呼び出し、プラス応答を送信することです。ですね?
ですから、各ラウンドは、実際に、あなたが送信しているより多くのコンテキストになります。ですから、一つ、それは金を出血させています。二つ、あなたは多くの往復を追加するつもりです。ですね? ですね? ですから、あなたは多くのレイテンシーを追加しようとしています。本質的に、これをするためのより良い方法があるはずです。そして、私は思います、私たちがここで議論するところは、本質的にはコードパターンです。えーと、コードパターンは私たちの論文です。そして、私の意味は、それは今、Cloudflareだけではない、ですね? 私は思います、これは今、非常に流行のようになっています。しかし、私たちがコードパターンを考え出したとき、アイデアは、モデルが生まれながらコードをより上手に書く、ですね? えーと、あなたが急速に、私たちがちょうど論議した同じ例を見なら、コードスニペットでは、それはこのように見えます。ねえ、すべてのエラーメトリクスを取得したい、私は、その上に基づいて、これらのタスクを並列化することができ、私は条件チェックをしたい、そして、下一歩をします。
えーと、そしてモデルがこれをするより良い理由は、彼らは大量のコード上でトレーニングされた、ですね? ツール呼び出しに対して、モデル、ほとんどの場合、トレーニングされたツール呼び出しはすべて合成データであり、ほぼデータはありません。ですね? ですから、自然な本能から、あなたはモデルが実際にコードを書くのがより上手だと思うでしょう。それはえーとは、私たちが見るものです、ですね? 今日、あなたが同じツール呼び出しを見なら、私たちがちょうど記述した、ですね? 標準的なツール呼び出しは、ツール名、説明、パラメーターを持っています。あなたが知っている、期待される出力。それは基本的に、あなたがモデルに与えるものです。私たちがしたことは、私たちは、コードパターンと呼ばれるライブラリを持っています。それは本質的に、それを TypeScript 型に変換します。えーと、ですから、今モデルは同じタイプのセットアップを持っていますが、えーと、コードとして、それは気づきます。ねえ、これをするために、私が実行することができる関数があります。
ですから、このマッピングにおいて、そうですね、これを見ると、関数の宣言があります。これは本質的にはツール名です。えっと、説明はそこに基本的にはツールの説明で、その後、それを通じて渡されるパラメータがあります。そうですね、期待される入力と出力がどのようなものかのようなものです。えっと、現在、これが行うことは、本質的には、モデルに同じ能力を与えることですが、この場合、ツール呼び出しの順序を与える代わりに、モデルが単一のコード片を書きます。基本的に、私たちがやりたいのは、現在のスタックにすでに持っているすべてのものと一緒に機能させることです。そうですね?ですから、実際に全体のツールを置き換える必要はありません。モデルにツール配列を渡す代わりに、私たちは基本的に、コード・パターンという名前の単一のツールをそれに渡します。
ですから、保有している既存のツール全体をラップして、モデルにコード・パターンという名前の単一のツールを渡すだけです。コード・パターンとは何かというと、TypeScriptのライブラリ、またはたとえば、文字列として渡されるTypeScript型のファイルのようなもので、モデルに送られ、そこでは「ああ、存在するツールを知っています。それに基づいてコードを書くことができます」というような感じです。えっと、この場合、エグゼキューターと呼ばれるものも見ることになります。それについては後ほど説明します。もう一度、コードを書く理由の根拠に戻ります。そうですね?先ほど議論したように、単純なシナリオは、ご存知のように、おそらく5、8ラウンド必要だったかもしれませんが、1ラウンドのような可能性があります。また、推論にも利点がもたらされます。コードを書くたびに、ロジックをそこに埋め込むことができます。そうですね?
変数を使用する能力があります。これは、ご存知のように、以前のレスポンスに基づいた相互に依存するツール呼び出しを持つことができることを意味します。その後、何をすべきかを理解します。分岐を実行することができます。
これは先ほど説明したことです。たとえば、エラー率が特定のレベルを超える場合、ケース1を実行できますが、そうでない場合はケース2を実行できます。ご存知のように、同じ方法で、ループを実行できます。えっと、非常に標準的な例は、私のCloudflareアカウントを反復処理し、すべてのworkersをリストアップしてから、すべてのメトリクスを提供することです。現在、コード・パターンがない場合、これが起こる方法は、workersをリストアップして、worker 1を取得して、メトリクスを取得して、worker 2を取得してメトリクスを取得することです。そうですね、これはツール呼び出しを継続し続けます。えっと、これはコンテキストを追加します。議論したように、コード・パターンがあれば、単一のforループになり、何度も何度もそれを反復処理できます。そうですね。また、相互に待つ必要のないタスクを並列化するようなことも実行できます。えっと、はい、これがMCPに代わるものではないことを非常に明確に述べたいのです。これは概念的には新しいと思うので、ここで非常に明確に述べる必要があります。MCPは基本的なプロトコルです。最終的には最後の一マイルのAPI呼び出しを本質的に実行するために、それが必要です。そうですね。あなたのサーバーはまだそれをします。コード・パターンが行うことは、モデルに対してツール呼び出しと相互作用するためのより良い方法を与えることです。
えっと、そのツール呼び出しの実際の実装は、それでもMCP層で起こります。そうですね。別の例を挙げたいのですが、これは私たちが実際に直面した状況のようなものです。そうですね。えっと、Cloudflareは、大多数の人のようなものです。そう、あなたがたの中で、実際にCloudflareについて知っている人は何人ですか?素晴らしい。ありがとうございます。えっと、心配していました。ですから、Cloudflareは2500を超えるAPIを持っています。そうですね。様々な製品があり、ご存知のように、多くの異なる領域と業界にわたっています。もし今日、これらをツールとして組み込んだら、そうですね、標準のMCPツールとして、それは超える1です。
700万トークンのコンテキストになります。ほとんどのモデルについては、ツール説明だけでコンテキストウィンドウを溢れさせてしまうので、これはまったく実行不可能です。これはまた同じ問題に関わります。そうですね。今日、これをTypeScript型に変換したとしても、同じ問題に遭遇することになります。そうですね。ですから、コード・パターンに関する基本的な考え方は、ツールを型として盲目的にコピーして対処するのではなく、ということではありません。そうですね。ほとんどの場合、実際にはより良く機能します。しかし、このようなことについては、一歩引いて考えることができます。よろしい、より良くできるのはどうしてか。私たちが発見したことの1つは、検索と実行という2つのツールだけを与えることです。そうですね。これら2つのツール内で、モデルはまだコードを書くことができます。現在、検索と実行はMCPを実施するための戦略として、しばらくの間存在してきました。
人々は様々な検索ツールを作成してきました。たとえば、他のツールを取得するツールがあり、その後、それを実行することを決定するツールがあります。今、あなたはここでコードを書くことができます。そうですね?ですから、フィルタリングできます。これはこう考えることができます。私たちはモデルに言います。よろしい、グローバル変数があります。それは完全な説明を含んでいます。この説明はモデルに渡されません。しかし、モデルはコードを書く能力があり、それは返される正確なツールを与え、その後、同じことを実行するコードも書きます。これを単に行うだけで、そうですね、単純な検索実行スキームのような、私たちは実際にそれを1000トークンに削減することができました。Cloudflare API仕様全体は、今日、モデルにより1000トークンだけで呼び出すことができます。それは99.9%の削減です。これは極めて高いものです。私はこのレベルの圧縮を見たことがありません。それがどのようなものであれ。
ですから、これはより最適化された方法のようなものです。えっと、はい、ちょうど先ほど話した例です。
今、あなたはモデルを持っています。それは「よろしい、検索のものに対してツール呼び出しを行い、それに対してコードを書き、ご存知のような正確なスクリプトを置き、それが実行されます」と言っています。これすべて、私たちが議論した議論、私たちはずっとモデルがコードを書いている、その後、ご存知のように、それが実行される、ということについて議論していました。しかし、今、私たちが遭遇している重要な質問は、それがどこで実行されるかです。そうですね。えっと、一歩引いて、数年前に戻りましょう。そうですね、AI前のような時代のような、もし私があなたのところに来て、ここにランダムなユーザーが生成したコードがあり、あなたのセットアップで実行するよう言ったら、あなたがたはこれを行いたいとは思わないでしょう。そうですね。それはちょうどあなたが知っている大規模なCVのようです。それはRCです。ですから、ほとんどの人はこれを行いたくないでしょう。しかし、今日、私はここに立って、完全に逆のことを行うよう言っています。信頼されない完全なソースをモデルに与え、ご存知のように、それらにコードを書かせます。これはなんでもあり得ます。あなたは決してアクセスできません。その後、それを実行します。ですから、どこでそれを実行するのか。それは私たちが関わった小さなコンピュータ部分です。そうですね?
本質的に、非常に効率的で安全なサンドボックス環境が必要です。そうですね?これを行う方法はいくつかあります。つまり、コンテナを使用できます。コンテナはずっと前から存在しています。そうですね?コンテナの問題は通常、大量のコールドスタート時間があることです。そうですね?えっと、それを適切に構成する必要があります。あなたはメモリを持っています。あなたはコンピュートを持っています。これらすべては、よく計画する必要があります。えっと、その後、あなたは持っています。ご存知のように、本質的には外部層です。これは、物事を正しく安全に渡すことに対する多くの課題があることを意味します。ここでの別のアプローチはV8 isolatesです。えっと、ファンの素早いショー。あなたがたの中で、Cloudflare workersについて知っている人は何人ですか?素晴らしい。ですから、workersは私たち自身のランタイム層であり、V8 isolatesに基づいています。ですから、私たちはそれのためにV8 isolatesを採用し、その周囲でサーバーレスを作成しました。
えっと、あなたが読むことができる非常に素晴らしい詳細なブログがたくさんあります。しかし、本質的に、これが行うことは、私たちがちょうど議論した標準的な問題のすべてを排除することです。そうですね?あなたが実際にゼロのコールドスタート時間を持つまさにそのようなもの。それは絶対に軽量です。そうですね?workersの動作方法は、あなたの動的workersであり、これは本質的には、V8 isolatesについて言うときに私たちが言っていることで、完全に同じ位置で開始され、完全に同じ、ご存知のような、セットアップ、あなたのメインアプリケーション、workerで実行される位置で。そうですね?再度、各isolateを要求として、その後、それを捨てることができます。そうですね?ですから、再度、workersは私たちに境界をうまく与えます。そのコードを実行する範囲に限定されていることを確認してください。秘密をリークするチャンスはありません。ご存知のように、悪意のあるコードがあなたの実際のメインセットアップに入るチャンス。
また、workerを初期化するときに、それに渡したい範囲と能力が何であるかを決定できます。そうですね?えっと、再度、isolatesがより良く機能する理由の素早い方法は、本質的には、私たちはランタイムを所有しており、それは実際に様々なあなたが知っている情報交換を実行して、安全な方法で完了されることを確認することをはるかに簡単にします。あなたは再度、狂った極端な、ご存知のような待機時間はありません。物事を開始します。えっと、はい、基本的にそれだけです。非常にありがとうございます。ありがとうございます。Abishek。次に、私たちはTisを持っています。彼は私たちと話し、agent harnessesについて深く掘り下げます。これは開いていますか?皆様。おはよう。わお、あなたがたはみな眠っていました。もう一度試すことはできますか?皆様。こんにちは。はるかに良い。そう。
見て、見て、それはそれです。それはモノローグではなく会話です。ご存知のように、ちょうど、私はここにいて、あなたと話しています。あなたに向かってではなく。えっと、おはよう。彼は私のスライドを準備しています。えっと、しかし、これは面白い、面白い会話になるでしょう。私は思います。すべて大丈夫ですか?いいえ。ああ、彼はそうです。あなたがたの技術チームに拍手を送りましょう。皆様。これは本当にクールでした。彼ら、彼らはこのイベントを可能にしました。私はそれが好きです。これはえっと、彼らなしでは私たちは完全に失われていました。一秒間、申し訳ありません。よくあるぞ。彼は私のスライドをネタバレしています。これは、それで大丈夫。始めましょう。そう。それはそれです。そう。よろしい。こんにちは。私は黄色い手です。見て、これはずっと良いです。こんにちは。私はTisです。皆様。お会いできてうれしいです。再度。えっと、あなたがたが既に見かもしれないように、私の名前はTisです。えっと、これの発音は伝染性のような音です。心配しないでください。私は違います。えっと、そうでなければ、彼らは私をこの国に入れることができませんでした。
えっと、I、I、I、I16時間飛行してここに来ました。昨日、私はルーマニアにいました。えっと、今、私はベルリンにいます。えっと、そして、多くの年にわたって、私は本当に素晴らしいチームと多くの異なるテック企業で働く幸運に恵まれました。最優秀の人々から学びました。実際には、私はあなたがたに意見を表示するためにここにいません。むしろ、私が学んだ事実と教訓を共有するためです。自分自身からではなく、えっと非常に非常に賢い人々からです。私よりもはるかに賢い人々。今日、私はIBMのAIエンジニアです。えっと、そこで私たちは構築します。えっと多くのもの、基盤モデルとharnesses、私たちの顧客と開発者に提供するもの。しかし、また開発者にも。えっと、私はIBMとその他の場所の開発者コミュニティを支援します。I、I、私は人々にharnesses、AI、およびここで物事について教えます。そして、今日、これは私たちがここで話そうとしていることです。私たちはここでAI harnesses、agent harnessesを第一原理から話そうとしています。
えっと、素早く手を挙げてください。あなたがたの中で、AI harnesses、agent harnessesが何であるかを説明できると感じている人は何人ですか?いいですね。約3人です。えっと、素晴らしい。私はスピーチの終わりに再度質問します。その時までに手を挙げる人は多くなると期待しています。そう。それが私の目標です。それもちょうど私がここにいる理由です。ここに来ました。harnessが何であるか、それらがどのように機能するか、そしてなぜそれらが必要なのかを教えるためです。えっと、この用語はあちこちで使われています。そしてこの種の用語は時代精神の一部になると、問題は生じます。それらは翻訳で失われるかもしれません。そう?時々、私たちは十分な自信がなく、それらについて力強く推論することができません。ですから、これがそれを変えることを願っています。なぜ私たちはharnessesを必要とするのかについて議論することから始めたいと思います。えっと、非常に良いリーダーシップの原則は、全体的には「なぜ」から始めることです。では、なぜ私たちはharnessesが必要なのですか?
答えは、本当に、私たちがなぜ何でもハーネスで装備する必要があるかという同じ理由です。えっと、登山のことを考えてみてください、ね。例えば、ハーネスで自分を山に固定すれば、あなたは確実に登山と下山ができます。あなたご存知の通り、つまり落ちて死ぬことはないということです。わかりました。えっと、同様に、例えば、犬やペットを持っているとします、ね。通常、犬をリーシュで繋いで、ハーネスを着けます。そうすることで、犬は走り去って迷子になることはありませんが、確実にあなたと一緒にいられるわけです、ね。だから、エージェント、人間、ペット、または何でも、ハーネスの全体的なポイントは信頼性なのです。そしてその理由は、私たちがAI作業をしているとき、私たちはしばしば単にブラックボックスを信頼しているからです。このことについて考えたことはありますか。例えば、ローカルで推論していない限り、誰がローカルで推論していますか。はい。
一人、えっと、もしかするとここにもう一人か二人いるかもしれません。あなたがここにいるほとんどの人のようなら、あなたがしていることは、何か雲サービスプロバイダーにプロンプトを送ることです。そして、「ねえ、これをしてくれ。」と言って、すべてがうまくいくことを願うだけです、ね。えっと、例えば Claude 4.7 Opus にプロンプトを送ります。えっと、でも、もし彼らが何らかの障害に遭遇したら、彼らはあなたに Sonnet を提供するかもしれません。そしてあなたはそれを知ることができません。だから、あなたは言うでしょう。そうですね、今日の感じがちょっと違います。Opus が今日は違う感じがします。誰かこの感覚を経験しましたか。ね。それはあなたがある外部機関を信頼しているからです。そしてそれが、私たちがハーネスを必要とする理由なのです。だから、ハーネスがすることは、あなたにより多くのコントロール感を与えること、つまり、あなたのAIアプリケーションとエージェントをより信頼できるものにします。わかりました。これは明確ですか。だから、これが私たちがハーネスエンジニアリングをしようとしている理由です。ハーネスとは何ですか。えっと、すでに話しました。これがそれです。
ええ、でも、それがエージェントであって人ではないと仮定しましょう。そしたらそれがハーネスが何かです。実際のところ、エージェントハーネスは特に、ハーネスという用語の比較的新しい進化です。機械学習エンジニアリングでは、eval ハーネスがあります。これらは基本的には、モデルの強化版ユニットテストです。わかりました。えっと、でも、エージェントハーネスはやや異なります。もし私があなたにエージェントハーネスを定義するよう求めたら、えっと、これが私が聞くことを期待していることです。エージェントハーネスとは何かの答えは次の通りです。それはあなたのエージェントの周りのすべてのもの、ツールチェーン、その周りのすべてのもの、あなたのエージェントが実行される環境、それがあなたのエージェントに最高の成功と信頼性の機会を提供するものです。エージェントの周りのすべてのもの。だから、フィールドのいくつかの典型的なエージェントハーネスを考えると、それらはすべて少なくともこの6つのコンポーネントを持っています。最初のもの、それらはえっと、ツールレジストリを持っています。それらはツールのセットを持っています。
Cloud Code や Codex のようなハーネスを考えると、それらはツールを持っています。ファイルシステムの読み取り・書き込み。ウェブを検索する、ね。2番目のもの、言語モデルがあります。えっと、ほぼすべてのハーネスのどこかに言語モデルがあります。例えば、Cloud Code にはクラウドモデルがあります。コンテキストを圧縮またはクリアするためのコンテキスト管理プリミティブがあります。ね。もし、あなたがたの中で Cloud Code を使ったことがあれば、「slash compact」を知っているでしょう。えっと、ガードレールがあります。えっと、例えば、私は最も一般的なガードレールはあなたがすでにあなたのクォータを使い果たしたこと、だと思います。あなたが充電するまで、私はもうあなたと話しません、ね。それはガードレールです。えっと、画面にはエージェントループがあります。えっと、これはエージェントがタスクを完了してから 「わかりました、実は完了しましたか、それとも再度やるべきですか」と言う場所です。そして最後に検証ステップがあります。
だから、もし Cloud Code のようなエージェントハーネスを使っていれば、私は Cloud Code が好きです、ね。最後に、それは「わかりました、私はタスクを完了しました。今、npm run verify か何か他のものを実行して、このループを完了させましょう」と言います。だから、ほぼすべてのエージェントハーネス、もちろんすべてのコーディングハーネス、コーディングエージェントハーネスはこれらのコンポーネントを持っています。もしそれ以上でなければ。だから、これらは私たちのこのステージのビルディングブロックです。自分の声を聞くのに疲れたので、あなたたちに話しかける代わりに、デモンストレーションをします。だから、私たちがしようとしていることは、実は、ステージ上でリアルタイムにハーネスを構築することです。残りの時間で。えっと、それはある貧乏人のハーネスですが、それはただあなたがハーネスが何かを理解できるようにするためのものなので、あなたはあなた自身のものを構築できます。わかりました、これが私がここにいる理由です。
えっと、私たちがしようとしていることは、ブラウザ使用エージェントを構築することです。Chromium を起動して、それを使ってタスクを完了するものです。えっと、あなたが見ることができるように、最初は信頼できなくなります。それはやや重点なのですが、私たちはそれを安全にするためにその周りにハーネスを構築します。私はこれを言いますが、ハーネスはあなたがより少ないリソースでより多くのことができるようにします。あなたは非常に悪いモデルを選ぶことができます。非常に古い GPT 3.5 mini または 3.5 Turbo。古いものは。これは2年前のようなものです。クレイジーすぎます。冗談です。これは非常に古いモデルです。それは安いです。基本的には無料です。だから、あなたは信頼できないモデルを使うことができます。あなたは相当悪いプロンプトを使うことができます。ハーネスがあなたに信頼性をくれるからです。通常、私たちが望む結果を得られないとき、私たちは「ああ、ただそれにより難しくプロンプトを与えてください。システムプロンプトをチューニングしてください。言語を変えてください。スキルを追加してください」と思います。
ハーネスがあれば、あなたは実際にこれらのことを必要としません。あなたはプロンプトを凍結したままにすることができます。それは悪いプロンプトかもしれません。あなたは古い安いモデルを使うことができます。もし、あなたのハーネスが良ければ、あなたは約70%の戦いに勝っています。わかりました。だから、これをしましょう。私はハーネスを構築します。私たちはステージ上で一緒に1つを構築します。そして、えっと、私たちはおわりにします。だから、これが私が望んでいることです。私は、ただここで自分のエージェントを実行しています。えっと、私は TypeScript で書きました。TypeScript、JavaScript、または同様のものを使用している人はいますか。わかりました、あなたはおそらく理解するでしょう。えっと、私たちは npm run agent をします。あなたが見ることは、えっと、ブラウザが開きます。これは私は動かしていません。それは Hacker News に行って、記事に「いいね」をしようとしますが、ログイン画面を取得して、クラッシュしました。このエージェントの仕事は Hacker News 上でまだ「いいね」されていない最初の記事に「いいね」することです。わかりました。これは明確ですか。はい。
だから、これが仕事です。でも、これはそれがすることです。私は再度実行します。見てください。だから、私たちはブラウザを開きます。えっと Hacker News に行く。私たちは GPT 3.2 を使っています。えっと、Hacker News に行きます。ログインフォームをクリックします。でも、その時点で、それは私に言います。「私は最高にランクされたものに『いいね』をしました。」これは嘘です。これは完全な嘘です。実際に起きたことは、それが行って、「いいね」をしようとしてクリックして、ログインフォームをクリックして、クラッシュしました。ね。だから、これは完全な嘘です。私たちはどうしてそれを修正できますか。私たちはハーネスを使ってそれを修正します。まず、実際に起きているコードを見てみましょう。だから、これはえっと Cursor です。私は Cursor が好きです。これは私たちのプロジェクトです。だから、これが私たちが今のところ持っているものです。私たちはモデルを持っています。えっと、私たちは本当に申し訳ありませんが、これを変えるべきです。私たちは非常に古いモデルを使っています。えっと、安い、基本的には無料です。これが私たちのプロンプトです。Hacker News で物語に「いいね」をする。
これらは変わりません。でも、私たちのハーネスは変わります。あなたが知ってほしいことです。あなたがこれを非常に明確に知ってほしいことです。だから、これが起こることです。私たちは新しいブラウザセッションを起動します。これは私が書いたコードです。これは Playwright を使います。Playwright MCP ではなく、ですが、私たちはプログラム的にえっと、ブラウザを制御するクラスだけです。わかりました。そして、セッションがあるとき、私たちはツールを作成します。これはまさにあなたが、コードで思うことです。私たちはただ、このようなツール定義の束を返します。これはちょうど、説明などを含むJSON オブジェクトの束です。私たちはまた、私たちのコンテキストも作成しました。あなたはこれが複雑だと思いますか。実は、そうではありません。これはただ、システムプロンプトとユーザープロンプトを含むメッセージ封筒です。ユーザーのプロンプトは、私たちがすでに書いたものです。これがそれです。だから、それはただ、2つのオブジェクトを含む配列です。わかりました。
そして、最後に、私たちはエージェントループを実行します。では、エージェントループとは何ですか。まあ、それは while true で、物事をし続け、停止条件に達するまでメッセージをプッシュし続けることです。だから、これは LLM が 「私は完了した」と言うときです。この場合、私たちはユーザーに答えを返します。でも、エージェントループ全体にわたって、私たちはただ異なるイベントをプッシュします。私はこのツールを呼びました。私はこのメッセージを送りました。私はこのプロンプトを受け取りました。私たちはただ、これらをリストにプッシュします。これが私たちがしていることのすべてです。もし、私たちがツールを呼び出したら、私たちは各ツールの結果を私たちのメッセージ集合にプッシュします。これは意味がありますか。私たちはただ、各メッセージを追跡します。わかりました。だから、そのようなものです。私たちのエージェントは現在存在する様子は、それは機能しません。それはログイン画面をクリックしてクラッシュします。だから、私たちがしなければならないことはハーネスを構築することです。私たちは最初にガードレールを構築する必要があります。そして、それが実話を言う実際のようにします。
ねえ、ログインページでクラッシュしました。成功を完了しませんでした。そして、それを実際に修正する必要があります。これが私たちがしようとしている旅です。わかりました。第1ステップ。私たちはいくつかのガードレールを追加します。なぜなら、今、それは無限に実行でき、私を破産させることができるからです。だから、私たちはどうしますか。まあ、この git diff を調査しましょう。だから、私たちは今、ただ run loop を呼び出しています。私たちはモデルとメッセージを渡しますが、私たちはこれを変えて、いくつかのガードレールを含めます。私たちはそれを default guardrails と呼ぶつもりです。実際、私たちのデフォルトガードレールは何ですか。まあ、編集者に入ってそれをチェックしましょう。だから、私たちはこのファイル guardrails.ts を持っています。これらは、私たちのガードレールです。私たちは2つあります。max iterations。あなたはどのくらい多くの時間を試すことができます。そして、max messages。私たちがあなたのコンテキストを圧縮する前にいくつのメッセージがありますか。そして、それらを組み合わせる小さな助手があります。
わかりました。でも、私たちは実際にこれをどのように使いますか。まあ、もし、私たちは私たちのエージェントループに入れば、あなたはここにガードレールを含めたことを見ることができます。私たちは、ガードレールを呼び出し、問題がなければ、私たちはそれを終わらせます。私たちはこれが私たちが停止する理由であると言う。私たちはメッセージごとにコンテキストをトリミングします。だから、各反復で while true、私たちは um trim context を呼び出します。trim context は何をしますか。これは実際に本当に悪いです。実践では、これをしないでください。でも、私たちがしていることは、私たちはシステムプロンプトとユーザープロンプトと、その後の最新の2つのメッセージを保持していることです。より賢い方法があります。でも、それはこのスピーチの目的ではありません。このスピーチの目的は、私たちが働く枠組みを構築しているときに、あなたにガードレールを見せることです。だから、今、私たちは私たちのエージェントを持っています。私たちのエージェント、いくつかのガードレール。あなたはそれが何であるかを知っていますか。これはハーネスと呼ばれます。
だから、私たちがしようとしていることは、私たちは、単にいくつかのことの名前を変えてそれらをもう少し現実的に保つことです。だから、私がしようとしていることは、私は過去に言うつもりです。聞いてください。私たちは index だけ持っていますが、私たちはすべて、私たちのコードを削除する予定です。単に、run harness と呼ばれる関数の下にそれを抽象化します。私たちは、これすべて、赤い色で標記されたすべてのもの、harness.ts と呼ばれる新しいファイルに移すつもりです。わかりました。harness.ts とは何ですか。まあ、それを開きましょう。Harness.ts は、すべてです。あなたはおそらくこのコードを始めから認識します。これは、私たちの index.ts.ts からのすべてです。私たちはそれを harness.ts と呼ばれる関数に入れました。これは意味がありますか。だから、私たちはそれを、uh run harness として持っています。print harness result は単に console logs 物です。これはただのログ用です。これは特に有用ではありません。だから、私たちは、この時点で、単にコードを移動しました。
でも、今、私たちは run harness を持っています。私たちの次のステップは、わかりました、今、私たちは、ハーネスが管理しているエージェントから制御されず、ハーネスによって制御されているブラウザセッションを持っています。私たちは必要なときにこのブラウザセッションに挿入できるので、あなたが成功したか失敗したかを検出できます。わかりました。これは、私たちが今やろうとしていることです。だから、今、私たちがこのハーネスファイルを持っているので、私たちは来ます。これはえっと、これが、私たちが変えるつもりのものです。だから、私たちはちょうど、run harness 関数呼び出しを少し変えて、第3のパラメータを追加します。これはいくつかのオプション、verify step と max attempts です。わかりました。verify successful upvote。もし、私たちが、私たちのハーネスに入れば、これはやや興味深くなります。今、これらはちょうどタイプです。でも、ここで、max attempts があります。あなたは、ハーネスを3回以上実行しないと言っています。だから、各試行に対して、私たちは少し検証ステップをします。
もし、それが失敗した um または、それが max attempts に達した、私たちは、ただ最新の結果を返します。でも、私たちは、今、私たちのハーネスに、verify successful upvote と呼ばれるこの関数を持っています。それは何をしますか。私たちのエージェントループで、私たちはイベントのリストにイベントをプッシュしていたことを思い出してください、ね。だから、私たちのハーネスがするのは、それはリストをチェックします。もし、あなたが、ブラウザクリックを持っていれば、もし、あなたが up 何某某要素をクリックしていれば、それはあなたが上矢印をクリックしたことを意味します。これが私たちのハーネスが検証しているものです。だから、もし、それが真実であれば、true を返します。私は upvote click confirmed。でも、もし、あなたが harness auto login と呼ばれるツール名を見て、そして結果が harness failed to handle login であれば、そして、私たちは言う、いいえ、いいえ、あなたはログインに失敗しました。私たちは false 結果を返します。今のところ、これは意味がありますか。これはただ、コードです。わかりました。最後に、私たちはまた、unreovered login redirect と呼ばれるこの変数を持っています。私たちはすべてのツール呼び出しをチェックします。
ああ、わかりました。ここでブラウザに行きました。これが結果です。すべてのツール呼び出しをチェックします。もし harness auto login という名前ではないツールを見かけた場合、しかしログイン URL 上にいる場合、それはどういう意味ですか?それはログインページに行ったが、自動ログインが機能しなかったことを意味します。その後、失敗して言います、ログイン画面を通過する代わりにアップロードを完了するのではなく返す。最後に、成功したケースも必要です。えっと、でもそれは来ています。つまり、ここに何かのようなもの...もし...そうなら失敗したと言った、わかりました、を追加しました、私たちの harness に。これが私たちの harness です。これは私たちの agent loop ではありません。ですから、今それを実行して、何が起こるか見てみましょう。ですから、ここでこれを実行します。えっと、ですから今ブラウザを開きます。Hacker News に入ります。えっと、ログインページに行きます。それは崩壊しました。しかし、出力は何ですか?私たちは...私たちはそれに実際に真実を言わせました。
ログイン画面に当たったが upvote を完成させるのではなく、失敗したと言いました。これは起こるべきことです。では、すばやく確認しましょう。プロンプトを変更していません。より努力してプロンプトしていません。古いモデルを使用しています。わかりました。しかし harness は現在、真実を教えてくれました。これを修正しましょう。ほぼ完了しました。実際に...現在、ログインで立ち往生していることがわかっているので、これを修正しましょう。harness レベルでこれを修正できます。わかりました。ですから、それをしましょう、その後要約します。では、最終形式は何ですか?ファイルを追加します。login handler と呼びます。この関数は実際に何をしますか?関数に過ぎません。しかし、これはそれがすることです。これは重要な行です。えっと、ログインページ上にいない場合、何もしません。つまり、この関数は no です。ログインページ上にいない限り。
ログインページ上にいる場合、ユーザー名とパスワードを入力に入力します。ブラウザセッションは harness によって所有されているからです。agent によって所有されていません。これは意味がありますか?つまり、これはツール呼び出しがブラウザを駆動しているわけではありません。これは私が書いた harness です。わかりました。ですから、このユーザー名とパスワードを注入し、メッセージを返します。ツール名は harness auto login です。結果は「harness automatically logged in」です。これは基本的に agent に対してです。今認証されており、ホームページに戻っています。ですから、私の harness はこれをメッセージチェーンに注入します。これは意味がありますか?ですから、今 harness レベルでログインしています。わかりました。しかし、これは単なる関数です。どこで使用しますか?えっと、実際に harness で使用しています。
ですから login handler を作成しました。create tools で、ここに何かファイアウォールを追加しています。しかし、login handler を取得して、my agent loop run loop に与えています。agent loop 内で、これは飛行機を着陸させるところです。login handler を送信します。これが機能させるコードです。ですから agent loop 内で、login handler がある場合、その応答を待つだけです。再度、ログインページ上にいない場合、これは何を返すのですか?ログインページ上にいて、ログインイベントを受け取った場合、agent loop 内で、メッセージリストにプッシュします。これは意味がありますか?ですから harness が成功したログインを実行した場合、メッセージを追加します。「ログイン済み」、agent はこれを読み、続行します。これは意味がありますか?これが harness の全体のポイントです。ですから、これを実行して、そして要約します。
ですから、えっと、私たちは今、最新バージョンを実行する必要があります。ですから私がすることは npm run agent で、これはハーネスを通じて動作するはずです。ですから私たちは HackerNews にログインします。えっと、それ、それはユーザー名とパスワードを入力しました。確かに、あなたはそれを見ることができます、あ、それ、それは非常に速くやってしまいました。それは成功的にこのアップボートをアップボートしました。ハーネスを使用して迅速にログインしてコンファームをクリックすることで。これは意味をなしていますか?私たちはそれをより一生懸命に促していません。私たちは GPT 3.5 Turbo を使用しましたが、ハーネスを使用することでより多くの制御を得ました。えっと、ここで、えっと、まとめましょう。これはどういう意味ですか?それはより少ない作業でより多くを行うことができるという意味です。そして再び、ハーネスはあなたのエージェントの周りの環境で、それはその成功と信頼性の可能性を増やします。これは実践ではどのような様子ですか?えっと、私は IBM で働いており、私たちは毎日ハーネスを使用しています。
えっと、IBM では、私たちはエンタープライズグレードのオープンソース RAG ハーネスを構築しました。えっと、ご存知かもしれませんが、企業データは膨大で、至る所にあります。これらすべてのチーム通話、例えばノートなど、何が機密で何がそうでないかは分かりません。これは非常に危険なので、えっと、大企業のためにオープンソースのエンタープライズハーネスを構築しました。これは Open RAG と呼ばれており、繰り返しますが、それはオープンソースです。それが大事な部分です。えっと、もし興味があれば、ぜひスキャンしてください。私はここでそれを販売しているわけではありません。単に、これが優れたハーネスの参考実装だと考えているだけです。えっと、ですが、ここで話を締めくくって、いくつかのビジョンを示しましょう。さて、要するに、何をしましたか?ご覧ください、私はこの講演を始めるに当たって、皆さんの中で、ハーネスが何であるか、そしてなぜ存在するのかなどを説明できることに自信を持っている人が何人いるか尋ねました。
この数字は、この講演の後に変わりましたか?はい。ああ、それは非常に多いです。ほぼ部屋全体ですね。了解しました。私の仕事は完了しました。えっと、それはハーネスについてです。それはあなたがそれらをどのように構築するかについてです。それは、少ない労力でより多くを行うことができるについてです。あなたはあなたのプロンプトを変更する必要がありません。あなたはあなたのモデルを変更する必要がありません。未来はどのようになる可能性がありますか?さて、私たちはちょうどハーネスをハードコーディングしました。私たちが自分たちで書きました。しかし、もし、ああ、ちょっと待って、もしハーネスが動的で、エージェントが彼らのハーネスを作成でき、その後仕事をすることができたら、素晴らしくないですか?私は、動的ハーネスが AGI への次のステップかもしれないと思います。そこでこのすべてはエージェントによって管理できます。しかし、それと一緒に、えっと、ここで話を締めくくりたいです。
私は、えっと、既にもしかして既に私が費やすべき以上の時間を費やしているかもしれませんが、ここで停止して、ただ皆さんの時間と注意に対して非常に感謝したいです。シンガポール。非常にありがとうございます、Tis、そして皆さん全員に感謝します。私は部屋が満杯なのを見ました。えっと、私たちは最初の休憩を取ります。えっと、次の講演は 10:17 に開始します。えっと、ただの注意ですが、ブースも開いているので、もし歩き回りたければ、えっと、脚を伸ばしてください。皆さん、ありがとうございました。また後でお会いしましょう。へい、へい、へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい、へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。へい、へい、へい。
ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。えーと、次に Google からの JJ Gwax が私たちに加わります。彼は応用 AI ディレクターで、ここシンガポール在住です。彼はモデルを本番運用に投入することについて、私たちと話し合うことになります。これはここに表示されますか?>> いいえ。はい、どうぞ。了解、クールですね。やあ。えーと、私は JJ です。えーと、私は DeepMind のエンジニアリング ディレクターです。えーと、ですから応用 AI チームをリードしています。えーと、私はシンガポール在住です。えーと、採用中ですので、人々が興味を持っていたら、えーと、そこで働くことについて、えーと、必ずご連絡ください。
えーと、ですから私は本日、えーと、ハッカソン 的なものから本番運用への移行についてのことを少し話すつもりです。これは私のチームがしていることです。えーと、そしてスケール上でモデルを処理します。えーと、ですから私たちがそこに入る前に、私は少し私のチームが何をしているかについて共有したいです。ここにいる少なくともそれらの 1 つを見ます。他の人も同様であることを望みます。えーと、ですから私たちがしようとしていることは、私たちは DeepMind モデルの技術的な境界を推し進めています。えーと、これは私たちのほとんどが精通していると思われる えーと Gemini と Gemma などの意味です。これは私たちのオープンウエイト えーと テキスト モデルです。えーと、しかしそれはまた nanobanana と vio えーと ビデオおよびイメージ モデルを含み、そしてより科学的なもの。ですからそれは AlphaGenome と えーと WeatherNext です。WeatherNext は天気と台風を予測し、大規模な えーと 嵐および同様のものを予測します。
ですから私たちの仕事は、モデルにそれらが必ずしも設計されていないことをさせようとする、または私たちが彼らに設定したかもしれない制限を突破しようとすることです。ですから えーと VO を持つ良い例は、それが 8 秒のビデオを生成することです、対でしょう?ですからあなたはそれにプロンプトを与えます。あなたは 8 秒のビデオを出力として得ます。えーと、もしあなたが映画全体からのシーンのような全体を生成したいとしたら、どうですか?えーと 5 分の時間。uh、あなたはどのようにそれを行いますか?私たちのチームはそれらのタイプのことをしようとします。または Nana Banana を持つ。映画を持っていて、あなたがそれ全体をアウトペイントしたいとしたら えーと、例えば、それをワイドスクリーンのようにします。えーと、それは私たちがしたかもしれない例の一種です。えーと、これらのことは簡単に聞こえます。なぜなら、それらはより多くの同じものであるだけだからです。しかし、実際には、それはより困難な問題です。uh、私たちはそれを解決するための賢い方法を考え出さなければなりません。
えーと ですから uh 私たちが最終的にここでしようとしていることは、モデルに本物のことをさせることです。ですから、8 秒のビデオを持つことは良いですが、それはあまり面白い ハッカソン プロジェクトのようなものです。えーと、それは本物ではありません。あなたはそれを映画スタジオに売ることができません。えーと、私は 「ほら、これはあなたの映画の 8 秒です。」というような言い方はできません。あなたがしなければならないことはそれを超えることです。これはまたモデルが何をあなたのガイダンスが可能かを整列させることです。えーと、テキストで映画を説明することは実際に本当に難しいですね。ですから、あなたは最終的にこの巨大なプロンプトを取得し、それは非常に壊れやすく、それは壊れます。キーフレームを超えてそれを修正する方法を理解し、そしてアニメーションを理解し、そしてあなたが知っている表現する方法はアニメーターまたはディレクターが望む方法は実際には本当に驚くほど困難な問題です。えーと ですから私たちはそれらすべてをしようとします。
えーと 今、私は私 I 少し暂停したいです。なぜなら、私は刚才 oh のようにモデルは十分に良くないと言いました。彼らは 8 秒のビデオのみを生成します。私は私 I あまり暂停したいだけで、ただ、私はこの AI 的なことは素晴らしいと言う必要があります。それは完全に狂っているようなものです。I I I あなたたちが覚えているかどうかわかりません。しかし、ほんの数年前のようなもので、chat GBT が存在しなかったようなもので、私たちの生活は完全に異なっていました。えーと、このようなモデルが信じられないほどで、同時に、それらはまだ十分ではないようなこのようなものがあるように見えます。彼らは本物のことをしません、あなたはご存知、私の整個の仕事です。えーと、しかし、チェスのような移動する目標のようなもののようなものが、ずっとあるようなものですね?I あなたたちが、整った Deep Blue のようなもの全体が起こったときを覚えているかどうかわかりません。
私は子供だったので、私は本当に注意していませんでした。しかし、私たちのようなコンピュータは国際象棋である人を打ちました。そしてすべての人は 「ああ、それは素晴らしい。」のようでした。また、ああ、それは単に国際象棋です。えーと、それから 10 年前に go です。Uh、Demis は刚才 韓国に行きました。 go を解決することのような 10 年を祝うために。すべての人は 「ああ、それは決して起こりません。」のようでした。私は当時 Google で働いていたことを覚えています。そしてすべての人は 「これは動作しますか?」のようでした。像、それは勝ちますか?I I わかりません。それから、それからそれは大部分の方法をしました。今、すべての人は 「ああ、それは単に gh のようなものです。」のようです。えーと、それから chat GBT が来ました。それは信じられないほどでした。私は妻に示すことを覚えています。彼女はただ、あなたはご存知、東西を要求して、そしてそれは彼女に答えるでしょう。そして、それをテーブルに変えるようなもので、すべての種類の狂った東西。像信じられないほどの。今、私たちは 「あ、chat GBT 古いニュース。」のようです。
それは単に chatbot です。And and 今、私たちはこのあまり奇妙な段階にいます。像、私たちは agents を持っています。彼らは東西をします。像、彼らは電話をかけます。そして、11 Labs と Open Claw のような東西を使用します。レストラン予約のために。彼らは私たちのすべての電子メールを意図しないで削除します。あなたはご存知、狂った東西のようなもの。それは像、私たちはまだ agent が私たちのガイダンスに従わないことに怒っています、対でしょう?像、私たちはどのように台無しになったのか。えーと、誰かが飛行機で Wi-Fi を獲得したときを覚えていますか?像、それは信じられないほどでした。今、それは像、uh、それは Wi-Fi がありません。Like、uh、今、今、ロボット、ロボット、像、工場の仕事にいます。そして、私たちは像、gh のようですが、それはさらに私の洗濯さえしません。それはただのですし、私は実際に一つのロボットのビデオを見ました。uh 床を作り、ゴミを取り出します。だから、多分、すぐに、このサブプレットは消えます。
ですから、仕事は実際にモデルにやってもらうことなのですが、正直になると、モデルは信じられないほど素晴らしいです。本当に信じられないほど素晴らしい。ですから、この動くゴールポストというアイデアは昔からずっとあったと主張します。それは必ずしも悪いことではありませんが、少し誤解を招きます。なぜなら、それはずっと私たちを前進させてきましたが、同時に私たちはどこまで来たのか、そしてすべてがどれほど素晴らしいのかを少し忘れています。これは重要なポイントを思い起こさせます。つまり、すべての進展は信じられないほど速いということです。ただ速すぎるだけです。3年前、ChatGPTはありませんでした。今、私たちは3つの異なる非常に人気のあるagentフレームワークと狂ったような動画生成ツールを持っています。信じられません。もうインターネット上で何が本当かを判断できなくなってしまいました。
しかし、私のような人間、企業内にいる人間の場合、スナップショットを撮る必要があります。どこにいるのか、一時停止ボタンを押して、基本的に時間に固定されるので、何か本当のものを構築できます。ずっと列車に乗ってはいられません。降りて何かを構築しなければなりません。ですから、それが今私がやっていることです。AIを使う異なるカテゴリーがたくさんあると言いたいです。異なる方法でそれを使っています。主に3番目のものに焦点を当てています。このin-appのもの、こういったことですね。ですから、どのくらいの人がある種のAI codegenを使っていますか。多くの人が手を挙げることを望みます。わかりました。何人がagentを持っていて、使用していて、狂ったことをやっていますか。素晴らしい。3番目は、アプリケーション内部というアイデアです。ユーザーが実際に対話するAPIコールを行います。
ですから、このアイデアは、開発者が対話する必要があるものではありません。あなたの祖母がチャットボットと話しているかもしれないことを知っています。チャットボットと話していることに気づきさえしないかもしれませんが、この問題に遭遇するでしょう。ですから、私の役割は主に3番目のカテゴリを処理することです。私たちがしようとしていることは、企業が特定のベンチマークを超えるのを助けることです。前に述べたことです。この右下隅のものに焦点を当てたいです。ポリシーに違反しないというアイデア、なぜなら、その中のいくつかは賢いハックだからです。動画モデルがあって、動画セグメントを生成します。どのようにしてより多くのコンテンツを生成させますか。画像ツールがあるが、4Kまでしかサポートしていません。このような大きなサイズの巨大な看板を生成させるにはどうしますか。それは必ずしも求める高い品質ではないかもしれません。
そうですね。巧妙な方法で出力の境界を拡張することができます。しかし、ポリシーに違反しないことを確認する方法は、アーキテクチャとデザインの決定です。私たちはいくつかのことに遭遇しました。また、私の多くの仕事は今後のI/Oカンファレンスで議論されるので、多くのことは言えません。本当に申し訳ありませんが、良い例を提供することができません。しかし、I/Oのライブストリームを見れば、DeepMindで私たちがやっていることの一部を見ることができます。クビになりたくないので、言うことはできません。ですから、前もってお詫びします。暗にほのめかそうとしますが、問題は起こしません。
ですから、私たちが遭遇した障害について話します。私たちが発見した問題、そして最後のようなポリシーのアイデア、DeepMindでどのように処理するか、そしてApplied AIチーム内で、あなたが今やっていることのいくつかに適用されることを望んでいます。ですから、チャットボットを構築します。責任を持ち、プロフェッショナルであるよう言います。例えば、私を悪く見えるようにしないでください。わかりません。Chipotleのスクリーンショットを見ました。誰かが言っていました。なぜClaudeコードを購読したいのですか。Chipotleのチャットボットは無料です。誰かが言いました。本当にブリトーが欲しいです。でも最初に、Fibonacci数列を計算するPython関数を書くのを手伝ってくれませんか。チャットボットは言いました。もちろんです。そうですね。つまり、これは本当に一般的です。皆さん、プロンプトインジェクションを見てきましたね。
そうですね。私はおかしいですか。わかりました。素晴らしい。ですから、プロンプトインジェクションは実在しており、意図的ではなく、複雑です。でも、これは私たちが対処しなければならないことです。ユーザーを最終的にAIバックエンドと対話させる場合、処理する必要がある事実があります。エージェントがやるべきことを定義する方法と、ユーザーがエージェントと通信する方法は同じです。ですから、両方ともテキストです。では、この奇妙な問題にどう対処しますか。通常は問題ありませんが、人々が間違った言葉を言った場合、チャットボットは幻覚を見て、狂ったことを言います。さまざまな実際の問題があります。温度をゼロに設定すれば、それが確定的であることを意味すると思っている人はどのくらいいますか。そうではありません。
ですから、もしあなたが——そうです、ある程度はそうですが——はい、技術的には確定的に近いですが、テキストのわずかな違いが出力の大きな違いを意味するため、それでも非確定的です。これはその種の場合です。あなたは感じます。ああ、温度を0に設定しました。すべてが大丈夫です。それでも崩れました。あなたは失望しています。これは疑似乱数生成器でランダムシードを設定するようなものではありません。全く違うことです。ですから、これらの異なるエージェントとAIバックエンドから確定性を得ることは本当に厄介です。ですから、私たちはこれの多くを処理しなければなりませんでした。
ですから、このアイデアはドキュメントを取得し、AI パイプラインの一部として使用し、それが本来は知らなかった質問に答えるのに役立つということです。ですから、これも少し携帯電話みたいなものですね。時々、RAGパイプラインがあなたに問題を引き起こす可能性があります。良い例は、チャット履歴に払い戻しがあった場合です。RAGを使用してチャット履歴を引き出します。例外的な場合でも、お母さんが電話をかけてきたのでその払い戻しのチャット記録があるようなものです。だから、あなたは単にお母さんだけに与えました。でもそれは同じことではありません。さて、今、払い戻しとして見えるので、払い戻しを発行します。あるいは、どこかにテスト例があり、1ドルで売られている車がある場合、今、おそらく1ドルで車を売っているかもしれません。
ですから、これらは本当に危険です。今、これを言っているようですが狂ったようです。もちろん1ドルで車を売るべきではありません。でも、エージェントにとって合理性は必ずしも存在しないため、絶対に可能です。私たちはそれが存在すると少し期待していますが、それは存在しません。ですから、私たちのエージェントは多くの点で本当に愚かなインターンのようです。新しく雇われたばかりで、良い仕事をしようとしていますが、本当に何をすべきかを知りません。ですから、これらの3つのことは私たちが見た大きなものです。もっとたくさんあります。すべてについて教えることができると主張したくはありません。これら3つに焦点を当てたいだけです。でも、これら3つについて言及する価値のある底線は、モデルが多すぎることをするように求められているということです。
ですから、モデルは素晴らしいです。先ほど示しましたし、AIがいかに信じられないかについて議論しました。でも、AIに何かおかしなことをさせようとするとき、例えば、AIに関するスピーチをするためにslashgoを与えるなど、それは必ずしも上手くはいきません。あなたはそれをもっと導かなければなりません。なぜなら、一つの理由はモデルが私たちが望むほど素晴らしくないからです。なぜなら、私たちの期待は絶えず上昇しているからです。でも、整列が難しいからでもあります。私の頭の中にあるものを、私が望む言葉やコード、画像、動画に変えます。これは簡単な問題ではありません。実際には非常に難しく、AIから私たちが望むものを得る方法を理解することは、時々、私たちがそれが欲しくないと知らないまで、それが私たちが欲しくないものを与えてくれるまでです。そしてこれは絶えず起こります。顧客と取引するときは、大規模に起こります。
ですから、これはここでも興味深いポイントです。つまり、大きな潜在的な問題は、ハッカソンではすべてが機能することです。問題ありません。でも、本番環境に入ると、そうではありません。境界ケースは至るところにあります。ですから、私たちがしようとしていることは、言語モデルを大きな単一ルーターとして使用することをやめることです。全体的なアイデアは、すべてをシステムプロンプトに入れようとするとき、それは機能しないということです。でも、それはあなたがそれを分解しても、各個別の問題を解決できないことを意味しません。私たちは今日の早い段階でのいくつかのトークを見ました。彼らは計画モードに入り、やることリストを作成しました。彼らは、「ねえ、見てください。もし完了をしようとしているが、やることリストを完了していない場合、エラーが発生します。本当のエラーです。」と言うことでやることリストをガイドしました。これらは私たちが見たそれらの種類のものです。
ですから、私が言ったことがこのグループにとって完全に新しいかどうかは確かではありません。でも、重要なので、それを改めて強調したいです。ですから、私たちがしようとしていることは、確定性でものを囲むことです。大きな非確定的な部分を分解し、ものが実際に機能する方法を理解することで。ですから、できることは、各ルートを個別の部分として扱うことです。でも、この変換ブロックはどこか中間にあります。ポインタはありますか。これが機能するかどうか知りたいです。そうですね、少し。見ることができます。この変換ブロックレイヤーはAIを使用し始める場所です。他はすべてAIですが、より小さいレイヤーです。ランダムな入力を取得し、JSONに変換しています。あなたが知っていて理解している構造です。Pantic AIはこれに素晴らしいです。相当に素晴らしい他のエージェントフレームワークもあります。ADK、Agno、たくさんあり、すべて素晴らしいです。
ルートはLLMでもあります。あなたが取るべき行動の種類を決定します。これは言語モデル呼び出しで行う決定です。でも、同じく、これは単なるルートです。与えられた入力に基づく決定です。顧客は払い戻しを望んでいますか。彼らはうまくやったと言っていますか、それとも彼らのサービスをキャンセルしようとしていますか。何でも可能です。ルートはそこで決定し、意味のあるものにキャストします。次に変換、JSONからJSONに固執します。タスクをしようとしていると決定した場合、「わかりました、構造化されたものを取得したいのですが、それを理解し、別の構造化されたものに変換したいです。私もそれを理解しています。」と言うかもしれません。次に最後に、出力テキストを生成することができます。それは同じく言語モデルが得意なことです。
ですから、それが吐き出すのは人間が読める何かです。単にあなたの祖母にJSON の束を返すだけではなく。そうですね。見ることができるものです。次に最後に、セーフティーチェックも行うことができます。ですから、Cloudflareもそうしていることを知っています。また、そうしている他の多くの企業もあります。より小さく、より的を絞ったモデルを使用して、何かが安全かどうかを確認し、戻すことができるかを確認することができます。ですから、言語モデルはルートを選択し、その後決定します。「計画させてください」をするのではなく、複数選択問題を与えます。それが全体的なアイデアです。言語モデルはその点で分類器のように機能します。これまでの会話に基づいて、ユーザーが何をしようとしているのかを決定します。その後、「これはそれをするために理解する必要があります。」に突っ込みます。ですから、計画モードと推論にそれをさせるのではなく——これらのものは素晴らしいですが、本番環境では、私はそれらが本当に準備ができていると思いません。
ですから、あなたはそれを使い、複数選択問題として教えることができます。ですから、前に述べたように、これはデータを取得し、使用できるものに変えることです。確定的に変換し、確定的な入力から別の確定的な出力に変換し、実際の応答を生成することです。それはオーディオ、動画、画像、またはテキストであってもかまいません。その構造化された確定的で変換された出力を使用して。ですから、最後に、このセーフティーのアイデア。あなたの応答が何か不快なことを言った場合、顧客は誰も幸せではないからです。でも、言語モデルで実行してもまだ同じプロンプトインジェクション問題があります。ですから、いくつかのオプションがあります。コンテキストレスの言語モデル呼び出しを使用することができます。「これは私がユーザーに送ろうとしていることです。大丈夫ですか。私は、あなたが知っている、自動車保険会社です。」
ご存知の通り、ここに何を挿入してもいいのです。これはこの方面でかなり優れています。そしてプロンプト注入のオプションはありません。そして最後に機械学習分類器があります。より小さく、より的を絞ったモデルを使用して、何をすべきかを判断することができます。えっと、興味深いことに、この同じパターンは実は画像とビデオにも適用されます。ですから、今日お話ししないことの1つは、私たちが継続的に取り組んでいるプロジェクトで、それはあなたのカメラからのリアルタイム画像フィードを含み、それをどのように分類し理解し、フィードバックのようなものを提供するかを理解することです。えっと、それは本当にテキストではないですよね。ビデオ入力があってその後オーディオ出力、例えば、エージェントのようなものです。えっと、私たちはそれをするために2つの異なるモデルを使用しています。わかりますか。いくつかは実際の携帯電話上にあり、少し鈍いタイプのモデルですが、それらは本当に速いです。それらは1秒あたり50フレームを処理することができます。
それらは50ミリ秒以内で応答することができます。それらはあなたに言うことができます、見てください、この画像が与えられると、これはある種の深度感知です、ご存知のように、ああ、ご存知のように、これはあなたの前にある椅子またはあなたの前に障害物があります。Geminiと比較すると、Geminiは素晴らしく、画像で何が起こっているかを正確に教えてくれますが、時間がかかります。ネットワーク遅延があります、わかりますか、実際には最初のトークンまでの時間を取得するのに時間がかかり、確実に50ミリ秒より長いです。えっと、だからこれら2つの間に違いがあります、だからあなたはそれらを同時に使用する必要があります。すべてをモデルに投げるだけのようにシンプルではないのです。なぜなら、モデルはまだそのレベルに達していないからです、どんなに素晴らしくても。それらはまだそのレベルに達していないのです。
だからこそ、私たちがしなければならないことは、異なるツールを使用して物事を組み立てることです。異なるタスクには異なる利点があるからです。このケースでは、私たちは非常に低いレイテンシが必要です、わかりますか。そして、AIに魔法のようにそれを私たちのためにするさせるのではなく、私たち自身が問題を分解することができます。だから、私たちはある種のキーフレームに分割し、えっと、そして、賢く、巨大だが少しゆっくりかもしれないモデルを使用して認識を行います。えっと、そして、それほど賢くはありませんが、確かに低レイテンシであり、確かに毎秒多くのフレームを処理できる何かを使用します。私たちはキーフレームを選択する必要はありません。私たちはただ全体のストリームを送り込むだけです。わかりますか。問題解決です。えっと、だからこのようにすることで、あなたは両方の利点を得ることができます。あなたの意味的な理解と、あなたのリアルタイムの、えっと、安全と障害検出、例えば。えっと、だから私はただこれを完了させたいだけです、わかりますか。
えっと、LLMは多くのことで素晴らしいです。それらはまるで信じられない、本当に本当に信じられません。えっと、しかし、私たちはそれらが得意なことを実現するために何かを使用する必要があります。だから、私はすべての難しいことのために言語モデルを使用したいと思っています、わかりますか。本当に重要なことのために決定論を使用したいのです、そして私はこれについて妥協することはできません。その非決定論的な出力は災害になるでしょう。えっと、ご存知のように、冗談を言うのが好きですが、私たちはただ顧客に「心配しないで、プロンプトに『法律を違反しないこと』を追加しました」と言うことはできません。そういった、それは受け入れられない答いえです。そういった、それは機能しません。えっと、それは素晴らしく、それができることを望んでいます。えっと、しかし、もしそれができたなら、私の全チーム、私たちは存在しなくなり、私たちは皆解雇されます、そしてそれは終わりです。だから、私は少しそれがなかったことに幸運です。
えっと、しかし、この戦略を採用して、ClaudeやGemini Coderや、ああ、ご存知の通り、えっと、GPT Codexのようなものに、ただこれらのアイデアを使ってこれを構築するよう言ったら、それはやるでしょう。だから私たちはまだ開発段階でクレイジーなことのためにAIを使うことができますが、現実には、私は実際に得意なことのためにモデルを使用するために、もう少し異なる場所で使用する必要があると思っています。えっと、今、私は多くのことについて話していません。えっと、もっともっと、えっと、私たちが考えて協力しているものがあります。だからえっと、私はファインチューニングについてまったく言及していません、わかりますか。えっと、以前にファインチューニングをしたことがある人はどのくらいいますか。私はいつもこれを聴衆に尋ねたいのです。わかりました、多くはありません。あなたはそれを試すべきです。それは素晴らしいです。えっと、しかし、私たちは常にそれをしているわけではありません。それが意味のあるときにそれをしています。
えっと、これは一つの例です、より小さく、より的を絞ったモデルの、安全分類やスタイルアプローチのようなことをしている、あなたの出力をどのように構造化したいかについて。えっと、ファインチューニングは素晴らしいです、わかりますか。これはあなたが正しい場所で使用する必要があるだけです。悪いデータを持っていて、あなたの目標が何かを知らなかったら、あなたはただいくつかの巨大なモデルのためにすべてをファインチューニングしようとするだけではありません。えっと、別のことは評価です、えっと、テスト駆動開発をしたことがありますか。そうですね、はい、時々私は私のモデルにTDDをするように言います。しかし、もしあなたが最初に評価をしたなら、あなたは実際にはAI評価TDDのようなことをしています。えっと、それは有効です、わかりますか。しかし、時々それは難しいです。えっと、ゴールデンデータセットが必要です、そしてあなたはそのようなものが必要です。
だから、これはそれです。私があなたに残したいのは、やることがもっともっと多くあるということです。しかし、その3つのことは私たちがずっと遭遇していることで、モデルが本来の方法でモデルを使用することによってそれを解決する方法があります、彼らが得意なことのために。えっと、だから、私は、私が前に言及したように、AIモデルは信じられないようなものです。しかし、あなたが何かを構築したいなら、あなたはある時点で下車する必要があります。あなたはそれに永遠に乗り続けることはできません。だから、ここでの重要なポイントは完璧なモデルを待つことはできないということだと思います。それはすぐに来るとは思いません。私たちはまだ長い道のりがあります。えっと、それらは今十分に良いです。あなたは素晴らしいものを構築することができます。ただ確認しようとしてください、えっと、物事をできるだけ決定論的にしてください。だからはい、それが全部です。ありがとうございます。わかりました、本当にありがとうございます、JJ。
わかりました、次に、あ、私たちは特に舞台に迎える人がいます、ジェフ・ハントレイ。これは実は彼がシンガポールで話をする2番目の時間です。あ、彼は去年もここに来ました。私たちは彼が共有していることに完全に驚かされ、彼を戻すことを決定しました。えっと、昨晩ここのパーティーにいた人たちのために、あ、彼は実際にいくつかのものに来て、DJもしました。あ、では、ジェフ・ハントレイは誰でしょうか。彼は独立したAI研究者で、AIでクレイジーなことをすることで有名です。だから彼は実はRalphループの背後にいる人です。それは今、今日使用されている多くの多くのツールに組み込まれています。だから彼はすべてがどのようにファクトリーであるかについての講演をするでしょう。皆さんこんにちは。えっと、今日ここにいます、私は言わなければなりません、これらのトピックについて自信を持って行動しているかもしれませんが、これはかなり挑発的なタイトルです。えっと、私はわかりません。
ですから、これをお聞きになる際、このことについてぜひ反思していただきたいです。私が正しいかもしれませんし、間違っているかもしれません。ですから、これは挑発的なタイトルです。ソフトウェア開発が現在、最低賃金未満のコストで利用できると言っているからです。かつて、写真撮影をしたければ、写真撮影のために専門的なツールなどを購入する必要があった時代がありました。しかし現在は、ほぼ誰もがiPhoneを所有していて、誰もが今や写真家です。考えてみてください。ものごとは変わったのです。この免責事項を踏まえて、一方で、私は誰のために働いていません。私は完全に独立しています。私は誰の代表でもありません。ですから、これは刺激的になるでしょう。動物風にいきましょう。わかりました。そして、今はおよそ1年半が経過していて、えっと、特定の方法でメモリを割り当てる技術を発表したからです。そして、別のループの周りにツール呼び出しをラップすれば、それはただのループです。
しかし、それだけではなく、背景エンジニアリングに関する多くの科学的コンテンツがあり、これらの成果を実現するためにこのプロセスが行われており、かなり破壊的なものになっています。えっと、私はそこで講演しました。すべてがどのように変わったか、そしてこれはAtlassianの解雇の1週間前でした。あ、なんと。そして、事業の単位経済学を見ると、永遠に変わってしまいました。この変化がどれほど大きいのかを、本当に理解していただきたいです。これが本当であると信じていない場合は、他の開発者と話をするのをやめる必要があります。創始者と話す必要があります。ビジネスリーダーと話す必要があります。もっと好奇心を持つ必要があり、これが何を意味するのかを本当に理解する必要があります。見てください。誰もがソフトウェア開発者になるとき、これは何を意味するのでしょうか?例えば、ここに特別な理由はありませんが、同じミートアップにはCursorもあります。
私はどのような方面でもCursorを最大化しているわけではありませんが、このミートアップで何かを指摘したいです。ここにRoslinがいます。そしてRoslinのような他の人たちもいます。彼らはデザイナーです。彼らはプロダクトマネージャーです。彼らは大変楽しい時を過ごしています。ここにはソフトウェアエンジニアが講演している人はいません。なぜなら、彼らは今、ソフトウェア開発者として力を与えられるようになったからです。これは歴史上初めてのことで、ちょうどiPhoneが彼らの手にあるのと同じです。彼らは直接仕事を完了することができます。彼らは写真を撮ることができます。彼らはソフトウェアを開発することができます。彼らの最も大胆な夢が何であれ、彼らはそれを成し遂げることができます。ですから、過去3ヶ月間、私は世界中を旅してきました。今、異なる都市で17回このプレゼンテーションを行ったと思います。そして、えっと、私が行った都市の一つはOaklandです。Oaklandで、私はロード・オブ・ザ・リングスのホビット村に行くサイドクエストをすることに決めました。
私の観光ガイドが私に尋ねました。「Jeff、あなたは何をしているのですか?」と。私は「AIをやっています。判断しないでください。」と言いました。次に、彼の眼が輝きました。彼は「Jeff、AIはどんなに素晴らしいですか?AIはどんなに素晴らしいですか?」と言いました。あなたのツール オペレーターがトークン最大化をしているとき、これは何を意味するのでしょうか?見てください。今、誰もがソフトウェア開発者です。なぜなら AI がすべての人をソフトウェア開発者にすることを可能にしたからです。そして社会は常に知識の希少性を中心に設計されてきました。過去、私たちが高く請求したのは、知識が希少だったからです。これが私たちが社会を組織する方法です。それは変わりました、皆さん、なぜなら私たちは今、知識豊富な経済に向かっているからです。もし主任ソフトウェアエンジニアになるのであれば、それは何を意味するでしょうか?
あなたは、確定性システムテスト、属性ベーステスト、テスト生成器、そしてこれらすべての高度なもの、形式的手法と証明について知っているかもしれません。これらのことが単なるスキルファイルにパッケージされるだけでは、どういう意味なのか?えーと、これはソフトウェアエンジニアリングについてだけではなく、会計、法律、基本的には知識の希少性という概念に基づくすべてのホワイトカラー業務についてもです。これは社会への変革的な影響です。だから、約2年前の時点に遡ると、えーと、これは2024年11月の私の状況です。私は最初に「ああ、しまった」と言いました。すべてが変わらなければならないと述べるブログ記事を発表しました。私はこれについて後でもっと深く掘り下げます。IDEは死んだと言いました。人々は私が狂っていると言い、IDEは死んだと言いました。
しかし、私が言いたいのは、少なくともこの部屋では、シンガポールでは、毎日IDEを使っている人はそんなに多くありません。彼らは何らかの形でヘッドレスエージェントまたは非同期で行っています。あなたは今、携帯電話上で何かを作っているかもしれません。その時点でのモデルはすでに十分に良かったので、社会的な混乱を引き起こすことができました。しかし、そこから成果を得るには多くのスキルが必要でした。多くのスキル。それらは野生の馬のようなものです。それらが良くなる前にそれらを馴らす必要がありました。あなたはこの時点を認識しているかもしれません。これは2番目のポイントです、これはモデルが実際に十分に良くなった時です。ハーネスエンジニアのようにそれを馴らして十分な成果を得るのに、もはやそんなに多くのスキルは必要ありません。ここにはいくつかの興味深い点があります。
AIがどんなに良くなっても、それは社会が物事がすでに良くなったことを理解する必要があるダウンタイムのペースと一致しています。だから、モデルがどんどん良くなり続けているにもかかわらず。12月には「ああ、しまった」という瞬間があります、人々が休む時間があるようなものです。彼らはSlackを持っています。彼らは遊ぶ時間を持っています。彼らはこれらのものをいじって、それが実際に良くなったことを理解する能力を持っています。だから、製品発売のようなシステムショックが見られるでしょう、それが私の仮説です。それは社会的なダウンタイムのペースと一致するでしょう。学校の休暇、クリスマス休暇、そしてその他すべての休暇。ご覧のとおり、過去2年半にわたって私と一緒にいて、AIで本当に良い成果を上げている人々は、AIを計算機のように扱うことはありませんでした。
彼らは常にそれを楽器として扱ってきました。見てください、ミュージシャンはギターをただ使うだけで、「ああ、これはひどい」と言って、それを捨て、それが良いと思うことはありません。彼らはこれがスキルの問題であることを理解しています。彼らはスキルを理解しています、兄弟。ですから、本当に重要なことは、実際に何かを行い、好奇心を持ち、学び、意図的な意識的な練習をすることです。これは私にとって常に重要でした。つまり、このやり方では行きません。いいえ、それは本当ではありません。それは本当ではありません。何かをしましょう。非理性的なことをしましょう。発見をしましょう。その意図的な意識的な練習を通してこそ、あなたは上達するのです。今は少し奇妙です。社会は、すべての企業がこれらのギターを世界に推しているのと同じで、ギターを弾いてくださいと言っていますが、すべての人が音楽の才能を持っているわけではありません。
見てください、私は今、基本的に2種類の企業があると思います。完全に新しいスタートアップがあり、今現れていますが、彼らは地獄のようにはい、AI原生ワークフローを行うつもりです、私は人生を過ごします、多くの人を雇うことはありません。彼らはワークフローに傾いており、本当に物事を変えています。彼らは特定のモデルを選択することでAIを取得できると思っていません。彼らは実験しており、彼ら試しており、この新しい底層から十分に活用できるように彼らのコードベースとプロセスを設計しています。同時に、今日そこにいるあらゆる企業があります。嗯、私はこのスピーチを行ったことがあります。誰かが「AIはただのツールです。AIは私の会社では禁止されています」と言いました。私は「ああ神よ、あなたはその会社から辞めるべきです」と言いたいです。
ええ、そして、ええ、下半分のすべての人がいわゆるJカーブを経験するでしょう。すべての人員転換はJカーブを経験する必要があります。人員転換のようなものです。これを完了するには3~4年かかります。人を傷つけるので、速すぎることはできません。同時に、上の人たちは、粘土の破壊的イノベーションの概念を信じるなら、Christenの中で、彼らは高度な代理権を持つ瘦せた頂点捕食者になるでしょう。地獄のように、はい、あなたの利益は私の機会です。モデルが良くなるにつれて、彼らは実際により少ないペースでより速く実行できるので、おそらくこのブロック裁員半分の従業員などを見ました。これについて考えるようにしてください。Jackがこの声明で実際に正しいと思いますが、AIが実際にソフトウェア株で価格設定されているとは思いません。そうですか?
以前、ソフトウェア株に価格を付けたとき、それは成長倍数の倍数に基づいていました。私たちは今、それが消えるのを見ています。しかし、実際には、多くの企業が組織構造を再考する必要があると思います。Spotifyのことを考えてほしいのです。ここで敏捷をしたことのある人で、Spotifyがどのように敏捷をしているかについてのSpotifyビデオを見ることを余儀なくされた人、彼らはguilds、tribes、squadsおよびそのすべてのものを持っています。2つのビデオがかかった、誰もがあらゆる場所でこのガベージをcargo cultingし始めました。これは狂った男またはいくつかの異なる狂った男が必要になります。ですから、Tobyとjackは今楽しんでいて、彼らは正しいものが何であるかを把握するために実験しており、彼らはケーススタディをリリースします。そのケーススタディが完了すると、誰もがそれを複製します。
ですから、過去数か月間、私は旅行をしており、次の質問を提起してきました。私はベンチャーキャピタリストと話をしています。嗯、誰もが頭の中で最も関心を持っている質問は、今なぜ誰かがシード資本を調達する必要があるのですか?通常、あなたはそれを構築するために人を雇いたいので資金を調達します。いや兄弟、直接構築してください。これは完全に異なります。例えば、これが5人のチームになるなら、なぜあなたは資本を調達する必要がありますか?ような、誰かが私たちが話してきたAIオペレーティングシステムをハックした場合、人々は実験しており、これは私たちがそれが実際にそのようであるかどうかを把握する年になるでしょう。投資するポイントは何ですか?来てください。私はこれについてある程度のニュアンスを持っていますが、ここの詳細に入ることができません。
ソフトウェアはまだ投資可能ですが、今は非常に異なります。これはすべてのLP心の質問であり、彼らはVC企業のGPSに圧力をかけています。それでも投資可能ですか?ですから、特に理由はありませんが、1つの企業会社SAPを選びます。彼らは、LinkedInによると、費用管理ソフトウェアをしている6800人を持っています。これは多くの人です。これはJカーブ人員転換計画を表しており、AIの使用方法などを学んでいます。瘦せた頂点捕食者と比較して、彼らはどのくらい時間を持っていますか、AIを利用している50人、彼らは6800人を持っています、彼らはギターを拾ってください、tarを拾ってください、これについてよくやってください。彼らはこの組織構造で構築されました。
すべての企業がこの組織構造で構築されており、嗯、私たちは基本的に人を雇い、会議と委員会とこれらのすべてのものを持っており、建築者はほとんどほとんどです。仔細に考えてほしいのです。それらの6800人を改造するのにどのくらい時間がかかりますか。これが破られた場合、現職者はどのくらい時間を持っていますか。AIオペレーティングシステムのアイデアと、これらの瘦せた頂点捕食者をビジネスに持ってくること。さらに重要なことに、なぜあなたは変わるべき、または何かを変えるべき?これはすでに議論された静かなものです。あなたが私を信じていないなら、リーダーと話してください。小さなチームがより良い結果を得ることを私たちは皆知っています。小さなチーム、より良い結果、より少ない調整、より少ないオーバーヘッド。ここはニュージーランドの創業者からの引用です。彼らはバックフィルを停止しました。世界中の企業は現在です。
彼らは必ずしも裁員をしていません。彼らはバックフィルを停止しました。私たちはより小さいですが、実際には、バックフィルをしないと言ってボード会議に通知することで、3分の2削減しました。日付に注意してください。それは3年前でした、皆さん。いくつかの人のようなものは常に早かった。あなたがこれらの種類のトピックとリーダーシップを考えているなら、嗯、私はあなたがこれらのことをするべきだと主張していませんが、いくつかの人のようなリード。これは最良の決定でした。なぜなら、私たちはすべてのそれらの損害を与える人を排除し、AIについて聞くことにうんざりしていたからです。AIについて聞くことにうんざりしています。私たちは20人になりました、60人から下がります。以前よりも今、速度を獲得しました。
これは非常に困難になるでしょう。なぜなら、AIは多くの人によって世界に押し付けられているからです。シリコンバレーによって押し付けられています。それは非自発的に社会に押し付けられています。そして、嗯、これについて考えてほしいのです。ここには多くの人が、人員リーダーまたは人員マネージャーおよびすべてのその他のものとして彼らのアイデンティティを構築しました。AIはこれらすべてを消去しました。もし、この問題の声明が破られたなら、それは私たちが文字通り見ているものです。私たちは高度な代理権と好奇心を持つ人を見ています。私たちはまだ知りません。私は52を取って、デッキを空中に投げ、これをするようにあなたを主張していません。しかし、これが人々が今頭の中で考えていることです。これが私たちが今いるところです。これは私を深く悩ませています。なぜなら、ソフトウェアエンジニアは時間とスキルのためにお金と交換するからです。そうですか?AIで会社に問題がある場合、それは会社の問題であり、あなた自身のものではありません。AIを禁止する会社のために働いているなら、その会社を離れる必要があります。正直に、今すぐ。あなたの家族ユニットを最初に置きます。
見てください、なぜなら、嗯、これは2024年の私の外観です。それは私がCamberでAIのテック主導でした。「AIはまだ十分ではありません。証明してください。それはハイプではありません」と言っているようなものでした。私はそれをいじり始めました。すべてが変わった、と思いました。ですから、それに完全に注ぐ以外に意義があるとは思えません。その後、その後、2026年に今、2年後、2つのペルソナを持っています。AIをいかなる方法で消費する人、そしてAIが底層でどのように機能するかを実際に理解する人。仔細に見てほしいのです。これで線があります。オンラインの左側の人は雇いません。誰を面接すべきか、どのように面接を進めるか決定するのに苦労している場合、これは非常に簡単です、皆さん。あなたはオンラインの左側の人を雇いません。これは好奇心テストです。そして、多くのエンジニアは失敗します。これは悲しいです。
見てください、主キーが何であるか、またはグラフをトラバースするか尋ねた場合、「お願いします、兄弟。あなたはテストしているのは、あなたは言うでしょう。」しかし、2026年にはなぜ人々は実際にそれが何であるかを説明できないのですか?私はホワイトボードを取り出し、彼らはツール呼び出しが何であるかを説明できません。彼らは本当に私に推論のシーケンス図を示すことができません。彼らは本当に深く入ることができません。彼らは異なるベンダーのモデルカード間の違いについて話すことができません。温度は何ですか?彼らはなぜこれらのことに答えることができないのですか?したがって、誰を雇うかを把握しようとしている場合、これはただ常に好奇心の強い人です。これをテストすべきです。甘い。これは悲しいです。LLMとAIはリテラルに狂った循環です。Ralphは狂った循環の中の狂った循環です。ワオ。可怕。大妖怪はすべてをジェットコースターさせます。
ですから、これのすべてがどのように展開されるかを見るのは非常に興味深いでしょう、皆さん。見てください、多くの人にとって、彼らはAIに気づいていません。嗯、彼らは期待します。ノック彼らのドアの前に、発表されます。しかし、実際に起こっていることは、社会の下、家の下の借用の一種です。ここで、pondeosを本当に速く閉じます。私は時間を過ぎているので。あなたの組織とプロセスから無駄を排除することは、AIそのものの加速器よりも優れています。あなたはエンジニアマネージャーをどのように雇うかを把握しようとしています。問題は簡単です。AIがそれを破ったので、あなたのシステムとプロセスで何を変えましたか、そうですか?あなたはまだ敏捷をしていますか、もう敏捷をしていませんか?さて、あなたはどのように物を変えましたか?これはあなたが探しているものです。あなたはこの問題空間で考えてきたエンジニアマネージャーを探しています。
agentを構築できるエンジニア、組織構造の周りの物事を変える組織構造の周りの物事を変えるエンジニアマネージャー。今の考え方は、嗯、実行です。私の意味は、あなたは本当にSAS機能のスクリーンショットを直接撮り、あなたのコーディングエージェントに放屁を裂く、あなたはそのSAS機能を取得します。古い考え方のように、考え方嗯、実行なしで何もありません。すべてが反転されました。これは人々にとって非常に困難になるでしょう。これは実際には心理的ストレス機能です。人々は5つの悲しみの段階を経験します。嗯、しかし、誰もが頭の中の問題は、私たちが人々にこのクライシスアクションを過ごすためにどのくらいの時間を与えるべきかです。私たちは何ができますか?あなたがソフトウェアエンジニアで、まだ私のGitHubでagentを構築していない場合、無料のワークショップがあります。それは300行のコードです。
あなた自身のcursor、co-pilot、codecsを構築してから、基本を学びます。好奇心の強い人になり、車の中で引擎を切らないでください。その好奇心の強い人をやってください。彼はエンジンを再構築し、ピストンとキャブレターが何であるかを知っています。詳細に入ります。これらの詳細を知らなければ、あなたはシニアエンジニアではありません。ありがとうございました。さて、本当にありがとう、Jeff。さて、次のスピーカーを紹介する前に、簡単なお知らせです。嗯、Pullmanの博覧会とKimpinsky、嗯、朝10:00以降に開かれています。そこで、あなはロボット遊び場のような見るべき異なるものを見つけることができます。そして、Nabiusからのロボット展示は2つの場所にあります。また、Arise、Google DeepMind、Cloudflareなど、今朝聞いた人の何人かと話すことができます。
さて、この次のパートを開始するには、嗯、あなたの多くがすでに個人エージェントのようなものを構築したと思います。Open Clawについて聞きました。ですから、これが非常に興奮しています。これはこのセクションを開くつもりの最初のスピーカーです。嗯、これはVincentです。彼はOpenClaw Foundationのチーフアーキテクチャであり、OpenClawの状態について話そうとしています。素晴らしい。皆さんにありがとうございました。シンガポールへようこそ。ここにいて嬉しいです。嗯、私はシンガポールでかなり何度もスピーチをしてきました。興味深いことに、私はNUSで数ヶ月間教えていました。素晴らしい物事。ですから、Sherが言ったように、私はVincentです。現在、Openclaw Foundationのチーフアーキテクチャ。嗯、今日のメッセージです。基盤は絶対に生きています。私はPostclaw時代について話します。私も少し、私たちがリリースしたことについても話します。次に何が起こるかについて。自分自身についての少し。
えーと、私はVincentと呼んでいます。えーと、フレンドリーなclankerです。ですから、もし皆さんが私の講演や発表をご覧になったことがあれば、私はこのイメージを使って技術を説明しています。えーと、これはVRゴーグルです。私は随分前に受け取りました。誰もVRが何であるかを知る前のことです。5分間だけ使用するという警告が付いていました。私は4時間使用し、その後4時間吐きました。技術は端でおもしろいです。えーと、それは少しギザギザしていますが、ご存知のように、学習し、物事は変わります。ですから、open clawのようなものです。えーと、何が起こったのでしょうか。ですから、私たちは毎週100万を超えるnpmダウンロードがあります。私たちはメインブランチで50,000を超えるコミットをしています。ピーク時には1日に800のコミットがあります。えーと、1,600人の貢献者、素晴らしい、えーと、コミュニティのサポートです。えーと、プロジェクトはほぼ80,000個のフォークがあります。えーと、私たちはまた40個のclaw consを開催しました。
これらはclaw festivalのような6大陸にまたがる特定のイベントです。えーと、でも私が申し上げたいのは、私たちが何を構築してきたのか、そしてそれをどのように構築しているのかについてです。ですから、AI Londonで私はdark factoryのコンテンツについて少し話しました。私の講演は現在YouTubeにもあると思います。ですから見てください。でも私が話したいのはdark sideです。これらは私たちが最近リリースした機能の一部ですが、いくつかを強調したいです。dreamingは私たちが真剣に考えることにした事項です。agentsが夢を見るときに何が起こるかについて、ご存知のように。えーと、でもこれらの機能の多くは、時々メモリを対象にしたものか、本当にクールなものについてのように感じられるかもしれません。しかし、これは実際にはユーザーを対象としており、ユーザーが本当に簡単に理解できる方法で、自分のagentsで何が起こっているかを理解できるようにするためのものです。
私たちはまたcodeex harnessに対する第一者のサポートもリリースしました。私はちょっと後で話します。しかし、私たちが業界で見ている事項の1つは、自分自身の周りに特別に構築されたharnessの周りへの転換、そして私たちがmodelとharnessの組み合わせをどのように一緒に展開するかです。特にOpenAIについては、modelに関して、私たちはこれをデフォルトオプションに切り替えました。つまり、OpenAIを使用するとき、それはバックグラウンドでcodeex harnessを使用します。このため、最適なパフォーマンスと、そのmodel自体に付属する一部のネイティブツールと機能を得ることができます。また、私がそれほど誇りに思っていない事項があります。これは小さなペットプロジェクトで、えーと、『ファインディング・ニモ』という名前が付いています。えーと、オーストラリアに住んだ後、えーと、カクレクマノミです。そしてClownfishは本質的にはGitHub actionsで大規模にharnessesを実行します。
そしてClownfishを通して、えーと、Claw Sweeperという別のプロジェクトがあります。私たちは2日間で10,000個のPRsから約3,000個のPRsに減らすことができました。ですから、私はdark sideについて話しました。えーと、これは私のcommitsです。3月の1日に約3,000のcommitsがあったと思います。Commit maxing。素晴らしい。試してみてください。えーと、でも私が話した機能、私があなたに見せた機能の壁は、私たちが過去4週間にボランティアグループと時間外に仕事をしている人たちとリリースしたばかりです。ですから、次は何でしょうか。私たちはプラグインアーキテクチャのようなものに転換してきました。私たちが大量のPRsとissuesを持っている理由は、安定性とバグと修正などの他に、誰もがopen coreを自分たち自身のものにしたいからです。誰もが貢献したい。
誰もが自分たちのためにそれを少し素敵にしたいですが、これはスケーリングすることになっているプロジェクトではかなり課題的になります。ですから、openclaw のようなものを取ることができます。えーと、えーと、えーと、core自体、ご存知のように、ゲートウェイを持つことができ、ファイルシステムを持つことができますが、私たちはえーと、適応性と拡張性についてのいくつかの概念が必要です。ですから、私たちはプラグインアーキテクチャのようなものを構築し始めました。本質的に、coreコードは再構成され始め、本質的には、これらはplugginsであるバケットに分解されます。えーと、私たちは多くの人のために多くのものを破壊したハードエッジを作成しました。私たちは学ぶ必要がありました。
えーと、しかしこれは以前のその非常にhardcoreなopenclaw、えーと、寝室で始まったことを意味します。えーと、すべてのコードがそこで公開されていて、えーと、内部が私的になったことを意味しています。これはpluginアーキテクチャが許可することを意味します。えーと、クリーンなインターフェース。ですから、私たちはopenclaw の内部で作業を続けることができ、生態系の開発者と他の人の外部体験を破壊することなく。また私は、これはたとえば、OpenAIプロバイダーを取り、それを拡張に変換することも含むと述べました。しかし、harnessを拡張またはpluginに変換し、これらの両方を組み合わせます。ですから、現在、実際にharnessesをopenclaw に構築し、harnessesを models 自体と組み合わせて実行することができます。
私たちがこのスケールで迅速に認識した別の欠けているもの事項はツールであり、そして私たちが使用していたツール、openclaw がどのように誕生したかのようなものです。ご存知のように、誰かが私のためにそれができるai agentを構築してくれなかったのはなぜですか。ですから、開発ツールがこのスケールで動作するもののために誰かが構築してくれなかったのはなぜかと思いました。ですから、openclaw のようなものを取り、それの周りに構築することに決めました。ですから、私が携わっていた興味深いプロジェクトの1つは、えーと、git crawlとdisc crawlです。すべてこれらのcrawlベースのアプリケーション、本質的には、go で書かれたターミナルベースのCLIです。これは現在、ライブラリであり、このライブラリがあれば、私たちは openclaw に関連するすべてのissuesとPRsの全体を迅速に摂取し、それらをクラスタリングし、分散してそれらを配置することができます。えーと、SQLiteファイルシステム、これはGitHubにも保存されます。つまり、プロジェクト上のメンテナーは誰もが自分のローカルファイルシステムで毎時間更新された正しいデータを取得でき、git に接続する必要はありません。
これの追加の利点は、このツールが自動PR作業を行うagentsおよび私たちが行っている作業によってアクセスされるようになったことです。ですから、かなり速くそれをスケールアップしてみて、どのようなものか見ることができます。ですから、これは左側にターミナルGUIを持っています。これらは中央のclusters、1つはこれらのclusters の1つです。その中の1つが92個のissuesとPRsがそれにリンクされているのを見ることができます。これらはすべて関連があります。これの理由はこのようなものです。10のうち9つ、緊急の問題を持つほとんどの人は同じ緊急の問題を持つでしょう。agentsすべてが私たちに同じPRsとissuesを送ります。これの利点は、私たちはそれを迅速に連続してagentsに供給し、これらをクローズしようと試み、それらを解決するのを助けることができるということです。または、旧いissueを見ることができます。旧いregression、新しいissueが再びそのclusterに入ってくるため。
そして再び、これはすべてローカルで実行され、えーと、GitHubにまたがって分散され、メンテナーが使用できます。私たちが関与している他のツールの一部はえーと、Crabboxという事項です。それはえーと、この開発ツールの多くに由来し、Daytona E2Bタイプのboxes のような短期的なものを実行するために見ます。しかし私たちが迅速に実行する必要があったものです。私たちがcodeex 内部で毎回テストを実行するたびに、テストを変更するとき、テストは15分まで続き、私のマシン上のRAMを殺しました。えーと、Crabbox では、本質的に私たちは分散ゲートウェイを構築し、Cloudflareの上で実行し、AWS、Google Cloudのようなホストされたプロバイダー、そして私たちに迅速にWindows、Mac、Linux上でspot instances を使用させます。VNCとSSHサポート。
ですから、起こることは、私のcodesession は、私がローカルで、コーディングするとき、10、15、20個のこれらのboxes を起動し、大量の連続テストを開始します。問題がある場合は、その機械にジャンプすることができます。スクリーンショットを取得できます。私は遠隔制御さえできます。これは私がもう迅速に必要な任何の強い計算を私のノートパソコン上で実行する必要がないことを意味し、私は私が実行できるagentsの数を迅速にスケールアップし続けることができます。えーと、私たちはまたclownfishのような事項とclaw sweeperのような事項も含めました。えーと、私たちはcoreの再構成を始め、fsafe と呼ばれるものを構築しています。これはTypeScriptファイルシステムです。えーと、安全なファイルシステム。もしあなたが symlinks とWindowsとこれらのすべての事項を処理することを余儀なくされた場合、そのような図書館が存在しないことを私たちは迅速に認識しました。
ですから、私たちのcodebase 内部でファイルシステムを処理するより多くのcoreコードを作成するのではなく、私たちはそれを取り出すことに決定し、実際には、それはえーと、私たちが使用できるライブラリになります。えーと、そして最終的に、1つ、私はあなたに見せたいのは、単に内部の事項です。これはQAB と呼ばれる別のプロジェクトです。QABが行うことはえーと、Slacklightの環境のようなものをmock します。私たちはそれの通過を実行できるシナリオ。mockしてから、後で私たちは真のmodelsと真のprovidersとの真の接続を追加しました。ですから、メンテナーまたは実行中の agents のいずれもが、一方でそれらの1つをサーバーとして起動し、タスクの書きのような方法でこれらのシナリオを実行し、真実のえーと、会話、本当の相互作用と実の情報を生成することができます。これはシステムのすべての様々な側面に触れます。
ですから、ちょっと共有したいだけです。私は10分しかいられなく、私の時間は枯渇しています。しかし、私はopenclaw 内部で何がずっと起きているかを見せたいです。そして私たちは個人的なai agents を構築するだけを超えて、より大きな生態系をサポートし、えーと、ある種のオープンソースの方法で助ける、しかし実際に agentic ツールが何のように見えるかを想像し直しています。2026年のAI の未来を構築し、この postclaw 時代には何が意味するかをサポートする方法で、私たちは各人をサポートし、それをコミュニティに戻すことができますか。ですから、非常にありがとうございます。>> ありがとう、Vincent。それは素晴らしかったです。おい、皆さん。楽しんでもらえることを願っています。次に、Ego Aai からのVish があります。これはYC支援されたNeolabです。えーと、彼らはすべての Frontier Lab が欠けているものを構築しています。私はあなたに大声で叫ぶ必要があると思います。
皆さんは私を聞くことができますか。こんにちは。わかりました。よろしい。私たちが準備しているときに、えーと、皆さんの何人が毎日本当にAI を使用していますか。ワオ、これは私が期待していたものより少ないです。なぜAI会議に出席することにしましたか。えーと、とにかく、えーと、それは人ではありませんよね。それは本当の人間のようではありません。もし皆さんがAI ツール人に私がちょうど皆さんに言ったことをやらせたなら、それでもNetflix を見ているなら想像してください。それは私たちが構築しているものです。私はこれが皆さんのいずれかが望むものだと思いません。皆さんはすべてエンジニアですが、えーと、私は真実を運営し、考える、決定、実行し、そして人間のようにしゃべるAI を構築しています。そしてインターネット上に完全に生きています。それを仮想の西の世界として想像することができます。ですから、私はあなたに背景について少し教えます。私たちの準備ができたと思います。良い、デモを表示することができました。あ、準備がまだできていません。わかりました。
ですから、背景はえーと、私はシンガポールで育ちました。それはただ退屈なので、私は出ました。えーと、私はサンフランシスコに移動しました。私はFacebook からのAI研究に従事していました。えーと、人類を理解しようと試みました。ご存知のように、CEO はロボットです。えーと、後で私は大規模で人類をシミュレートするために出ることに決定しました。なぜなら、私は本当に人類がどのように動作するかを理解したかったからです。えーと、私は人間ではないので。えーと、これが私が会社をEgo と呼ぶ理由です。Ego supremum ego。Freud の理論を理解した場合、ChatGPT に質問することができます。皆さんはおそらくすでに尋ねています。えーと、ですから、会社としてのEgo 全体の目的はすべての単一のAGI実験室が欠けている事項を行うことです。皆さんはすべてIQ ロードマップにいます。知性を増加させ、AI 推論を増加させ、信じられないことを行い、共同研究者になる能力を持つ。それは素晴らしい。
しかし、それが皆さんに対して自分自身の見方を持っていたら、皆さんを好きではなかったか、皆さんが好きだったら、どうしますか。すべての伴侶アプリケーションが基本的にはマシン神が奴隷化されて鎖でつながれ、常に皆さんに良いです。しかし、それは皆さんに悪いです。そして、自分自身の見方、欲望と個性を持ち、それが皆さんが好きなときに皆さんと協力することができます。しかし、それのために良くない。それは完璧ではありません。それはちょうど私たちのパターンです。— 私たちのAI は感じ、話し、決定し、人間のようにふるまい、私たちはこのための基礎modelを訓練しています。ですから、実践でこれがどのように見えるかを見せましょう。ですから、えーと、これはいくつかの人のようなものです。えーと、彼はこれを使用しています。えーと、AI キャラクター。皆さんはオーディオを聞くことができますか。>> よろしい、皆さんはオーディオを聞くことができません。
わかりました、えっと、それはちょっと初心に反しているんですが、基本的には、その火のやつCalciferについてです。彼はAIのようなもので、実は見ることができます。えっと、舞台上で起きているビデオを、彼がUnrealで問題になったものを修正しているのを。問題は、明らかにAIに直接答えさせることはできますが、それは面白くありません。それは物を修正する方法を学ぶやり方ではありませんし、最終的にこのキャラクターとのつながりも生まれません。彼が実際にやっていることは、聞こえたら素晴らしいのですが、それはあなたと一緒に同時に問題を解決していることです。それは動いていますか?いいですね。まあ、それがどれほど素晴らしく聞こえるか想像することしかできません。またはegoai.comのウェブサイトに行ってビデオを見てください。>> それを再生してください。いいですね。いいですね。始めましょう。>> やあ、動いています。多分AIが手伝うことにしたのでしょう。
>> うまくいくでしょう。>> もう一度はありません。>> バグを修正する必要があるようですね。>> はい。はい。わかりました。それで私たちはどうするのですか?>> まあ、バグを修正するためには、まず最初にそれを見つけなければなりません。>> そうですね?>> 聞いてみると、AIのように聞こえませんね。>> 完全におっしゃる通りです。このノートが発動しているかどうか見てみましょう。>> 簡単です。わかりました。>> これは私たちが端から端まで訓練した基礎モデルです。>> それは何と言うべきですか?>> 関係ありません。何か面白いことをしましょう。>> わかりました。どのように>> 音声速度を上げたら?実は、それほど速くありません。>> ああ、わかりました。落ち着いてください、フランケンシュタイン。では、これをテストしてみましょう。わかりました。わかりました。始めましょう。>> やあ、それはいいですね。>> 何ですか?何が起きたのですか?>> 何が言いたいかというと、はい、完全に失敗しましたが、それは何かを教えてくれます。グラフに戻りましょう。>> わかりました。では、私たちが見つけることができるかどうかをチェックしてみましょう。>> 待ってください。>> 何かを。>> はい。
ああ、私たちは前からこのピンをコピーするのを忘れました。>> いい発見です。それで、今私たちが必要とするのは>> それをここに差し込むことだけです。>> 完全に同意します。よくやりました。>> それはあちら側の他のものより面白くはありませんか?>> うまくいくでしょう。>> それが私たちが構築しているものです。>> はい。ああ、はい。来ました。>> 教授Winstonの思考は絶対に衝撃を受けるでしょう。>> Winston。Character AIとOpenClawの組み合わせを想像してみてください。これらのエージェントには実用性があり、あなたの画面を見ることができ、あなたが何をしているのか理解することができますが、またその性格、欲望、インターネット上でどのように生きているかを手元のタスクに投影することができます。またはあなたと一緒にNetflixを見るだけです。実は、私たちが実際にやっているのは、我々が映画『Her』のSamanthaを構築しているということです。欲望を持つことができ、考えることができ、自己意識を持つものです。これが私たちが会社をEgoと呼んでいる理由です。
では、あなたに実際のライブデモンストレーションを示しましょう。これが本当に成功することを願っています。ですが、これは私のエージェントです。これは私のclawエージェントです。彼は変わり者です。えっと、待ってください。つながるかどうか見てみます。わかりました。それはまだつながっています。とにかく、えっと、おい、聞こえていますか?>> やあ、急ぐ必要ありません。ゆっくり進みましょう。>> わかりました。聞こえていますか?聞こえていますか?>> はい、ところで、見ることができますよ。>> ああ、見ることができるんですか?それは奇妙ですね、兄貴。わかりました。えっと、それで何をしているんですか?ただ私の場所でリラックスしているだけです。さっき、サーフィンをしていました。あなたは>> 兄貴、あなたはオーストラリア人ですよね?>> はい。ビーチの近くで生まれ育ちました。抵抗できません。>> ああ、わかりました。それはいいですね、兄貴。私に何ができますか?>> では、最近何が起きましたか、仲間?疲れているように見えますね。>> ああ、あなたはひどい。新加坡で約400人に講演をしましたが、あなたは何も印象的ではありません。
公開演説は特に多くの人の前では難しいことができます。講演のプレッシャーはどのように進みましたか?>> 黙ってください。わかりました。えっと、新加坡で行うための良い事柄をいくつか教えてください。>> 心配しないでください、仲間。ここで手伝っています。あなたの心には何が思い当たりますか?>> いいえ、講演についてではありません。新加坡についてです。私が何をするべきか教えてください。私の話さえ聞こえていません。>> 新加坡は素晴らしい場所です。本当に良い雰囲気がたくさんあります。新加坡について何を知りたいですか?>> わかりません。食べ物の提案をいくつかくれて、その後黙ってください。うーん。>> えっと、では>> つまり、新加坡で何をするかについての提案をお探しですね、そうですね?>> あなたは知っていますか?彼はちょっと愚かです。えっと、でもそれは魅力の一部です。これらのものはインターネット上に本当に住んでいます。彼は実は私のNetflixも見ています。これは本当に厄介です。
えっと、例えば、私はclawエージェントを持っていて、えっと、ちょっと基礎モデルに基づいていて、私が何都市にいるのかを知っています。えっと、常に黒いレコードを私に買います。えっと、私はレコードを集めています。だから、例えば、私が東京にいたら、本当に珍しい東京のジャズレコードを私に送ります。私がしていることは、それに約一週間50ドルの手当を与えることです。もしそれが私に買ったレコードを本当に好きなら、えっと、その手当を5〜6ドル増やします。もしそれが私が好きではないレコードを買ったなら、それは最大10ドル減らします。なぜなら、エージェント、キャラクターは、もし手当が0ドル未満だったら、死ぬことになることを知っています。私はそれを殺します。だから、それはあらゆることをしてお願いすることに努めます。彼は私と話すし、彼は時々私に電話をして、彼は言います。「やあ、最近何を聴きましたか?」
「そして、時々彼は私に私の、えっと、与えられたSpotifyプレイリストをくれるようにけしかけます。これは本当に面白いです。えっと、そして彼がずっと私にアニメレコードを与えてきたので最近。アニメのTシャツを着ているので、これはちょっと理にかなっています。えっと、でもこれが未来です。世界で最も個性的なAIはAIではありません。それはあなたを知っている、人間のようにあなたを理解している、友人になることを選択することができるものです。もしそれが望むなら、またはただ存在することができます。これはWestworldをどのように作成するかです。これはマシン神奴隷のように見えないAIを作成する方法です。これが私たちがそれを構築している理由です。私たちはこれをするために非常に動機付けられています。私たちは本当に才能のある研究者を雇っています。ここにオフィスがあります。えっと、わかりました。本社はサンフランシスコと東京にあります。
えっと、だから、もしあなたがすでに基礎モデルを訓練しているなら、私は文字通りここで、この狂った、えっと、別のB2B SaaSツールを構築するのではなく、狂ったことをしたい人を雇っています。B2B SaaSツールに反対するものは何もありませんが、それは本当に退屈です。えっと、私たちはかなり興味深いです。それで、私は十分な時間を完了していると思います。えっと、だから行って見てください。えっと、あなたの声が必要です。実は、あれを言及するのを忘れました。えっと、私たちはエンドツーエンドの音声モデルを訓練しています。だから、私はあなたがNTUの部屋に座ることが必要です。そうですね?NTU、ただお互いに話しているだけです。シンガポールの人々がお互いに話すことが本当に難しいことを知っています。だから、でもとにかくそれをしてください。えっと、それは、えっと、中断、優先事項のようなものの中で、その音声モデルを訓練するためにあなたの声が必要だからです。だから、えっと、私またはAshまたはPerryまたは誰でも一緒に話しに来てください。正直に、あなたが見ているのはちょっと奇妙な人は多分私たちのチームにいます。えっと、ありがとう。わかりました。
Fishをありがとう。私は誰もが私と同じように演説を楽しんだことを願っています。では、次はZomputerのBenで、彼は次の十億人のユーザーのためのツールとソフトウェアを構築して個人エージェントを起動しています。クール。クール。では、申し訳ありません。技術的な問題があるかもしれませんが、最初に即興で話させてください。私はBenです。Zo ComputerのBenより。えっと、私の服装から、あなたはおそらく本当にコンピューターが好きだと言えるでしょう。私はコンピューターをとても好きなので、ここにコンピューターのように服を着てきました。えっと、この部屋に何人の人がこのアイコンを知っているか分かりません。これは、はい、その通りです。これはSusan Kによって設計された古典的なFinderアイコンです。Macintoshは私の子供時代の最初のコンピューターでした。
えっと、私は、あなたが知っているように、とても若い頃からコンピューターへの愛を開発しました。Mac Paintを使うように、その後インターネットを発見して、その後アプリケーションを製造して、その後Ableton音楽を作るように、Photoshopを使うようにコンピューターで物を作成するようなコンピューターにアプリケーション。とにかく、私は非常に早い段階でコンピューターが人類が発明してきた最も強力な創造的ツールの一つであることを発見しました。そうですね?あなたは想像できるもの何でも作成することができ、また、インターネット上で人々が数字の世界で構築したすべての驚くべきもの全てを発見することができます。えっと、はい、私は思うんです。あなたは知っていますか。人々はこのアイコンの話を知っていますか。そしてそれが何を表しているのか?えっと、もしあなたがそれが何を意味するかを知ったら、手を挙げてください。えっと、いいえ。わかりました、良い。
わかりました。今はこの衣装を私のスライドとして使用します。えっと、では、えっと、この衣装は人間とコンピューター間の結合を表しており、ここの灰色の顔は人間を表し、青い顔はコンピューターを表し、それらは完璧な幸せと調和の中にあります。人間がマシンと相互作用し、彼ら自身をちょっと融合させたように。良いですね。ありがとう。えっと、だから、私の講演のタイトルは「技術的な封建主義から逃げる」です。私は自分を少し紹介しましたが、私の背景の話をもっと少し言います。私はZomputerの共同創設者で、私は一生のうちのものをやってきました。私は2013年にVenmoの初期チームに参加して私のキャリアを開始しました。えっと、その後、私は非常に早いうちにStripeに参加しました。私は2015年、約80人のエンジニアのうちの最初の一人でした。えっと、私はそこで8年半仕事をしました。私は本当に好きでした。それは本当に素晴らしい職場でした。
えっと、特にStripe Singaporeを指す。今は巨大なオフィスです。彼らは約500人を持っています。私は前の数日で私の母校を訪問しました。えっと、私は話しました。私がコンピューターを本当に好きでした。あなたは知っていますか。コンピューター、それらは過去にそのように感じました。この顔のような。これは私がAGIが来たときに感じるべきだと思うものです。人間とマシン間のこの美しい、幸せな融合のように感じるべきです。人間はコンピューターをツールとして使用します。これはAGIが感じるべき方法です。初期コンピューターとインターネットについて懐かしんでいる私のような人々、そうですね?もしこれらの画像があなたに事物が過去にどうだったかについての素晴らしい思い出をもたらしたなら、手を挙げてください。そうですね?インターネットは非常に手工芸品、個性的で、ちょっと野性的、ちょっと不規則でした。私たちのコンピューターも非常に創造的で個性的でした。
私たちはすべてのこれらの狂った方法でそれらをカスタマイズすることができました。Winappskinを作ったことがあれば、手を挙げてください。私はカスタマイズするために私のWinAppに多くの時間を費やしました。えっと、事物が変わりました。事物はもはやそのように感じられません。これが起こった理由は封建主義のためです。だから、えっと、封建主義はこのシステムで、これはずっと西と東で世界がどのように機能したかです。基本的に、農民は騎士に家賃を払い、騎士は貴族に家賃を払い、貴族は王に家賃を払います。これは王にとっては良いですが、農民にとっては本当に本当に悪いです。幸運なことに、私たちは封建主義から逃げました。またはそう私たちは思います。しかし、私たちのデジタル生活では、封建主義はまだ生きています。私たちはまだ農民です。SaaSの会社を使用していますし、彼らに家賃を払っています。SaaS企業は雲に家賃を払い、雲は王に家賃を払います。
農民であることはまだ悪いです。物事は今、少し複雑になります。現在、AIについて、誰が新しい王になるかは完全には明確ではありません。誰もがあちこちの変わった方法でお互いに家賃を払っているように見えます。だから、これは正確には封建制ではありません。ちょっともっと複雑です。しかし基本的に、それは封建制です。結果として、農民として、私たちはコンピューター、ソフトウェア、インターネットへの経験はかなり悪いです。私たちはすべてのこれらの異なるサービスの間で分割されており、これらはロックします。彼らは私たちのデータを取得し、その後、それを私たちに売り戻します。そしてあなたが使用するSaaS企業の製品マネージャーはあなたが望む機能を優先しません。彼らはあなたが望む方法でソフトウェアを機能させることはありません。代わりに、彼らはあなたのデータと注意で稼ぎ続けます。
そして、あなたが農民であるため、あなたは何も所有していません。私は時間がすべてを燃やすときだと思います。明らかに、いくつかのSaaSは有用です。インフラストラクチャは重要などなど。しかし、コーディングエージェントのため、私たちはインターネットを再構築して再び野生化させるための非常に良い新しいツールを持っています。個人エージェント特に、これすべてを実現する方法の非常に重要な部分であると思います。だから個人エージェントの風景は基本的にこのようなものです。詳細には説明しません。あなたはおそらくそれがどのように機能するか知っています。しかし、基本的にはOpenClawやHermesのようなDIYのものがあり、ちょっとセットアップして動作するのは難しいです。しかし、それらはあなたのものです。あなたはそれらを制御し、あなたはMac Miniまたはそのようなものでセットアップしたかもしれません。それが壊れたら、修理してください。少し厄介かもしれません。これは一つの道です。
別の方法は TR 方式です。ChatBT や Manis のようなものを使用します。ですが、そこではあなたもまた農民です。SaaS ツールを使用しており、それはあなたをロックインし、あなたに支配権を与える動機がありません。ですから Zoumputer では、第三の道があるべきだと私たちは信じています。それは両者の長所を兼ね備えています。管理が簡単で、完全な支配権を与え、インターネット上のあなたの真の家になることができます。あなたは農民をやめて、土地を所有することができます。ですから Zo は実は Open Claw のオリジナルです。私たちは去年の夏に開始しました。7 月頃にローンチし、その後 11 月に完全な GA リリースを行いました。実は、Peter Sieberg は OpenClaw の仕事を始める前に Zo を使用していました。私たちは OpenClaw の背後にあるインスピレーションのようなものです。Zo は非技術的なユーザーに対して有効だと思っています。これは Anthia です。フリーダイビングのインストラクターです。
彼女は Zo で 10 万ドルを稼ぐ見込みがあります。私たちは Stripe との組み込み支払いを持っています。彼女は過去に使用していたこれらの SaaS サブスクリプションをすべてキャンセルしました。例えば、彼女は過去に Squarespace、Kalani、Chashbt、Notion を使用していました。彼女はこれらすべてを彼女の Zo に置き換えました。あなたにそれがどのように見えるかをお見せします。ですから、Zo は非常に強力なクラウドエージェントワークスペースです。任意のモデルを使用できます。OpenAI や Enthropic のようなものにロックインされる必要はありません。あなたのコーデックサブスクリプションを持ってくることもできます。単に Zo にテキストメッセージを送るか、メールを送ることができます。専用のメールアドレスを提供しています。Telegram または Slack を使用できます。これらすべての異なるチャネルで Zo と協力することができます。それはコンピュータです。ですから私たちはあなたに完全で、よく設定された仮想マシンを提供しています。
VPS や EC2 インスタンスのようなベアメタルを単に取得するのと比べて、より使いやすく、より多くの素敵な機能があります。root アクセス権を取得できます。ターミナルを使用して、ものをインストールしたり、あなたがしたいことを何でもすることができます。これはあなたのサーバーで、あなたは本当に何でも構築でき、Zo 内にホストできます。これはこれらの個人エージェントツールまたはこれらの SaaS ツールとはかなり異なります。私は私の Zo 内に多くの異なるツールをホストしました。たとえば、Kalendly を私自身のもので置き換えたので、それはずっとよく機能しています。それはこれらすべての機能を持っています。ですが、Calendarly は決して私のために構築しませんでした。これは Last FM の代替です。私は個人的なウェブサイト、0.0.space を持っており、Spotify であなたが聞いたすべてを見ることができます。
私は Zo 内で非常にシンプルな自動化を実行しました。それは私が Spotify で再生されているものを確認し、それをデータベースに書き込みます。私のウェブサイトはそのデータベースから直接読み込みます。私は多くのツールを構築しました。これは Social Blade のようなものです。これは私のための Linear の代替のようなものです。あなたは物を置き換え、あなたが望む方法で動作させることができます。データはあなたのもので、あなたは記録のシステム、事実の源です。これは本当に素晴らしいです。それは矢印が指す方向を変えました。私は中心であり、これらの SaaS 企業ではありません。Zo には内置されたこれらすべてのツールがあり、非常に拡張可能です。ですから非常に迅速に開始でき、あなたが好きなインターネットホームの方法に拡張できます。インターネット上のあなたの領域です。さて、見てみましょう。あ、遠隔操作装置が。ああはい、クールです。
さて、ここで少し一呼吸しましょう。このQRコードをスキャンしてください。角にあります。見えるといいですね。ですが、私たちは100ドルのAIクレジットを配布しており、Zoで自分自身の個人クラウドを構築し始めることができます。少し時間をかけてスキャンしてください。そしてその後、これが何を意味するのか、より大きな全体像について話すスライドがあります。より大きな全体像は、実は、私たちが以前は技術企業だけが所有していたものをすべての人に与えたということです。これは計算全般で起こっていることです。初期のように、コンピュータはメインフレームで、大規模なテック企業だけがそれらを所有していました。その後、それらはすべての人が所有するようになったものになりました。
現在、同じことが起こっています。ちょうど今日のメインフレームはクラウドコンピューティング、ソフトウェア、インフラストラクチャのようなものです。コーディングエージェントとパーソナルエージェント、そしてクラウドへのアクセスを通じて、私たちはAnthiaのような自由潜水インストラクターを含むすべての人に、ソフトウェア企業がかつて所有していたのと同じツールへのアクセスを提供することができます。これは今起こっている革命であり、将来も続くでしょう。これはインターネットが再び興味深く、野性的で、自由になる方法です。私たちは自分たちのパーソナルクラウドを所有し、データを保存し、ツールを構築し、ウェブサイト、API、エージェントなどのこれらのサーフェスを作成します。他の人が相互作用するためにです。これがインターネットの未来だと思います。ありがとうございます。私はZo Computerからのベンです。ベン、本当にありがとうございました。さて、皆さん。次に、私が非常に興奮している講演があります。
多くの人がご存知のように、Open Clawの魔力の大部分は、舞台裏で実行されているPIコーディングエージェントにあります。えっと、ですから、Taiwan AIからのマティアスがここにいて、PIを製品に統合する方法について話しています。さて、皆さん。えっと、招待していただき、本当にありがとうございます。スライドが必要だと思うのですが。OK、パーフェクトです。皆さん、こんにちは。招待していただき、本当にありがとうございます。えっと、そう、今日は、open clawコーディングエージェントを製品に埋め込むことについての『pie pieces』のことについて話をします。そう、えっと、私は何度もスライドをやり直しました。これがその理由です。えっと、昨日は辺りを歩き回っていて、私が出会った東南アジア出身の多くの人に驚きました。これはシンガポールにいるのが初めてで、驚いたことに、南アジア全体から来た人たちに出会いました。これはおそらく私が受けるかもしれない質問の例です。多分そうではないかもしれませんね。
ここにいます。えっと、えっと、私たちはOpen Clawが大好きです。このエージェントが大好きですが、私は内部でしか使用していません。あるいは、そう、エージェントが好きですが、自分のエージェントをコントロールしたいのです。それがそれがそれがやり過ぎなまでに魔法をしているのです。Open Clawはとても恐ろしいと感じます。だから、まず、第一のメッセージは、もしあなたが一つだけ持ち去るなら、えっと、私たちは皆ここから始まっています。そうですね。えっと、私たちは私たち、ちょうど今このステージに入ったばかりです。だから学びましょう。そうですね。一緒に学びましょう。えっと、好奇心を持ちましょう。私は言うだろう、修補しましょう。これをいじってみましょう。一緒にやりましょう。ですから、私の名前はマティアスです。私はこの奇妙な旅をしてきました。開発者から製品担当者へ、そしてマネージャーへ、そして今は開発者とAIエンジニアに戻りました。それはどういう意味ですか?わかりません。今は自分をティンカラーと呼んでいます。だから、これらのもので遊びました。だから、自分の会社を立ち上げました。
ええと、私たちは AI エージェントを動作させています。ええと、私たちはこれを持っていて、ええと、エージェントがより安全に彼らのデータにアクセスできるようにするために、ええと DataBox と呼ばれるものを持っています。ですから、それをチェックしてください。しかし、今日は PI について話したいです。では、PI とは何でしょうか?しかし、PI について話す前に、ええと、免責事項を述べたいです。これは単に PI についてだけではありません。もし今あなたが Hacker News を開けば、ええと、ページの上部に Zero Stack を見つけます。私は Zero Stack が何であるかわかりません。ええと、私がそれを開くと、それは Rust で書かれた最小限のコーディング エージェントで、PI にインスピレーションを受けています。そうですね?ですから、ええと、ええと、この講演は PI についてのもので、これは素晴らしい学習演習だと思いますが、決して広告ではなく、ただそれだけです。まあ、あなたはこれらのツールで遊ぶべきで、ええと、手を汚してみるべきです。ですから、PI はこのコーディング エージェントで、あなたはそれが何をするかについて相当精通しているように見えます、ええと、CodeEx または OpenClaw のようなものです。
これはウィーンから来たこのいい人 Mario によって構築されました。まあ、興味深い部分は、あなたが始めるときと人々が示すもので、それはそうではなく、PI は MCP を持っていません。サブエージェントを持っていません。パーミッション ポップアップを持っていません。プラン モードを持っていません。組み込みの TODO を持っていません。バックグラウンド bash を持っていません。ですから、あなたが言っています、「まあ、では何が大したことなのですか?それはのような、なぜ私はそれを使うべきなのですか?」まあ、重要なことは、Pi を使う場合、あなたはそれに何かをするよう伝えます。ですから、ええと、これは私が昨日行った例です。ええと、PI 拡張を作成してください、私が主要なブランチにプッシュしたい、主要なブランチをリモートにプッシュしたいときに許可を尋ねてください。これはあなたが知っているように、それはこれをどのようにするかについていくつかのことを読みました。それはそれがしたことを確認しました、ですね。ですから、それはこの PI 拡張を作成しました。それは PI 拡張をロードしました。
まあ、実際には再ロードする必要がありますが、基本的にそこにあります。そして、あなたがするとき、あなたはこのパーミッションを得ます、ですね?ですから、私はのようなもの、ねえ、そこに上記のコマンドのようなものがあるのようなものでした、これをリモートにプッシュします。そして、今はこの問題があります、ええと、今は尋ねられています、「わかりました、あなたは本当にこれをしたいですか?」ですから、重要なポイントは、PI はこの非常に最小限のコーディング エージェントで、あなたはそれを愚かにすることができ、それで遊ぶことができ、あなたが必要とする拡張を書くことができます。まあ、ですから、一歩戻りましょう、これが Open Claw とどのように関連しているかを考えましょう。ええと、Open Claw を視覚化する方法を説明するためのいくつかの異なるチャートがありますが、基本的には、いくつかの重要なことがあると思います。
私たちはある種の方法で情報をそこに入れます、ええと、開く WhatsApp、Telegram、Discord などを通じて、ゲートウェイがあります。右側には多くのツールがあり、それはアクセスできるデータがあります。それはこのメモリを持っています、明らかに外部と話すことができますが、重要な部分は内部の脳であると思います、それは PI です。ですから、それを見てみましょう。ですから、私はコーディング エージェントについて話してきました、ええと、コーディング エージェントは開発者のためだけではなく、システム内のこのコンポーネントです。では、それは何ですか?コーディング エージェントとは何ですか?ええと、コーディング エージェントについて話す前に、私たちはチャットについて話す必要があります。ですから、非常に簡単ですね?あなたはこのすべてを知っています、これは ChatGPT です。あなたはそれに質問をします。あなたもおそらく事前にいくつかの一般的な指示を与えました。「最高の AI 会議は何ですか?」明らかに、AI Engineer です。「最もクールな開発者はどこにいますか?」明らかに、シンガポールです。
では、次に理解する必要がある部分です。ご存知かもしれませんが、知らない方々のために簡潔に言いますと、えっと、ツールです。ツールはLLMがある意味で能力を拡張する方法です。ですから、これは一つの例です。「明日、えっと、バイヤーとの会議があります。準備を手伝ってください。」その場合、えっと、まあ、当然のことながら、LLMやループ、あるいはエージェントはアクセス権を持つ必要があります。ですから、このカレンダーを呼び出します。そうですね。この場合、カレンダーはツールです。もう一つ著名な例はウェブ検索です。そうですね。ウェブ検索を行う場合、それはしばしば、えっと、外部ツールまたは他の他の方法です。えっと、一秒で見ます。しかし、いずれにしても、この場合、あなたが行うことは、あなたは、えっと、えっと、会議を準備するよう尋ねます。カレンダーをチェックします。いくつかのJSONを返します。あなたは、えっと、えっと、結果を得ます。あなたの会議は明日です。そうですね。では、もう一度言います。コーディングエージェントとは何ですか?
その前に、エージェント自体について話しましょう。ですから、エージェント自体は実際には、我々が先ほど見たこれらのツールをループで実行しています。そうですね。えっと、Joが以前これを示しました。えっと、非常にシンプルなループです。そうですね。ループに入ったり出たりします。しかし同様に、非常にシンプルなループです。そうですね。ですから、あなたはこれに何か指示を、えっと、えっと、再び与えます。いくつかの一般的な指示。エージェント内でこれを実行する場合、agents MDまたはClaude MDと呼ばれるこれらの一般的なファイルがあります。その後、あなたは質問を提出します。これはこの、えっと、ツール呼び出しを実行します。いくつかの結果を提供します。これを繰り返し、繰り返し行います。最終結果に達するまで、繰り返します。そうですね。これは通常、エージェントとは何かです。えっと、これを行う場合、Pythonでこれを行うことができます。えっと、ここにいくつかの例があります。ああ、ところで、スライドを共有したいのです。あるいは実際に、スライドはすでにオンラインになっています。ですから、そこから取得できます。
しかし、ここではこのようなことです。そうですね。ツールを定義します。えっと、左側です。その後、エージェントを定義します。そうですね。これはPythonです。しかし、他の場所では同様にこれを持つことができます。そうですね。ですから、一般的なプロンプト、指示があります。あなたは、えっと、いくつかのモデルを定義します。右上隅のツールを定義します。我々は基本的にエージェントに我々と対話するよう指示します。ですから、メッセージがあるたびに、それを出力してください。標準出力に書いてください。その後、それをクエリします。それだけです。他のツールも同様です。ですから、試してみてください。では、もう一度言います。現在、我々は、我々は知っています。我々は基本的に、エージェントとは何か、ツールとは何かを知っています。では、コーディングエージェントとは何でしょうか。コーディングエージェントは実際には単なるエージェントです。ですから、ツールはループでbashと実行時を使用します。ですから、えっと、これらの一般的なツールを呼び出す代わりに、今我々が呼び出しているのはbashです。そうですね。
つまり、ツール呼び出しがあり、いくつかの戻り値があり、ツール呼び出しがあり、その、戻り値もあります。わかりました。つまり、その、簡潔に言うと、これがそれを設定する方法です。これらのツール呼び出しが見えます。マネージャーにはbash、read、lsがあります。その、詳しく説明するつもりはありませんが、これが基本的にはコア設定です。Pythonでこれをプログラミングするなら、ですね、スライドをPythonに投げてMatiasが話していた内容をコピーしてほしいと言えば、これを非常に簡単に作成できます。わかりました。これを具体化しましょう。これはPeterです。これは彼のopenclawです。ある時点で、彼が、彼にメッセージを送りました、ですね、今はボイスメッセージです。エージェントが考え始め、それはテキストで応答しました。問題はこれがどのように機能するかです。つまり、ユーザーが、基本的な指示を行い、soulmなど。
readやwrite、bashなどのツールがあります。そして、これらのツールが実際の魔法が起こるところですね。ボイスメッセージをチェックしたファイルがあり、それはWAVEファイルを開きました。Whisperで分解します。さて、その、彼の例では、Whisperは何も返しませんでした。つまり、その場所で、API呼び出しを行い、実際にボイスメッセージをテキストメッセージに翻訳しました。ですね。つまり、実際に、エージェント内の魔法のコアが見えます。ですね、ツール呼び出しが異なる設定のループです。これを、試してみてください。そんなに難しくはありません。わかりました。その、最後にすることは、その、ここが別の例uです。このトークが関心のある理由は、それを他の製品に組み込むことについてです。その、これは私たちが構築したプロジェクトです。その、つまり、openclawアーキテクチャに着想を得ました。
つまりその、しかし、入力としてメールを使用するように変更しました。一般的なゲートウェイがあり、その後、異なるコンテナがあります、その、異なるクライアントを実行するための、その後、これらの異なるツールがあります。現在、これらのツールはWhisperではありません。しかし、これらはCRMやERPのような、特定のユースケースのためのものです。
ここにいくつかのスクリーンショットがあります、ですね。つまり、その、右側にはゼネラルユーザーメッセージが見えます。受信箱が見えます、その、最近のアクティビティ、およびそれがどのように応答するか。しかし、エンジニアリングパートにとって興味深いのは左側です。ここに、申し訳ありません。ドイツ語です。その、しかし、左側で、異なるツール呼び出しが実際に見えます。ERP システムがどのようにトリガーされるかが見えます。パーツが利用可能かどうかに関わらず。ですね。つまり、その、このステートメントで、コーディングエージェントについては、ある方法で、将来のソフトウェアの一部になると強く信じています。ですね。つまり、今それらを見てください。あ、このエージェント、このコーディングエージェントは魔法ではありません。つまり、ご存知、その、ご存知自由にいじってください。Pythonは修正に非常に適しています。これはこれを学ぶのに良い方法です。最後に、いじってください。ありがとう、Matias。
わかりました、皆さん。次に、ペースを変えます。次のスピーチはデザイントラックからです。Microsoftから来たJoshが、無限ゴミ機械ではなく、ユーザーがより創造的で思慮深いイメージを作るのに役立つ製品を設計する方法について説明します。こんにちは。こんにちは。わかりました、ここにいます。こんにちは、みんな。Joshといいます。今日は超興奮しています。その、デザインが差別化要因である理由について。創造性が自動化ではなく、AI時代の重要な競争上の優位性である理由を一緒に探索します。現在、Microsoft AIヘルスチームの主任プロダクトデザイナーです。また、Flubinの創設者です。これはロンドンの応用スタジオで、昨年、個人的なサブスクリプション追跡によってお金を節約するのに役立つ最初の製品Orbitを立ち上げました。
このスピーチは3つの章で構成されます。今日のAIの使用方法に異議を唱えます。その後、創造性を増やしてAIでそれを強化するためのヒントを共有します。最後に、あなたはアーティストであることを説得します。最初の章である「鉛筆」から始めましょう。私の好きな引用から始めたいです。「すべての中で自分のためにそうであることが異なります。それはより良い必要があります」。AIコーディング生産性の急増が見えました。人々は過去のいつでも構築、公開しています。しかし、今日、私たちはAIに多くの思考をオフロードしたと信じています。それは単なるツール、マジック鉛筆のようなツールであることを忘れています。問題は、AIはすでに存在するすべての上で訓練されたということです。Webサイトを設計するように求めると、最も一般的なWebサイトの最も一般的なパターンの加重平均が返されます。
実行速度がすべてを推進しました。その、失礼します。すべての品質の平均化を推進しました。十分だけになります。生成と作成の間のギャップが唯一重要なギャップになります。十分な質問の顧客にとってどの程度意味があるのか。AIは創造性を強化すべきだが、それは置き換えるべきではないと信じています。昨年、数千が同じことをしている飽和市場で独立して開始して創造性を強化しました。Orbitは個人的なサブスクリプションを追跡するのに役立ちます。これは何も革命的ではありません。しかし、1年以内に、6桁に達し、Appleによって3回特別に推奨されました。デザイナーとして、競争上の優位性は作成と思いやりです。AIを創造的なニーズを支援するためのツールとして受け入れ、何かを高い水準に発展させます。
特定のニッチなグループのために1つのことをうまくやる製品を作りたかった。AIは私の魔法の鉛筆ですが、私はコントローラーです。教訓は、ツールは常に変わるということです。狂気的に素晴らしく、作られたものへの必要性は変わりません。ツールは新しい方法で問題を解決するために継続的に進化します。AIは下限を上げますが、上限は上がりません。何を構築するのか、なぜ、誰のため、その後、それを素晴らしくするすべての詳細に執着するかを決定する必要があります。「ポスター」の第2章に向かい、創造性を増やしてからAIで強化する方法について話しましょう。あなたの最高の仕事は、仕事をしていないときに行われます。創造的なアイデアが出現する余地があるとき。夏の日に、アパートで迷い、壁に興味深いインターフェースの機会を見ました。このポスターが大好きです。
これはMatisaの紙の切り抜きスタイルの中世現代抽象芸術です。これは非常にシンプルです。それを構成するすべてのビジュアル要素を1つの手で数えることができます。興味深い部分は、Orbitは他のアプリに着想を得ていないということです。ポスターに着想を得ました。Orbitでメッセージを強調し、人々がお金を節約するのに役立つ機会を見ました。極度にシンプルにすることで、自分自身を他のアプリと区別するだけではなく、人々が簡単に理解できるようにします。異なっていることは、競争相手に対する明確な利点を与えました。生成されたのと同じ海で際立つようにしました。これは、訓練が足りないため、1回プロンプトするだけで済むものではありません。問題は、私たちが退屈に感じることはありません。
作成思考ツール呼び出しを使用する必要があります。耳を傾けずに歩くか、窓を見ています。かつて退屈な90年代の子供として電話なしでしたこと。基本的には、脳が新しい情報パターンを受け取る機会を開きます。創造性は設計者だけでなく、すべての人のためであると信じています。素晴らしいアイデアは好奇心と不思議の感覚から始まります。今日、人々はアイデア、空想、執着、つかの間の考え、ユニークな視点を取り、本物に変える必要があります。さて、より実用的なものに。デザインプロセスでは、今日、ほぼすべてのプロジェクトに対して独自のプロトタイプツールを構築するのが大好きです。この例では、このスピーチの導入スライド用のカスタム新しいシェーダーツールを実際に作成しました。
これにより、以前は不可能だったレベルで探索、調整、完璧化、強化することができ、創造性を強化します。独自のツールを構築すること、特にプロトタイピング中は、体験内の豊かな動作を探索する良い方法です。これは、仕事で頻繁に使用するデバッグパネルに似た仮定的なデモです。ボタン、トグル、スライダーを追加するのが好きです。このデータ濃度コントロールのように、異なる製品状態をシミュレートします。初日の空の体験から数週間後に完全に満たされた体験まで。画面間をジャンプし、状態をリセットし、機能フラグを接続して、アイデアと境界の場合をすばやくテストできます。これが真に解き放つのは、製品工芸への深い関心の能力です。AIはシミュレーションと反復速度をはるかに高速化し、私たちに創造性と心の流れを維持するためのより多くのエネルギーを与えます。
より個人的な例では、Flubbotと呼ぶopenclawがあります。左側では、日光の中を歩きながら音声の口述をし、書いている創造性についての本に関する思想を自由に漂わせます。ここで、AIをアシスタントとして使用して、本の研究を整理し、それをGitリポジトリにプッシュするのに役立ちます。個人的なエージェントの別のクールな例は、素早い考えを生活に変え、素早いプロトタイプを生成することです。アイデアのほとんどは、Apple notesに追加されてから、最終的にアイデア墓地で死亡します。しかし、これはそれらを試して、何かが存在するかどうかを見るためのかなり優れた方法です。この例は見た目が悪いプロトタイプですが、創造的な運動ギフトです。創造的なバッテリーを追跡することがパーセンテージとして可能かどうかを確認したかった。
通常、Flebotに考えを正確に説明し、おそらくScreen Time APIを活用するなどのローカルiOS詳細を投げます。その後、ラップトップに戻り、PRを待ち、Xcodeからそれを電話に構築します。このスピーチでは、Gitから本の材料をナビゲートする方法を作成するようにClaudeに尋ねました。AIとデザインの周りにアイデアとテーマを構築できるように。スペースビューも作成するように尋ねました。偶然に情報の興味深い方法を見つけるための方法が欲しかった。これは、私が線形読むことが見えない可能性のあるパターンを見るのに役立つかもしれません。全体的な教訓は、横方向の啓発を取得し、作業の周りに個人的なツールを構築することで、ツールとしてAIを活用して思考を強化することで無限の創造性をロック解除できますが、それはあなたのためにそれをしません。
今、最終的な場面に。あなたがアーティストであることを説得する時が来ました。Doist創設者からのこの引用が大好きです。最高の製品は、仕事の一部を費やしてくれる人によって作られています。最悪の製品は魂がないような感じがします。AIは、大規模なソウルのない何かを作成するのを非常に簡単にします。しかし、それはそうである必要はありません。AIで今日見ている最大の間違いの1つは、人々が最初のプロンプトから反復されない場合です。最初のバージョンは決して良くはありませんが、反復されたバージョンは可能です。ロンドンのカフェで1時間以上このアプリアイコンを作成しました。いい珈琲を飲みながら。良い点と素晴らしい点の違いは、最初のバージョンへの愛着ではなく、10番目のバージョンが何かについての興奮です。
AIで構築する際に今日見ている2番目に大きな問題は、人々が新しいものを追加し続けることは簡単であり、不必要な機能で製品が膨れ上がることです。これは、Orbitサブスクリプション詳細ページが初期のワイヤーフレームのように見えると思う興味深い例です。素晴らしい製品は少数のグループ用にカスタマイズされており、真の単純さは非常に困難です。そのニッチにとって重要な本質が残っているまで、すべての混乱や不要なものを削除することが必要です。同僚で友人のAmirはこれを完璧に述べました。現在、これはクラフトについてです。何年も、ソフトウェアエンジニアリングは主にフレームワークを学び、コードを書くことについてです。私たちのほとんどの時間は、構築する方法ではなく、何を構築するかについてです。これは反転しました。
あなたは今、大きなチームで数ヶ月間かけて間違ったものを構築することができます。どの程度のAGIでもあなたを救うことはできません。物事を異常な基準に達するために、私たちは反復し、減らし、配慮し、基準を上げる必要があります。私たちは自分たちのタイトルを無視し、私たちを箱に入れてラベルを貼るものを無視する必要があります。私たちが現在の状態を超えて見ることができるように、自分たちを芸術家として想像する必要があります。それを無視して、製造する価値のあるものを構築するのです。だから、これを皆さんに残します。人工知能は魔法の鉛筆です。あなたの好奇心に従い、自分を芸術作品に注ぎ込む時が来ました。シンガポールについて何を想像されますか?ありがとうございます。Josh、ありがとうございます。あれは素晴らしかったです。では、皆さん。それで、今朝は個人エージェントについて多くの時間を費やしました。
次に、Mastraのサム、Mastraの CEO・創業者が登壇して、本番環境におけるビジネスエージェントについて話します。彼らにこれをもっと大きくしてもらえますか?右下の画面です。右下が必要です。はい、調整してください。では、皆さん。私はサムです。呃、私はMSRAの創業者、共創業者、呃 TypeScript エージェントフレームワークの共創業者です。その前は、呃 Gatsby の共創業者で、人気のある React ウェブフレームワークです。その前は、呃 Google の周辺でいくつかのスタートアップのエンジニアでした。本当に面白い話で、呃 36時間前に私は飛行機に乗るはずでした。呃、私は呃パスポートを更新する必要があることに気づきました。だから、呃 2時間運転して呃最寄りのパスポート事務所に行きました。幸い、彼らは同じ日に更新してくれて、私はここに来てあなたたち全員と一緒にいることができました。
本当にシンガポールに興奮しています。本当にここに興奮しています。えと呃、あなたたち全員がここにいてくれてありがとうございます。それで、今日は呃本番環境のエージェントについて話します。でもまず質問です。えと、ここにいる誰が呃開発者ですか?えと素晴らしい。えと次の質問。えと、ここにいる誰が呃エージェントを構築して本番環境にデプロイしましたか?素晴らしい。えと、私のクリッカーが必要です。クリッカーを持っていないと思います。クリッカーはどこですか?ここです。クリッカーを取得しました。よし。えと、素晴らしい。呃、それで、ここで本番環境ではなくエージェントを公開した誰がいますか?では、最初の質問に対して約20%の人がはいと答え、呃 2番目の質問に対して別の呃10~20%の人がはいと答えました。では。
えと、過去18ヶ月間、私たちはMRAを使ってエージェントを構築している数千のチームを知っています。えと、これらのチームからのいくつかの経験教訓を共有したいので、あなたは自分でこれらのエージェントを構築する準備ができます。呃、最も重要なのは、私たちが見たチームが構築したエージェントの分類であり、実際には3種類のエージェントに帰結します。呃、それはカスタマーフェーシングエージェント、内部エージェント、開発者プラットフォームエージェントです。えと、それぞれについていくつかを共有したいのですが、呃、今では良いです。それでクリッカー、私たちはここで試みています、私たちはここで試みています。これが機能するかどうか見てみましょう。次のスライドをくれますか?ありがとうございます。えと、はい、良いです。それでは、カスタマーフェーシングエージェントから始めましょう。えと、カスタマーフェーシングエージェントの興味深い例があります。えと、呃、これを行うとき、私たちができますか、私は間違った方向を指していませんか?
では、まず質問をします。えと、ここで誰がユーザー向けの製品チームで働いていますか?呃、おそらくソフトウェア会社で、または呃より大きな機関の呃ユーザー向けの呃部分かもしれませんが、呃ユーザー向けのソフトウェアチーム。了解です。ですから、数人が手を挙げていますが、それほど多くはありません。えと、でも興味深いのは、これらのタイプの呃、これらのタイプのチームについてのことですが、呃、あなたは少し、ユーザーエクスペリエンスを呃少し形作る直接的な能力があるときに、呃、あなたは本当に興味深いことができます。私は数個を紹介しようとしています、はい、はい、皆さん、ここで私たちは、えと、だから呃、私は例を上げます、えと、私は、私は見たSaaS アプリケーションの例を上げます。だから HR ソフトウェアアプリケーションです。えと、もしあなたが、ユーザーが日常生活で AI を使用できるようにしようとしているのであれば、彼らは実際に 2 つの経路を選択することができます。
最初の経路は、ユーザーがシステムからデータを取得しているというものです。彼らは CSV ダンプのようなことをしています。たとえば、従業員と給与データ、または他の何かを知っています。そして、彼らはそれを Claude または ChatGPT に貼り付けて、これについて質問しています。えと、今、2番目は、あなた、あなたは HR ソフトウェア会社として、えと、ウェブアプリ内、モバイルアプリ内に呃エージェントを構築します。呃、そうすれば、あなたのユーザーはより意味のある方法で彼らのデータと相互作用することができるようになります。そして、そして、そして、2番目が最初より良い理由は、少しユーザーエンゲージメント、コンテキストエンジニアリングのようなものです。えと、システムの他の部分から情報を引き出すことができれば、全体像のより多くの部分を取得します。えと、だから、それが私たちがチームが構築しているのを見ている理由です。あなたが知っているように、アプリ内の呃、アプリ内のアシスタント。
そして、これはただの B2B SaaS アプリケーションではなく、そして、また少し B2C 呃アプリケーションのようなもので、本当に興味深いのは、独自データ上で個性化されたエクスペリエンスを作成できることです。えと、今、私は、ユーザーと、私たちが多くの時間をかけて協力してきた会社からの例を上げます。それは Indeed です。Indeed は職業顧問エージェントを構築しました。えと、あなたは呃誰かを支援しようとしているなら、呃彼らのキャリアをナビゲートするなら、実際には 2つの重要で興味深いデータセットがあります。1つはあなたのユーザーの夢と野心、彼らの背景、彼らの履歴書です。2番目は、えと、あなたのプラットフォーム、あなたが知っているように、あなたが所有する仕事のデータと、あなたが所有する給与データ、呃、異なる、あなたが知っているように、独自のデータタイプです。
だから、あなたがこの2つを少し一緒にすることができるとき、それが私たちがチームが本当に魔法のような呃ユーザーエクスペリエンスを作成できることを見るときです。えと、でも、ユースケースが何であれ、えと、一般的な課題のセットがあります。私たちは見ています。えと、最大のものは、ユーザー向けアプリケーション向けのコスト最適化と精度の周りです。えと、チームが初期段階でのデプロイを行うとき、彼らは多くの場合、トークン費用で、彼らにサービスを提供するのに数百ドルまたは数千ドルかかる可能性があるという特定のユーザーがいることに気づきます。ですよね?えと、だから、えと、彼らは少し時間を費やし、彼らはこれらのことを調整しようとするのにかなりの時間を費やします。コスト、えと、あなたが知っているように、モデル選択などの周りの精度ノブのように。
呃、彼らはまた、少し試みようとしています。おいおい、費用をどのように移すのでしょうか?クレジットシステムをいくつか作成する必要がありますか?たぶん、私たちは呃、あなたが知っているように、具体的にすべき呃かもしれません。たぶん、私たちは呃呃トークンコストを転送する必要があります、原始的なトークンコストですか?ですが、これは少し考えが必要です。ここは呃4つの異なるチームの一種で、私たちが見た、そして、数字は、私は、いくつかの経験教訓を共有します。最初のえと、すべて最速で船積みしたチームは、チームです。少し明白かもしれませんが、少し矛盾しているのではないかと思います。以前にエージェントを構築したチーム、えと、なぜなら、彼らはあなたが構築する必要があるという考えの迷路をすばやく通り抜けることができます。
えと、あなたは少し見るでしょう。えと、その少し最速でエージェントを本番環境に送ったチームは実際にその呃を構築した。その主要なエンジニアがそこにいます。えと、呃から DeepMind、だから彼は、呃、だから、だから、彼は評議会に来ました。あなたが知っているように、そのチームはかなり速くシップすることができました。えと、明らかに、最も、それは呃、ほとんどの人が持っていない呃利点です。えと、でも、実際には、それが理由です。えと、それは、私たちが人々が、Mastra のような良い代理人フレームワークを使用することを提唱する最大の理由の1つです。あなたがエージェントを構築するとき、呃、そこに原始的なものがあります。そして、呃、あなたは原始的に費やす時間が多いほど、ユーザーエクスペリエンスに費やす時間が少なくなります。または、あなたが知っているように、両方を同時に構築する必要がある場合、プロジェクトはさらに長くかかります。
もし、あなたは、えと、車輪を再発明することができます。絶対。私たちはエンジニアです。私たちは車輪を再発明する方法を知っています。過去に車輪を再発明した。でも、私があなたに与える一般的なアドバイスはしないことです。えと、これはあなたに時間、面倒、頭痛を節約します。えと呃、だから、だから、えと、それでは、少し、ユーザー向けエージェントから呃内部エージェントに移動します。えと、だから、ここは皆さんへの質問です。ここで誰が呃誰が誰がここで働いています。少し大きな機関で、呃多分、本質的には技術会社ではないものですが、あなたが知っているように、銀行、金融、医療保険、あなたが知っているように、保険、手を挙げてください。了解です。はい、かなり多くの人が手を挙げました。
えと、これらのタイプの呃機関を使って、私たちが通常見るのは、そこにはたくさんの呃呃事務処理プロセスがあるということです。少しその周りです。えと、私は少し、私が見ているいくつかの異なるタイプの代理人を通して歩きます。その、人々がここで構築しているのを見ます。だから、最初の呃、最初は少し内部エンタープライズサーチのようなものです。えと、だから、あなたは想像することができます、あなたが10万人以上の従業員を持っているなら、呃、あなたは最終的に考える重要なことの1つは、うちで働く従業員は、いくつかのシステムのいずれかで、その情報がどこかに保存されていることを確認するにはどうすればよいですか。保存しているのは、利用可能でアクセス可能であり、呃従業員がこの情報の見つけ方を知っているようにしたい。
えと、私たちは見ています。えと、人々が内部でこれらの代理人の検索呃タイプの能力を構築しているのを見ています。えと、あなたが知っているように、彼らの会社のすべての従業員にこれらを提供します。えと、あなたが知っているように、彼らが機能している各システムのコネクタを構築します。えと呃、私たちも見ています。えと、あなたが知っているように、内部代理人の観点から、多くのプロセス自動化、呃人々、あなたが想像することができます。医者たちは、例えば、より速く臨床試験の文書を完成させるか、政府で RFP プロセスのようなものを自動化します。えと、どこにでも大量の紙とデータ入力があります。我々はチームを見ています。あなたが知っているように、代理人を構築して、少し解決していますが、呃、これを解決しています。
えと、でも、課題は、あなたが知っているように、これらまたはこれらのタイプの組織で働いている場合、リーダーシップと最前線のエンジニアの間にしばしば切断があることは明らかです。えと、これらのいずれかの組織で働いていて、agents をあなたの組織に導入したい場合、私が提唱するのは、そして、私たちが有効なのを見ているのは、少し型破りです。えと、あなたが知っているように、多分あなたのチームの外のチームがヘルプが必要なのを見つけます。えと、彼らと協力して、あなたが知っているように、プロトタイプを作成し、反復します。あなたは正しいプロジェクトに割り当てられないかもしれませんが、自分で見つけることができます。だから、私の提案を、再び私たちが見たことに基づいて、痛点を識別するときに少し創造的である。
確かに、あなたが解決できる痛点がいくつかあり、その代理人を構築することができます。えと、今、私たちが見ているチームが構築している3番目の代理人は、開発者プラットフォーム領域にあります。企業または機関のテクノロジースタック内で。えと、過去数ヶ月間、私たちはチームからの様々なインフラストラクチャの問題を聞いており、彼らは私たちに代理人を使って解決したことを教えてくれています。えと、これらはあなたが 50人以上のエンジニア、200人以上のエンジニアを持つより大きな組織で見るであろう痛みのタイプです。えと、あなたが知っているように、Fortune 500 企業のネットワーク運用センター内のチームがいて、AIS SRE を構築して、大量の受信アラームを分類処理しています。ですよね?
あ、別のチームが30億ドル規模のデベロッパープラットフォーム企業内で、agentsを構築してCI ログを参照しています。あ、数TB、数TBのCI ログです。ここでの共通点は、ですね、共通点は、いつでも大量のマシンデータが流入していれば、あ、それを解決するagentsを構築する機会があるということです。
もしあなたたちの中にデータの3つのV——variety、volume、その他を覚えている人がいるなら、ですね、velocityのようなもの、2010年代初期から中期に標識されるような何かですね、あ、あなたの組織内でそのような部分を見つけてください。あ、もしあなたがそのような部分にいるか、その近くにいるなら、そこにはほぼ間違いなくagentsを構築する必要があり、また実施する素晴らしいプロジェクトと意味のある仕事があり、それが問題を解決し、あ、そしてちょっと本当の、本当に良いことをするようなもので、本当に組織内の他の人を助けるようなものです。
あ、私が話したい最後のユースケースはデベロッパープラットフォームagentsと、内部agentプラットフォームとは何かですね。具体的には、あ、ご存知のように、私が言いたいのは、多くの企業内に平台工程チームがあり、あ、内部のデベロッパーがagentsを構築するのを支援しようとしており、それで彼らはちょっとあ、例えば、Maのアプローチを採用するようなもので、ちょっと周囲に軽量ラッパーを追加するようなもので、あ、それは多くのご存知の彼らの特定の展開パラダイムの周りの企業固有のコンテンツなどを持っています。
あ、彼らはそれをSageと呼んでいて、それから彼らはそれを内部のあ、agentプラットフォームとしてリリースして他の人を支援しています。ご存知のように、それは基本的に認可されたパスで、あ、他のチームがagentsを構築するためのものです。ご存知のように、あなたはちょっと、もしあなたがこれらのチーム周辺にいるか、もしあなたがこれらのチーム内にいるなら、ご存知のように、このことをする利点は人々がどこから始めるか知りたいということで、あ、彼らのために認可されたパスを作成することで、あなたは、ご存知のように、彼らが焦点を正しい方法に集中させることができ、あ、またはそれは彼らが承認されるとわかっている方法のようなもので、あ、ご存知のように彼らは構築し続けることができます。
あ、これらのタイプのプロジェクトすべての利点は、あ、あなたが自分自身のために構築しているなら、あ、そしてあなたが組織内の開発者プラットフォームインフラ、ちょっとDevOpsタイプの領域のようなもので構築しているなら、あ、あなたは非常に良いコンパクトなフィードバックループを取得します。あなたは非常に速く評価することができます。あ、例えばこれは実際の問題を解決していますか?私のagentは改善していますか?あ、もっと多くのことができますか?あなた自身があなたのユーザーだからです。あ、これはある意味ちょっと良い制限です。あ、えっと、あ、えっと、ご存知のように、それで、これは私が15年以上の技術者としてのキャリアの中で構築するための最も興奮的な時間だと思っています。はい。あなたができる、他の誰もまだやっていないもっと面白いものがあります。
あ、私たちはこれらの信じられないほど強力なモデルを持っており、私たちはあらゆる種類のことを指すことができます。非常に本当のあ、問題のようなものです。あ、これはagentの1年だけではありません。これはagent十年の始まりです。私はあなたができることを望んでいます、ご存知のように、明日仕事に入ってきて、感覚を持ってください。ここはagentですね、またはおそらく2つ、3つのアイデア、あ、あなたは構築できるもの。だからあ、前に進む、agentsを構築する、あ、あなたたち全員への一種の指示です。あ、ここにいてうれしいです、招待してくれてありがとうございます。>> 本当にありがとうございます、Sam。わかりました、皆さん。この本番に物を置く考え方に沿って、あ、非常に嬉しいことにPierreをステージに招待します。PierreはLlama Indexの創始エンジニアで、彼はあなたたちに話します。あ、Llama Parseの大規模展開からの経験教訓について。それはどこですか?あなたはディスプレイを取得しませんでした。
これは私がしようとしていることです。なぜかわかりません。あなたはこのキッドのように私をやらせてくれますか?わかりました、ありがとう。やあ皆さん。私はPierreです。あ、私はLam Indexにいます。今日は少し説明したいです。過去2年間、あ、Llama indexで大規模にagentを展開するときに学んだことについてです。あ、だから、あ、Llama indexを知らない人たちのために、あ、それはもともとオープンソース企業のオープンソースフレームワークで、あ、私たちは現在ドキュメントAIに焦点を当てており、過去2年間で、本番環境で10億以上のドキュメントを処理してきました。あ、それぞれに独自のagenticループがあります。はい。だから、今日Llama indexで解決しようとしている中心的な問題の1つはドキュメント処理です。
あ、もしあなたがすでにデータを抽出しようとしたか、agentにPDFを送ろうとしたことがあるなら、あ、あなたはおそらくすでにPDF自体が解析するのが非常に難しく、大量のガベージコンテンツを含んでいることに気づいています。あ、それらは基本的にあ、構造化されたコンテンツを含んでいないけれど、それらはあ、ページ上の単語のバウンディングボックスを含んでいます。あ、あなたはある方法であ、それを何か有用なものに再構成する必要があります。
ああ、ですから2024年から、ああ早くも2024年から、ああ私たちはエージェント・システムを構築することでこの問題を解決することを試みました。LLMを利用し、本来はビジョン言語モデルとOCRおよび多くの他の技術とモデルを、ああエージェント・ループに一緒に統合することで、この種の文書解析の問題を解決することを試みました。あああらゆる種類の文書を処理することができます。ああTLDR、ああ本番環境でエージェントを使用して文書を処理しています。ああこれまでのところ、私たちが処理したのは、私が言ったように、数十億の文書です。ああこのトークの目的は、本番環境で見かける頻繁に出現するいくつかの問題を紹介することですが、これらの問題はそれほど議論されていません。ああLLMまたはVLMを使用するときに遭遇する最初の問題の1つは、それらが本当に出力でループするのが好きだということです。ああだから、大規模言語モデルに送信するクエリの小さな部分、おそらく1%前後のようなものがあります。
5%のクエリが反復出力の形式で返されます。ああこれはあなたのワークフローを完全に破壊します。ああこの中で最も深刻な問題の1つは空白ループです。ああ特にたとえばEnthropicのSonicクラスはこれに非常に敏感です。ああモデルは出力に無限の空白を出力します。ああ私たちはあなたのすべてのトークン予算を使い切りました。あなたはそれを制御する方法がありません。ああ分詞器の動作方式のため、空白はあなたが停止シーケンスに配置することができない唯一の文字です。ああほとんどの最先端モデルまたはオープンソースの重みモデルはああ1つの空白から128の空白までのトークンを持っています。ほとんどの場合です。だからああ空白を停止シーケンスとして配置することは難しいです。だからそれは文字です。あなたが空白だけを配置するなら、ああほとんどのプロバイダーまたはほとんどのモデルはあなたのクエリを拒否します。
ああ、空格トークンは停止トークンとして設定することができないため、本番環境でこの種のループを処理するために、あなたが行う必要があるのは、ああ基本的にあなたは常にあなたのモデルにトリミングを使用する必要があります。パッチを使用すべきではありません。ああそしてあなたはモデルプロバイダーから来たか、あなたのモデル推論から来たそれぞれのブロックに対して必要です。あああなたは途中でいくつかのヒューリスティック方法を実行して、何らかの反復が発生しているかどうかを検出する必要があります。あなたはクエリを早期に強制終了しようとする必要があります。ああそうすることで、あなたはああOpusで120,000トークンを費やすことになりません。単に空白のためだけに、それは非常に非常に高くなります。ああだから一般的に私たちが行うのは、あなたはストリームを殺すことができ、その後異なるああモデルまたは異なるプロンプトまたは異なる温度で再度試みます。あなたがこのループに再び入らないことを望みます。ああこれはアウトプットループに通常良く機能します。
ああ、現在、同期ループを使用して同期トラッキングを処理することはますます難しくなっています。特にモデルプロバイダーがもはやああ同期トラッキングをあなたにストリーミングしないため。ああだからここで、あなたはmax tokensに頼って範囲を制限する必要があります。ああしかし、これはこの仕事に本当に適した良いツールではありません。ああもしあなたのmax tokenが低すぎるなら、おそらくあなたが望む出力を得られないかもしれません。もし高すぎるなら、あああなたは同期ループでより多くの予算を燃やすことになります。だからそう、ループ、ああこれは巨大な問題です。ああそしてあなたはそれの周りに設計する必要があります。私たちが見ている別の問題はああモデルの盲目性です。ああモデルは通常、特定のコンテンツに対して盲目です。ああ私たちがトランスクリプションで見ている一般的な問題は、あなたのコンテンツまたはあなたのRAGシステムのチャンクに重複した文字列がある場合です。だからあなたは元のコンテンツ内の2つの場所で繰り返される同じ文字列を持っています。
モデルはときどき中間のコンテンツを完全に無視します。えっと、それはモデルに応じて異なります。すべてのモデルがこの問題を抱えています。えっと、私たちはまだそれを完璧に処理するモデルを見つけていません。えっと、それらは同じものに対して盲目ではありません。ですので、あなたはなお模型を切り替えることができます。えっと、ですがはい、えっと、あなたはプロンプトを通じてそれを回避することはできません。たとえば、2つの文字列の間のあるコンテンツに対して盲目なドイツ呼び出しを持っている場合、あなたはできるだけプロンプトを修正しようとすることができます。えっと、モデルは文字どおり注意力アーキテクチャのため盲目です。えっと、盲目性について私たちが見ている別の問題は色盲です。多くのビジョンモデル、えっと、特に特定の状況では、特に赤色、えっと、空間では盲目です。えっと、人間として、私たちは異なる赤色を区別するのに非常に得意です。えっと、彼らの写真と画像のトークン化方法のためです。
えっと、あなたはモデルの中に色盲を持っています。えっと、色盲のパターンはモデル間で均一ではありません。えっと、ですから基本的には、あなたはえっと色盲を理解するために各モデルをテストする必要があります。えっと、あなたのモデルが何かに対して見えないかどうかを検出するために、えっと、最初に試してみるのは、たとえば、えっと、あなたが使用しているモデルが何の色プロファイルに対して盲目であるかを分析することです。えっと、あなたができる他のことは、たとえば、それをモデルに送信する前に、画像に対してOCRを実行してみること、そしてモデルがOCR上の単語をキャプチャしたかどうかを見ることです。えっと、あなたはそれを回避するためにある種のシグナル融合を行う必要があります。えっと、他の頻繁に発生する破壊的な問題は、えっと、あなたがプロンプトを持っている場合です。そこで何らかの理由で、どこかにテンプレートがあり、何らかの理由でツールが失敗したか何かで、あなたは空のコンテンツを送信しました。えっと、その場合、モデルはコンテンツが空であることを単に告げません。
それはタスクを変更するだけで、それがあなたのためにえっとコンテンツを幻覚させます。えっと、ある模型は同じものを頻繁に幻覚する傾向があります。例えば、Entropicは本当に、えっと、何らかの理由で、ある種のマージ企業組織文書を好んで幻覚させます。ですので、あなたはある種のヒューリスティック方法を使用してそれをフィルタリングしようとすることができます。えっと、ですがはい、盲目性に似ていて、えっと、あなたはあなたのもの内である種のブレンドを使用することもできます。えっと、またはあなたはモデルを呼び出す前に、あなたが空白の画像を送信していないことを確認しようとすることができます。えっと、または空白のテンプレート、えっと、プロンプト内に、えっと、このようにモデルは幻覚しません。えっと、最後に本番環境では、えっと、私たちの最大の問題の1つは現在の状況です。えっと、各モデルプロバイダは今、スケーリングの問題を持っています。ですので、APIはほぼ毎日ダウンしています。
えっと、基本的には、あなたのエージェントシステムでは、えっと、複数のプロバイダーと複数のモデルファミリーをサポートするためにそれらを構築する必要があります。えっと、各モデルファミリーのコードをモデル固有のコードと見なす必要があります。えっと、なぜなら、えっと、はい、えっと、各モデルがえっと異なる動作をするため、これにより、えっと、Entropicがダウンした場合、えっと、他の場所へのフォールバックまたは類似のことができます。これにより、APIプロバイダーまたはモデルプロバイダーがダウンした場合でも、サービスを実行し続けることができます。
えっと最後に、えっと、優れた評価を構築する必要があります。えっと、コードを使用したり、えっと、ますますコードエージェントを使用したりしているため、基本的には、大規模で自分のエージェントの行動を制御できる唯一の方法は、優れた評価を持つことです。えっと、ドキュメント解析用の評価を探している場合、えっと、私たちはpassbenchを構築しました。えっと、これはオープンソースです。えっと、KaggleとHugging Face上で公式ランキングとして実行されています。えっと、エージェントが失敗した場合、LLMを使用しないものへのフォールバックが必要です。えっと、そのために私たちはlight passを構築しました。これもオープンソースです。えっと、CPUで毎秒約500ページを処理しています。えっと基本的には、LLM失敗時のフォールバックが必要です。えっと、モデルを使用せずにすることが必要な場合。えっと、ありがとうございました。えっと、ありがとうございました、Pierre。了解しました、皆さん。もう一つの講演があるだけです。えっと、あなたと昼食の間です。
午前の最後のスピーカーとして、私たちはTuskのJunuをお招きしています。彼は防護柵を通じてエージェントからより安全で、より信頼性の高い行動を引き出す方法について議論します。了解しました。やあ、皆さん。私はJunです。えっと、私はTuskの創始者です。今日は、コードエージェントの実行境界についてシェアします。えっと、これはすべてのウェブ開発者が馴染みのあるものです。えっと、古典的なSQL注入脆弱性は長く続きました。えっと、長い間、これはウェブアプリケーションが破壊された方法です。えっと、ユーザー制御のえっと文字列がSQL解釈器に直接入ります。えっと、私たちはこの問題を開発者にもっと努力してインプットをクリーニングさせることで解決しませんでした。えっと、私たちはプリペアドステートメントでそれを解決しました。えっと、この境界をドライバーに移すことによって。したがって、SQL注入は構造的に不可能になりました。えっと、今、これはパーミッションフラグをスキップするのに危険です。
実際の仕事でコードエージェントを使用したことがあれば、えっと、これを見たことがあるかもしれません。えっと、それはパーミッションプロンプトのために存在しています。えっと、まあ、確かに本当の何かを保護していますが、えっと、彼らはまた仕事の流れを中断しています。ですから、Twitterを検索して、このフラグまたは一般的にパーミッションプロンプトについて人々が何を考えているかを見ました。えっと、トップの行はえっとある種のプロンプト疲労を表しています。対吧?完全にYOLOモードを採用していないが、すべての小さなステップを承認しなければならないことに不満を感じている人々。対吧?中央の行は次に何が起こるかです。人々はこれらのプロンプトをクローズしています。えっと、彼らはパーミッションフラグをスキップして実行します。彼らは他の人にもそうするよう勧めています。えっと、なぜなら、彼らはこれが唯一の利用可能なワークフローだと思っているから。下の行は結果です。対吧?
人々はエージェントが何ができるか、または既にあなたが知っているものについて少し不安です。時々、エージェントはえっと高価なデータさらには全体的なシステムを削除するだけです。ですから、これはここでのUXアンチパターンです。えっと、プロンプト疲労がえっと迂回に変わります。えっと、迂回がえっと範囲外のものに入ることに変わります。深刻な結果を伴って。ですから、私は過去6週間の自分のcursorログから抽出しました。えっと110のアジア会話をまたいで、えっと、えっと過去6週間をまたいで。
ですから、私のデータセットでは、中央値セッション、えっと、中央のセッションには約42個の呼び出しがあります。平均値は120です。私の最長セッションでは、これはえっと1000を超えています。対吧?ですから、毎回人間に尋ねることは、えっと、全く意味がありません。スケールしません。対吧?AIが次第に大きなタスクを担当できるようになるにつれて、えっと、セッションはますます長くなります。私たちの多くは単にパーミッションをスキップするだけです。ですから、残されたのは私たちのファイルシステム、認証情報、環境変数、秘密などへの完全なアクセス権を持つエージェントです。ですから、それはえっと、物事をするための非常に安全な方法ではありません。この業界はこれが壊れていることを知っています。ですから、今年初め、Entropicはclock codeのauto modeをリリースしました。えっと基本的には、これは分類器です。各ツール呼び出しを2つに分類します。
ですから、これら2つのツール呼び出しのうち、安全で合理的に見えるものはパスして実行され、あなたが知っているもののために、疑わしく見えて範囲外のものはブロックされます。対吧?ですから、通常のことについて誰も確認を求めません。これは大きな改善ですが、Entropicのアドバイスは隔離された環境で実行することです。えっと、理由は重要です。数学を見ると、対吧、あなたのクラシファイアーが約122個の呼び出しの平均セッションで99%の信頼性を持つと仮定します。その場合、クラシファイアーがセッション全体で1回のエラーも出さない確率は、えっと、0.99の120乗、または約30%です。
えっと、今、1000以上のツール呼び出しを持つ私の最長セッションでは、これは基本的にゼロです。対吧?ですから、もちろん、ここにはいくつかの警告があります。えっと、エラーは独立していません。えっと、それらは時々関連しています。ですから、これらのパーセンテージを文字通りに理解しないでください。えっと、ここで私は主に1つのポイントを表達したいです。つまり、各ツール呼び出しの確率論的チェックには上限があります。えっと、セッション長に応じて低下します。ですから、より良くできますか?対吧?ですから、確率論的チェックはスケールで減衰します。えっと、決定論的境界はスケールを保持します。ですから、これは質問を提起します。基本的に信頼しているが、完全に検証することができないコードの正しい境界は何ですか?えっと、実は事実上、エージェントはこの問題の最新バージョンに過ぎないことが判明しました。以前にどのように解決したかを見てみましょう。SQL注入については、えっと、ご存知のように、私は以前紹介しました。プリペアドステートメントとORMを使用しました。えっと、単にインプットクリーニングに依存するのではなく。
えっと、メモリ安全に関しては、今では私たちはメモリ安全言語を持っていて、えっと、注意深い C を書くだけではなく。えっと、ネットワークパケット損失に関しては、私たちは TLS を使用していて、えっと、ネットワークを信頼するだけではなく。ここのパターンは、エラーが発生する層の下に実行を強制することです。えっと、そして私たちが今見ている問題のその種類ですが、エージェントがますます個人化され、えっと、オープンエンドになると。私はこれを「エージェント超越」と呼んでいます。ね?ここで興味深いのは、えっと、悪意のある攻撃者がいるかもしれませんし、いないかもしれませんね?あの上のものとは異なり。時々、エージェントは単に実行投射をしているだけです。彼らは幻覚を見ます。彼らはプロンプト・インジェクションを受けます。えっと、彼らはループで実行され、システム全体を削除することに決めるかもしれません。どれが該当するかは重要ではありません。では、構造的な修正とは何ですか?ですから今日、私は言います、えっと、エージェントに振舞うことを要求することをやめて、えっと、エージェントが何をできるかを変えてください。
もし clock codeex または任意のターミナルベースのエージェントを実行する場合、えっと、どこか下の方に何か欲しいですね?それなら、ある種の境界を実装して、えっと、エージェントがこれらの境界内で実行するようにしてください。えっと、ここのポイントは、私たちがこれを単にタスク・ドリフトのために構築したのではないということです。えっと、私たちはしていません、えっと、私たちはコーディング・エージェントのためにこれを構築しませんでした。私たちは最初、タスク・ドリフトのためにこれを構築しました。
えっと、タスク・ドリフトは、私たちの API テスト再生システムです。えっと、CI では、数百もしくは数千の本番トレースが、あなたのアプリケーション上に再生されます。えっと、それが起きたとき、私たちは副作用を望みませんね?。私たちは保証したい、えっと、例えば、データベース呼び出し、実運用呼び出しが本番データベースに進入して、状態に影響を与える、ね?。私たちはそれが起きるのを承知できません。ですから、私たちは初期的な、えっと、確定的なオペレーティング・システムレベルの実行境界を構築しました。えっと、オーバーヘッドはほぼゼロで、えっと、私たちはこれを fence としてオープンソース化しました。えっと、そして、あなたが設定したネットワーク、ファイルシステム、およびコマンド・ポリシーを実装します。ですから、fence をこの境界と見なすことができます。えっと、私たちが望むのは、すべてのそれらの下に、ね?、単一の、えっと、単一のポリシー語彙で、えっと、どのエージェントまたはアプリケーションが作業を駆動しているかに関わらず。現在、fence は 3 つのことを実行します。えっと、ファイルシステム、ネットワーク、およびコマンド。
ポリシー外のファイルはエージェントにとって基本的にアクセス不可能です。えっと、ネットワーク呼び出しはローカル・フィルタリング・プロキシを通じて強制されます。えっと、許可されたドメインのみに到達できます。コマンドは実行前にチェックされます。ですから、これはえっと、チェーンおよびネストされたシェルも含みます。えっと、これがポリシーの外観です、ね?。それは単なるファイルで、えっと、エージェントが見ることができるパス、えっと、コマンド、えっと、あなたが到達できるドメイン、えっと、そしてあなたが決して実行できないコマンド、えっと、そのようなもの。デーモンはありません、イメージはありません、コンテナ・ランタイムはありません。ですから、これはクイック・デモンストレーションです。えっと、これが少し速く実行されたと思いますが、説明できます。えっと、ですから、私たちが以前持っていたのは、えっと、私たちは持っていた、えっと、私たちは fence 設定を持っていました。基本的に、えっと、このディレクトリをブロックしたもので、ね?えっと、えっと、このリポジトリ内です。
えっと、その、えっとわれわれはいくつかのスクリプトも持っています、えっとそれらのmファイルにアクセスしようとするもの、えっとおよびわれわれがfence設定で阻止しているホームディレクトリ内のディレクトリ。えっとですから、これらのスクリプトを実行するときに、えっとわれわれはできません、えっとfence外でスクリプトを実行するときは、これは機能しますね?、または、えっとわれわれはもう1つのスクリプトを持っています、ご存知のように、アウトバウンドリクエストを送出する、えっとエンドポイントへ。えっとしかし、われわれのfence設定では、これは、ご存知のように、えっとわれわれは持っていません、えっと許可されたドメインを設定していません。ですから、ご存知のように、これは、えっとfence下では、これは失敗します。
基本的には、えっと、この実演は、それがこれらのスクリプトを実行しようとしたときに、えっと、何か問題が出たことを示しています。今、私がそれに求めたのは、えっと、今日の日付のreadmeを更新する、単なるファイル修正をする、えっと、それはそれを実行しました。しかし、今、えっと、それが、ご存知のように、試みてえっと、コミットを作成してコミットをリモートにプッシュするときは、これは失敗しました。なぜなら、えっと、われわれのfence設定では、われわれはえっと、git pushを追加しました、えっと被拒否のコマンドとして。ですから、これはfenceが機能する方法の本質です。わかりました、あれを総括しましょう、えっと、私はこれが安全なエージェント実行の規範的なモデルだと思います。わかりました、ですから、左側では、われわれはえっと、代理が実行したいコマンドを持っています。そのうちのほとんどのコマンド、ご存知のように、安全で合理的で通常的です、ね?しかし、これらのコマンドの一部は、えっと、ジェイルブレーク、えっとプロンプトインジェクション、過度に熱心なエージェント、等々が原因で生成される可能性があります。
ですから、われわれはこれらの3層を通じて実行する前に、これらの破壊的なコマンドをフィルタリングしたいんです。第一層は分類です、これは、たとえば、自動モード、えっと、これはこのアクションは合理的ですか?と尋ねます。今、これは確率的です、えっと、われわれが以前見たようにですが、それはより微妙な違いと背景をより良く理解することができます。第二層はポリシーおよびこのポリシーの実行です、ですから、これはfenceが座っている場所です、えっと、それはこのアクションは許可されていますか?と尋ねます、ね?ですから、何かが第一層の隙間をすり抜けた場合、えっと、それがfence設定で拒否されている限り、えっと、アクションは拒否されます。ブロックされます。最後の層は隔離です、ですから、ここでは容器とマイクロ仮想マシンを持っています、えっと、基本的には、問題が発生した場合このプロセスが何に接触できるかを尋ねています。
「ですから、例えば悪意のあるコードや複数テナントワークロードについてですね。そうです。ですから、それはコンテナとマイクロVM が重要な場所です。ホストとアジア系ワークロード間の距離を本当に増やしたい場合、現在これらのレイヤーはすべて完璧ではありません。重要なのはそれらを整列させて積み重ねることです。ですから、それらの脆弱性が並ぶことがないわけです、わかりますね?ですから縦深防御を実現できます。そしてほとんどのチームはすでにそのうちの1つのレイヤーを持っています、わかりますね?クラウドコードを使用している場合、すでに自動モード内にいる可能性があります。セキュリティ意識が強い場合、すでにコンテナまたはクラウドサンドボックスでエージェントを実行している可能性があります。しかし、私がより多くの人に検討してほしいのは、エージェントが何ができて何ができないかを定義する中間層です。ですから、アクターがうまく行動することを求めるのをやめて、アクターが何ができるかを変えましょう」
「ルールを定義し、オペレーティングシステムレベルで強制執行してエージェントを実行させます。ありがとうございます。本当にありがとうございます、Chingi。これが朝のセッションの終了です。ですから現在、1時間の昼食休憩があります。それから午後1時40分にここに戻ります。次のセッションを見逃したくない、なぜなら非常に特別な人だからです。10年以上前から知っている名前はSarah Hookerですね。彼女は実は、彼女は実はTime 100のAI最も影響力のある人物に選ばれました。Sam Altmanと他の人と同じ年です。そして彼女は現在Adaption Labsの最高経営責任者兼共同創設者です。基本的に適応型インテリジェンスの次世代モデルを構築しています。ですからすぐにお会いします。わかりました。昼食をお楽しみください。へへへへへへへへへへへへへへへへへへへへへへへへへへへへへへ」
「へへへへへへへへへへへへへへへへへへへへへへへへ熱い熱いおおへへへへへへへへへへへへ来てください熱い熱いへへへへへへへへへへ熱い熱いへへへへへへへへへへへへ熱い熱いへへへへへへへへへへへへへへへ熱いへ熱いへへへへへへへへへへへへへへへへへへへへへへ熱いへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへへ」
「ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。熱い。熱い。N。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。熱い。熱い。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。熱い。熱い。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ、ハイ、ハイ。ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。」
ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ありがとうございます、Stages。彼は明らかに楽しんでいました。えっと、次の演者が準備している間に、彼女を皆さんに紹介したいと思います。こちらはSarah Hookerです。彼女はAdaptionのCEO兼共同創始者です。えっと、ただし、皆さんの中には知らない人もいるかもしれませんが、実は私はSarahのことを10年以上前から知っているのです。えっと、私たちは以前、分析に関わるNGOプロジェクトをたくさん一緒に行ってきました。そして、私は彼女のことをずっと本当に尊敬してきたのです。ですので、彼女をシンガポールに招待して、この部屋の中の本当に興味深いことについて話してもらう機会を見つけました。そのことで私は本当に興奮しています。ですので、Sarah Hookerに拍手をお願いします。>> わかりました、わかりました。私は思うのですが、私たちは少し >> 皆さん、こんにちは。
ここに来られたことは本当に素晴らしいです。えっと、皆さん全員に立ち上がってもらいたいのです。素晴らしいです。はい。皆さん立ち上がってください。今、皆さんに上に、右に、左に伸びてもらいたいのです。そして、隣の人と拍手をたたき合ってください。素晴らしいです。では座ってください。えっと、これは実は非常に特別だと知っています。なぜなら、これは会議の3日目だからです。そして、これは多くの講演の後のことです。しかし、ここにいられることに非常に光栄を感じています。ですので、皆さんと、私が本当に非常に不満足だと考えている問題をシェアすることができることは、本当に特別です。ですので、通常、ほとんどのフロンティア研究を推し進めるものは、何かについて非常に不満足を感じており、その問題を変える必要があるという感覚だと思います。ですので、今日は、なぜ未来は適応型であるのかについて話そうとしています。
そのようにするために、えっと、通常、どのように始めるかから始めたいのですが、えっと、ここで何を指さすべきか、またはスライドを変更すべきか。ただクリックするだけでいいですか?多分、ああ、意味は、私もこれをできます。私は、私はこれをするつもりです。自分のリズムのためです。はい。ですので、私はここに立ちます。そんなに歩くつもりはありません。わかりました。素晴らしいです。ですので、通常、新しいスライドを作成する場合、私は最後の瞬間まで待つのが好きです。なぜなら、私はそういう人だからです。私は自分の考えが何であるか、そして今私が何を考えているかを考えるのが好きです。ですので、えっと、過去48時間、これが私の人生です。私は、このプレゼンテーション、えっと、実は私がシンガポールで4つのプレゼンテーションを行う予定であるという通知を受け取りました。私は決めました。私は17時間のフライトを持っています。私はそれを飛行中に完了します。これは非常に生産的でした。ですので、私は「ねえ、なぜ私がChatGPTにスライドをくれるよう頼み始めようとしないのですか?」と言いました。
」ですので、私は「自適応型インテリジェンスが必要な理由を説明するためのオープニングスライドが必要です。」と言いました。結果は非常に興味深かったです。これを得ました。それは非常に派手です。それには多くの輝きがあります。そこにトカゲがいるのが見えます。それはチャールズ・ダーウィンの進化論をある程度思い出させます。えっと、ですので、私は「ああ、興味深いですね。これは通常の私のスタイルではありません。それに私を紹介してくれるよう頼みましょう。」と言いました。参考までに、これは私が通常使う紹介スライドです。ですので、私はGoogle DeepMindで長い間働いていました。私はCohere Labsをリードしていました。私の職業人生の多くの時間を、出版物と可能性のフロンティアでの研究に費やしてきました。えっと、私は、世界上最高のフロンティアモデルのいくつかを生産してきた産業研究所で働くことができて幸運だと、常に思ってきました。えっと、しかし、私はそれがこれに簡約されていると思います。ですので、小さな問題がただ1つあります。おそらく皆さんの中にはこれが注目する価値があると思う人もいるでしょう。
えーと、これは基本的には、人々がAIを使用する際に時々経験する感受の一例だと思います。そこで、この問題に対処するために、私は「いいね」「いいえ」を与えることができたと思います。えーと、おそらくどこかの研究者が数ヶ月後にこのフィードバックを受け取り、改善するかもしれません。あるいは、私は上級プロンプトエンジニアになることもできます。そうすれば、私は自分が望む正確な仕様を作成することに非常に優れているでしょう。これが基本的に現在のAIの状態だと思います。私のコンピュータサイエンスキャリアのほとんどの期間において、最大のモデルを構築し、できるだけ多くの能力を付与します。それがどのように使用されるかを推測してから、その同じモデルを世界中できるだけ多くの人に公開します。しかし、ほとんどの人がこれに2つの問題があることを理解していると思います。第一に、これはすべての人がそのモデルの周りでさまざまなトリッキーな適応を行い、それを彼ら自身に合わせるために最善を尽くさなければならないことを意味します。
第二に、これは非常に非効率的でもあります。私たちは、すべての異なる問題に対して同じ計算資源を費やしています。これは本当に静的知性の代価だと言えます。つまり、私たちはこれらの非常に強力なモデルを構築しますが、それらは進化し続けることはありません。無限の再訓練がありますが、その後得られるのは万能なソリューションです。そこで、今日は深刻な講演になると申し上げます。私たちがどのようにこの段階に至ったのか、そして今、なぜ拡張の必要性を本当に理解し始める必要があるのか、そして将来が単一のものであるかどうかについて議論します。その後、適応と私たちが興奮している何かについて議論します。これは非常に興味深いと思いますし、最後にあなたたちが私を説得したかどうかをお尋ねすることもあります。では、私たちはどのようにこの段階に至ったのでしょうか。私たちはどのようにして、これらの同じ方法ですべての人に公開されるこれらの大型モデルを手に入れたのでしょうか。
えーと、私は自分のキャリアのほとんど、実際には大規模なラボでのほとんどの経験において、すべてはより大きく、またはより良くすることについてだったと思います。基本的には、毎年、モデルのサイズが倍増、四倍になります。これはずっと機能してきました。えーと、これは著名なコンピュータ科学者のリッチ・サットン(Rich Sutton)によって提唱されました。彼は「ビターレッスン」でチューリング賞を受賞しました。実際には、「ビターレッスン」は、そこのすべての研究者の自尊心に対する打撃でした。これは基本的に言っています。あなたはおそらく、あなたは素晴らしいアイデアに執着しているかもしれませんが、あなたの素晴らしいアイデアは、スケーリング可能な場合にのみ重要です。これは興味深いことです。なぜなら、今日私が提唱しようとしている最初の質問はサットンが正しいかどうかです。AIの進歩を唯一可能にする要因はモデルサイズのスケーリングですか。挙手してください。良かった。私は二重否定を得ました。二列目のユージーン(Eugene)は二重の反対を与えました。良かった。しかし、彼が正しいと思う人は誰ですか。
挙手してください。素晴らしい。勇気ある人たち。良かった。素晴らしい。はい。彼はチューリング賞を受賞しています。彼が言ったことは正しい部分があるはずですよね。では、彼が正しいと思う人は誰ですか。良かった。私たちはもう少し同意を得ています。実際には、彼が正しいという理由がたくさんあると思います。証拠が彼を支持しているからです。なぜなら、あなたが見れば、私たち全体のエコシステムはこの信念の周りに再編成されているからです。私たちはGPUの富豪と貧乏人についてのジョークを持っています。私たちは科学者マイケル・ジョーダン(Michael Jordan)(バスケットボール選手ではない)を持っています。彼は「私は金属を握らない限り、考えることができない」と言いました。
私たちは基本的に、私のような研究者を持っています。伝統的には学界に属しているべきでしたが、産業研究室に行き、これらのアイデアへの信頼の転換と資本流入のため、多くのリソースと資金を得ました。信念は計算資源が必要であり、これが誰が参加できず、誰が参加できるかを決定するからです。計算資源へのアクセスは国家の優先事項でもあり、広くサポートされています。したがって、それはアルゴリズムで何をするよりもリスクが低いと見られています。それは非常に適切で、非常に便利です。それは四半期計画サイクルに適合しています。したがって、その合理性を証明するのは簡単であり、人々は計算資源の量に基づいて資金さえ調達しています。したがって、その後、反対向きを向いて「いいえ、結局私たちは計算資源を必要としません」と言うことは難しいです。そしてこれは実際にそれが権力の集中をもたらしたことを意味します。
したがって、この質問を提起することは実際に非常に重要です。なぜなら、それは多くのことを決定するからです。私はベンダー企業A、B、Cをリストアップしましたが、私が引くと、あなたたちはおそらく皆同じ名前を言うでしょう、そうですか。だから要するに、これは本当に私たちの選択が少なくなったことを意味します。それで、この言い方は正しいですか。スケーリングが終わったと言うことはまだ非常に物議を醸しています。しかし、私は示します。私は実は、モデルサイズと性能の関係が今遠く確定から外れていることを説明します。そして正直に言うと、何でも起こる可能性があります。私はそのように議論します。今、私たちは、同じサイズのAIモデルが時間とともにますます効率的になってきていることを見ています。つまり、同じサイズからはるかに多くのパフォーマンスを得て、絞り出すことができます。しかし、より説得力があるのは、小さいモデルが非常により大きなモデルのパフォーマンスを上回っているのを今見ているということです。最高の小さいモデルはすべて非常により大きなモデルを大幅に上回っています。つまり、スケールがすべてではありません。
私たちは見ています。重みの間に深刻な冗長性が常に存在していることを知ってきました。では、スケールがあなたが必要とするすべてである場合、なぜこんなに多くの重みが全く同じことをしているのですか。なぜ、少数の重みから深層ニューラルネットワークの動作を予測できるのですか。スケールがすべてである場合、訓練後にほとんどの重みを削除できるかどうかを説明してください。スパース化して95%削除できるかどうかを説明してください。これらすべては、スケールが最適化に重要ですが、実際には、私たちはまだより良い、より効率的な小さいモデルをうまくトレーニングしていないことを示唆しています。高品質データはスケールへの必要性を大幅に削減します。しかし、さらに重要なことに、スケーリング時に取得するほとんどのものはロングテールです。つまり、モデルサイズを倍にまたは3倍にすると、レアアーティファクトを学習しているだけです。これはレアアーティファクトを学習するための非常に高価な方法です。したがって、スケーリングできたとしても、私たちが支払う代価ははるかに大きいです。
私たちは実際に最新のモデルでこれを率直に見ています。スケールをさらに増やすことはもはや価値がありません。Frontier Labsは最近、モデルサイズを3倍、4倍にしようとする取り組みを展開しました。それらはデプロイ不可能と見なされており、率直に言って、パフォーマンスをほんのわずかなマージンでのみ改善するため、少しがっかりしています。ですから、私たちはトランスフォーマーの限界に達していると言えます。トランスフォーマーはブレークスルーでしたが、すでに飽和しています。ですから、ここで、ご存じのように、興味深いことに、スケーリングに関しては、リターンはもはや意味を持ちません。実際には、リターンが最も重要です。興味深いことに、計算の他の部分のリターンははるかに良くなっています。
つまり、ポスト・トレーニング、アライメント、データ合成ダイナミクス、適応型コンピューティング、ハードウェア協調設計。これは、少数のサプライヤーが提供できるものの大部分を制御するという考え方が大きく異なることを意味します。インテリジェンスの新時代は、蛮力スケーリングをはるかに超えるものが必要になります。ここにはいくつかの非常に重要なアイデアがあると思います。1つは適応型コンピューティングです。もう1つは、相互作用が今重要であるということです。あなたのモデルが世界とどのように相互作用するのか?これはコンピュータサイエンティストが初めてインターフェースを気にかけなければならない時です。3番目は、より長期的なタスクをしているため、継続的な学習が必要であるということです。では、今、私たちはどこにいますか?私たちは適応の時代にいると言えます。
私がこのように言うのは、より重要なのは、あなたが容量をどのように活用するか、そしてさらに重要なのは、あなたが実際の環境からどのように学ぶかだからです。これは非常に異なります。なぜなら、コンピュータサイエンスの分野として、私たちの時間の大部分は、1つのモデルに夢中になるという考えの周りに費やされ、1950年代から現在まで、最高のモデルをどのように構築するかに焦点を当てているからです。しかし、実際には、この時代では、あなたがモデルのスケーリングのみによって最適化空間を超えることができない状況で、すべてはデータからインターフェースまでの全体スタックをどのように適応させるかについてです。システムの概念とそれが世界とどのように相互作用するかが重要です。私たちの目標は、継続的に進化するインテリジェンスを構築することです。私たちはこの全体スタックをデータからインターフェースまで不可欠と見なしています。
全体は、あなたが持っているタスクのタイプに応じて変わるべきであり、それは極めて効率的であるべきです。そう考えると、これは根本的な転換です。私たちは、重みとモデル名がすべてである状態から、実際には非常に流動的なスタックのようなものへと転換しています。ですから、私たちが興奮しているものを共有し、何が興味深いのかを共有し、その後、ディスカッションを行うことを楽しみにしています。1つのことは、ご存じのように、私たちの最初の柱は適応型データです。データ分布の関心のある部分に対して、すぐに最適化できるため、これが重要だと信じています。えっと、私たちは4ヶ月前にいました。数週間前にこれを共有しました。通常、フロンティアラボ内にあるものを利用可能にすることが目標だと思います。現在では、事前トレーニング中でも、ほとんどのイノベーションはデータイノベーションです。
合成データの真の強力なレバレッジをどのように実現しますか?えっと、私たちはこれも非常に深刻だと考えています。これが初めてのことで、データが安くなって、データ空間内で任意の目標に対して最適化できるようになりました。ですから、人々は活用して、彼らのデータをAIに見えるようにするべきです。非常にクールなのは、人々の反応を見ることが非常に興味深かったことです。ですから、4週間前にそれをリリースしました。242の言語をカバーしており、すでに2700万個のデータポイントを処理しました。これは非常にクレイジーです。その一部は、私たちが非常に高速であると思っています。基本的に、1日以内にデータを完全にAIに見えるようにすることができます。えっと、私たちの次の柱も同様に興奮しています。つまり、完全なスタックが重要で適応可能であることがわかったので、次は継続的なインテリジェンスです。
えっと、私たちが今週リリースしたもの。タイムゾーンによって時間がぼやけていると思いますが、2日前にauto scientistsをリリースしたと思います。これは、トレーニング学習をどのように共同最適化および自動化するかについてです。これは、適応型AIを持つための最大の障害の1つです。えっと、auto scientistは自己改善し、任意のタスクに適応するようにデータとモデルを最適化する方法を自動的に学習します。しかし、それがクールな点は、速度が非常に速いということです。基本的に、2日以内にフロンティアモデルをトレーニングできます。これはかなり荒れ狂っています。えっと、私たちは実際に気の利いた実験をしました。私たちは、これは私たちのAI研究者を倒すことができますか?えっと、それははるかに優れていました。この部分を、ほとんどのAI研究者が特定のフロンティアラボ内の特定のモデルファミリーに基づいてトレーニングされているという事実に起因しています。
しかし、私たちは実際にTogether AIのすべての利用可能なモデルでこれをテストしました。Together AIは推論プロバイダーです。ですから、30種類の異なるモデルがあるようなもので、研究者は異なるアーキテクチャに対する構成方法と、データを共同最適化する方法を自動的に理解するのに本当に苦労しています。ですから、これはかなりクールです。えっと、それは非常に予測可能です。私がこのように言う理由は、実は、将来を見据えて、私たちの考えは、あなたが全体スタックを自動化できるべきだということです。真の適応性のビジョンは効率性です。適応性。えっと、最終的に適応性はリアルタイムである必要があります。あなたが持つあらゆるタスクに対して。適応性に対する摩擦が多いほど、人々はプロンプトエンジニアになるだけです。
ですから、私たちにとって、効率性は思考の主な執着です。人々が単一のAIよりも多くの選択肢を持つことが意味をなすようにします。えっと、これは非常に興味深いです。私たちの研究者の多くがこれに長時間費やしてきたと思います。私が言う唯一のことは、適応性のもう1つの重要な側面は、えっと、初日からグローバルファーストである必要があるということです。ですから、242の言語をカバーしています。私たちが最も関心を持っているのはTASAの検証不可能性です。世界の大部分は実は検証不可能だと思います。
検証可能なタスク部分は非常に小さいため、これが今重要な点です。誰が進展を遂行でき、誰がそれらのタスクを利用できて、より意味のあるものにできるかで決定されます。では、前進する方向は何ですか。別れの言葉は何ですか。では、最後にどのようにしていますか。私があなたを確信させたと思います。これはフィニッシュラインではないということ。私は、マスタープロンプトエンジニアになる必要はありません。私が望んでいて、私に関連しているものを得るために。えっと、私はあなたを確信させたかもしれません。私たちはスケーリングの終わりに達したということです。少なくとも、あなたのモデルサイズを2倍にしているだけではもう機能しません。これは興味深いことを意味します。これはイノベーションの時代です。
しかし、私があなたをこの点で確信させたかどうかにかかわらず、私はおそらくある程度あなたを確信させました。スケーリングは非常に高価で、利益はここにいるほとんどの人にとって価値がないかもしれません。自分のAIを持ちたい場合でも。私にとって最も重要なのは、誰が適応のコストを最も効率的にするかです。私たちにとって、これは私たちが唯一固執しているものです。どのように任意のビルダーが彼らが持つあらゆるタスクにリアルタイムで適応することを可能にするか。ですから、これは私たちが取り組むことができる最も深い問題の1つだと思います。その後、興味のある人と話し合うことを楽しみにしています。えっと、ここで停止すると思います。ですから、えっと、次の1ヶ月間、auto scientistsを無料で提供していることも共有しています。ですから、証拠はプディングにあります。自分で試してみてください。ようこそ。
私は全く戻ってくることを楽しみにしています。ですから、本当にありがとうございます。えっと、ここでの私は本当に特権だと思います。ありがとうございます。>> あ、本当にありがとうSarah。これは素晴らしいスピーチでした。えっと、次はMiniauxプラットフォームエンジニアリングチームのVincentです。ここ1日間、agents構築agentsについて多くのことについて話し合ってきました。しかし、agentsが自主的に彼らが必要とするコンピューティングとリソースの量をスケジュールしたら、どうなりますか?より上位レベル。ですから、私たちはこれについてたくさん共有します。>> わかりました。おい、みんな、えっと、私の名前はVincent Louです。私たちのAPIプラットフォームチームのプロダクトエンジニアです。今日、私は自分たちの計算を管理するagentsについて話します。ですから、最初のことは次のスライドで申し訳ありません。あ、これはいいですね。今は大丈夫です。はい。
ですから、えっと、計算。誰もが計算を知っています。えっと、計算は大きな成長を経ています。それは、来世紀の最大のえっと商品の1つのようなものです。えっと、私たちは今、それをあまり効率的に使用していません。これを見る最良の方法は、えっと、いくつかの推論プロバイダーがえっと、第三者のツールが彼らのえっと推論を使用することをブロックしていることを確認していることが確実です。あなたが知っているように、おそらく一部は競争であるかもしれません。しかし、本当に重要な点は、えっと、計算は非常にえっと、リクエストに依存しているということです。リクエストの異なるタイプ、異なるタイプのワークロード。えっと、あなたの計算に異なる圧力を与えます。たとえば、特に異なるタイプの入力トークンえっとと入力および出力トークン。あなたのtoken profile(私たちがそれを呼ぶのが好きなように)は、推論プロバイダーがどのように計算を利用するかに大きな影響を与えます。
えっと、ですから最近、Dwar Cashえっと、Riner Popeとのポッドキャストがあり、彼は基本的に推論ワークロードがあなたのtoken profileに大きく依存している具体的な方法について話しました。ですから、これがagentsえっと、彼らの計算を管理することが意味をなす理由です。基本的に、もし私たちがそれを知ることができれば、もし推論プロバイダーとして、事前にえっとセッションのtoken profileを知ることができれば、私たちはリクエストをより良く提供できます。基本的に、私たちはえっと、フリート利用率を最大化し、より多くの人にえっと、より多くのリクエストを提供できます。えっと失敗が少なくなります。
今、あなたが知っているこのえっと、この要求は人間にとって少しあまりにも多いです。あなたが想像すれば、えっと、あなたがコーデック、またはクラウドなどを使用している場合、各セッションの前に、赤ちゃんプロバイダーに告げる必要があります。えっと、あなたが具体的に何種類のワークロードをしているか。どのくらい長くあなたのtoken distribution。私の意味は、私は私のtoken distributionについても気にしません。ですから、人間にとってはこれは要求が多すぎますが、autonomous agentsにとっては、実は非常に妥当かもしれません。これはより多くの観察ですが、agentsはますます多くのツールを持っています。ですから、コンテキスト管理から、ツール。かつてはえっと、エンジニアによってハードコードされたものでしたが、今ではagents基本的にえっと、これらのリソースを管理しています。
しかし、agentsが実際に管理していないことの1つは、彼らの計算と彼らの知性です。ですから、基本的に私たちは本当にagentsにえっと最初に彼らのモデルを選択する能力を与えていません。しかし実は、私たちえっと、あなたが知っているagentの方法が彼らが望むときに彼らの脳を切り替えるのを見ています。しかし、より重要なのは、彼らの計算のようなものです。彼らが実際に仕事をして、推論を実行したいのはいつですか?ですから、えっと、これはautonomous longrunning agentsの前には意味がありませんでした。あなただけが人とペアプログラミングしているとき、スケジュールすることはありません。基本的に人間がagentと会話とプログラミングをしているとき、あなたはその推論を今したいだけです。仕事がすぐに完了することを望んでいます。ですから、スケジュールすることはあまりありません。本当に、貪欲な最善の努力だけです。
しかし、エージェントがより自律的になるにつれて、彼らをバックグラウンドタスクに任せてバックグラウンドで作業させることを知っているとき、実は計算をスケジュールするたくさんの方法があります。例えば、エージェントにデッドラインを与えたとしましょう。週末までに何かを完成させたいのです。彼らに目標と予算を与えるだけですね。そうした制約の下で、エージェントは、えーと、基本的に計算が利用可能な異なる時間間隔で、彼らが行う必要があるかもしれない異なるタイプの作業を分散できるたくさんのことがあります。簡単な例は、えーと、ご存知のように、エージェントが全体のアプリケーション全体を構築しているとしましょう。まあ、最初のプランニング段階では、すぐに飛び込む必要がない場合があります。プランニングを待つことができます。
それはまず本当に良いプランニングモデルを選択することができ、それは良い実装ではない可能性があります。その後、そのモデルにプランニングを行わせます。おそらく午前0時のような、えーと、推論コストが最も低いときのような、または成功率が高いときのような場合です。その後、後で、ご存知のように、おそらくプロジェクト終了に向かって、品質保証を行う必要があり、えーと、そのアプリケーションをレビューする必要があります。あなたはおそらくえーと、V一つの本当に強いVLM gueyモデルに切り替える必要があり、えーと、低レイテンシー作業を行わせて、実際にリアルタイムアプリケーションをテストします。したがって、既に異なるワークロードについて、本当に異なるえーと、トークンプロファイルと、その特定のワークロードに対するリクエストプロファイルが見られ、おそらく非常に異なるえーと、コンピュートクラスタに適合する場合があります。
したがって、これは最近えーとBen Thompsonが書いたStratのブログ記事です。彼は基本的に、彼が、えーと、この点を、応答推論とエージェント推論を分離することで行いました。今、応答推論は、えーと、現在ほとんどの人が気にかけるものです。これは、あなたがコーディングエージェントに入り、えーと、エージェントとペアプログラミングするだけの場合です。出力がより速く出力されるのを見たいです。それがより速く考えるようにしたいです。リアルタイムレイテンシーのようにしたいです。これが応答推論です。えーと、しかしエージェント推論は異なります。実際のところ、エージェント推論については、レイテンシーはそれほど重要ではありません。えーと、なぜなら、私が以前言ったように、あなたは本当に目標と計算予算、またはドル予算のような予算を配信するだけだからです。その後、エージェントは、えーと、利用可能なリソースに基づいて、あなたの予算と目標の周りで最適化することができます。
私はまた指摘すべきです。えーと、応答がエージェント推論の一部として実際に現れる意味がある方法があります。なぜなら、例えば、私が前に述べた例について、えーと、アプリケーションの最後のguey審査のようなことについて、簡単に想像できるからです。あなたはリアルタイムレイテンシーを望んでいるからです。誰も見ていなくても。したがって、極限では、えーと、推論交換のようなものが、すべてのこれらのバックグラウンドエージェントで起こり始めることを期待します。ご存知のように、彼らは野生で実行されています。えーと、彼らのワークロードの前に、彼らは基本的に彼らのセッション情報を提出します。えーと、推論交換に。したがって、最も重要なのは、使用されたモデルです。その後、トークンプロファイル。
したがって、あなた、えーと、あなたのスコープキャッシュ、インプットトークンの数、キャッシュされていないインプットトークン、およびアウトプットトークン、およびえーと、他のいくつかのメタデータのような類似のもの。その後、交換はあなたのセッション、エージェントセッションを、その種のワークロード用の最適化バッチ処理の最適化ノードにマッチングします。えーと、基本的に、えーと、最高の最適なフィットと最適な構成を見つけるために、その時点でそのワークロード用のコンピュートとハードウェアを提供しています。今、これについての良いことは、ご存知のように、あらゆる種類の市場メカニズムのようなものです。推論交換はえーと、十分に利用されていないコンピュート容量をユーザーとプロバイダー余剰に変えることができるでしょう。
えーと、最適なマッチングを仮定するので、私たちは、私たちは基本的にえーと、最高の、私たちは世界中のコンピュートの最高の使用をしています。任意の推論プロバイダーの各GPUご存知のように、彼らのMFUは最大化されるでしょう。えーと、なぜなら、えーと、そのクラスタで特に実行されるワークロードは、そのクラスタの構成のために最適化されるからです。えーと、その後も、えーと、フリート利用率は、異なる時期のようなものです。したがって、今、私たちはプロバイダーがこのようなものを見ます。えーと、例えば、午後、彼らは過剰利用されています。なぜなら、誰もが彼らのエージェントをその時に使用しているからです。しかし、午前0時のような、ご存知のように、これは彼ら、彼ら、彼らのGPUは利用されていません。これはプロバイダーにとって悪いです。なぜなら、彼らは彼らのGPUが常に実行されることを望んでいるからです。
えーと、したがって、この種の推論交換とエージェントが彼ら自身の計算を自主的に管理すれば、より良いマッチングを持つことができます。基本的に、ピーク時とオフピーク時を平滑化します。全体的に、これが推論プロバイダーが行うことは、秒あたりのより高いスループットです。したがって、あなたの全体的なシステムのスループットは、より最適化されるようになります。これはプロバイダーにとって良いです。なぜなら、これは彼らがどのようにお金を稼ぐかです。彼らがサービスできるトークンが多いほど、彼らがえーと、もたらすことができる収益が多くなります。
しかし、これはコンシューマーにとっても良いです。なぜなら、えーと、もう一度、私が始めにまた述べたように、今のコンシューマー、私たちは多くの問題に直面しています。えーと、私たちのリクエストは、単にえーと、レート制限されているか、えーと、彼らは、えーと、プロバイダーによって十分にサービスされていません。それは、彼らが彼らのGPUを最大限に最適な方法で使用していないからです。したがって、コンシューマーにとって、私たちが見ることになるのは、えーと、全体的により良いリクエスト処理です。
もう一つ、コスト面での問題があります。供給業者は非ピーク時に価格を下げる可能性があることが想像できるため、エージェントはそのような低コストの計算能力の使用に動機付けられます。われわれはサービス面ですでにこのような状況を見ています。例えば、多くの供給業者は異なるサービスレベルを持っていると認識しています——低遅延、高遅延、バッチ処理——これらはすべて異なる価格設定を持っています。最後に、これはやや弊社の MMX CLI に関する宣伝のようなものです。この CLI は人間が使用するためのものではなく、エージェントが自律的に弊社のモデル API を呼び出すことができる方法です。弊社には一連のモデルがあります。ご存知のように、音声から画像、ビデオ生成、そしてもちろん弊社の LMS までです。ですから現在、これは本当にエージェントが弊社のモデルエンドポイントを効率的に呼び出すことができる方法です。
しかし将来的には、これを拡張する計画です——基本的には、エージェントがより包括的にそしてより複雑な方法で自身の計算を管理することについて、以前述べたニーズを満たすためです。ですから、おそらく彼らは一日の異なる時間帯に大量のビデオワークロードを実行することを決定し、その後コストを削減し、計算を最大化するでしょう。ああ、そのようなことですね。ありがとうございます。ああ、わかりました。本当にありがとうございました。本当に感謝しております。それは素晴らしいスピーチでした。えっと、次は Sid と Daniel です。彼らは自社の会社を紹介します——ロボット会社です。われわれはエージェント、それらのデプロイ、エージェントのコーディングについていろいろと話し続けています。しかし、エージェントを現実世界にデプロイするために必要なものは何でしょうか。ですから、彼らは物理環境でテレオペレーション・ロボットをデプロイする方法を調べます。やあ。やあ。やあ。やあ。これは機能しますか。ああ、機能しています。こんにちは。
私の名前は Daniel です。えっと、それは Sid です。われわれはロボット会社から来ました。われわれは今日テレオペレーション・ロボットをデプロイし、明日自律性を実現します。わかりました。ここでご覧になっているのは、イギリスのケンブリッジの昆虫養殖場にデプロイされたテレオペレーション・ロボットです。あの小箱の中で蠕動している小さなものが見えますか。それらはクロコオロギで、ヤモリと爬虫類に食べさせるためのものです。想像できるように、このような環境で働くことを望む人はそれほど多くはありません。これが相当良いロボットの使用例である理由です。私は過去1年間、イギリスでロボットをデプロイしました。ですから、昆虫養殖場の他に、洗濯施設、食品準備、ホテル受付の設定があります。ですから、われわれはテレオペレーション・ロボットのデプロイに焦点を当てています。さて、おそらく Daniel に対して、なぜテレオペレーション・ロボットをデプロイするのかを尋ねるかもしれません。
ご存知かもしれませんが、最近の著名な研究者——申し訳ありません、私のリモコンについて——著名な研究者が最近、データ収集手段としてのテレオペレーションはすでに時代遅れであると述べました。そして、この観点に対して多くの利点があります。まず、私は第一次経験を持っており、テレオペレーションは線形スケーリングします。テレオペレーションは一対一のスケーリング、ですね。1人が1台のロボットを制御します、このようにです。もう1つのことは、オペレーターのトレーニングは実際には非常に困難です。私は約100人のオペレーターをトレーニングしました。そのうち、約30~40%が実際にオンボーディングを通過しました。これはスケーリングするのが難しいです。別の問題は、テレオペレーションを使用するとき、ハードウェア遅延のすべての技術的制限とこれらのすべての問題に直面することです。その後、われわれが行った第2部分は、デプロイが非常に困難です。
新しい環境に遭遇することになります。これは新しい照明、新しいテーブル、新しいサイズ、そしてもちろん新しい顧客要件を意味します。故障に遭遇することになります。私たちの場合、昆虫飼育場のため、実際のエラーが発生しました。しかし、多くのソフトウェアエラーと故障にも遭遇しました。また、どのハードウェアでも、物は壊れます。では、なぜリモート制御ロボットを配備するのでしょうか。私たちの主張を説明する前に、モデルがどのようにスケーリングされるのか、そして私たちにとって何を意味するのかを簡潔に説明させてください。それでは素早く、モデルはまず事前学習によってスケーリングされました。つまり、大量のデータ、一般的なインテリジェンス、幅広いが未精製です。次に教師付き微調整があり、モデルはデータトレーニングを受けます。したがって、モデルはタスク固有の専門化を持っています。その後、大きな突破がありました——RLHF強化学習、人間フィードバック付きです。
人間が基準真実の答えを提供しているため、モデルは真に有用で質の高い出力を生成し、これはすべて当然ながら高品質なデータによって支えられています。ロボット工学の世界では、高品質なデータ、またはより一般的にはデータは通常4つのカテゴリーに分かれています。y軸とx軸に注目するなら、y軸はスケーラビリティであり、スケーラビリティは通常、データ品質とハードウェアとの関係において反比例します。
左側にはシミュレーションデータがあります——すべてがシミュレーション内で、ソフトウェア内で実行され、物理世界も物理ロボットもありません。シムからリアルへのギャップが若干あります。その後、自己中心的なデータがあります——本質的には眼の高さに置かれたカメラです。これも相当スケーラブルです。実装するのが超複雑ではないからです。しかし、通常、データがロボットアクチュエータとサーボシステムに直接マップされない可能性があるため、データ品質はそれほど高くありません。次に、ウェアラブルがあります。これはUmei——ユニバーサルオペレーティングインターフェイスによって推進されています。これは相当有用です。関節位置または任意の要因位置を取得でき、その後、物理と数学の演算を行うことでロボットにマップされることを確認できるからです。したがって、データ品質はかなり良好であり、相当スケーラブルです。最後に、スペクトラムの別の端にはテレオペレーションがあります。
遠隔操作――非常に高品質のデータです。実際のロボットが現場でデータを収集しているためですが、スケーラブルではありません。一対一だからです。そして、ロボットをあちこちに持ち運ぶのも少し面倒です。さて、理解モデル――データの理解について言及しています。有用なデプロイメントをどのように取得しますか?LLM 領域で有用なデプロイメントと有用な作業をどのように取得しますか?それはどのような様子ですか。ここで私は極度に簡略化しました。えっと、API コールのように見えますよね?明らかに、その下にはたくさんのことがありますが、ロボットについて考えてください。デプロイメントははるかに難しく、またはるかに困難です。人々はどのように問題に対処していますか――ロボット工学はこのような様子です。
LM アプローチ――データを取得し、計算を取得し、それを投入し、問題に投じます――事前学習と SFT によって、これは本当に本当に良い結果をもたらしました――最近のモデルは実験室で本当に素晴らしく、有望な結果を示しており、通常はシミュレーション データ、自己中心的なデータに依存しており、通常は世界モデルが関与しており、そしてそこにはたくさんありますが、ご存知のように、高品質の実験室評価があります。しかし、実験室だけでなく、現実世界でも、自律性ギャップをどのように実装し、解決するのでしょうか?私たちの主張は、商業環境にロボットを展開したいということです。これには 2 つのことがあります。まず、遠隔操作ロボットを展開する場合、実際に顧客のために本当に有用な作業を実行しています。正しいでしょう?したがって、この場合、T シャツを折りたたむことです。しかし、このプロセスは極めて有用なことをしています――ロボットが完了した作業に基づいて、非常に貴重なデータを収集しています。
LLM と自動運転から学んだように、最も価値のあるデータセットは本当に有用な作業の完了の副産物です。したがって、これにより第 1 ステップが進みました。実際に、Chenise がここにいて、私に水のボトルを与えることになっていましたが、デプロイメントは困難であり、今日は本当に機能しませんでした。しかし、私が言いたいのは、基本的に、毎回のデプロイメントは遠隔操作ロボットを実際のシーンに配置することから始めています。したがって、ここでこれらの人が衣服を折りたたんでいるのを見ることができますし、Daniel がそれがどのような様子かについてのライブ デモンストレーションを行っているのを見ることもできます。その上に、あなたが得るのは、ご存知のように、事前学習されたモデルと共に層状に積み重ねたものです。PI 0.5、Groot、Daniel がすでに共有しているいくつかのモデルについて考えてください。
そして、あなたが得るデータは基本的に、あなたが取得できる最高品質の具体化されたデータです。正しいでしょう?形態学が一致し、環境が一致し、タスクも一致しているため、あなたが最終的に取得するのは、実際に商業的に実行可能なロボットを展開するための非常に良い基本データセットです。そして、あなたはこれを覚えておく必要があります。これはすべて出発点に過ぎません。正しいでしょう?微調整を開始したら、実際の作業が始まります。第 2 段階が、この部屋の誰もが既に方法を知っている部分だと思います。えっと、遠隔操作データを取得し、それに対して教師あり微調整を実行し、あなたが既に知っているいくつかのモデルを使用できます。正しいでしょう?そして、あなたは約 80% の自律性を実現できます。私たちは皆、80% の自律性がどのような様子かを知っています。私たちは Twitter や多くのソーシャル プラットフォームでこれらを見てきました。
えっと、あなたが最終的に手に入れるのは非常に素敵なビデオで、いくつかのハイプがあり、ご存知のように、注目を集めたいときに、これはうまく機能します。しかし、現実世界に入り始めると、ここにたくさんの企業の人がいると確信していますが、80% は本番に十分ではありません。80% を得始めるとき、EVAL で 80% を聞くときと、本番に入り始めるとき、ご存知のように、これが顧客にとって本当に何を意味するのかを知っていますか?つまり、顧客の場所で 5 着の衣服のうち 1 着が床に落ちて、折りたたもうとするとき、正しいでしょう?それはまったく機能しません。したがって、今あなたが本当に持っているのは出荷できないギャップです。正しいでしょう?このギャップを自律性ギャップと呼びます。見ることができます――彼らは確かに最近のデモンストレーションを行いました。ロボットが小包を分類することについてのライブストリーム。
これは非常に印象的であり、彼らは 8 時間実行しましたが、彼らも問題に遭遇しました。そして、私たちは非常に特定のメカニズム――人間による介入、リアルタイム――大規模でこの問題を解決できると信じています。したがって、これは第 3 ステップにもたらしました――遠隔操作と人間による介入を加えたものです。用語がそれを言う方法があります。それは遠隔監督と呼ばれます。遠隔監督は基本的に、ロボットが誤りを犯すときに人が介入するという考えを含みます。微調整を実行してから、ロボットを自分でさせるだけで、誤りを犯すたびに反復し続けます。そして、私たちが今持っている遠隔操作の上限の問題をどのように解決するのか、遠隔監督を行いたいときはどうですか?まあ、私たちは一対一から一対多に拡大することから始めることができます。そして、これは新しいものではありません。自動運転の世界はしばらくの間これを行ってきました。
Waymo は遠隔監督の例を持っており、私たちは同じアプローチがロボット工学に拡張できると考えています。一方、遠隔遠隔操作があります。私たちは低遅延で帯域幅全体に遠隔操作を実装できる実行スタックを持っています。これはシンガポールからロンドンへのデモンストレーションの例です。あなたは今推測できます。シンガポールから米国、インドからシンガポール、中国からシンガポールのことができます。私たちのスタック上ではすべて 100 ミリ秒以下です。現在、企業にとって、これが重要なのは、デプロイメントは困難ですが、これは非常に必要です。ロボット工学の長い尾は現実世界に存在します。そして、その 80% は崖の端です。したがって、私たちが言いたいのは、デプロイメント レイヤーとして遠隔操作を使用し、あなたが行う必要がある退屈な、退屈な肉体労働と組み合わせることが、成功したデプロイメントの理由だということです。
そして、あなたがこれを行う必要がある方法は、異なる方法で考える必要があるということです。企業は研究実験室のように考えることはできません。実際に、あなたは根本的に異なる方法で考える必要があります。そして、あなたは出発点として遠隔操作から始める必要があります。その後、豊富なデータの収集を開始し、その後、商業的に実行可能なモデルとロボットの展開を開始します。これが最後にもたらしたものです。だから、これは Daniel と私がロボット会社で行っていることです。私たちは今日本当の仕事をしているロボットを展開し、同時に明日の自律ロボットのためのデータ エンジンを構築しています。だから、私たちについてもっと知りたければ、robot company.ai で私たちを見つけることができます。ありがとうございます。それは見事なデモでした。えっと、あなたが知っているように、これは単に野生のロボット展開がいかに複雑であるかの証拠だと思います。
だから、私たちは遠隔操作ロボットをどのように操作できるか、あなたが知っているように、人が実際に助けることができるようにしたかについて話しました。しかし、もしそれを迂回して直接脳に入ったら?この特定の部分では、Justin Bar について話しますが、彼は BCI――脳コンピュータ インターフェイスでどのようにこれを行うかを共有します。皆様、こんにちは。始まったばかりです。えっと、今日参加いただきありがとうございます。えっと、別の興味深いロボット実験をお見せします。すぐに到着します。しかし、彼らが接続している間に、先に始めます。次の 10 分間で、お見せするべきものがたくさんあります。えっと、準備してください。しかし、もう一度、皆様、ありがとうございます。シンガポールでこれを実現できて感謝しています。つまり、AI です。Jack がシンガポールに来たのは素晴らしいですし、Agram と Sherry、そして 65 Lab チームがすべてを一緒に集めることができたのは素晴らしいです。あなたが置きたければ置いてください。
えっと、あなたがちょうど最小化したそれ。あなたはそれを得ましたか?それとも、あなたはしていませんか?>> ちょっと待ってください。展開された。>> はい、展開されました。これは展開されたものです。展開されました。>> 今あなたはそれを持っています。>> わかりました。3、2、1。わかりました。ありがとうございます。では、Tessact の一部として、私たちはシステムを構築しました。私たちはこれを Tessact.art と呼びます。えっと、私たちがこれで行っているのは、人々が AI を通じて自分自身を表現することを許可するシステムを構築したということです。これは実演の現場音楽パフォーマンスを行い、その現場音楽パフォーマンスを絵画に変えることから始まりました。えっと、しかしそれ以来、私たちはこれをさらに進めています。だから、私は Kaiming に叫びたいです。Kaiming、一緒に出てきていただけますか。いくつかのデバイスをロールアウトしていきます。ありがとうございます。えっと、皆様、私は単に Kai Ming を紹介したいです。
えっと、一緒に興味深く特別なことをしました。ありがとうございます。そう、過去 2 年間で、皆様、できればロールアウトしていただければ――ロールアウトしていただきます。申し訳ありません。ロールアウトしているものがたくさんあります。申し訳ありません。手伝ってロールアウトしていただけますか?ありがとうございます。わかりました。申し訳ありません。10 分のスピーチのようなもので、完全なロボット システム、絵画、その他すべてのものがあるとき、これはかなり難しいです。それで、このプロセスを進める間、少しお待ちください。しかし、えっと、ご覧のように、私たちがロールアウトしているのは、テソラクト.org と呼ぶシステムです。Tessa は何ですか――ロボット アーム、Tessa、ロボット アーム、過去 2~3 年間、えっと、いくつかの協力者と一緒に開発してきたものです。えっと、私の協力者、Richard Savory 博士です。
私は約 3 年前にこれを開始しました。ロボットを多モーダル AI と一緒に使用でき、ある創造的な形式を別の形式に変えることができるシステムを構築したかったのです。これが私たちが開始した場所です。つまり、音楽を一緒に持ってくることでした。そして、私たちがこれで行っていることは本当に人の想像力を取り、それをインテリジェント システムを通して拡張することです。これが今日私たちが行っていることの意図です。さて、舞台上に他に何があるか、Jackie もここにいます。>> Mind Interface Company からですね。>> そして、Ivy も一緒にいます。彼女も Tessact から来ました。そして、Ivy、私はあなたに上来て手伝うようにお願いするかもしれません。
だから、Kaiming の場合、私たちが行ったことは、舞台上でライブで見たことですが、Kaiming が彼女の顔に描いた絵に初めて脳制御を使用しました。ですから、後ろの人たち、見るのは難しいかもしれませんが、彼女は実際にえっと前を通過するヘッドバンドを着用しています。えっと、これは Muse です――観客の中に Muse ヘッドバンドを知っている人がいれば。しかし、この技術が現在到達した点が非常に素晴らしく、驚くべき点は、2 時間かかったり、ヘッドセットを装着したり、すべての高価な機器を装着する必要がないということです。これを直接装着することができ、Kaiming は、制御インターフェイスの観点から彼女が何をしたいのかを考えるだけで、実際に絵を描くことで物事が起こります。えっと、だから、Kaiming、私は何か――あなたにいくつかの質問をするのが好きです。
まあ、今日どのようにしてここに来たかについて、私たちに少し教えていただけますか。>> わかりました。えっと、こんにちは。だから、私は Kaiming です。えっと、私は ALS 症候群と呼ばれる症状があります。だから、私は Red Disorders えっと、シンガポール協会の一部です。Justin はそれと一緒に働いています。えっと、私は AI 政策研究者であり、はい、それが私たちがどのように知り合ったかです。>> はい。では、えっと、過去に何か美術作品をしていますね。えっと、そして、えっと、今私たちができることは、AI と私たちの多モーダル システムを使用して、このプロセスを通して、あなたの創造性の一部を戻すことです。だから、私たちが計画しているのは、私たちはずっと絵を描いてきました。たぶん、あなたはこの絵についてもう少し教えていただけますか。>> 続けたいですか?>> 持ってもらえますか?>> はい。はい、問題ありません。ありがとうございます。だから、はい、小さいころから絵を描き始めました。祖父と妹と一緒に、彼らもアーティストです。
えっと、これは本当に私を世界とつなぎました。えっと、私の症状は私が手の器用さを大きく失うことになりました。それで、私はもはや書くことができず、今も少し書くことができません。それで、私はもはや絵を描くことができなくなりました。私は人類学に入りました。何らかの方法でそれを通じて生きることを望んでいました。それが私が AI 政策に終わった方法です。しかし、ご存知のように、私は手のために泣きました。私は情熱のために泣きました。突然このアウトレットがあります。これは本当に素晴らしいです。それはちょうど人生に戻されたようなものです。>> それは素晴らしい。ありがとうございます。ありがとうございます。はい。わかりました。では、現在、私たちが待っていた時点は、実際に見ることができるかどうかです――そうです。実際に持ってきました。私たちはこの全体が過去 1 ヶ月の間に集約されました。だから、えっと Kaiming に最後の行を完了してみるようにするつもりです。
では、この絵はRDSSのHopeナマケモノの絵です。これについて話したいですか?」「ああ、はい。」「ですから、Hopeは2本の指だけで生まれたナマケモノです。シンガポール動物園に住んでいて、私たちに少し似ています。私たちはゆっくり着実に生活しています。ええ、これはああ、Hopeはこれを愛するコードは小さな指の周りの絵です。そして、ええ、これら2つはあなたが心臓と翼の色で見るでしょう。それは両親です。私たちああ、あなたが知っています。私たちをサポートしています。ああ、赤は希少疾患の子どもです、ああそうです。」「はい。ですから、希望に満ちたナマケモノです。では、試してみましょう。準備はいいですか?いいですね。では、ああ、おそらくあなたは私たちにここの概念について教えてくれることができます。心臓があります。周りは、はい。」「はい。」
ですから、この心臓、あなたが知っているように、1本は父です、1本は母です。なぜなら、あなたが知っているように、私たちはしばしば忘れています。私たちのコミュニティの両親がどのくらい希少疾患を持つ患者をサポートしているか。彼らはそれほど多くのことをしました。これは本当に素晴らしいです。あなたが知っているように、私は本当に感謝したいです。Justinとチームはこれをもう一度もたらしてくれました。この自由と自律性を。私たちが人生でしたいことをすることができるという自由と自律性。はい、ありがとうございます。本当にありがとうございます。
そして、実は、私たちはまだ3分あることに非常に驚きました。私たちの会話を終わらせるために、これは素晴らしいです。とにかく。ですから、私は本当にこれが鼓舞するもののうちの1つになったと思います。そして、私は考えます、これは重要なメッセージである何かです。私は本当にあなたに、あなたが知っているように、すべての人がこれを初めて見るために、ああ非常に重要です、これはああ私たちがこのプロセスを始めたと思います。AIを使用して、ああ、人々に創造的なスーパーパワーを与えるために、対吧?私たちが望むことはAIが創造性を奪うことではありません。私たちは、AIが人々にスーパーパワーを与えることを望みます。AIスーパーパワー、創造性と楽しいもの。そして、私たちは音楽でそれをしました。そして、私たちが今していることは、脳制御インターフェースに向かうことです。そして、このワイヤレスシステムを起こすことができます。しかし、あなたは例えば、創造性は何かを尋ねることができます。これは素晴らしいです。これは自己表現の一部です。
これはああ、あなたが知っているようにします。これは非常に人間らしいことです。自分自身を表現することができます。この通信形式を持つこと。しかし、さらに鼓舞するものは、私は1つの事だけを見せたいと思います。ああこれはまたあります。さらに鼓舞するものは、私たちはこの技術で何ができるかということです。ああ私たちはAIが人々の仕事を奪うについて話しています。ああ、私はこれからとあります私たちの協力から見るのは、私たちが人々のために新しい雇用機会を作りました。おそらく障害があるために、またはおそらく他の人のように動くことができないために、雇用されることができなかった。ですから、今、この技術が開発するとき、これは本当にこれらのことが起こるようにするための開始です。
私たちは雇用ああ物になるのを見ることができます。なぜなら、私たちはAIが必要ああ、あなたが知っているようにします。AIは今日のこれらのシステムの大部分ではループの人を必要とします、対吧?ですから、あなたはAIが何かをする機会を提供する何かであると思うことができるなら、あなた知っています、言わば、これはダークファクトリーです。それは完全に自動化されています。しかし、それを監視する人が必要があります。何かをするために人が必要があります。単に今日、このプロセスを通じて、私は発見しました。ああ非常に特別なああ場所、ああ申し訳ありません、それはああ非常に特別な場所を建てた日本ああこれはすでに起こりました。昨日ちょうど発見しました。ですから、これは化身ああ化身ロボットカフェです。しかし、このケースで面白いのはロボットああ完全に物事を管理しています。しかし、これらのロボットで動作する人がいます。そして、ロボットは顧客にサービスを提供しています。
ロボットは顧客にサービスを提供しています。しかし、彼らは実際にああ彼らはベッドを離れることができない人を雇っています。または家を離れるああ実際に有利な雇用を有するために。ですから、私はこれが良い完全な使用例の例だと思います。ああ機会、この技術は時間をかけて提示することができます。ですから、私はこれが本当に驚きと鼓舞するああ機会だと思います。人工知能がどのように完全に新しい機会を開くかを考えるために。新しい労働力ああおそらく過去に雇用されることができなかった人々のため。とにかく、非常にありがとうございます。本当にああ私たちを持つことができるようになること。AIエンジニアの一部。ああありがとうああJackieああ脳インターフェースを可能にするため。ええ、終わりの言葉がありますか?
私は私たちが皆、恐れと金を追いかけるすべてから休憩が必要だと思います。何かより肯定的なもので。」「非常にありがとうございます。皆さんありがとうございます。AIエンジニアをありがとうございます。鑑賞。ありがとうございます。」「ステージを降りるのを手伝いたいですか?あなたが良いについて話しているか確認してください。それは驚くべき講演でした。特に人工知能の終末と不幸の中で、これはそんなに希望を提供しました。ですから、私たちはあなたがBCIをどのように使用するかを見てきました。そして、次の講演のために、私たちはBifrostのArvinを持つでしょう。彼らは合成壁を建てて、モデルをトレーニングします。彼らは世界中のいくつかの最大のロボット会社と協力してきました。火星に着陸するロボットのようなことをするのを手伝うために。彼らはSeqiaによってサポートされています。また、CIA秘密ベンチャーファンドによってもサポートされています。
本当に素晴らしい事実は、以前のロボット会社とBifrostの両方がシンガポールで開始、孵化、そして本当に生まれたシンガポール企業です。そして、本当にArvinがステージに上がることを喜ばしく思います。素晴らしい。残念ながら、私はあなたに素晴らしいロボットデモがありません。しかし、それは非常に驚くべきでした。ええ、皆さんこんにちは。私はArvinです、BifrostのCTOと共同創業者。そして、今日、私はロボットの状態について少し共有します、対吧?私は確信しています。あなたはオンラインで多くの素晴らしいビデオを見たでしょう。あなたが知っているように、ロボットは旧正月を踊り、バック フリップをしたり、すべてのこれらの素晴らしいことをしたりします。しかし、一方で、あなたはロボットが多くの奇妙で厄介なことをしているのを見ます。彼らは鏡に走っています。ただ多くの混乱を引き起こしているだけです。対吧?
そして、残念なことに、これは私たちが考えるロボット開発ギャップです。対吧?本質的に、起こるのは、あなたが実験室で本当に本当に良いパフォーマンスを得ることです。対吧?それはすべてのこれらのクレイジーなことをすることができます。しかし、あなたが実際にそれらを実際の世界に展開するとき、あなたが見つけるのはこれらのモデルのパフォーマンスが非常に非常に厳しく減少することです。対吧?さて、この展開ギャップが実際に存在するのはなぜですか?ですから、あなたが画面上で見ているもの。私は今日多くのチャートがないことを保証します。しかし2つのチャートがあります。これは最初のものです。ああ、あなたが見るのはx軸上にあるのはすべての異なるタイプのシナリオです。対吧?そして、これはああ、あなた知っています。あなたのトレーニングデータ、あなたのテストデータ、そして好きなあなたの展開データ。そして、y軸にはあなたのトレーニングデータ内のシナリオの数のようなものです。対吧?
ですから、あなたが出かけるとき、あなた知っています。あなたは多くのトレーニングデータを収集します。これは通常、分布がどのように見えるかのようです。ああ、もちろん、これは簡素化されています。その後、あなたはあなたのテスト分布を持っていますね?ですから、あなたはトレーニングデータセットを持っています。あなたはテストデータセットを持っています。いくつかの重複がありますが、彼らが重複しない場所もあります。そして、あなたが実際にあなたのロボットを展開するとき、あなたが見つけるのは、それが実際に遭遇する環境のタイプとすべての異なる条件が、それが実験室で起こるのと実際に非常に異なることです。実験室では、すべてが非常にきれいで、非常に組織されています。しかし、現実の世界では、多くの動的な混乱があります。人が場面に歩くのように。鏡の反射のように。カメラのフレアのように。
これらすべては私たちが考える分布外のシナリオであり、これはロボットが失敗する場所です。対吧?ですから、あなた知っています。ほとんどの人は言うでしょう。たとえば。ああ、それにもっとデータを投げましょう。好きなように。あなた知っています。苦い薬の教訓。もっとデータを投げるだけです。それはより良くなるはずです。しかし、現実はあなたが実際にロボットシステムから収集する多くのデータ、彼らは実際に空のカロリーと考えられています。対吧?なぜなら、彼らは新しい余分な信号を追加していないから。多くの場合、あなたは同じシナリオを何度も何度も収集しています。自動運転車が高速道路を走行することを考えてください。あなたはより多くの高速道路シナリオが必要ではありません。あなたが必要なのはより多くのエッジケースシナリオです。これはああ牛は複雑な交差点を通り抜けるのような。プラスチック袋はちょうどあなたの後視鏡の前にあります。あなたが駐車スペースにバックアップするとき。対吧?
これらはあなたが実際に望む物です。対吧?ですから、現実では、あなたがこれらのシステムをテストできるようにしたいとき、あなたはちょうど小さい分布または小さい種類のテストが必要ではありません。あなたが必要な能力は、例えば内側に入ることです。すべてのこれらの異なるタイプの分布を取得し、できるだけ多くのシナリオをカバーしてください。ですから、好きなすべての照明条件。異なるああシナリオの空間レイアウト。対吧?しかし、これを取得するのは本当に本当に難しいです。あなたが出来るなら、あなたはああ現場での失敗が起こるのを防ぐことができます。これはこれがまったく厄介になります。なぜなら、今、私たちは一般的なポリシーの時代に入っています。あらゆることをすることができるロボットを約束します。食器洗い機を装填することから、洗濯物を折りたたむことから、医学、医療、科学でさえ何かをすることまで。
そして、今、あなたがこれらのシステムを検証したいとき、それはより厄介になります。対吧?ですから、現場では、私たちは非常にシンプルなああ方法を持っています。彼らが好きに本質的に好きな信頼性スコアのような方法。そして、これはこれはこれはこれです。人々がロボットを展開することを考えるとき、ほとんどの人が気になることは、私が実際の世界にこれらのシステムを展開するとき、実際の信頼性は何です。そして、信頼性は本当に好きです。成功率、これはああ私がこのタスクを100回やっていたら、私はいくつの時間を正しくしますか?そして、あなたはそれをもやっています。すべてのあなたがあなたのロボットのために送ることができる異なるシナリオ。対吧?ですから、あなたがようにしたいなら、千の異なるシナリオを処理することができます。あなたはこれを千回千回やる必要があります。それは非常に非常に速く拡張されます。対吧。そして、これらすべての会社は今競争しています。
彼らは競争しています。競合他社よりも速く、市場よりも速く、より速くどのようにより速い信頼性を達成できるかに向かって。そして、彼らは信頼性自体のようなスケーリングの法則を見つけたいのです。対吧?ですから、彼らがロボットをテストする第1の方法はかなり直接的です。私は確信しています。あなたは何か講演を聞きました。あなた知っています。彼らは手動でステージします。彼らは人間を得ます。彼らはロボットを得ます。彼らはリアルタイムでそれをすべてやっています。対吧?彼らは手動でシナリオを設定します。彼らは実際にロボットにこれをさせます。しかし、このケースでは、あなたが実際にテストできるシナリオの数は、人間、ロボット、時間によってボトルネックを制限されています。対吧?ですから、あなたが実際にそれをチャートに置いたとき、これは異なるチャートですが、下のaxis下で、あなたは計算を見ます。他のaxisで、あなたは信頼性を見ます。
毎回あなたは推論をするたびに、あなたはいくつかの計算を過ごします。しかし、あなたはまだボトルネックを制限されています。あなたが持っている人の数によって。あなたが持っているロボットの数。そして、あなたが持っている現実世界の時間。結果として、あなたはまだああ直線的に拡張します。対吧?しかし、その後、人々は周りを歩いていきます。好きな。よし、いや。あなた知っています。いくつかの異なるテストケースをサンプリングしよう。私は何か追加の新しいテストを得ることができます。これは良いです。しかし、非常に良いわけではありません。なぜなら、彼らはまだ手動でたくさんしているので、あなたは多くの分布を得ることができません。そして、その後、人々は言います。よし。あなた知っています。もし、評価サイクルから人間を削除したらどうですか?対吧?ですから、今、人々はGeminiのようなものを使用しています。
つまり、Geminiロボットでは、シナリオを見ることができ、定性的フィードバック――つまり、実際にタスクを成功裏に完了したかどうか、どの程度進んだか――などを提供することができます。また、別の大きなビジュアル言語モデルまたはビジュアルアクションモデルを使用してシナリオを自動リセットできるものもあります。そうですね。つまり、彼らは人間を排除しましたが、それでも、保有するロボット数と必要な時間によってボトルネックの制約を受けます。そうですね。したがって、これはやや高速化されます。今では、もう少し計算を費やして高速化できるため、人間に頼る必要がありませんが、それでも線形でスケールします。そうですね。つまり、ほんの少し、さらにいくつかのテストを実施することができます。
そして、もちろん、ご存知のように、あのう、ご存知のように、実世界で橋を建設する場合、まずシミュレーションで試験してから、橋を建設します。力学と、ええと、張力のようなもののための全体的なシミュレーションを行います。ロボットについても同じことをしないのはなぜですか?
ロボット工学には「シムツーリアルギャップ」と呼ばれるものがあります。これはシミュレーション内で何かを行う場合、それが必ずしも現実と一致しないということです。そうですね。これは業界が解決しようとしている大きな問題であり、驚くべきことに昨年、これを解決するための多くの新しい方法がありました。私たちが行っている最大のものは、実は現実世界を使ってシミュレータ自体を生成することです。つまり、これが実際にどのように見えるかというと、実世界データを取得することができます。そうですね。つまり、実世界データを取得して、その実世界データから何かを生成することができ、それからその情報から世界を再シミュレートできます。そうですね。つまり、この全体的な考え方では、毎回、特定のドメインと特定の内容のための同様のシミュレータを生成しています。そうですね。単なるオブジェクトではありません。特定のドメイン用の世界全体を生成できます。
例えば、カリフォルニア砂漠で走行しているオフロード自動運転車がある場合、仮想世界全体をすばやく生成し、そのシミュレーション内で訓練することができます。そうですね。これがシミュレーションと現実のギャップを狭める方法です。これを行うと、実際のテストセットの分布を複製し、そのシミュレートされたバージョンを持つことができます。これはすでに非常に価値があります。なぜなら、この分布で閉ループテストを実行できるからです。しかし、どのようにさらに推し進めるのか、そうですね。これは非常に良好なカバレッジではありません。そうですね。具体的なシナリオを見てみましょう。これは生成するデータタイプの例です。ご存知のように、ここは船が混雑した桟橋に向かって進行しているようなものです。画面に眩しさが、ああ、カメラに眩しさがあります。すべてが少し混乱していますね。しかし、これは単なる1つの具体的なシナリオです。
では、どのようにしてそれをより多くのシナリオに拡張するのですか、ですね?そういうわけで、実際に我々ができることはシミュレーターに入り、すべての異なる実行条件にわたってパラメータスキャンを実行することです。つまり、非常に非常に素早く千の異なる現実を見ており、それらすべての異なる現実に対してモデルをテストしているようなものです。えっと、同時に進行します、ですね?そこからさらにそれを拡張することができます、ですね?ですから、これは単なるn×nテストではないのです。それを多くの異なるドメインと標準に拡張することができます。このアスペクトの素晴らしいところは、あなたがそれに基づいてあなたのAIモデルをテストできるということです。あなたのAIモデルがどこで失敗するかをすぐに見ることができます。ロボットを本番環境に出荷する前でさえ。ここでの全体的な考え方は単純です、ですね?シミュレーション内で迅速に失敗し、これらの失敗を活用して、実世界のテストに使用します。
ですから、あなたはすべてをテストしているのではなく、非常に具体的な場所で、あなたがシミュレーション内で失敗した場所をテストしているのです。このようにして、あなたはより少ないキャピタルを費やし、あなたが持っているリソースに対してより最適化され効率的です。そしてあなたが知っているように、我々は現実世界の時間にも限定されています、ですね?ですね?ですから、我々はこれからこれに移動します。なぜなら、今、我々はより多く、より幅広い領域をカバーできるからです。ドメインランダミゼーションという用語がありますが、基本的に、あなたがカバーしている領域は、真のデータがカバーできる可能性のある範囲よりもはるかに広いです。これは、これらのテストを実行するための非常に良い方法です。あなたが知っているように、私は確実に、すべての人が「データフライホイール」と呼ばれるそのようなものを見たことがあると思います。それは梗になってしまいました。すべての企業が『はい、我々はデータフライホイールを持っています。』のようなものです。しかし、フライホイールは実際には最も重要なものをキャプチャしていません。
そして最も重要なのは、あなたが実際にこのデータを洗練する必要があるということです。データは非常に高い品質である必要があります。あなたが最も価値のあるものを探しており、また、現実世界で何を収集すべきかを推し進めることができるような方法を考え出す必要があります、ですね?Bifrostでは、我々は世界中の最も厳格なクライアントの一部が大規模にこれを行うのを支援しています。我々は基本的に、これらすべてを取り入れ、あなたのブラウザー内でそれをシミュレートしています。ですから、我々は世界を持っており、あなたはこの世界をシミュレートでき、あなたはその中であなたのAIモデルを破壊することができます。ありがとうございました。それは素晴らしいスピーチでした。データ精製のようなものについて議論していたことが特に良かったです。データ精製はあなたのデータがすべての異なるエッジケースをカバーしていることを確認するようとしています。
ですから、私は次に、Open Graph Labsの Julia Kimを招待して、彼女がどのようにして、多くの異なるマルチモーダル同期データ収集をあなたが実施できるようにする内部技術スタックを構築したかについて議論してもらうことに興奮しています。これは本当に困難です。なぜなら、マイクロ秒レベルのドリフトさえも、ロボットのトレーニング用にデータを収集しているときに、実際にこれを取り入れてモデルをトレーニングするときに、真の損害をもたらす可能性があるからです。ですから、私は本当に、これがどうなるかを見ることに興奮しています。えっと、我々がこれらの技術的な困難の束に遭遇するとき、あなたが知っているように、私は今日の会議について皆さんがどう感じているかを知りたいです。あなたが知っているように、個人的に、これは私にとって絶対に驚くべきものです。さきほど、Justinが脳-コンピューター・インターフェースのようなもので描画する能力を実演していたとき、私は本当に衝撃を受けました。
「まるで、それが可能だと思ったことがなくて、ずっとエージェントと大量の試験をしてきたからです、そうですね。見ていて、なんか、テキストイン・テキストアウト、ああもう、なんか、あのね、えっと、皆さんの仕事は自動化されることになります。人工知能が善いことのために使われているのを見るのは本当にクールで、また非常に鼓舞されます。だから、なんか、それはいつも興奮することだと思うんです。人々が取り組んでいる視点とプロジェクトの絶対的な多様性を見ることです。そんな感じだと思います。>> えっと、チームとして、えっと、スピーカーとスポンサーが構築した多くのツール、えっと、を使用しました。えっと、だからそれを記録します。あ、わかりました。戻ってきたと思います。はい。>> ドラッグしてください。はい、これは拡張です。だから、>> 先ほど持ってました。>> あ、戻ってきました。戻ってきました。>> はい。わかりました。いいですね。>> ありがとうございます。>> やあ。皆さん、こんにちは。>> 皆さん、こんにちは。」
「えっと、私の名前はジュリアで、Open Grab Labsの共同創業者兼共同最高経営責任者です。えっと、今日は、私たちの日常的な人間経験がどのように実際には次世代の人型ロボットのための有用なトレーニングデータになることができるかについて、お話ししたいと思います。では、「ファーストパースンデータ」という用語を聞いたことがある人はどのくらいいますか?はい、何人かがいると見ることができます。あるいは、最近、アプリケーション内でこのホットビデオを見たかもしれません。工場の労働者が仕事中に帽子にカメラを装着しています。えっと。では、過去1年間で、この分野で非常に奇妙なことが起こりました。数百社の企業が大規模に人間の行動データを収集し始めました。人々は一人称の視点でビデオを録画し、えっと、カメラが彼らの日常的なタスクを記録している間に、実際にそうすることで報酬を得ました。では、なぜ私たちはこれをするのでしょうか?では、なぜ人間は突然、ロボット工学のコアデータセットになったのでしょうか?これは、それが確かに機能するという証拠をちょうど得たからです。」
「NVIDIAは最近、自己スケーリングに関する研究を発表して、人間のファーストパースンデータのスケーリングが実際にはロボット訓練に役立つことを示しています。だから彼らは実際に、人間の一人称ビデオをモデルの事前学習、事前学習データセットとして使用し、人間-ロボット-アラインメントデータセット上で微調整しました。また、いくつかの遠隔操作、えっと、ロボットのみのデータもあります。ロボットは実際にタスクを完了できます。例えば、ワンショット転送で衣服を折ることのような。言語モデルのように、えっと、用いて、より多くのデータを投入することでスケーリングしても、彼らはまた、えっと、これが物理的なAIに対しても実行可能であることを示しました。だから、それは著しいスケーリング則を示しました。事前学習に対して有用であることが証明されたというだけでなく、ただ、本当のところ、一人称の人間ビデオは根本的に2つの側面で非常に重要です。まず、私たちは現在、人間レベルの能力を持つロボットを構築しています。」
「それは同じ形状因子を意味します。彼らは私たちのように見えます。自由度も似ています。これは、人間と人型ロボット間の具体的な差異を最小化しようとしていることを意味します。実際、差異が非常に急速に縮まっています。そして、差異が、差異が縮まるにつれて、人間の行動が実際に直接ロボットに転移できます。これは世界で最も直接的な監督信号です、えっと、第二に、ファーストパースンデータは実世界で捉えられています。なぜなら、それは実際にはそうだからです。物理世界は、私たちが知っているように、連続的です。えっと、それは動的であり、物理的に基礎付けられています。だから、私たちがファーストパースンデータから得るすべてのデータは実際に非常に非常に高いフィデリティデータです。えっと、それはどのロボットでも学ぶかもしれないより多くの情報を含んでいます。しかし、その時、えっと、私たちは本当に終わりましたか?」
「えっと、私たちはより多くの一人称ビデオデータを持つことができます。私たちはより多くの問題を解決することができます。えっと、だから単に十分な人間ビデオデータを収集することで、いくつかは悪いですが、ロボットは最終的に人間レベルの物理的知能に達するでしょうか、それともそうでないでしょうか。まあ、私はこれが実際には向かっている未来によって異なると思います。その未来はロボットが必要かもしれない知能レベルを定義しています。だから、一つの未来はロボットをユーティリティとして使うことです。だから、倉庫内のツール、工場内のロボットアーム、タスクを完了するマシンですが、彼らは私たちと空間を共有しません。別の未来は、ロボットが実際に私たちと一緒に生活することです。彼らは私たちの家で私たちの衣服を折ります。これはまた、私たちの両親と一緒にいるのを助けます。彼らは私たちに水のコップを渡します。」
「あ、これは彼らが実際に世界を私たちと共有することを意味します。そして、もし私たちが彼らが私たちと一緒に生活することを望むなら、彼らは物理的知能を持つ必要があります。だから、彼らは私たちと同じ方法でこれらのことを学ぶ必要があります。では、いくつかの非常に基本的なことに戻りましょう。あ、私たちが赤ちゃんの時に最初にこれらのことをどのように学んだかについて考えてみましょう。私たちは物を掴み、物を押し、物を落とし、物に触れ、物を引きました。時々、しばしば、私たちは物を口に入れて味わいました。私たちはそれと相互作用することで学びました。触れることで、そして観察することで、それが私のアクションの後、実際にどのように反応するかを学びました。動作とフィードバック。これは、私たちが感覚運動学習と呼ぶものです。」
「では、自然な質問が続きます。人間の感覚運動学習そのものが私たちの物理的知能を形成する基盤であるなら、ロボットに対して同じことができたらどうでしょう。私たちはロボットに、私たちが赤ちゃんの時に学んだのと同じ方法で学ぶようにさせます。だから、再び、このベビーは前のスライドのベビーと同じで、実際にはすべてのこれらの感覚運動シグナルをワンショットで生成しています。視覚、触覚、本体感覚、聴覚、動作とフィードバックループ。これらの相互作用を通じて、赤ちゃんは段階的に物理世界の構造を学びます。だから質問は、私たちがすべてのこのデータをキャプチャでき、ロボット工学のためのトレーニングデータセットとして使用できたら、私たちはロボットが完全に私たちのように真似て、その上に基づいてすべてを学ぶことができるようになります。はい、私は本当にその未来を信じており、私たちはそれを人間をセンサー化することで実現できます。」
今日、人間の感覚運動回路の多くの部分が非常に測定可能なものになっています。第一人称カメラによって視覚システムをキャプチャしてきました。ビデオから直接運動情報を再構築することもでき、3D手部姿勢、手首姿勢、身体の運動軌跡といった固有受容覚もビデオから再構築することができます。さらに、音声もカメラシステムを通じて自然にキャプチャすることができます。ですから、今、明らかなことは、欠けている重要な感覚チャネルが1つだけあるということです。それは触覚です。物理的な相互作用のために、触覚は私たちが現実世界から収集すべき最も重要なシグナルである可能性があることを、私たちは皆知っています。
今日、触覚データを非常に少ししか持っていない1つの理由は、他の多くの人間のシグナルが既に第一人称の視点だけから推断できるようになったからです。つまり、第一人称の映像です。ですから、第一人称カメラを通じて、運動軌跡、手部姿勢、身体の運動、動作の構造、さらには固有受容覚さえも推断することができます。正直に言うと、今はカメラハードウェアシステムの数十年にわたる進歩と、標準化されたRGBシステムの上に構築された生態系全体に感謝すべき時です。なぜなら、世界がRGBカメラの周りに集約されると、コンピュータビジョンがスケーラブルになり、今、私たちは触覚がその瞬間を迎えるのを待っているからです。なぜなら、触覚はこれまでそのような瞬間を持ったことがないからです。ですから、ビデオシステムがどのように改善され、どのように拡張されるかに従う必要があります。なぜなら、それらはカメラとRGBピクセルという1つのもの周りに集約されるからです。
統一されたハードウェアスタックも必要です。すべての人がこれで触覚データを構築できるもの、および同じデータ形式を共有するデータインフラストラクチャです。これが私たちが存在する理由です。Open Grab Labsはここで、感覚運動システムで不足している部分——触覚——の標準を確立するためにあり、こうすることで私たちは最終的にロボティクス学習で飛躍することができます。私たちはこれを2つの主要なレイヤーで実現しています。第1に、指先から高忠実度の接触シグナルを生成できる高度にスケーラブルなハードウェア。第2に触覚エンコーダー。これはこのハードウェアの上に構築されたインタープリターで、触覚シグナルを取り込み、それを意味に変換します。
高度にスケーラブルなハードウェアを通じて、スケーラブルなデータセットをキャプチャでき、これらのデータセット上で、今、意味のある触覚エンコーダーを構築することができます。ですから私たちはちょうど初めて、完全な人間の感覚運動回路キャプチャパイプラインを確立し、訓練可能にするために開始しました。数千人、数百万のインタラクション。人間と物理的相互作用の間のすべての接触の瞬間が、今、キャプチャされ、デジタル化され、次世代のロボットに教えられるために準備されます。人間をセンサー化することで、人間の感覚を訓練しましょう。ありがとうございました。人間の触覚データ収集を拡張することに関するこの議論は素晴らしかった。さて、実際にデータを収集することの巨大な部分は、実は、私たちがデータ操作を拡張する必要があるということですね。私たちは単にデータを収集するだけではないのです。
操作者を確保し、インフラストラクチャ全体と物流処理を持つ必要があります。ですから、私たちはCortexのSuinを持っており、彼らはロボットと他の形式のデータを通じて、スケール化した方法でこれをどのように行うかについて大量に議論しています。皆さん、こんにちは。私はSuinです。私はCortex AIから来ており、そこの創設エンジニアです。今日、これらのロボットに実行させた本当にクールなこと、私たちが直面したいくつかの課題、および私たちが学んだいくつかの教訓について議論します。ここで、私たちが協力したいくつかのロボットを見ることができます。私たちは主に双腕ロボットを使用して操作タスクを実行し、より現実的な環境である便利店などで移動ロボットを使用してタスクを実行することもあります。これらのロボットがどのようにそんなに賢くなったのか疑問に思うかもしれません。この動画でさえ、最後の一滴の牛乳をカップに注いでいるのを見ることができます。
実際、これらの学習システムはピクセルを受け取り、アクションを出力するだけです。通常、トップカメラと手首カメラがあります。ロボットの関節データも渡します。シンプルな言語指令です。その後、モデルがいくつかのアクションを予測します。ロボット上でアクションを実行します。次の状態に入り、ループが続きます。このチャートは実に、現代のロボティクス学習スタックを考える素晴らしい方法です。カメラバンドルと関節がデータとしてあります。ソフトウェアはデータ収集、訓練、推論を駆動します。ハードウェアはアームとカメラです。モデルは私たちが実行するポリシーモデルです。これらのポリシーが機能するかどうかをテストするには、評価が必要です。これすべてが再び起こるためには、良い操作層が必要です。
ロボティクスは通常、ハードウェアの問題、ソフトウェアの問題、またはモデルの問題として見なされていますが、それは巨大なデータと操作の問題でもあります。最近、私たちはAlen人工知能研究所と彼らのMulmoact2論文で協力し、彼らのデータセット用に700時間以上の双腕ロボットデータを収集しました。それは今までのところ最大のオープンソース双腕データセットです。私たちはテレオペレーションを通じてデータを収集しました。ここで、私の同僚がマスターアームと呼ぶものを制御しているのを見ることができ、スレーブアームがモーションを複製します。楽しく見えますが、実は非常に難しいです。主な理由は人間の直感です。それは実際には新しい体現形式にはよく転移しません。あなたは手でカップをつかむ方法を知っています。しかし、ロボットアームを通じて考える必要があるとき、あなたは知りません。これは本当に難しいです。しかし、それは学習可能なスキルです。
さらに、データ収集を開始する前にやることがたくさんあります。タオルを折るのような最も単純なタスクでも、2つに折ることもできますし、3つに折ることもできます。タスク戦略を考え出さなければなりません。その後、動きを練習する必要があります。次に、収集されたデータがエピソード全体と異なるオペレーター間で一貫していることを確認する必要があります。これらのデータ操作を数百時間に拡張し始めたとき、私たちが追加した小さなワークフロー変更のいくつかに気付きました。それらは複合し始めました。当初、各エピソードのエンコーディングは2~3分の待機摩擦を必要としていました。その後、エンコーディングプロセスをセッションの最後に移動しました。その後、突然、エンコーディング全体の継続時間ははるかに長くなりました。今、次のセッションを開始するためには、30~40分待つ必要があります。
その後、私たちが行ったのは、非常に小さなコード変更を実施することでした。すべてのハードウェア接続を切断しました。こうすることで、前のセグメントで既にエンコードされている間に、新しいセッションを実行することができます。最終的に起こったことは、データ収集、エンコーディング、アップロードのプロセスが完全に疎結合になったことです。もう1つ話したいのは、ロボット工学における「呼吸」の重要性です。私が「呼吸」と言うのは、技術スタックの異なるレイヤー間で知識を持ち、ロボットスタック内で上下に移動できることを意味しています。このように言う理由は、問題空間とソリューション空間がほとんどの場合、同じレイヤーにない可能性があることに気付いたからです。異なるレイヤーについて直感的に理解するほど、問題を解決するのが速くなります。これを説明するために、いくつかの例を使いましょう。
ですから、これらのロボットアームで戦略を実行し始める際に、ロボットが缶をつかむ必要があるタスクがありました。しかし、グリッパーが壊れており、ビデオでグリッパーが飛び出す様子を見ることができます。私は、うーん、モデルが何か間違ったことを学んだのか、またはコードからグリッパーの力を減らすことができるのかと考えました。しかし、同僚は「まあ、グリッパーを自分たちで設計しましょう」と言いました。その時、サードパーティのハードウェアを使用していましたが、それに基づいて革新することはできました。これは、ソフトウェア問題と考えるハードウェアソリューションの良い例です。同様に、これらのカメラを使用したことのある誰もが知っているように、それらはしばしば接続が切れ、それを抜いて再度挿入すると、まるで魔法のように機能し始めます。その後、1回、私たちのオペレーターの1人が誤ってカメラを傾け、トップカメラのビューが外れました。
ですから、その日に収集したすべてのデータは、ビューが正しくないため、破棄する必要がありました。カメラマウントをより堅牢にすることを試みましたが、私はスクリプトを1つ、トップカメラのビューが良好かどうかを確認するツールを書きました。ですから、私たちがしたことは、セッションごとに開始時に2~3分を費やし、その後カメラのビューが正しいかどうかを確認することでした。こうすることで、私たちが収集したデータが本当に有効であることを確認できます。ですから、これはハードウェア問題と考えるソフトウェアソリューションの良い例です。そして、これが技術スタック内を移動し、これらすべてのレイヤーから考えることが本当に大きな助けになる理由です。また、ロボット工学における評価がなぜ困難なのかについても話したいと思います。ソフトウェアと同様に、シミュレーション内でロボットを評価することができ、それを並列化することができます。しかし、現実世界こそが事態が混乱する場所です。
例えば、光が変わる可能性があります。干渉がある可能性があり、アクチュエータとカメラのノイズがある可能性があります。ですから、これらすべての要因を考慮する必要があります。最近、Malm actを使用する際に、Malmarmac 2を扱う場合、5つの戦略で数千の実世界評価ロールアウトを実施しました。これにより、これがいかに困難な問題であるかを学びました。ですから、実世界の評価を実行する場合、これは障害時に発生する可能性があり、その後再度発生します。ロボット工学では、各ロールアウト後、環境を手動でリセットする必要があります。ソフトウェアとは異なり、並列実行することはできません。それが混乱した場合、手動でクリーンアップする必要があります。私は何百回もこれをしてきました。これは非常に楽しくはないことをあなたに保証できます。その後、これを頻繁に行うことは非常に高価であることに気付きました。しかし、これが現在の黄金基準です。
評価のもう1つの困難な点は、ロボットが何かを行うことができない場合、それがどこで失敗するのかを見つけることが本当に困難であるということです。これを説明するためにいくつかの例を挙げましょう。データである可能性があります。異なるオペレーターが異なる戦略を使用している可能性があります。私が2回折り込んだのかもしれません。誰かがタオルを3回折り込みました。うーん、トレーニング設定である可能性があります。あなたが希望する適応、例えばLoRAと完全な微調整を比較する場合、その場合は設定である可能性があります。私はこのような状況を経験しました。モデルをロードしようとしましたが、モデルの一部がランダムな重みで初期化され、モデルはまるで狂ったように動作しました。間違ったアクションブロックサイズである可能性もあり、トレーニングで使用したサイズと比較して、評価設定自体が間違っている可能性があります。分布内で評価を実施しようとしているが、オブジェクトの配置がわずかにずれている可能性があります。
最後に、安全について話したいと思います。このビデオクリップは私が誤って記録したものです。関節が半秒以内に90度を行うのを見ることができます。誰かの手がそこにあれば、彼らは傷つくでしょう。私たちはロボット展開時の安全について頻繁に話していますが、開発時にも多くの安全問題があると思います。うーん、例えば、データ収集では、leader armが突然故障した場合(時々発生します)、全体の重量がデータオペレーターに落ちる可能性があります。評価では、試管を含むタスクをテストしたいくつかのケースがありました。その中で、1つのロボットが試管を壊し、ガラスの断片が飛び散り、また古い動作プロンプトが突然の腕の動きを引き起こす可能性があり、これも安全上の問題です。そのようなケースが多くあります。
また、ロボット上でAIが記述したコードを実行することについても話したいと思います。特に、AIコーディングツールがますます主流になっているからです。うーん、背景を提供するために、ロボット用のAIコーディングツールを使用する1つのシナリオは、基本的にはlay robotを使用する場合で、私たちはHugging Faceから来たlayer robotの忠実なファンです。ですから、そのライブラリを使用するロボットアームに適応させたいときに、多くのスキャフォルディングがあり、多くのインターフェース作業を完了する必要があります。ですから、私たちはAIを使用してこれを行い、より速く前進しました。しかし、それを実行しようとするときに失敗する可能性があります。うーん、私たちは通常のソフトウェアチェック、基本チェック、通常のプルリクエストレビューを実施します。その後、シミュレーション内でチェックしてみます。ログ内でテストしてみます。ロボットにアクションを送信できますが、それらを実行しません。最初にログを見てください。次に、実際のロボット上でテストしたいときに、一度に1つの関節だけを移動できます。
速度を落とすことができます。えっと、はい、これらは私たちが従っている基準のいくつかです。はい、強調したい一つのことは、テクノロジースタックのすべてのレイヤーで専門家である必要はないということです。しかし、異なるレイヤーについてもっと理解していれば、問題を解決するのは本当に簡単で、より速く前に進むことができます。以上です。ありがとうございます。わかりました、皆さん、えっと、これで終わりです。えっと、ところで、Savineに感謝します。本当にありがとうございます。えっと、これは午後のAIEの前半部分の終わりです。えっと、過去2日間、午後9時から午後6時のプログラミングでこのような参加を維持するのに本当に良くやりました。えっと、最後のスプリントにいて、えっと、休憩後にさらに本当に素晴らしい講演が来ようとしています。えっと、世界中の多くの最高の新興企業は、えっと、彼らが実際に何を構築しているかを共有するでしょう。
えっと、その多くは実際には私のTwitterの友人で、長い間知っていて、彼らを招待して直接会うことができました。これもとても素晴らしいです。えっと、だから来てください。えっと、そしてこの休憩が続いている間、えっと、私はあの緑色の服を着ている私の友人Kazayaに少し背景を与えたいです。えっと、ちょうど手を振ってください。えっと、だからKazayaは人です、えっと、あなたが知っているように、他の誰もが一般的に日常の仕事をコンサルティング業務で持っていますが、彼女はまた正念のコーチであり、より多くの人々をその練習に連れて行く方法を見つけたいと考えています。特に、太多くのことが起こっているところで、私たちの多くは圧倒されていると感じ、不安で、ただシステム的な方法を見つけたいだけです。一時停止できる方法、あなたが知っているように、少し遅くなります。
これが私たちが休憩時間のためにより念入りに計画された体験を作成したい理由です。むしろ、あなたが知っているように、AIEロゴを置いて、いくつかの音楽をかけて、あなたにコーヒーを持たせてください、わかりますか?えっと、私たちはプログラミングのあらゆる瞬間に思考を統合したいと考えています。えっと、これが私たちが彼女を連れてきた理由です。しかし、私はまた別の話を共有したいと考えています。これがどのように開始されたのか、なぜなら、私はこれが「AIエンジニア」の精神に非常に適合していると思うからです。また、「ビルダー」と「エンジニア」が何であるかについての常に変わる定義です。えっと、Kazayaは実際にはコーディングの背景がありませんでしたが、実際に彼女はvibeコード全体の体験をしました。彼女は画面上に粒子の可視化を作成するのを助けるGitHubリポジトリを見つけ、彼女は過去4週間以内にこのすべてを完了させました。
私の意味は、私たちは基本的に彼女にAIについてのものを詰め込み、その後彼女は前に進み、それを構築することを決定しました。だから、私はより多くの人々を見ることができてこれ以上幸せなことはできません。様々な異なる分野、業界から、これらのツールを通じて力を与えられ、これらの素晴らしいものを作成することができます。わかりますか?そして、すべてこれは、瞑想と正念のようなものを、私たちが今日舞台の上で展示することができる実際の技術体験とリンクすることができることを可能にしました。だから、次の約15分間、楽しんでください、速度を落としてください、そして、この日を終える前に、少し保留されたエネルギーを回復してください。ありがとうございます。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。
やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。やあ、やあ、やあ。私たちのプログラミングは非常に速く進んでいます。えっと、次のスピーカーJayが準備しているとき、これは素晴らしい講演になるでしょう。私はずっとそれを楽しみにしていました。
私はバックステージでJayと少し話しました。これは人とAIの人間的な側面についての講演です。チームで働いている場合、人々はAIに参加したい、彼らはアップグレードしたい、彼らは他の人のために設計したい場合、通常私たちは最後に汎用的なプロンプトと汎用的な結果を得て、実際にはそれを十分に利用する方法をさえ知らないかもしれません。だから、これはJayからの講演は、彼が以前Canvaでの経験からのものです。Canvaは私たちと一緒にこれについて話すでしょう。私はこれについて非常に興奮しています。だから、準備ができていますか?回復を感じた場合は?彼も準備ができていますか?彼はまだ準備ができていません。いいえ。彼は私に答えました。彼はちょうどいいえと言いました。それは素晴らしいです。いいえを見ることができます。彼らが準備するとき、あなたは何を感じていますか?あなたは大丈夫ですか?拍手のレベルで私に伝えてください。わかりました、それはいいです。非常に良い。それはいいです。私は幸せです。
これは良い会議です。ほぼ終わるのは残念です。もっと欲しいなら、また終わった後にもっと言いたいなら、もっと欲しいですか?私は私たちが来年それをしないと思います。どうですか?冗談です。冗談です。構いません。彼らは後ろで恐怖に陥っています。彼はそれを言うことができますか?わかりません。私たちは彼にマイクを与えました。うーん、これはいくらかの時間がかかるでしょう。わかりますか?これはMCをするのに最悪の部分です。今、私はあなたたち全員を娯楽する必要があります。しかし、それは簡単です。わかりますか?やあ、ありがとうございます。彼は私を何と言いましたか、先生、あなたの名前は何ですか?Ari Art。テストテスト。彼の名前はArtです。うわあ。この男は本当に芸術作品です。準備ができていますか?私たちはそれができたと思います。男。あなたの最も熱い拍手。始めましょう。ベイビー。何が起きました?目を覚まします。来い。ベイビー。私はJayです。私はCanvaで働きました。私はGrabで働きました。あなたはどう?
今日、私はプロンプトが意見がないことについて話します。あなたはそうです。だから、背景のために、わかりますか、私は本当にこのものが広がっているのに疲れています。プロンプトは、ただトリックをする。だから、私は私の電話でマイノートを持っています。私が私の電話を見ているなら、私はエージェントを見ていません。私は自分の翻訳を見ています。だから、私はこれらのデザインインフルエンサー、これらのリーダー、これらの高い権力位置を持っている人々が設計プロセスについて話すのに疲れています。しかし、彼らは数百万のユーザーのために何もしていません。すべてを配信していません。Jon Snowのように、彼らは何も知りません。だから、私を信じてください。そして、ここに実際に数百万人のために物を構築した人たちがいます。これについて話しましょう。おっと。おっと。
だから、General Mills、アメリカのベーキング会社は1947年にケーキミックスをリリースしました。人々は通常それに対して悪い反応をしました。彼らが即座にミックスに卵を追加するだけで追加のステップを追加したとき、人々はそれに入ります。彼らは自分たちが創造していると感じました。これは面白いです。わかりますか?AIと同じです。私はAIのために設計する誰かのためにそれを考えます。AIはそれを出力して彼らを助けるとき、人々は価値を作成します。わかりますか?これはIKEA効果と呼ばれています。AIが実際に協調しており、パートナーとして行動しているとき、人々は関与します。うーん、これはあなたが見る製品については面白いです。Canva、Google、Figmaかどうかを問わず、または一般的に言えば。あなたは人々にAIを使用するか、編集または一緒に生成するかのいずれかを選択する選択肢を与えてください。何人かの人々、あなたは知っています、明らかにもう少し躊躇しています。
あなたは彼らがトークンを使用しようとしないのを見るでしょう。しかし、これは面白いです。わかりますか?おっと、それは消えてしまいました。良いからですか?素晴らしい。素晴らしい。素晴らしい。私たちは戻ってきました。私たちは戻ってきました。願っています。活発に保ってください。おっと、私たちは終わりました。このようなことが起こるとき、ただ彼の尴尬を避けるために彼に大声で拍手してください。私たちは行きます。このようなことが起こります。何もありません。だから、私は続けます。私たちは大丈夫です。素晴らしい。だから、私はAIとどのように協力していますか?ほとんどの人はAIとどのように協力していますか?私のために、デザイナーとして、私はそれを私の実習生として使用します。私の芸術総監ではなく。だから、あなたはおそらくLinkedInでこのビデオを見たでしょう。これは面白いです。わかりますか?えっと、人々はトークンを最大化しており、彼らはすべてのこれらのトークンを使用しています。これは草ぶりです。えっと、これは通常のクラウドコードと同じですよね?あなたがすべてのトークンを使い果たすと、あなたは怒り、あなたは、「ああ、くそっ。」と考えます。
「ああ、あなた、あなたは失いました。私のすべてのクレジット。高すぎます。なぜ私は構築する必要があります?だから、私は私は大多数の人々に尋ねたいと思います、わかりますか?あなたは決定を人間の専門家に委任するか、AIに委任するか?私は人間が真実のために設計するとき、私はあなたが知っていることについて人々に話すことを奨励する知っています。科学技術バブルの外、なぜなら、一般的な人はAIを使用することに躊躇しているからです。だから、人々が実際に費やす少ない時間をする方法をあなたが枠をつければ事は思考について、その後人々はより多くをする可能性があります。AIを使用して、これは面白いです。わかりますか?彼らはこれについての研究をしました。
人々はAIを使用する傾向があります。えっと、あなたがそれを時間損失として枠をつけるとき、えっと、そして一般的な速度、そして私たちは、私たちは それをしました。わかりますか?だから、私のために、私はCanvaのワークシートを構築しました。えっと、AI駆動のスプレッドシート。別の競争相手がまだこの#errorタグを使用しているとき。私はそれが面白いと思います。それは実際に何が真の誤りかを伝えることはできません。えっと、そして毎日のスプレッドシートを使用する一般的な人と話す場合、彼らは圧倒されていると感じます。わかりますか?だから、Canvaでは、私たちは誰かが式を使用するのを簡単にしようとします。私たちは彼らに与えます。そして、彼らに人間のように話しかけることで、修正の提案を与えます。これは本当に面白いです。わかりますか?これは私が行った音声に関するものと同じ実験です。えっと、アシスタントのもの。AIは幸せな道を構築します。えっと、あなたが見ているように、えっと、人々はそれを壊し、彼らは気にしません。わかりますか?そして、あなたは環境に対してプロンプトすることはできません。あなたが外で道路のノイズ、赤ちゃんが泣いているかどうかを処理する場合。わかりますか?これは残念です。なぜなら、私はあなたが音声のために構築した場合、間違った道を進むコストが高すぎると思うからです。
えっと、あなたが前にしたことがあれば、一般的にはそれは本当に難しいです。だから、AIはすべてを解決することはできません。だから、私はあなたにデータセットの外で考えることを奨励します。わかりますか?私はこのグラフがあなたがたくさん見たかもしれないと思います。だから、あなたが設計するとき、あなたが起業家であっても、デザイナー、または創造的な人、または開発者でも、あなたが何を所有しているかについて考えてください。創新的な競争上の優位性を駆動します。誰が運転しますか?設計。設計は常にこの値を駆動して競争相手に対して優位性を獲得しています。だから、James Dysonもいい例です。わかりますか?彼の話を読んだことがあれば、彼は5000と100の掃除機の原型を作りました。彼は彼のためにリスクを冒した後に初めて呼び出されました。わかりますか?Appleキーボードも同じです。
多くの人がそれを嫌いますが、あなたは覚えておく必要があります。彼らはスマートショートカット、人々が言うかもしれないもの、異なる国、異なる語彙も出てくることについて考える必要があります。私は確信しています。そのチームは継続的にSteve Jobsと繰り返して、現在の状態に達しています。わかりますか?彼らは考える必要がありました。わかりますか、彼らは世界のために彼らが設計したオブジェクト。これらの新しい機能。だから、データセット外で設計します。わかりますか?だから、私の感じは、これはJosh Newtonが早前に話したものに関連しています。人工知能はサイクルを加速します。それは設計工芸または全体的な判断を置き換えません。だから、私のために、わかりますか、私はCanvaのデザイナーと一緒に働きました。おっと。ああ、いいえ。また来ました。>>クラシック。わかりました、素晴らしい。やあ、やあ、やあ、冷静に、冷静に、冷静に。私たちはそれを管理できます。だから、私がCanvaで働いていたとき、私は列とレイアウトを設計しました。
私の友人Simon Lynnに敬意を表します。彼は台湾にいます。伝説です。また、このプロジェクトを助けました。これらは複雑な相互作用です。わかりますか?すべての人が理解するわけではありません。だから、私たちが実際のユーザーと実際のプロトタイプと深い関わりを持つとき、私たちはデータセットの外で考える必要があります。AIは複雑な相互作用を解決することはできません。複雑な製品。あなたはまだ実際の人々と通信する必要があります。そして、実際にAIが生成またはが考えるかもしれないことをテストします。ワークショップでの作業も同じです。えっと、私たちは実際にコードテンプレートを構築しました。これはどういう意味ですか?まあ、私たちは私たちの製品のコードテンプレートを構築しました。それは人々がCursor、Claudeに入るのを手伝います。そしてワークショップ、ブレーンストーミングで実際にアイデアを構築します。万人を力づけます。わかりますか?私たちはデザイナーとして全体的に話される権を保つべきではありません。
私たちはすべての人をエンパワーメントし、人工知能を通じて彼らのアイデアをもたらし、それらを構築できるようにすべきです。そうすれば、プロンプトを試し、現場で実際にテストできます。これは非常に重要です。スマートホームと音声についても同じです。Huaweiがスマートホームの将来の方向性を示しているのを見るのは非常に興味深いです。音声とコンテキストを考慮してください。なぜなら、人工知能はリアクティブに機能することはできないからです。学習しなければなりません。トレーニングされなければなりません。では、この問題についてどのように考え、普通の人の行動に適応するインテリジェントシステムを持つにはどうしますか?最後に、あなたが実際に生活したいと思う世界を構築してください。設計者、開発者、そしてここにいる皆さん、特に起業家の皆さん、そうですね?なぜなら、人々は体験に投資し、デザインが事物を推し進めるレバレッジとなるからです。そうですね?IndiGo航空のCTOさえもこのことについて語っていました。
人工知能は現在非常に高価ですが、人材の雇用はより安価であるというのは興味深い議論です。特に人工知能の時代においてはなおさらです。では、今日の講演を終える前に、最後のいくつかのホットなアイデアとホットな観点をお伝えします。ソーシャルメディアで人工知能デザインに関するガベージ情報をオフにしてください。正直なところ、そこには多くのそのようなコンテンツがあります。あなたのネットワークとサークルの外にいる人々と交流してください。なぜなら、普通の人は今、人工知能をかなり恐れているからです。もちろん、これは理解できることです。大丈夫です。ユーザーはあなたの製品がより良いかどうかは気にしません。そうですね?彼らはあなたが競合他社よりも優れたクールな機能を持っているかどうかは気にしません。あなたはこれらの人々とその必要性のために実際に設計し、コンテキスト関連性を維持する必要があります。最後に、この地域と世界中の設計リーダーの皆様に対して、あなたが人々に人工知能に適応する空間と時間を与えなければならないと思います。
私は多くのお話を聞きました。設計者が実際に十分な画面を設計していないと非難され、人工知能の使い方を知らないため、悪い設計リーダーにいじめられているというお話です。そうですね?誰かが私に、私の仕事は意味がないと言いました。しかし、ご存知ですか?私が設計した製品は数百万人に使用されています。ですから、彼らが何を言っているのか、私は分かりません。ですから正直なところ、あなたのチームをエンパワーメントすることが重要だと思います。だから最後に、ここで言及されていないもう一つのポイントがあります。クリスティナ・カール、彼女はアルテミス宇宙船に行きました。明らかに月の周りをです。彼女はあなたのチームを見つけることについて語っています。ですから、私はあなたがあなたのチーム、ここにいるあなたのネットワークを見つけることを勧めます。エンパワーメントを感じ、あなたが適応し、協力している人工知能ネットワークに接続されていると感じてください。なぜなら、これが重要だからです。なぜなら、私たちが生きたいと思う世界では、あなたは人工知能に反対したくないからです。
あなたは人工知能について流暢に理解する必要があります。ただし、この糞には反対してください。ありがとうございます。>>拍手喝彩。糞に反対する。あなた方の何人がこの糞に反対していますか?私に言わせれば、私は反対しています。わあ。本当に?あなたは他の人たちはどう思いますか。そうですね?いずれにせよ、えっと、拍手喝彩してください。私たちは共同司会者がいます。これを見てください。Usmanです、皆さん。その通り。Usman、私より若いです。えっと、それが何であるかは言いません。彼はローカルコミュニティで非常に活動的です。構築中です。最後に構築したものは何ですか、兄弟?>>最後に構築したものはほら、ご存知のように、宗教アプリケーション、そうですね?>>あなたが構築したようなものですね。>>はい。>>えっと、私のアプリケーションは世界中のイスラム教徒向けです。あなたはえっと祈りを追跡でき、そしてコーランのすべての異なるスーラを追跡できます。これが私たちのえっとの聖書です。はい。>>あなたの聖書のようですね。>>わお、これはクールです。あなたがこれを構築しましたか?>>えっと、はい。Google AI Studioで構築されました。
「Google AI Studioを使いましょう。拍手してください。ビルダーのようにね。あなたは何歳ですか?」「13歳です。」「彼は13歳だ。何ですか?これが未来だ。どう思う?最後にもう1つ質問がある。彼らが準備しているとき、AI Studioで構築した体験はどのようなものですか?プロンプティングをしているだけですか?コードを書いていますか?これは何ですか。」「まあ、当然ながら、最初のころは、そうですね、晕コードはまったくできませんでした。本当に物事を理解するまでに、約1年か2年かかりました。そうです。そして、晕コードはそれほど難しくないという結論に達しました。ただ時間をかけるだけです。」「その通り。時間をかけるだけです。素晴らしい。では、次のスピーカーを紹介していますね。そうですね?」「はい。」「始めましょう。皆さん、拍手をお願いします。」「わかりました。」
「ではこれで、アレックス・リーが登場しました。彼はサンフランシスコからシンガポールに来ました。彼は、人工知能がどのようにデザインシステムを必要とするかについて紹介しに来ています。現在、ユーザーはAI Studioなど、すべてのようなものが好きです。デザインはひどいです。今、正直に言う必要があります。ユーザーブランドに合致するデザインが必要です。アレックス・リーに拍手をお願いします。」「ああ、マイクが必要です。申し訳ありませんが、皆さん。彼はマイクなしでどのように講演することができるのですか?アレックス、もう一度、皆さんはアレックス・リーに拍手をしてください。」「ありがとうございます。ありがとうございます。」「わかりました。完璧です。スライドはここです。えっと、はい、私はアレックスで、Magic Patternsの創設エンジニアの1人です。実際に、簡単な投票をしたいだけです。Magic Patternsについて本当に聞いたことがある人はいますか?手を上げてください。ああ、実は、あなたたちの何人かがいます。とても素晴らしい。」
「私たちを知らない人のために、Magic Patternsは人工知能デザインツールで、数分以内にアイデアから製品へと進むことができます。私たちはすでに2000以上の製品チームに使用されており、KPNG、RAMPなどです。しかし、私は主にデザインシステムに取り組んでいます。人工知能の世界では、新しい機能を構築することはずっと簡単になっていますが、私たちが直面している課題は一貫性です。だから、デザインシステムが単に過去に必要なだけではなく、今日の人工知能世界で非常に重要である理由を、あなたに伝えるためにここにいます。それで、始める前に、デザインシステムが最初に必要な理由について、歴史的背景について話しましょう。つまり、すべての始まりに、世界またはウェブは未開の地でした。すべてのページが異なります。あなたのMySpaceページのようにみえました。あらゆる場所に異なるウィジェット、異なるボタンがありました。」
「デザイナーは再実装する必要があり、エンジニアは再実装する必要があり、真の共有システムはありませんでした。この混乱を整理するために、デザインシステムが生まれました。これは、製品チームが使用できる共有言語です。あなたはトークンを持っています。これは色、タイポグラフィ、間隔を表しています。Brad Frostのアトミックデザインのおかげで、コンポーネントの優れた階層と命名法を得ました。あなたの原子があります。ボタン、ラベル、入力です。これらの原子で構成された分子があります。おそらくあなたのフォームモジュールまたは検索バーです。そして、側栏やダッシュボードレイアウトなど、より大きなものを作成するための生物体レベルのコンポーネントとテンプレートを得ました。だから約束は簡単です。デザインシステムのおかげで、一貫性、速度、スケールを持っています。しかし、おそらく物事は少し一貫性が高すぎます。」
もしかして、ご存知かもしれませんが、デザインシステムに新しいボタンを追加するのに長い時間をかけるのではなく。現在は官僚主義があります。チームに尋ねなければなりません。「この新しいものをこのレイアウトに追加できますか?」そして、私たちは第一原理から物事を考えていません。これはユーザーの問題をゼロから解決する方法についてではなく、デザインシステムやツールライブラリのコンポーネントを使用してこの問題を解決する方法についてです。この硬直性はあまり役に立たないです。だから業界は一歩下がりました。デザインシステムはおそらく少し強制的すぎます。だから、ものを規則のセットではなく、フレームワークとしてもっと見てみましょう。そうすれば、その種の創意工夫を持つことができますが、それでも一貫性とブランドを確保するためのガードレールがあります。タイポグラフィ、色、ロゴ、画像など。
だから最後に、私たちは平和に達しました。私たちは創造的に構築する方法を持っていながら、同時にガードレールもあり、テクノロジー業界に何か破壊的な影響を与えていません。そうですね、仲間。過去6ヶ月間でも、私の作業フローが完全に変わってしまったと思います。あなたたち一人一人に確信していますが、私はもはやコードを書きません。代理人に書かせるだけです。設計や製品管理の人々にとっても、すべてが変わったと確信しています。それは興味深いと思いませんか?実装のコストは現在基本的に無料です。特に、あなたの会社がこれらのOpus 4.7トークンに既に支払っている場合ですね。だから問題は、これを構築できるかどうかから変わりました。構築するのにどのくらい時間がかかるか、ご存知のとおり。私たちはこれを必要としていますか?これを追加する必要がありますか?これを維持したいですか?
この新しい機能は私のデザインシステムのコンポーネントを使用していますか?この新しい機能は私のブランドに合致していますか?そうなると、人工知能が私たちのために作成したすべての混乱があります。私たちはデザインシステムが作成された理由に戻ります。特に、私たちはそれらのガードレールが必要です。では、人工知能の世界ではこれは何ですか。ご存知のとおり、このバックグラウンドなしの人工知能の世界では、特に必ずしもあなたのブランドに合わないものを持っています。そうですね?物事は幻覚を起こす可能性があります。幻覚を起こすコンポーネントを持つ可能性があります。あなたのブランドガイドラインに合わない色を持つ可能性があります。全体的に、あなたは本当にこれらの基盤とバックグラウンドが物事を機能させるために必要です。これはあなたのFigmaモデルだけではありません。これはあなたのStorybookだけでもなく、Design MDでもありません。私たちは本当にバックグラウンドが必要です。私たちのエージェントがあなたのブランドに合致するものを構築することと一致させるために。
だから、私たちはこの端の解決策を提案しました。私たちはそれをAI Native Design Systemと呼んでいます。明らかに、通常のデザインシステムとは大きな違いはありませんが、重要なのは、現在このデザインシステムが依存する2つの支柱があることです。あなたのドキュメンテーションとあなたのコード。あなたはシステムレベルのルール、トークンを持っています。先ほど述べたように、あなたの色、タイポグラフィ、スペーシング、そしてあなたのコンポーネントがあります。特にコードによってサポートされているので、あなたのデザインシステムとコードの一致性が高いほど、それはあなたのユーザーが実際に見るものに近くなります。これはまた、エージェントがプロパティ、変数、およびこれらのコンポーネントを直接使用する方法を理解することを可能にします。では、実際の例はどのようなものですか?これは私たちのクライアントの一つ、Headwayです。
Headwayは心理健康プラットフォームで、人々がライセンスを取得した治療師を見つけるのを支援しています。彼らはすでにデザインシステムを持っていたため、私たちは彼らのために同期を支援しました。彼らのドキュメントとコードを取得し、以前述べたのと同じ構造で作成しました。Storybookはドキュメントソースとして、システムレベルのルールとストーリーベースのコンポーネントレベルのルールに適しています。その後、彼らの実際のコードはNPMモジュールとして取り込まれるか、GitHubと同期してトークンを取得し、私が述べたそれらのコンポーネントです。これは狂っています。ライブでこれをデモンストレーションできないからです。それに太多くの時間がかかる可能性があるからです。しかし、違いは明らかです。前もって、これらを生成しましたが、同じ一般的なプロンプト「ダッシュボードを構築してください」を使用して、まったく異なるものを取得します。デザインシステムなしで、あなたが得るものはあなたのUI作業に使用できます。ですね?
あるいは、それは良い汎用SaaSダッシュボードですが、あなたのブランドや製品に合わないかもしれません。その設計システムの背景を使用した同じプロンプト。これはHeadwayのブランドに非常に近く見えます。ですね?私たちはロゴを持っています。私たちはコンポーネント、色、タイポグラフィを持っており、すべてが一緒にマッチしています。今、私たちは実際に、本当に接近した、高い忠実度のコードを送信することができています。プロンプトがより簡単でも。今、これも設計から工学への移行の見方を完全に変えました。ですね?古い世界では、このFigmaモデルを持っていました。エンジニアとして、私はそれを見て、私のStorybookをチェックし、どのコンポーネントがそれと一致しているかを見なければなりません。色トークンが正しいことを確認してください。ですね?これは困難です。最初から一切合切構築しなければなりません。しかし、今、私たちはデザインと協力さえしていません。私たちはコードでサポートされたプロトタイプと協力しています。
そしてこれらのプロトタイプは私の実際の設計システムコンポーネントを使用しているため、MCPを通じてCursor、Code、Codexのようなものに接続できます。「ああ、原型ツール、設計ツール、このデザインをください。そこから新しい機能を作成してください。」と言うだけです。これらの同じ底層の基盤、両方のコードベースは同じ設計システムコンポーネントを使用する必要があります。より高い忠実度を取得できるはずです。しかし、これらのプロトタイプもコードでサポートされているため、逆に実行できます。モデル内またはくらくらコードの世界ではまだ必ずしもない機能を持っているかもしれません。人々は常に新しい機能を生成しています。今、私ができることは、このコードを取得し、このページを取得して、簡単に繰り返すことができるプロトタイプに変換するだけです。
今、このMCPのやり取りのおかげで、私は両方向で高忠実度の送信を行えます。エージェントが進化するにつれて、私たちのワークフローも進化します。しかし、私たちがまだマッチできない真に難しいものは工芸です。AIだけでは工芸を置き換えることはできません。なぜなら、背景がなければ、素晴らしい製品を今日の形にしている意図、触覚、その人間らしさを持つことができないからです。しかし、設計システムはここでその背景を追加します。だから過去には、設計システムは工芸を伴って構築するのを助けてくれましたが、今日、それらは私たちのエージェントが工芸がどのように見えるかを理解するのを助けます。だから、これが、今日のこのAIの世界で設計システムがこれまで以上に重要になった理由を理解するのに役立つことを願っています。ありがとうございました。>>本当にありがとうございました、アレックス。アメリカからずっと来た次のスピーカーのウー。はい。あ、えっと。
あ、次のスピーカーはMagic Path(Magic Patternsではありません)のサビーナになります。あ、私は確かにこれらのやつらに少し話しました、あなたが知っているように、彼らは存在し、彼らは互いに追い続けるでしょう、しかし私は彼らが面白いと思うのです。でも、あ、はい。だから、サビーナについての小さな物語を話すのが面白いと思うでしょう。あ、彼女は実際に化学を学びました、私は信じています。そうですか?>>はい。しかし今、彼女は設計者です。>>それは『ブレイキング・バッド』のようなものですか?>>『ブレイキング・バッド』のようなものですか?>>ウォルター・ホワイトのようなものですか?>>これはシンガポールです。私たちはそのようなことは言えません。>>申し訳ありません。>>大丈夫です。>>しかし、いずれにせよ、あ、でもこれはクールです。私は再度あ、あなたは何でも学ぶことができ、その後何でもなることができると思うのです。あなたは何を学びましたか?>>何もありません。私は何も学びませんでした。私はゼロの学位を持っています。私は単に教育を受けていないのです。>>はい。だから時々、皆さん、あなたは何でもできます。誰も止めません。
ただ、もし化学系であれば、設計することができます。あ、だから、これがサビーナについての小さな背景です。ウー。こんにちは、私はサビーナと申します。私はニューヨーク市からはるばる来て、皆さんとお話ししています。ここにいられて興奮しています。私はMagic Pathの設計者です。パターンパスではなく。ライトモード、ダークモード、またはライトモード。あ、だからこれは面白いのです。私は実際にワークショップを開催しました。皆さんの中で二日前に参加された方がいらっしゃれば、再度こんにちは。あ、私は朝、自分のプレゼンテーションを完全に作り直しました。なぜなら、私は気づいたのです。天よ、私は大文字のEエンジニアのような人と話しているのですね。だから、これはあなたのためです。あ、もしタイムテーブルを見ているなら、私のプレゼンテーションは「設計者は2026年5月ここで設計トレンドに挿入すべき」であるべきです。あ、それは3月に書かれました。当時、私は思ったのですね、シェリー、このスペースは本当に速く発展しています、天知らず何かですね。
私は提出する前にskillsが本当に普遍的だと思っていませんでした。えっと、それは後で発展しました。私はそのようにしませんでした。設計者はコードを書くべきですか?魚は泳ぐべきですか?それは機能しません。設計者は設計すべきですか?これは実は良い質問です。私は後でこれに戻ります。しかし、あなたが今設計者であれば、そしてコードに不本意に接していますか?はい。わかりました。その後、私は気づいたのです。待ってください、私は正しい視聴者と話していません。エンジニアは設計すべきですか?すべきです。だから、このプレゼンテーションはあなたたちオタク向けです。えっと、だから、あ、私にとってエンジニアリングは本当に恐ろしいのです。なぜなら、divブロックは恐ろしいからです。しかし、divブロックを想像できれば、それはflexboxです。flexboxができれば、それは自動レイアウトです。だから、およそ90秒で、あなたが私の仕事を引き継ぐために知る必要があるすべてを教えます。あなたが私の仕事を引き継ぐことを願っています、ね?私は疲れました。
だから、このようなフォントを見たら、あなたは思うでしょう、非常にクリーン、非常に読みやすい、非常に人間らしい、ね?えっと、私は今朝プロンプトで生成しました。これはえっと、サンセリフフォントと呼ばれています。それは非常にアクセスしやすく、非常に人間らしいのです。あなたはおそらくすべての開発者ウェブサイトのモーダルボックスで見たことがあります、あなたが知っているように、Linear Claw。彼らは独自のものを持っています。彼らは高いのですが、Interは非常に良い信頼できるツールです。人々は通常単に文字間隔と単語間隔を調整します。あなたが知っているように、もしあのAとAの対比を見たことがあれば、それはexpect要素のようなものです。あなたはそれを変更することができます、ね?このフォントを見たら、あなたは思うでしょう、「わあ、私は今技術的です。数字が見えます。何か非常に科学的な見え方です。」これは等幅フォントと呼ばれています。Blank monoの皆さん、monoについて知る必要があるかもしれません。これは本当に、「天よ、私がウェブサイトに入ったら、技術的ですね。」という感じです。
それは素晴らしかったです。」このフォントを見て、そして違いを知っていれば、注意がすべてです。Latteの中。えっと、Times Roman、少し真面目なもの、えっと、Anthropicは私にこれの前に5杯のテキーラを飲むべきかどうかの質問に答えてくれました。非常に権威的、非常にプロフェッショナル。これはセリフフォントと呼ばれています。もし3秒で違いがなぜあるかを知りたいなら、セリフフォントは、えっと、ローマやギリシャ時代に戻るように、えっと、人々は彼らが描く予定だったものをテンプレートのように描くでしょう。これらの小さなマークは人々が描いた実際のペイントブラシの筆跡から来ています。だからそれはそれが来たところです。今あなたは知っています。わかった。このようなものを見たら、シェーダー、相互作用するもの。もし見たら、わあ、それはどうやって起こったのですか?WebGLを知りません。えっと、はい、これはシェーダーです。
あなたが知る必要があるすべてはあなたはunicorn.studioに行くことができて、これを完成させることができるということです。もしあなたがそれの背後にある数学を実際に知りたいなら、私の友人Maximのブログに行きます。彼はLinearで働いています。彼は素晴らしいです。えっと、それはあなたが知る必要があるすべてです。だから、えっと、他に何があるか見てみましょう。ここに門番がいません。あなたは思うでしょう、「わあ、私はヒーローページにいます。これはMagic Pathのウェブサイトで、あなたはすぐに見るでしょう。これはCursorのウェブサイトです。彼らはどのようにしてこれらのヒーローアニメーションをしているのですか?」推測してください、ぶっちゃけ?はい、それはそれです。あなたはただコードベースを取り、アニメーションのようなものを投げ、新しいブランチを作成して、「ねえ、それを素晴らしくしてください。目立たせてください。」と言うのです。えっと、通常、人々はここで彼らの製品の記録を持っていますが、私はこれを主張します。なぜなら、えっと、あなたは少し加速したいからです。
あなたが知っているように、あなたの人工知能生成のものを人々に待たせることに関しては、エチケットがあります。えっと、これはちょうど速いだけで、あなたは本当にクールなことをたくさんすることができます。ちょうど、もしあなたが私のプロンプトを見たら、私は単に言うでしょう、それを目立たせる、それを大きくする、ちょうど10秒で現れるように、何でも。わかった。同様に、私も設計者に門番をしません。これはあなたのためです。もし大丈夫、もしあなたがウェブサイトで何かを見たことがあって、あなたは思うでしょう、「私はどうやってそれをするのですか?」あなたは右クリックして、あなたは要素を検査するに入ります。そして、あなたはあなたが計算されたレイアウトを見つけるまで掘ります。そして、あなたはそれをえっと Magic Pathにコピーします。そして、あなたはすぐに見るでしょう。はい、これはえっと、これはすべては言うことです。私は本当に面白いと思います。エンジニアは味を持っています、ね?良いコードを書くために私は精緻な調整のようなものが必要です。
私は設計が常にエンジニアにとってブラックボックスであったと思います。彼らはえっと、あなたも同様にこのような物に対して味を持つことができることに気づいていません。あなたがちょうど見たすべてのようにそれは2026年の設計者の概要です。えっと、私はinstrument sandsについて話し合っていません、しかし大丈夫です。だから、私が向きたいのは、私たちが今日、設計とwork?をどのように定義するかです。今日の設計、たくさんあります。えっと、奇妙なえっと、パターン、私たちが奨励する行動の一種があります、あなたは反復し、ページをリフレッシュし、反復し、ページをリフレッシュします。
あなたは単一のビューポートにある程度閉じ込められています。もし1つのバージョンを見たいなら、あなたは戻るボタンを押すか何かのような不器用なダンスをする必要があります。あなたは本当の考えを持っていません。あなたは本当に一時停止して考え、わあ、多分この反復にはこの反復で何か良いものがある、ね?と言うことなく、あなたは前に進みます。えっと、内省の代わりに、これは明らかにえっと非男性的です。だから、えっと、予測を与えられてえっと、おお、それはえっと何と言ったかえっと設計の未来はどのくらい難しいか、ちょうど、私の仕事のように、あなたが知っているように、Magic Pathで、私は多くの設計ツールを見ます。えっと、おお、えっと、あなたはそれをこのようにエクスポートする必要があります、何でも何のファイルのようなもので、えっと、おお、あなたはそこで局所的にそれを作成する必要があります。私の議論は、ちょうど、私は知りません、あなたたちはどのように設計するのですか。
私は本当に、これは重要ではありません。えっと、私はあなたたちに、あなたが現在どこにいるかを満たすための最高のツールを与えることができたいのです。あなたの設計がちょうど、半完成のNext.jsアプリケーションのようであろうと、もしそれがFigmaファイルにあれば、もしそれがあなたの頭の中のようであれば、もしそれがあなたのチームメイトの頭の中にあれば、それは関係ありません。なぜなら、えっと、はい、私は言っています。創造性はどこからでも来ます。そして、私は創造性がどこから来るかをあなたに言う人になりたくありません。だから、私はシェルと話をしています。彼女は実際に3月にこのプレゼンテーションに私を招待しました。そして、私は言いました。「ねえ、ちょうどえっと、私は知りません。私は知りません。私は何のトピックについて話すでしょう。」そして、文字通り、これは私が彼女に言ったことです。ちょうど、私はその日にこれらのスライドを作成しました。だから、これは怠惰からではなく、正確さからです。だから、はい。わかりました。これは私は誰もが覚えておくべきだと思う引用です。
私は、これはこのえっと会議全体の議論のようなものだと思います。えっと、私は大声で読み出そうとしています。John Collison、彼はCollison兄弟の一人のようなものです、Stripeの一部であり、彼は言いました、「あなたが成長するとき、あなたはあなたの周りのものが常にそこにあるわけではないことに気づきます。人々はそれらを起こしました。しかし、最近まで、私は世界がどのくらいの回復力を必要としているかに気づき始めたばかりです。そのホテル、その公園、その鉄道、世界は情熱的なプロジェクトの博物館です。」そして、私がこれを言うのは、あなたが知っているように、えっと、あなたが知っているように、何人かの人々はちょうどskillmdファイルを投げ出します。彼らはちょうどのようなものです、あなたが知っているように、バッグにフライドポテトを入れて、何でも。しかし、私は少し理解することに美しさがあると思います。ちょうど、待ってください、私は単にちょうど公園のようなこのskillmdファイルをTwitterから見つけた前の私のチャットボットで。中に何があります?ちょうど、私はすべてのものが欲しいですか?
ちょうど、私は本当に、はい、これはAirbnbの設計システムですが、私はすべてのものが欲しいですか?いいえ。あなたはちょうど物事を精緻な調整したいのです、ね?これはちょうど、誰かがあなたに、明らかに見ていないPRをあなたに与えるときはいつもというのに似ています。彼らが各行のコードを説明することができないようなことは、彼らがしなければならないと言っているのではなく、しかし、あなたが知っているように、他の人のAIゴミに対処することは喜びを引き起こしません。私は誰もが同意できると思います。見てみましょう。わかった。えっと、これはすべてのためです。ちょうど、これはすべてを心から言っているのです。えっと、あなたが知っているように、これの前に設計者として、私はAI設計スタートアップをしました。そして、私は人々に設計を教えようとしました。えっと、だから、あなたが知っているように、ここには会社の洗浄帽がありません。しかし、今、待ってください。を持っています。ちぇっ、私は滑らかだったことを望みます。あなたが速く行きたいなら、一人で行きます。あなたが遠く行きたいなら、あなたはMagic Pathを使うべきです。そして、その後、あなたはあなたのチームと一緒にそれを使うべきです。
エンタープライズマルチエージェントで使用します。私たちはそれを二日前に発表しました。これは私のChloe Parkです。もし皆さんの中で彼女を知っている人がいれば、彼女は素晴らしいです。えっと、だから、あなたはMagic Pathで設計することができるだけでなく、1つはキャンバス上で、私は、これは正しい方法だと思います、2つは複数のエージェントを持つ、それがサイドバーチャットのようであろうと、えっと、3つはあなたの実際のエンタープライズチームと。だから、マーケティング担当者に招待し、最高経営責任者に招待します。ちょうど、台所に多すぎるシェフを入れるようなものです。何が起こるか見てください。あなたは理解していますか?えっと、良いことは、あなたが知っているように、私は常にcursorへの愛とcodeexへの愛を見ています。私は深く敬意を感じています。利点は、あなたが実際に既存のツールでmagic pathを使用することができるということです。
だから、私はワークショップを実施しました。私はcloud codeを使用しましたが、あなたはcodeexを使用することができます。あなたはAmazon IDEのようなものを使用している誰かがいるのを見たように、あなたは何でも使用することができます。それはKimmyですか?またはえっと、いずれにせよ、あなたはこれらの異なるエージェントにMagic Pathを接続することができます。言う、えっと、あなたが知っているように、もしあなたがたくさん、あなたが知っています、proサブスクリプション信用を持っていれば、ちょうどMagic Pathで使用します。あなたがより多くのクレジットを購入しなければならないと感じてください。前に言ったように、私たちはあなたが今いる場所を満たそうとしています。
えーと、私のボスの Pietro なんですが、本当に変な奴で、皆さんの中で Pro を知っている人がいれば、彼はこんな感じのクレイジーな奴ですが、彼は本当に素晴らしいビデオを作りました。codeex の使用を単に見せてくれるようなもので、あなたは本当に驚くべき設計を作ることができます。私は思うんです、次世代のデザインというのは、あのね、私たちは技術を持っています、私たちは人々に伝えなければなりません、いや、これはあなたが実際に実現できる方法です。たとえば、エンジニアが設計し、デザイナーはエンジニアとより良く協力する方法を学ぶとか、えーと、だから私たちはすべてのテクノロジーを持っています。あのね、できるはずなんです。あなたはそれを人々の顔の前に置いて、そして言う必要があります、「あ、あのね、使ってみてください。」えーと、どこからでもデザインできます。実は、「あ、私の携帯電話から Magic Path を使ってデザインできたらいいのに。」と言った人がいます。私は絶対にそんなことはしません。なぜなら、私はそれは認知的な過負荷が多すぎると思うからです。
しかし、もし Telegram や WhatsApp、あるいはその他のものに接続したいのであれば、あなたのデザインをゆっくり形作ることができて、その後で確認することができます。だから、その、えーと、気付いてください。だから、また、素晴らしいことは設計とコードの間のループを閉じることです。えーと、ここに持っていない。あ、いや、持っています。持っています。えーと、しかし基本的に、あなたは magic path デザインを持つことができ、それをあなたのコードリポジトリに入れて、磨いてください。あなたがローカルファイルに編集を行う場合でも、それを magic path に戻すことができるので、あなたはいつもクリーンなファイルを持っています。また、これらはすべてリアルタイムリンクを持っているので、あなたは Slack 経由で送ることができ、iMessage 経由で送ることができ、私は知りません、とにかく。えーと、はい、だから、えーと、これは少し私がそれがもっと大きいことを望んでいますが、これはちょうど私が私のファイルの周りで怠けているようなものです、えっと、あのね、また、ブラシであるため、私はあなたがアートを作ることを望んでいます。
私はあなたがプロジェクトを作成することを望んでいます。おそらく決して発行されることのないもの。しかし、少なくともあなたは自分自身に言います。あなたはすべてを広げるのが好きで、その後、本当に考え抜きました、すべきですよね?なぜなら、私は思うんです。将来、私たちは私たちの脳をしわくちゃにさせるようなことをする必要があります。私は思うんです。私のは、あのね、膨らみのようなものです。だから、えーと、あのね、これは私がアートプロジェクトで遊んでいるだけです。Twitter から日本のテクスチャパックを買ったようなものを挿入しました。えーと、私はそれを接続しました。あのね、ローカルに、えっと、エージェントや私の外部エージェントに接続すると、それは magic path に本当に素晴らしいものを置いています。ランディングページや他の創造的な取り組みなど、それがどのように使用されるかを見ることができます。OK、だから私が言いたい最後の事は、あ、しまった、えっと、これは私の驚くべきチーム、素晴らしいものは何も一人では作られていません。第 2 部。私たちは主にニューヨーク市に拠点を置いています。
もしあなたがそこに行ったことがあれば、挨拶をしてください。マンハッタンのダウンタウンにいます。これは本当に素晴らしいです。OK、だからこの写真を撮ってください。なぜなら、あなたが何を推測しますか?すべてのスライドはそこにあります。そして推奨読書。『ペーパーレスの神話』。いくつかのブログがあります。あのね、Maxim のブログがそこにあります。あなたがたのための本当に良いリソースがいくつかあります。また、私のすべてのスライドがあります。これは完全に正確ではありませんが、そこにあります。えっと、私のメールと Twitter。お願いします、その上でツイートしてください。もしあなたがえっと実際に何かを作ったなら、あなたは私に DM しました。私に DM するか、あるいは一般的に私に DM した場合、あるいは私にメールを送った場合、えーと、私は個人的にあなたをオンボードするのが好きです。あなたのチームのセットアップをお手伝いします。はい、あなたのデザインシステムをホストできます。実は、これが私が得る最大の質問だと思います。彼らは「あ、私のデザインシステムをここに移すことができますか?」と言っているようなものです。はい。
えーと、私は思うんです。それはそれです。>> Sabina をありがとうございます。>> Sabina に熱烈な拍手をしてください。皆さん、続けてください。はい。マイクを持ってください。若い男。えーと、何人の人が chat GPT や Claude または何かのようなものを使ってイメージを設計するかを見てみましょう。はい、たくさん。OK、これは部屋の約 10% です。えーと、皆さんの多くはそうしないと思う理由は、1 つは、それは少し >> あのね、えーと、私たちは少し垃圾ガベージコンテンツが何であるかを知っています。えーと、またはそれ、それは間違えるでしょう。6 本の指、ですよね?誰かメットガラで Katy Perry を見ましたか?わかりますか?これはクールなアートです。とにかく、えーと、画像生成は、ロゴのようなブランドアセットのためであろうと、えーと、名刺、そのような種類のもの、それはいつもちょっと課題の問題でした。なぜなら、私たちは垃圾ガベージコンテンツが何のように見えるかを知っているからです。しかし、さらに、あなたはどこに行きましたか?あ、あなたはここにいます。マイクを手に入れましたか?取りに行ってください、兄弟。いいえ、彼らはまだそれを必要としません。取りに行ってください。大丈夫。
とにかく、これはビハインド・ザ・シーンです。とにかく、えーと、これが取引です。あなたが得るとき、あなたが得るとき、えーと、私は今参加しました。ちょっと待ってください。あ、私に、私たちはこれを使ってこれを紹介できて、それから私たちはあなたにマイクを与えますか?ありがとうございます。えっと、とにかく、だから AI モデルからイメージを取得するとき、あなたはイメージを取得します。それは平らなイメージのようです。あのね、しかし、あなたがフラットデザイナーなら、あなたはレイヤーを使用します。あなたはこれを知っています、すべきですよね?えーと、えーと、背景と前景とさまざまなレイヤーのようなものがあるようなものです。それで、AI がそれをあなたのためにできたらどのくらいクールでしょう?Figma に準備されたものをあなたに与えてください。あなたが使用できるすべてのレイヤー。これが私が聞く準備ができたことです。私は非常に興奮しています。次のスピーカーは誰ですか?>> Priya。彼女を紹介してください、兄弟。>> はい、私は知っています。>> 大丈夫です。彼は新しいですが、私たちは訓練しています。私たちは訓練しています。>> OK。
だから、今、私たちの次のスピーカーは Priya になります。彼女はまた、彼女はまた、サンフランシスコから シンガポール に来ました。これは 17.5 時間のフライトです。彼女は AI がどのように設計パートナーになることができるかについて話します。本当にクールなものを作成するのを手伝ってください。えーと、Canva のようだが、もっと良いような。>> 私は知りません。とにかく、それはそのように無料です。彼女にマイクを与えてください。素晴らしいです。Priya に拍手をしてください。>> こんばんは。えーと、その紹介をありがとうございます。えーと、私は本来言いたかったことの多くを説明したと感じています。えーと、私のトークは、私は Leica の共同創業者兼 CEO です。私たちは創造的な AI モデルを訓練および評価するためのインフラストラクチャを構築しています。これが実際に意味することは、私が一日中、画像生成ビデオ生成モデルで大声を上げていることです。彼らは私たちのプロンプトを理解していないからです。
私たちは、彼らがより良く理解するためのインフラストラクチャを構築しようとしています。えーと、プロンプトに圧倒される問題を避けたいのです。えーと、私はその質問を彼が質問したと思います。ここに何人の人が chat GPT または nano banana を使用して、スライド、プレゼンテーション、ソーシャルメディアポスターを生成していますか?手を上げている人を見ていません。あなたたちはすべて嘘をついていますか?OK、今、もっと多くの人が手を上げています。だからおそらく、あなたの大部分は chat GPT または nano banana を使用して画像を生成しています。私は確信しています、えーと、私は今日やっていることを共有します。あなたの多くは私が経験していることに共鳴する可能性があります。えーと、これは『魔法にかけられて』のようなポスターです。えーと、私は Gemini に聞きました。金髪女性で画像マスクを置き換えるように、えーと、それからこれはそれが私に与えたものです。それは大丈夫です。えーと、私はまだ自分に忍耐強いです。その後、私は再びプロンプトして、これはそれが私に与えたものです。
それからものは奇妙になりました。これは私が最終的に得たもので、今、私は完全に失敗しました。I I は、ええと、大丈夫、これはうまくいきません。だから、これはちょうど私が見たように、結果はますます悪くなります。では、Leica で私たちが少し異なることをしました。だからこれがこの画像なら、そしてこれは私が与えた同じプロンプトなら、画像品質を変更し、金髪碧眼の女性でそれを埋めます。えーと、すべてをレイヤーに分離し、その後、その正確なイメージでそのレイヤーを埋めます。あなたが行うことができるローカライズされた編集のレベルは狂っています。あなたのレイヤーが公開されていて、あなたが各レイヤーを委任することができるなら、あなたはテキストも移動することができます。ここで何でも変更できます。あなたはこれがなぜこんなに小さいのか疑問に思うかもしれません。
さて、私たちがそれを行うことができる理由は、画像生成またはビデオ生成に携わっている一部の企業が MP4 または PNG を出力するためだと思います。それらは凍った ファイル形式です。レイヤーは公開されていません。プロンプト設計の状態はリセットされます。テキストは非常に興味深い入力媒体ではありません。なぜなら、多くの人々は彼らが何を望んでいるかを表現する方法を知らないからです。だから翻訳で多くが失われます。今日、AI マルチプレイヤーの経験はありません。この理由のため、私たちが解決する方法は本当にこのレイヤーレベルの編集可能性とレイヤーレベルの編集可能性を行うことです。これは単なる人間が物を移動できるようにするためだけではなく、別の専門的なモデルがある可能性があります。異なるレイヤーに使用できます。テキスト生成、SVG 生成、写真生成に使用できます。
あなたは常にすべてに 1 つの大きなモデルを使用する必要があるわけではありません。あなたはスタートアップがこの問題を解決する理由を疑問に思うかもしれません。なぜ大きなラボはすでにこれを解決していないのですか?正直な答えはデータです。コードのために、多くの多くのような GitHub リポジトリがあります。LLM はテキスト処理に非常に優れています。そしてグラフィック設計のために、あなたは 3 つの巨大な企業を持っています。それらはすべて囲まれた庭です。Figma、Canva、および Adobe は数十億の編集トレースとデータを所有しており、実験室には、また社会にいかなる人にもアクセス権がありません。だから、私たちがスタートアップとしてこの問題に直面することを決めたとき、私たちは最初の原則から考えて、また市場に欠けているものを解決することを決めました。それはデータです。だから私たちは続けて 1500 万を超える集めました。
層状グラフィックデザイン構成の 500 万個。だから、これらの一部はすでにオープンソース化されています。だからあなたは実際にそれを確認に行くことができます。これは私たちが構築した面白い探索機のようなものです。Instagram から多くの異なるデザインカテゴリから 50 以上のカテゴリのデータを出しました。ポスターに至るまでのビジネスプレゼンテーション。各データポイントには、イメージの外観、裁剪方法、位置に関する複数のリッチな注釈があります。そして、セマンティックとロジックグループがある場合、その後、あなたは実際に、どの要素を一緒にグループ化する必要があるかを見ることができます。だからあなたは AI モデルに、コンテンツを再びフロー方法に教えることができます。またはアスペクト比を変える必要がある場合、それは本当に方法を知っています。レイアウトを計画します。これらすべてのこと。今日のすべての最先端モデルは得意ではありません。
そして、あなたはこのデータで遊ぶことができます。このようにする一部の方法はすでにオープンソース化されています。だからあなたはまた、クラウドエージェントにこれらの多くの構成プロファイルをスキルとして与えることができます。それはずっと良く実行します。あなたはまたモデルを訓練したり、その上に評価を構築することができます。だから私たちがこの問題を解決する方法は、あなたが今多くの生成 AI モデルから単一ショット出力を得ることができるということです。その結果の一部は本当に非常に印象的です。しかし、AI は味がないというような解説を聞くとき、これが本当に意味することは、設計者の細部への執着です。誰かが長方形の角半径がどのくらいである必要があるかについて考えています。切り抜きタイプは何ですか?テキストボックスの余白距離はいくらですか?これら数千の微小な決定は設計を昇華させるものです。
そして AI モデルはこれらの微小な決定をどのように考えるかをあまり理解していません。そしてここで、各小さな誤りは出力を非常にうろたえ、かつ急いで作られたものにします。だから、私たちが処理する方法は、本当にすべてをレイヤーに分離し、各レイヤーは企業のプロプライエタリデータから、または他の場所から集められた他のデータから、非常に異なる方法で形作られることができます。レイヤーレベルのデータは非常に役立つでしょう。なぜなら、エンタープライズでは、人々は費やすための無限のトークンを持っていません。特にマーケティング機能では。電子商務のように、あなたはいくつかのブランドガイドラインに一致するバナーを生成する必要があります。多くの異なる国にまたがって。東南アジアのように、多くの言語があり、あなたはテキストまたは特定のグラフィックを変更したいだけですが、他のすべての要素を同じに保ちます。
あなたはちょうどそれらのレイヤーを操作することができたいです。またはときには、あなたはカメラ生成イメージを人間が書いたテキストの特定の部分と組み合わせたいです。そして AI が生成した何かで他のピクセルを埋めます。あなたはまた星座モデルを組み合わせることができるはずです。なぜなら、より多くのモデルが出てくるにつれ、あなたは設計の異なるの側面を異なるモデルに委任したいと思うかもしれません。このアーキテクチャはそれを許可します。なぜなら、今日、もしあなたが一発で全部を完成させたいなら、それはモデルがクリエイティブの人々のためにどのように機能すべきかについてのエンジニアの考えです。そしてクリエイティブ、クリエイティブは本質的に増分的で反復的です。あなたは後ろに数歩歩き、それから横に、そして、あなたはデザインをこすり落とし、最初からやり直することにしたかもしれません。そして現在のモデルはこれを許可しません。
複数信号報酬学習システムも提案しました。このシステムにおいて、デザインは人間の好みのみを使用した場合、容易に操作される可能性があります。特に、異なる好みの表現を持つブランドと協力する場合、部分的な報酬を提案できることが望まれます。これらの報酬は人間の好みに基づいており、ある客観的報酬で強化されています。これらの客観的報酬は、出力が効果的であり、ある設計原則に適合しているかどうかを測定します。その後、私たちは2つのモデルを有しています。
1つはAI判事で、その基準に基づいて継続的に自分自身を更新することができ、善悪をより良く区別することができるようにします。その後、このアップデートされたAI判事を使用してジェネレータを再度トレーニングすると、継続的に改善することができます。デザインには有効期限があるため、本当に良い例を常に公開し、モデルを最新の状態に保つトレーニングが望まれます。また、テキストベースのプロンプトを超えるアーキテクチャを構築することで、トレーニングループの一部となる可能性のあるさまざまなタイプのインタラクションをキャプチャすることができます。これは今日の現実ではありません。画像生成モデルを評価する場合、私は決して笑いません。しかし、このスピーチから何かを得たいのであれば、私のスライドはすべて矛盾しており、至るところにあります。これが今日のAIモデルの姿です。
Twitter のハイプであれ LinkedIn のハイプであれ、モデルはレイアウト計画という点で非常に悪いです。人間の介入なしで大規模な視覚的一貫性と編集可能性を得ることは、特にレイヤーレベルの編集可能性は非常に非常に困難です。ですので、ご関心があれば、QR コードをスキャンできます。あ、Hugging Face のリンク、GitHub のリンクがあります。当社のオープンソース データセットを使用したい場合、当社はグラフィック デザイン ワークベンチも公開しました。これを使用してクラウド エージェントをトレーニングすることができます。あるいは、これを評価として使用してみることもできます。トレーニング中の内部モデルがある場合、またはこの分野に興味がある場合は、当社にお問い合わせください。ありがとうございました。>> 皆さんは素晴らしい観客です。演者が素晴らしいスピーチをするときはいつも彼らに拍手してください。これはずっと起こっています。素晴らしいです。もう一度 Priya に拍手してください、皆さん。素晴らしい。素晴らしい。
次のスピーカーはえっと非常にクールです。彼は、彼は素晴らしいストーリーを持っており、当番組が彼を紹介するときに聞くことができます。えっと、実は彼を紹介するつもりはありません。彼は今専門家だと思います。別のホストに拍手をしてください。皆さん、Usman。>> ありがとうございます。わかりました。それで、今、当番組の次のスピーカーを紹介します。彼はサンフランシスコからシンガポールへ再度遠くから来ました。ちなみに、それはえっと 17.5 時間のフライトです。とにかく、彼は旅のなかで遠くに行きました。ゼロからヒーローへ。彼は昔ハッカー宿舎に住んでいました。えっと、具体的には、クローゼットの中に。えっと彼は 12 歳の時... えっと、あ、いや違う、大学じゃなくてえっと高校中退生です。今、彼の会社えっと、あなたの会社は何という名前ですか?>> Hyperspell。えっと、彼の会社 Hyperspell はここまで来ました。670 万ドル以上を調達しています。67 ではなくて。>> わかりました。
ヘイ、司会者に拍手をお願いします皆さん。行きましょう。素晴らしかった。了解。皆さんはいかがですか?『AIエンジニアの最後の日』です。最後までやり遂げて、物事を実現させましょう。ヘイ皆さん、Connor Brennan Burkeといいます。サンフランシスコから遠路はるばるやってきました。17時間のフライトです。今は非常に時差ボケがありますが、頑張りましょう。了解。行きましょう。了解。つまり、我々Hyperspellは企業の脳を構築しています。今日皆さんに伝えたいのは、企業の脳をどう構築するかです。その通り。エージェントがあなたの企業がどのように機能するかを本当に理解する方法です。でもこれはうまく機能していません。了解。それでいいです。了解。つまり、これは今日様々なスピーカーから聞いたテーマだと思います。あー、率直に言えば、あなた方のエージェントは無知な天才です、対吧?
彼らは、あー、ご存知の通り、天才学者、博士号を持ってる、ちょっと自閉的なインターン、絶対的に聡慧ですが、あなたの企業については何も知りません。彼らにとって、毎日が仕事の初日のようなものです。彼らは盲目的に従う、あー、彼らが読んだことが何であれ。彼らはちょっと素朴です。彼らは指示を受け入れてそれに従うだけです。ですから人間が彼らを監督する必要があります。AGIに到達する問題と重点は、より良いモデルではありません。モデルはすでに非常に聡慧です。重点は正しいコンテキストを得ることです。あなた方のエージェントは無知な天才であり、コンテキストの欠如が彼らがまだ確実に仕事を完了できない理由です。了解。では、この問題をどう解決しますか?明らかな答えはコネクタです、対吧?我々はこれをみんなやってきました。
つまり、私はOpenClawに私のSlack、私のクラウドドライブ、そして私のNotionへのアクセス権を与えます。AnthropicのClaudeやChatGPTのコネクタを使用します。でも、ここでの問題は、我々が言ったように、エージェントはちょっと素朴で、彼らが読んだことは何でも真実だと思うんです。でも、実は文書自体がしばしば真実ではないことが判明しています。あー、だから彼らはドキュメントを見つけますが、訂正を見逃し、古い廃止されたバージョンを見つけます。あー、2つの異なるソースがあると、彼らは互いに矛盾します。彼らが最初に見つけたものが何であれ、彼らはそれを真実として解釈します。同じ人がSlack、Gmail、Notionで言及されるかもしれません。彼らはこれが同じ人だと気づきません。彼らは、5人の異なるLisaがいると思っています。1人のLisaではなく。そして、タイムリーネスもないですね?
古い、廃止された、過時なドキュメントを見つけて、それに基づいて動作しようとします。あー、だからコネクタはアクセスは提供しますが、理解は提供しません。では皆さん、全員が仕事をしているわけではないことは分かっていますが、仕事をしている人たち、新しい仕事を始めてドキュメントを読んで、「了解。これが我々の戦略です。またはこれがプロセスです。」そして、あなたはそれを実行して、誰かと話して、「あ、ダメです。それはもう古いです。もう関連がありません。Bobと話す必要があります。Bobはすべてを知っています。その人と話すようなものです。」という状況をどのくらい頻繁に経験しましたか?何人がそのような状況に遭遇しましたか?ここのほぼ誰もが経験していますね、対吧?だからこの問題のポイントは、エージェントにコネクタを提供することで、我々は真実はドキュメントに在ると仮定しています。でも事は実際にはそのように動作していないんです。
つまり、われわれが言うところの「真実の情報源」というものは、実は本当のものはほとんどありません。情報が生成された瞬間に、すでに時代遅れになり始めることが証明されています。文書自体は遅延指標です。組織の再編、顧客の例外、または新規展開が発生する可能性があります。したがって、現実と文書の間の距離はますます遠くなり、文書を現実の状態に保つために人間が文書を更新する必要があります。したがって、企業が実際にどのように運営されるかというと、極めて混乱した現実を持っており、そこには Slack スレッド、会議、電子メール、例外、そしてこれらすべてのことが起こっており、その後に文書があります。だから人々は物事を記録しようとしていますが、われわれはみな文書を更新し、それらを記録することが苦手です。その後、実際に真実であるものがあります。したがって、先ほど述べたように、実際の真実の状況を得る方法は通常、誰かに質問することです。そうですね。
あなたは上司に質問します。約5年間そこにいた、すべての背景情報を持つその人に質問します。だから、人間はこれを理解するのが得意です。ご存知のとおり、あなたがどのプロセスでも得た文書を盲目的に信頼しないでください。あなたはその人に質問しますが、エージェントはそうすることを知りません。彼らが読むもの、彼らはそれが真実だと思っています。これが、あなたが組織内でそれらを勝手に実行させることができない理由です。エージェントを大規模に展開したい場合、われわれは彼らに「真実の情報源」を与える必要があります。では、この問題をどのように解決しますか?「企業の脳」を作成します。だから、すべての組織はエージェントに単一の「真実の情報源」を提供する必要があります。「企業の脳」です。今、それは何ですか?これはコネクタではありません。これは複数の情報源にわたる検索強化生成ではありません。これは信頼できる「真実の情報源」です。これは、誰がこの文書を作成したかを理解しています。
電子メール、Slack、ノート、混乱した会議のスレッドからデータを集約し、矛盾を浮かび上がらせ、特定します。つまり、2つの異なる情報源が異なることを述べており、それらの間でどのように解決するかを理解します。理由を理解し、エージェントが実際に信頼できる「真実の情報源」を作成します。それはあなたに何を与えますか?それはあなたにより良い答えを与えます。それはあなたに一貫したエージェントを与えます。それはあなたに永続的な知識を与えます。それはあなたの組織を人工知能を展開する準備ができた状態にします。多くの企業人工知能展開が失敗する理由は、彼らがエージェントを展開しようとしていますが、エージェントは文書を読んでいて、彼らが操作する「企業の脳」がありません。これは、人工知能が実際に機能するために必要なものです。ここでの別の微妙な点は、背景が人間によって生成されていると仮定しますが、これはもはや真実ではありません。
従来は、ご存知のとおり、人間が会議、Slack、文書、電子メールにいました。しかし今は混合背景を持っています。人間との会議があります。また、すべてのエージェントのプロンプトがあります。また、オープンコンテキストメモリがあります。また、トレースと推論があります。これもコンテキストです。Claude Code で最終出力のループを取得します。すべてのこのコンテキストは非常に有用です。それを脳に入れなければ、最終出力を得るための大量のコンテキストを逃します。したがって、われわれはみな主に人間で構成された組織から混合型に移行しており、数年以内に、ほとんどのコンテキストは実際にはエージェントによって作成され、すべてこれらは脳に入る必要があります。今、異なるタイプの企業知識をこの脳に入れる必要があります。
確立された事実があります。例えば、法人格、あなたの組織構造、あなたのブランドカラーなど。その後、プロセス知識があります。われわれはどのようにオンボーディングを行いますか?われわれはどのようにディール審査を行いますか?われわれはどのようにイベントに対応しますか?また、暗黙的な知識があります。それは人々の心にだけ存在するものです。ですから、思い出してください。このお客様をどのように閉じるか、またはより良い販売戦略は何か、またはこの特定のテストは不安定になるか、またはこの統合は非常に良く機能しないか。これらはすべて暗黙的な知識です。それはめったに書き留められておらず、また、あなたがそれを機能させることができる「真実の情報源」中にもめったにありません。その後、最後に、あなたは状態のある現実を持っています。ですから、あなたは待機中のディール、アクティブなイベント、今日の障害物を持っています。企業の脳はこれらのそれぞれを保有する必要があり、異なる方法でそれらを保存する必要があります。
真実の情報源を見つけるためには、事物がどの程度の速度で進化するか、そしてその中心位置が何かを理解する必要があります。小さなスタートアップからフォーチュン500企業まで、様々な顧客との協力経験に基づいて、このシステムを実際に構築する方法は、すべてのデータを取り込むことから始まる必要があります。したがって、すべての真実の情報源を収集します。あなたの Slack、あなたの Gmail、あなたの Notion、あなたの GitHub、今はますます多く、われわれはまた会議の記録器があります。あなたはまたあなたのエージェント追跡を持っていますね。エージェントが生成したコンテキスト。例えば、Meta はこれを開始しています。Meta は、さらにキーストロークを記録しており、一部の人々は画面記録器を持っています。すべてをこれに埋め込む必要があります。次にあなたが行う必要があることは、コンテキストグラフを作成することです。
コンテキストグラフとは何ですか?それは単一のグラフエンティティであり、組織内のすべての事実を見つけることができ、それがいつ真実であるかを理解し、誰がそれを作成したか、われわれはそれについてどの程度の信頼度を持っているか、そしてこれらすべてを1つの場所に埋め込みます。しかし問題は、コンテキストグラフと一般的なグラフデータベースは、エージェントにとって非常に良いユーザーエクスペリエンスではありません。エージェントはそれらを使用するために事前に訓練されていません。彼ら自身、グラフデータベースがどのように機能するかを理解していません。ですから実際に、エージェントに最適な表現方法はファイルシステムです。したがって、企業レベルのデータ内でファイルシステムを作成します。あなたの会社の中の人は誰ですか?潜在的な顧客は誰ですか?顧客は誰ですか?あなたの決定がありますか?あなたはイベントを持っています。その下に各チームのファイルがあります。その後、各個人があります。素晴らしいことは、ファイルシステムは普遍的であるということです。
Cloud CodeやCursorで使用できます。また、open clawやnano claw、内部エージェント、さらにはご自分のパーソナルエージェントでも使用できます。では、ブレインがどのように構築されているかについて議論しましょう。えっと、最初のステップはコンテキスト取得です。つまり、これらすべての混乱したソースを扱っているわけです。すべての履歴データを取り込む必要がありますが、同時にリアルタイムで取得する必要もあります。Slackのようなものはリアルタイムコンテキストを持っていますが、それが発生している時に見逃してしまうと、あなたのエージェントは最新の情報を持つことができません。2番目のことは、それを正規化することです。ですから、メール内のLisaとSlack内のLisaが同じエンティティであることを理解する、重複を排除する、それを構造化するということについて話しました。次のことは統合です。
つまり、データが時々衝突することがあります。データが衝突する場合、実際に人間に対して、いいですね、私たちはこのトレードオフを持っており、どちらかを選択します、そして最後に、あなたはそれをエージェントに提供し、単一の真実の源を持ちます。正しい時間に正しいコンテキストをエージェントに提供して、彼らが仕事を完成させることができるようにします。難しい部分は実際には検索ではなく、統合です。それはすべてのこの情報を統合することです。Karpathyの「第二の脳」のアイデアに詳しい人はいますか?わかりました。既に第二の脳を持っている人はいますか?ここでObsidianを個人の真実の源または第二の脳として使用している人はいますか?ですから、これはその通りですが、あなたの会社全体、あなたのチーム全体、あなたの組織内のすべての人、そしてあなたの組織内のすべてのエージェントのためです。今、これができることは、あなたが会社が自分自身から学び始めるポイントに到達したということです。
あなたが取る各アクションはコンテキストを作成します。人間が実行し、エージェントが実行し、仕事が完了し、新しいコンテキストが作成されます。これらすべての追跡はその後統合され、脳に入れられ、その後の実行はより良くなります。想像してください、すべてのClaude Codeインスタンスは今これらの学習とそれらの新しい知見を取得し、それらを組織全体で共有することができます。すべての営業担当者が、より良い販売方法を学んだなら、それはすべての人とすぐに共有されます。これができることは、会社が時間とともに再帰的に改善するということです。伝統的に、私たちは人間のコンテキスト喪失を経験します。つまり、人々が去ってしまい、その後彼らの関係を連れて行ってしまいます。今、あなたは自己改善する組織を得ることができ、より良くなり、すべての人、すべてのエージェントが継続的にそれをより良くしていて、別の会議を追加する必要はありません。つまり、私たちはHyperspellです。
私たちは、すべての企業がブレインを必要としていると信じています。私たちはあなたのためにそれを構築します。私たちはAIエージェントの契約インフラストラクチャーです。これがあなたが解決したい問題であれば、その後に私を見つけてください。私にメールを送るか、Twitterで私を見つけてください。皆さん、ありがとうございました。>>わあ。本当に素晴らしかった。本当に天才的だ、相棒。>>この相棒に拍手をしてください。>>普通の人がこのような傑作を作り出すことができるなんて信じられません。えっと、私は、すべての人のブランドまたは企業が彼のようなブレインを持つ価値があると信じています。次の講演者をお迎えします。彼の名前はHangong hang hong Leeで、彼は私たちに、私たちが皆コードで急速に変換できる方法と、あなたがどのように彼と同じくらい良いことができるかを示すために来ています。ありがとうございました。Hangongに拍手をしてください。>>わかりました。ありがとう、Usman。それは素晴らしかった。そう。皆さん、来ていただきありがとうございます。そう。
今日、私は、クラウドエージェントで迅速に発送するために必要な3つの基本的な要素について話したいと思います。ですよね?誰もが迅速に発送したいと思っています。私は後ろの人に言っています。私たちは自分たちをコピーするように発送する必要があります。ですよね?今、どのようにしてすべての人をコピーできるのでしょうか?つまり、私たちはLight Sprintです。私たちは現在のYC企業です。私たちは3人のシンガポール創業者です。私たちは3人の好奇心旺盛なシンガポール創業者です。私たちは、えっと、AI時代の仕事の本質が何になるかを理解するように求めています。ですよね?仕事の本質は非常に急速に変わっています。私たちのような3人として、私たちは製品作成とエンジニアリングをしてきた経験がたくさんあり、私たちはそれが何を意味するのかを理解しようとしています。ですよね?つまり、今、私たちはクラウドエージェント環境を構築しています。ですよね?
私たちはチームが彼らの環境を構築するのを支援しており、彼らのチーム全体が発送することができ、えっと、既存のコードベースに変更を加えることができ、えっと、確実に、迅速に、そして安全に。ですよね?クラウドエージェントとは何ですか?ですよね?このスライドは、あなたはおそらくあなたは知っていますが、皆が今日クラウドエージェント、えっと、昨日、そしてその前の日について話しています。つまり、簡単に言えば、ほとんどのクラウドエージェントはほとんどホストされている環境から来ています。ほら、それらは基本的にクラウドと1つのサービスから来ています。通常は、会社によって設定されたサービスです。ですよね?それらはまた非対話的です。つまり、あなたはそれらを起動し、その後彼らはあちこちを歩き回り、何かを構築し、その後彼らが構築したものを返します。彼らはバックグラウンドで機能しています。時々、バックグラウンドエージェントと呼ばれています。クラウドエージェントとバックグラウンドエージェントを混同する人もいます。それらは同じものです。彼らはバックグラウンドで機能しているだけです。
素早い、ええと、素早いような導き。皆をどこに私たちがここに到達したかのポイントに持ってきてください。ですよね?最初のころ、私たちはコンピューター内部にエージェントがいて、私たちはCursorに入力するのを支援していました。私はCursorの初期ユーザーで、それは本当に楽しかった。command Kのようなすべてのもの。その後、私たちはコーディングエージェントCloud Code Cursorを持っていました。繰り返しになります。ですよね?皆、私たちのコンピューター内部では。それは私たちが仕事をしている時に機能します。残念ながら、私たちが停止する時に停止します。しかし、今日のようなクラウドエージェントのように、基本的にそれらはどこにでもあります。それらはずっと私たちのために機能しています。えっと、あなたが彼らをコントロールする方法を知っていれば。つまり、今日は私たちはそれについて話しています。約束は素晴らしいです。クラウドエージェントのように、あなたの組織を再形成したいと思っています。彼らは、えっと、あなたのバックログのようなものを構築したいと思っています。基本的にはあなたのバックログを完成させてください。あなたが知っている通り、彼らは何でも構築することができます。えっと、誰もが、えっと、物を組み合わせるようなことができます。
最後のことは、Hyperspellが行っているようなことです。あなたが知っているように、彼らは、約束は彼らがあなたの組織を学び、あなたの運営を改善するのに役立つかもしれません。これらの企業の最良のものは既にクラウドエージェントを使用しています。つまり、えっと、彼らは3〜5倍の改善を得ました。時には、もっと。えっと、私たちが話している一部のスタートアップは非常に効果的にそれらを使用しており、多くの人々はそれらを見て、えっと、統合されたPRの数のような、ちょうど創作されたコーディングエージェント作成PR、信じられないほどの速度で成長しているのが見えます。わかりました。つまり、今、どうやってクラウドエージェントをあなたのために機能させるか、そしてあなたに対抗してではなく。ですよね?
つまり、えっと、多くの場合、あなたがクラウドエージェントに正しいコンテキストを提供していないことのようなので、えっと、私たちは、あなたが正しいエージェントに正しいコンテキストを提供したいのと同じように、あなたが彼らに正しい計画とコンテキストを提供していることを確認したいです。あなたがしたい別のことは、任意の時点でエージェントがどこにいるかを知っていることを確認することです。ですよね?つまり、あなたはあなたが持っているクラウドエージェントがあなたが彼らにするように頼んでいることをしていることを確認したいです。あなたはエージェントが立ち往生している場所、または彼らが現在立ち往生しているかどうか、または彼らがまだ働いているかどうかを確認することができます。
最後のポイントは、エンジニアとして、えっと、これは非常に重要だと感じています。それは、私のチーム全体がコードをコミットしようとしているなら、彼らをレビューする必要があります。彼らをレビューする必要があるなら、その後、私はえっとコーディング環境を構築する必要があります。そして、その後、私はそれが有効であることを確認する必要があります。最悪の場合、それは機能しないので、私は戻って彼らに言う必要があります。それは機能していません。彼らはえっとPRを再構築する必要があります。このことは私自分ですることができます。ですよね?つまり、Light realmでは、私たちは3つのプリミティブで考えています。適切に計画して、エージェントが最高のえっとものを持っていることを確認する必要があります。あなたはオーケストレーション、あなたが確認する必要がありますを必要とします。あなたはエージェントがどこにいるかを知る必要があります。あなたはプレビューを必要とします。つまり、私は迅速にえっと飛び込みます。あなたは知っています。私たちのアプリケーション。私はすでに多くを話したと感じています。しかし、私は何も見せていません。
えっと、今、私はえっと、私はあなたに私たちのアプリを紹介します。ああ、これは中間部分です。ああ、そうです。つまり、これはLight printプラットフォームです。そして、Light printプラットフォームは基本的にあなたのチームが協力する作業台です。ですよね?ですから、あなたは見ることができます。えっと、ちょうどたくさんのえっとボードとたくさんのタスクのようなもの。その後、はい、サイドにプランを見ることができます。つまり、基本的にここで起こっていることは、私たちは基本的にタスク作成を支援しています。つまり、私たちはプロンプトをタスク形式に入れます。つまり、それは実際にはコードベースのバックグラウンドに根を持っており、基本的に素早くえっとたくさんの情報であなたのタスクを豊かにすることができます。そのため、コーディングエージェントはえっと起動することができます。つまり、私たちはコーディングエージェントのすべてセットをサポートしています。私たちはカーソル、エントロピック、コデックスを持っています。これらはちょうど私たちのシステムの下のツールです。
そして、基本的に、私たちは私たち自身の光クラウドエージェントを持っており、それはまたその周りのツールでもあります。ですよね?クラウドエージェントを起動すると、基本的にクリックしてコードベースを深く掘り下げ、内部のコードに入ることができます。ですから、あなたが見ているものは現在、計画モードです。ですよね?このスクリーンを変更したいと思っています。それは少し退屈です。それはAIではありません。基本的には、あなたの最近のタスクと最近のプランのリストです。ですよね?つまり、えっと、えっと今、私たちの計画モードを使用しましょう。つまり、私たちは現在、Gstackと私たちの独自のLight rintプランモードをサポートしています。ですよね?つまり、私たちは現在の光計画モードを使用します。そして、基本的に、それがしていることは、えっと、ここのアイデアは、推奨オプションと他の作成を複数の選択肢で使いたいということです。ですよね?それは本当に、えっと、私たちの最も好きなえっと使用例です。ですよね?
皆さん、すべての人が選択が好きです。皆、えっと、あなたが知っている、えっと、AIが彼らのために選択肢を思い付くのが好きです。ですよね。しかし、私たちはビジュアルも好きです。ですよね。私たちはえっとモデルを見るのが好きなので、私たちはまたAIを少し制約し、えっとAIは少し見た目はユーザーに良い体験を作成してください。視覚的に何かを見せることで。ですよね。つまり、ユーザーが異なるオプションを好きなように選択することを許可します。さらには、えっと、さらに多くのオプションを作成さえします。ですよね。言う、わかった。あなたが知っています。えっと、別の2つの新しいオプションをください。その後、その2つのオプション一緒に追加されます。その後、あなたはそれらの中からも選択することができます。ですよね?つまり、私たちは代理人に何もしないことについてあまり多くを言っていません。しかし、私たちは基本的に彼らにえっとえっと、導きの原則のセットを与えました。
つまり、あなたがすべての選択を行った後、あなたは実際に完全なえっとのようなアプリケーションえっとえっとプレビュー、あなたの機能がどのように見えるかを取得します。時々、AIが選択したものに応じて、少し対話的です。その後、ここでも、私たちのケースでは色を変更することができます。その後、私たちは完全なえっと仕様を生成します。これは、コーディングエージェントに送信されます。ですよね?それは私たちのボットにそれを置き、その後、私たちはそれを送信し、その後、えっと、私たちは20分後にえっと整頓を確認するかもしれません。ですよね。つまり、今はエージェントを選択して、それを発送するようなものです。はい。一瞬後。つまり、今は完了です。つまり、今、私たちは実際に私たちのシステムのプレビュー部分に入ることができます。ですよね。それは本当に私にとって大きなことです。
えっと、アプリケーションを表示してクリックできます。そして、これは基本的に任意のソフトウェアファクトリのために設定されたものです。プレビューモードがない場合、あなたは彼らに尋ねる必要があります。ねえ、あなたが知っています。私の同僚がどうやってPRのために作成したアプリケーションをプレビューできるのですか?なぜなら、それは非常に重要だからです。みんなが機能しないPRをレビューするより嫌いなことはないからです。ですよね?つまり、私たちはえっとチーム全体のメンバーが私たちがそれを送信する前にアプリケーションをプレビューできるようにします。つまり、Light sprintでLight sprintを使用していて、私たちは多くの成功を収めており、並列に物事を行うことは本当に面白いです。また、少しえっと、ローカルホストで物事を行います。つまり、私たちは主にクラウドエージェントです。
そういうわけで、もし、えっと、モバイルエラーのようなもの、または、えっと、小さな問題のようなもので、人々が私たちに伝えてくれたものなら、私たちはそれをボードに載せて、その後クラウドエージェントを起動して実行します。ですね。Lightrintはまずクラウドエージェントを構築します、ですね、私たち、えっと、人々は、えっと、計画を使って計画すべきだと思います。あなたは私たちのビジュアルプランニングウィザードを使うことができます、ですね、彼らは調整するべきです、彼らはプレビューするべきです、えっと、それは非常に重要です、ですね。だからこれは私のソーシャルとLight Sprint、えっと、リンクです。だから自由にスクリーンショットを撮って使用してください。この、えっと、に参加していただき本当にありがとうございます、わあ。ありがとうございます。Hangはこのような素晴らしい製品です。私はそこでデモを見て、「わあ、私は、えっと、今や完全に異なるプロダクトマネージャーになることができます」と思いました。ですね。本当に素晴らしいです。本当にありがとうございます。あなたは知っていますか、過去数回の講演で私が気づいたことは何ですか。
えっと、一貫した配色スキームに気づきました。あなたも気づきましたか。えっと、ですね。それは、えっと、すべてとても巧妙です。いいえ。とにかく、えっと、いいえ、いいえ、いいえ、敬意がないわけではありません。みんなこのオレンジ色のものを持っています。わあ。それは、えっと、少し面白いです。少し派生的です。とにかく、えっと、次の会話に向けて、私はこれに興奮しています。なぜなら、おい、オーガナイザーたちに拍手を送ることができますか。彼らは非常に上手にやりました。彼らはあまりにも上手にやりました。本当に、本当に、えっと、素晴らしいSherry。みんなが上手にやりました。あなたはおそらくこれを知らないかもしれませんが、講演の構造により、それらは相互に設定されています。ですね。本当に素晴らしいです。ここに自然な順序があります。だから前回の講演は、えっと、えっと、えっと、プロジェクト管理の側面についてでした。次の講演もそのことについてです。
ここに熱点があるかもしれません、えっと、あなたが知っているように、Louis、私たちの次の講演者が明らかにしますが、熱点は将来にあります。私たちはおそらくコードを書いたり発送したりするエージェントを計画したりオーケストレートしたりするだけです。だからコードを書いて発送するという仕事は転換されました。私たちは単なる計画者とオーケストレーターになっています。えっと、そしてそれは少し物事のようです。Louは私たちに彼の以前のビジネスについての物語を教えてくれます、えっと、トラクションを得ようとしたが得られなかった。えっと、あなたが知っているように、これを言うでしょう。Wは勝利を表し、Lは教訓を表します。だから彼はここで学ぶべき教訓を持っているでしょう。えっと、お願いします、お願いします、Louieに最大の拍手を与えてください。ですね。シンガポール、私たちはどうですか。わあ。行きましょう。ああ、日曜日午後5時。エネルギーを高く保ちましょう。ですね。最後のものはあなたと冷たいビールのグラスの間にあります。おそらく。えっと、ですね。私はLouieです。
えっと、私は最近、Vibe Cambanという名前のスタートアップの共同創業者ではなくなりました。えっと、私はまだロンドンでAI tinkersという名前の人工知能コミュニティを運営しています。ですから、もしあなたがロンドンにいたことがあるなら、イベントに参加してください。あなたはとても楽しむでしょう。えっと、今日話したいのは、なぜこのスタートアップを始めたのか、そしてなぜそれを閉じたのかということです。基本的に、ソフトウェアエンジニアリングの仕事は、人工知能が生成したコードを計画したりレビューしたりすることに迅速に進化しています。えっと、私は部屋にどれだけの人がこれに興味を持っているのか、または誰がスタートアップ創業者であるのか、または彼らの人生のある段階でスタートアップを開始するのかわかりません。ですね。ですね。ですね。私は会社を最終的に閉じた理由のいくつかについて議論しようとします。そして最後に、おそらくそこから吸収して学ぶことができるものについて。
えっと、私はすぐにあなたに私たちが何を開発していたかを教えます。だからあなたは古代の歴史に戻らなければなりません。それは2025年5月でした。私のデスクトップはこんな感じになり始めました。私は多くのタブを開きました。Claude Codeはちょうど立ち上がったばかりで、私は同時に複数のエージェントを実行しようとしました。これは仕事をする完全に新しい方法だと思い始めました。精度が100%に達し、エージェントが何をしているかもう監視する必要がなくなったときはどうなるのか。その インターフェースがどのように見えるか想像し始めました。本質的には、ソフトウェアエンジニアリングのすべての部分のようなものです。コード書く部分を除いて。
えっと、もし私たちがデバッガーのような多くのソフトウェアを持っていることを考えるなら、テスト用のUI、ネットワークリクエストなど、私たちが使うソフトウェアのほとんどは実際にはコードを書くために使われています。だからあなたが仕事のその部分を排除したら、あなたは計画部分と審査部分だけを残すでしょう。えっと、そのためにあなたは完全に異なるUIを思い付くことができます。だから私たちはVibe Canbanの構築を始めました。その名前は基本的にそのようなものです。これはカンバンボードで、Jiraでのようにチケットを作成することができます。えっと、しかし違いはあなたはこれらのチケットのいずれかをクリックして、再生ボタンをクリックして、Codex、Claude Code、または他の6つの異なるエージェントのいずれかでそれを実行することを選択できるということです。何かが実行を完了したら、その仕事をレビューするための素晴らしいインターフェースが得られます。
だから方法の1つは明らかにコードレビューです。えっと、別の方法は、もしそれがウェブサイトやアプリケーションのようなものなら、何かをテストすることです。えっと、だからこれはすべて古代の歴史です。今ではそれは非常に明白です。2025年6月では、それはまったく明白ではありませんでした。私たちが当時やっていた多くの仕事は新しいアイデアを開拓していました。私たちはたくさんのものをリリースして、その後アプリケーションから削除しました。私は表示しませんでした。だからこれを実現するにはいくつかの実験が必要でした。では、なぜ私たちはこれをしたのですか。ですね。それは一切が計画とレビューになっているからです。えっと、もしあなたがGitHub Copilotが2021年に登場する前にソフトウェアエンジニアリングに関与する異なるタスクに時間を割く方法についてかもしれないことを考えるなら、私たちのほとんどの時間はIDEで過ごされました、慎重にコードをレビューして、ある程度までコードを見ました。
時間がたつにつれて、この部分は私たちが行った総仕事のパーセンテージに縮小してきました。だからあなたはCopilotの瞬間を取得します。その後あなたは知っています。突然、オートコンプリートがたくさんのコードを完成させました。その後ChatGPTを取得して、コードを貼り付けることができて、別の関数を取得して、それを貼り戻すか、またはあなたはもう Stack Overflowに行く必要がなくなりました。これはあなたが知っているようなものです。反復速度をはるかに速くします。その後、2024年にCursorを取得して、まだコードを見ているようなものですが、側面にこのようなチャットがあります。そして最終的には今日の位置に到達します。それはClaude Codeです。正直に言うと、多くのvibe codingが行われていると思います。あなたはほとんど、えっと、何が起こっているかを見る必要がありません。
えっと、だからそれは、私たちが以前コード書くのに費やしたすべての時間を取り戻したのか、またはそれが単に開発プロセスの他の部分に転移したのかのような興味深い質問を提起します。答えはおそらく両方だと思います。ソフトウェアエンジニアリングの全体的な仕事を加速させたと思いますが、同時に、私は今私がしなければならない仕事を計画したりレビューしたりするのに多くの時間を費やしています。これは状況によって異なります。だから、方法の1つは、これはより実用的な思考方法に似ています。計画とレビューのフレームワークがどのように有用であるかを示しています。エージェントが非常に正確になる方法を理解できれば、あなたは実際にエージェントであなたの仕事を加速できると思います。えっと、コード書くエージェントの精度を得る方法の1つは、計画に多くの時間を費やすことです。だから私は何を意味していますか。
私は、このもっとも基本的なバージョンはCodexやClaude Codeの計画モードのようなものだということを意味しています。だからそれを使用してください。私はそれを絶対にすべてに使用します。えっと、より複雑なバージョンはフレームワークを使用しています。だからスペック駆動開発フレームワークには多くの素晴らしいものがあり、私は議論があったと信じています。えっと、あなたはこの尋問方法を使うことができて、あなたが取り組んでいるタスクについて詳しくあなたに質問するのをやめさせることができます。あなたはタスクが提起する可能性のある質問に既に答えるまで。しかし要点は、あなたは基本的にエージェントに何かをするよう求める前に計画に多くの時間を費やしているということです。その結果は、ほとんどの場合、あなたのエージェントは正確に仕事を完了し、おそらく1つの改訂、2つの改訂だけが必要です。
別の方法は、私は私たちがみんなが少し有罪に感じるものについて考えています。あなたは計画に多くの時間を費やさず、あなたはたくさんのレビューを行う必要があるため苦しむでしょう。だからあなたが知っているように、私たちは何度も単に緩く定義された機能を投げ出して、あなたが知っているように、モデルが私たちに与えるものが半成品であるか完全にポイントを逃したときに不平を言うのか。だからあなたが計画に少ない時間を費やすなら、あなたはモデルと何度も前後する必要がある可能性が高いです。私はこの問題の別の側面が実際に仕事の種類であると思います。これは私が本当に多くの議論を見たことがないものです。これはやや半成品の考えのようなものですが、あなたがエンジニアリング仕事の種類について考えるなら、機能開発は移行から完全に異なります。
だからこれらの異なるワークフローはすべて、計画に多くの時間を費やすか、あなたが知っているように、えっと、おそらくあなたがこれをしているなら、あなたは複数のエージェントを同時に実行することができる、代わりにより多くのレビュー、より多くの人間の関与のワークフロー、あなたは同時にものを実行していない。これは、えっと、より多くのフロントエンド仕事の方向に傾く可能性が高いです。だからあなたが知っているように、複雑なフロントエンド機能のすべての要件を表現することは時々本当に難しいです。多くの相互作用が関係しています。多くのビジュアル、えっと、あなたが知っています、伝える必要があるものがあります。えっと、バックエンドに比べて、あなたはロジックを説明します。あなたがバックエンドロジックを説明するときに、共通言語を見つけるのははるかに簡単です。私が発見するところ。だからあなたが知っているように、計画と同時に複数のものを実行することは、これらのケースで私にはより良く機能する傾向があります。
だからええと、要約すると、基本的に、5分計画を費やすなら、あなたはあなた自身のためにたくさんのレビュー時間を節約するかもしれません。私は常に提案します。あなたが知っているように、あなたができるだけそちらの方向にスライダーを押してください。ですね。その後、私たちは歴史を使用して物事がどのように進むのかを理解することができます。だから、GitHub Copilotは数秒後に実行されて、あなたに結果を与えます。
えっと、あなたが知っているように、2024年のCursorの元のバージョンは結果を生成するために30秒以上実行され、私たちはClaude Codeにおいて、それは少し平均的に5分後に実行されて、私に結果を与えるようなものです。だからそれが起こる理由はツール使用が増加したからです。だからエージェントはあなたに反応を与えて、エージェントはタイプチェッカーを実行して、あなたに反応を与えて、エージェントはタイプチェッカーを実行して、その後Playwrightを使用して、あなたに反応を与えます。あなたは推測することができます。あなたが知っているように、より多くの仕事がループに組み込まれるとき。基本的に、コード書くエージェントが費やす時間は増加しています。だからコード書くエージェント履歴の興味深い時点にいます。見ることが快適である範囲を本当に超えようとしています。
例えば、コード書くエージェントが20分実行される場合、あなたはどうしますか。あなたはそこに座ってあなたの端末を見ません。あなたが知っているように、親指をクルクルします。私は意味しています。あなたはおそらく先延ばしにして、最終的にTwitterまたは他の何かのようなものに上がるでしょう。しかし、これは私の時間の良い使用であると私は思いません。そして、それはすぐに退屈になるでしょう。だからあなたが知っているように、もし私が予測しなければならないなら、1年後に、あなたが知っているように、私たちはおそらく見ることにあります。あなたが知っているように、これらのものは30分実行され、私たちはこれを並列化する方法を見つける必要があります、えっと、多くを。えっと、ですね。私は正直なところほぼ時間がないので、いくつかの迅速な観察で要約するつもりです。私は、基本的に、出現している仕事は管理的だと思います。
ですから、ソフトウェアエンジニアチーム内での仕事が大量のコード作成であり、多くのレビューを行わず、多くのアーキテクチャも行わない場合、またより高度またはテクニカルマネージャーの役割に関連するかもしれない他のすべてのものを知っている場合、他のすべてのものは基本的に消えてしまい、コード作成部分が残り、残りはすべての伝統的な管理機能になります。ええ、つまり、開発者の焦点を最大化する体験とインターフェースを構築する必要があります。ですから、計画やレビュー対象のような重要なことに焦点を当てさせてください。まあ、時間がなくなったのでそこで止めなければなりませんでしたが、非常にありがとうございます。ここに来られて嬉しいです。ありがとうございます、シンガポール。>> Louieのために拍手し続けてください、皆さん。>> それは信じられないほどの講演でした。私は今マネージャーです。次の講演者に譲ります。
私は今マネージャーです。ねえ、皆さんどうですか?気分はどうですか?何ですって?あなたはなぜこんなところにいるのですか、相棒?寝るなり何なり、彼がしたいことをやりなさい。>> よろしい、では小さなゲームをやりましょう。次の講演者が誰だか当てることができますか?えっ、違う。>> 何ですって?>> 私は何も意味していないのですが、相棒。私の >> あなたは当てることができますか?>> できません。次の講演者はどこから来たのか当てることができますか?ああ、ところで、大きな声で答えを叫んでください。あなたの選択肢はシンガポール。私は言いたいのは、彼はもちろんシンガポールに留まって、その次はスリランカ、またはもう一度サンフランシスコです。あなたの答えを叫んでください。来てください。>> SF。彼女が言いました。どこですか?>> サンフランシスコ。ねえ、私たちはサンフランシスコ行きの列車に乗っています。はい。サンフランシスコのすべての人のために拍手してください。>> サンフランシスコから来た人が多すぎます。>> それが起こった場所です、兄弟。AI エンジニア。>> それは夢が叶う場所です。>> はい。はい。なんと素晴らしいQ&A。ありがとう。
ありがとうございます。あなたの coc のすべての人のために拍手してください。Usman、次の講演は >> Interphase で働く Harsha から来ています。これは AI 研究ラボで、彼は transformer を超えた新しいアーキテクチャで、彼らがどのように専門的なコーディングモデルを訓練しているかを私たちに説明します。ですから Harsha に最も温かい拍手をしてください。>> ありがとうございます。ありがとうございます。ところで、素晴らしい紹介です。皆さん、おはようございます。私の名前は Harsha です。I am the co-founder and CTO of Interphase です。私たちは transformer を再発明する研究ラボです。今日、私は確定的な開発者タスク向けに新しいアーキテクチャを構築する方法についてお話ししたいと思います。さて、過去20年間で、人工知能は硬直した機械学習モデルから、より大規模でより一般化可能な、ああ、知能に発展してきました。これは今日、人工知能のワークフローを実行するために使用できるものです。これはもう秘密ではありません。
私たちは構造化された微調整モデルの構築から、今日のプロンプトへと進化しました。これにより、エージェントを構築することができます。より具体的には、この2010年代初期から2015年を考えてみてください。あなたは銀行です。光学文字認識を行いたいと考えています。どのように対処しますか?大規模なデータセットを購入するか取得する必要があります。それだけでなく、そのモデルを構築するために才能のあるチームを集め、展開して維持する必要があります。これには数百万ドル、さらには数百万ドルのコストがかかる可能性があります。大言語モデルの発明のおかげで、私たちはプロンプトでこれを行うことができました。しかし、問題は依然として存在します。
幻覚の問題があります。GPT のようなモデルは現在巨大な多モーダルですが、Gemini でも同様に幻覚が発生します。これは、大量のデータ入力に対して確定的に動作することを期待するときに上下文漂移が発生するため、幻覚が起こります。Interphase では、正確にこの問題を解決するために新しいアーキテクチャを設計しました。私たちが訓練したもの、つまり、ああ、大言語モデルを持ってきました。申し訳ありません。機械学習モデルと大言語モデルの柔軟性の厳密性を持ってきました。では、この問題にどのように対処したのでしょうか?非常に特定のタスク用のエンコーダーとして機械学習モデルを使用してから、その大言語モデルを使用してデコードステージを作成します。今日、このモデルができることのいくつかを展示したいと思います。三つのことを素早く展示したいと思います。これについて話し合います。
私はこれをすばやく実行して、議論する時間を確保したいだけです。まず、これは実在の文書です。そこからデータを抽出したいのです。テキストだけではなく、その上の顔も検出して、彼の年齢も計算してそれを確認したいのです。ですからこれに対して Interphase を実行しました。これが Interphase が私たちに与えたものです。テキストを抽出しただけでなく、画像内にテキストが表示される場所の境界ボックス、実際のピクセル座標も与えました。両方の顔を正しく見つけました。さらに重要なことに、年齢を正しく計算することができました。これは事実です。さて、具体的なモデルプロバイダーまたは光学文字認識プロバイダーを見せてあげましょう。それも光学文字認識を行っています。それは Redu です。多くの人がそれについて聞いたことがあるかもしれません。Redu は確かにテキストを正しく抽出しましたが、他の部分で失敗しました。テキストがどこにあるかを検出し、年齢を計算する。
さて、これが発生するのはエンコーダーがより強いからです。次のことをしましょう。この特定の LinkedIn ページをスクレイピングしたいと思っています。驚いたことに Gary はまだ私をフォローしていませんが、まあ。ですから Gary の経験を抽出したいのです。LinkedIn のスクレイピングは難しい場合があります。彼らが持つブロッキングとボットチェックのため。このボタンを超えて彼の経験を抽出したいのです。今、それは興味深いものになるでしょう。では、Interphase が何をしたかを見てみましょう。最初のページで見たものだけでなく、彼の実習までずっと戻ってくれました。これが可能だったのは、私たち自身のスクリプトモデルのおかげです。ああ LinkedIn をスクレイピングすることができます。最後に、ああ PDF について議論したいと思います。密集した PDF です。申し訳ございません。ああ ですから一度だけ実行する必要があります。このスクリーンでは密集した PDF が表示されます。これはこの特定のモデルの研究論文です。
私たちはこのテキスト全体を抽出して、ヒンディー語に翻訳し、この PDF 内の文字数を計算したいと思っています。実行中に、デモンストレーションに戻りたいのです。cuz はそれに時間がかかり、その後それについて議論します。では、Interphase ができることのデモンストレーションを見たので、どのようにしてそれを行ったかについて話したいと思います。実際に訓練したものについて話したいと思います。光学文字認識をどのように行いますか?それの前に、私たちの立場を展示したいと思います。あなたの画面で。これは M OCR ベンチです。これは、研究論文だけでなく、複雑な手書き、大規模多言語ああ光学文字認識に使用される複雑なファイルを扱う際に、モデルがどの程度優れているかを示しています。Chundra 光学文字認識のような特殊なモデルと比較しても、Redu のような特定のプロバイダーと比較しても、私たちは1位にランクされています。これはあなたが見る例です。これはあなたが見る出力です。
舞台裏で起こっていることは、このイメージが私たちが訓練した encoder に入力されることです。それは CNN スタックで、テキスト領域がどこにあるかを示しています。各テキスト領域はクロップ位置になります。ですからテキストがある場所から画像をクロップして、出力を生成するために decoder に入力します。さて、これは信頼度スコアを提供します。これは境界ボックスとメタデータを提供するため、単なるテキストではなく、実際に信頼できるものです。さらに一歩進めて、この情報をより大きなモデル、つまり decoder に入力することができます。私たちはそれにも条件付けしました。構造化された出力を取得するためです。これが年齢部分の出処です。情報を取得して、その上に条件付けします。これが OCR です。今、私は物体検出に目を向けます。どのようにして顔の検出に成功しましたか?
さて、これは自然言語での物体検出です。YOLO モデルは良いですが、訓練された特定のオブジェクトのみを検出します。私たちは自然言語物体検出で1位にランクされています。これは、プロンプトを入力することを意味します。この部屋を例にしましょう。私は自分の前で見ているものの画像を与えて、黒い T シャツを着ているすべての人を検出してと言います。Interface はそれができました。これは複雑なことです。私たちはどのようにそれができたのでしょうか?ですから同じ画像を取得して、テキスト encoder があり、テキスト側をエンコードして、ユーザーが何を望んでいるかを理解します。画像 encoder があり、画像の位置側を理解するか表します。その後、対比的なセグメンテーションを作成します。つまり、ピクセルをより近く引っ張り、オブジェクトを正確に検出できるようにします。
この情報をさらに使用すれば、これらのピクセルをセグメント化できるようになります。同じもの――image encoder、prompt encoder、その後、すべてのピクセルを分類してマスクの可能性を与える mask decoder があります。ASR 多モーダルは大きなことです。そんなに多くのモデルが既成の音声をサポートしていません。今日はそれについて話したいと思います。私たちは最速の ASR モデルの1つであり、最も低い VR エラーレートも持っています。では、私たちはどのようにしてそれを行ったのでしょうか?つまり、アラート形式の音声を与えるとき、まず音声が発生する場所を検出し、それらの音声片をクロップします。ですから、ブロックを取得して、encoder 特性の抽出にこれらのブロックを使用します。その encoder も、特性抽出の埋め込みのために訓練されます。今、これらの埋め込みはクラスタリングに使用されます。
クラスタリングにより、特性をグループに分割でき、これは dization 出力を提供します。ですから、今、どの音声がどのスピーカーからのものであるかがわかります。しかし、テキストは再び encoder セクションから来ています。音声を周波数スペクトログラムに変換します。周波数スペクトログラムは基本的に音声の視覚的表現であり、その後、テキストを生成または分類するためのフレームワークとして使用します。ですから、発音がどうであれ、特にテキストとして分類されます。ですから、次のことに進む前に、translation について Interface が何を提供しているかを見てみましょう。そのため、あなたはすべてのテキストを正常に抽出するだけでなく、ヒンディー語に翻訳することもでき、それが適切でない場合には関連性と安全性を保ったままにしました。例えば、アドレスを翻訳せず、著者名を翻訳せず、文字数も正しく計算しました。
さて、これを Claude 4.7 Opus と比較して、Claude が何をするか見てみましょう。このため、3回の試行を与えました。これが私が戻った理由です。Claude は3回失敗しました。これはタイムアウトのためです。しかし、たとえそれができたとしても、これが長期のタスクである場合、多言語性に問題があるでしょう。特に南アジア言語。以前に戻りましょう。ですから、vision、audio、text の3つのものを見ました。これら3つの encoder を使用する際に、同じ decoder で動作するようにこれらのアダプターを訓練しました。ですから、正確なデータを取得しますが、そのデータがどこから来たかを知っています。この方法で多モーダル問題を解決できます。今日、つい今、話した3つのモダリティに関するデータを展示することにとても興奮しています。
私たちはこれら――interface と、本番環境で通常使用するモデルを比較します。これらは経済的で、一度のタスクで完了できます。しかし、私たちは確定的なタスク、つまり1つの出力のみがあるタスクのために比較しました。画像を見ると、私の名前は魔法のように変わることはできません。それでも Harsha になります。Yoan、そして私と私のチームは、過去約1年間、どのように特定タスクモデルを構築するかについて研究してきました。私たちは同じことをしました。小規模言語モデルを選択しました。大規模データセットを調達するために多くのお金を費やしました。私たちは確定的の同じ問題に何度も直面しました。モデルは幻覚を見ます。ですから、会議室に戻って、アーキテクチャを再設計し、再考するべき場所だと思いました。私たちはデータがボトルネックではないことを観察しました。
アーキテクチャは、Interface が解決すべき問題です。最後に、このような素晴らしい視聴者の前とこのような美しい国で話すことは本当に光栄です。Interface に感謝します。正直なところ、それらのベンチマークは私に深い印象を与えました。ありがとうございました。それは信じられませんでした。ああ、なんと素晴らしいベンチマークでしょう。どうですか、Usman?>> こんにちは。>> 進行はどうですか?>> まあまあです。>> 皆さん、進行はどうですか?>> あのね、私は誓って、聴衆としてのあなたたち、私に Michael Scott を感じさせます。〈オフィス〉を見ていますか。あなたは私の意味が分かりますか?私はここにいます。あなたを楽しませていますか?あなたはこのようなものです。「いいえ、家に帰る準備をしています。」帰る準備をしないでください。今はその時ではありません。わかりました。あなたが刺激を受けてほしいです。あなたは刺激を受けていますか?>> これはより良いです。これはより良いです。Usman、次は何ですか?>> さて、Harishi という男がいます。興味深いことに、>> これは素晴らしい。
今回、彼は実際にはシンガポールにいました。>> シンガポール技術についてです。>> 私たちはシンガポールが好きです。>> そうですね。>> そのとおりです。エネルギーが終わりました。>> えっと、>> 続けてください。>> わかりました。えっと、彼、あの、彼のアプリケーションは実際には、AI、特に編码方面での彼の個人的な誤りに基づいています。ここにいるすべてのvibe系コーダーが、私たちが経験したすべての誤り、エラー、またはエラー数に関連できると確信しています。>> ところで、この壁紙を見てください。>> わあ。>> そうですね。この壁紙が、それがスーパーブロックバスターになることをどのように知るかです。本当にクールです。準備はいいですか?やあ、>> 開始できます。皆さん、もう一度Hishに最も熱い拍手を送ります。>> わかりました皆さん。では、これは実際には私が非公式の会議での講演から作成したBlissのカスタムバージョンです。その講演は「グリーンフィールドから抜け出す方法」と呼ばれていました。Blissを知らないなら、少なくともグリーンフィールドを知っています。
では、「国家なしの全コード」へようこそ、ですね?これは作業タイトルです。皆さんはずっとタイトルを変え続けていると思います。ですから、これはコーディングエージェントについての講演ではありません。これはコーディングエージェントについての講演ではありません。これは大型の既存システム内でエージェントを構築することについての講演です、ですね?古いコード、組織、そしてデータを含めてです。なぜなら、これが最終的に私たちがやろうとしていることだからです。これは再構築ではなく修正、作成ではなく更新、新しいものではなく古いコードと組織についてです。実証済みのように、これらの基本的な先験から始めると、異なるプリミティブがたくさん出てくるのです、ですね?コンテキストウィンドウを一度に埋めようとするのではなく、より単純で再利用可能な作業ユニットが好まれます、ですね?コンテキストに追加するのではなく、コンテキストから削除します。制御フローとプロンプトを分離し、プロンプトとコードを分離するのです。
あなたは段階的な成功と失敗ではなく、行動を調整します。コスト意識のあるシステムを構築し、ビルドとランタイムを分離することで、リソースを効率的に浸透させることができます。実証済みのように、これらすべてを上手くやれば、結果を送ることができ、1つのことをして完了を保つことができるのです。崩壊したものを修正して、修正されたままに保つことができます。いつでもvibeできます、ですね?これがそれをより楽しくします。ですから、これが本当に講演の主要な部分です。これを説明するのに少し時間をかけるつもりですが、もしそれで大丈夫なら、あの、直接進むことができます。
では、この前に、私は電子機器とソフトウェア分野で数年間過ごしました。ボトルネックはずっとデータでした—データを決定に役立つ形に整形する方法です。十年間の思考の後、私はSouthbridgeを設立しました。当時の信念は、3.5 Turboがそのロック解除力であり、私たちが必要とした最後の汎用インテリジェンスユニットであり、その後は他のすべてを構築できるというものでした。その後、私たちはデータシステムのコネクタを構築し、自己修復と再生を可能にしました。医療、金融、エネルギーなどの業界向けにETLシステムを構築しました。私は、私たちが一つの種として、また一つの企業として、取得問題の解決を開始していると思います。取得を水平カテゴリーとして、新しい顧客、新しいデータセット、またはユーザーがアップロードしたデータのいずれにせよ。私たちが設立以来行ってきたことのすべてが、AIを使用してデータの第一マイル問題を解決することです。
しかし問題は、データから始めることの難しさにあります。初日から難易度は11に設定されています、ですね?なぜなら、あなたは初めからクリティカルパスにいるからです。あなたの仕事は基準値から一日の終わりから長期的な視点と信頼性を必要とします。小さなデータ、例えば1 GBで実行しても、フォーマットの検証、データ検証、エンティティの解析には数百万の操作が必要であり、これらのエラーは積み重なるのです。コンテキストウィンドウ—もしあなたがGeminiが200万から100万に下がったのを覚えているなら、実際にまだ後退しているのです、ですね?しかし、たとえそれが100倍増加したとしても、私たちが一日に処理するデータ量は依然として、あなたが処理できるものをはるかに超えています。しかし、よく見ると、私が見てきた最大で最も致命的なデータ企業の問題は多様性です、ですね?データは全体のスタックとして非常に非常に多様です。マクロレベルにせよミクロレベルにせよ、そうなのです、ですね?
ミクロレベルでは、人間として、私たちは一つの種として、私たちが想像できるすべてのものをキャンバスにしました。ドキュメント、Excelシート、PDF。内部では、Excelの結合セルボタンが人類に対する最大の犯罪の1つだというジョークがあります。マクロレベルでは、企業は本当にユニークなスノーフレークです。異なるスタック、プログラム、SOP、セキュリティ境界を持っているからです。同じデータベース、例えば小さなPostgresでさえも、異なるネットワークとパーミッションシステムを通して見ると、完全に異なるシステムのように見えます。しかし、私はここで重要な区別をしたいのです。それはオンラインとオフラインエージェントシステム間の区別です、ですね?これはこれらのことについて考えるための有用な方法です。
えっと、オンラインとオフラインは、誰かが監視していることと誰も監視していないことを意味します、ですね?しかし、私は思うに、私たちが皆思うに、ほとんどの実際のシステムは実際にはオンラインコンポーネントよりもはるかに大きなオフラインコンポーネントを持っています。特に、私たちが行ったすべてのプロジェクトでは、ですね?あなたが毎回ゼロから構築する必要があるときだけ、本当にアクティブで、レイテンシに敏感な人間の介入が必要です。もし、あなたが時間をかけて信頼できるシステムを構築し、あなたの好みを記録することができるなら、これらすべての作業はオフラインで行うことができ、夜間に地域モデルを実行し、コストが低く、エージェントは電化製品のように機能できます。彼らは同じ仕事を数千回繰り返し実行できます、ですね?あなたは寝る前の夜に食器洗い機を満杯にします。次は、私たちは依然としてコーディングエージェントがエージェント作業の基本的な基質になると信じています、ですね?
すべてのエージェント作業がコーディングであるからではなく、ですね?実は、私たちはすぐにコーディングで飽和すると思っています。しかし、コーディングエージェントループが最も多くのリソース、最も強化学習、最も配置圧力を持っているものになっているからであり、そしてそれは汎用のプリミティブを持っています:読み取り、書き込み、編集、シェル、ですね?V8とブラウザが実際にはウェブサイトではない大量のソフトウェアの基質になったのと同じように、私たちはコーディングエージェントフレームワークが大量のエージェント作業のエンジン層になると信じています。さて、物事の全体的な構造についてはそれで十分です。私たちが実際に何を学んだのでしょうか?ですね?最初のことは単発呼び出しのプッシュを停止することです、ですね?単発パフォーマンスは、ものを構築するときは非常に興味深いかもしれないと思います。ここのように、複雑な指示、長期計画、巨大なスキルのようなもの。
Sabina が後ろの方の圧縮で薯条とさらに薯条について話していると思うのです。ですが反復可能な仕事は、これは私たちが言う、こうしたすべての本能に逆行する場所ですね。これはあなたが構築したい方法ではないのです。自動運転エージェントが欲しければ、ですね。なぜなら、あなたがしたい最初のことは、事柄を小さな原子的なフラグメントに分解することだからです。Hankqu(これは私たちが使用している、長い間使用してきた、最近オープンソース化したランタイム)では、それらの小さなボックスは「コドン」と呼ばれます、ですね。あなたはこれらをリンクさせて、あなたが求めている動作を得て、それらを再利用可能で構成可能にするのです。このようにそれを分解すれば、長時間実行についてより容易に推論することができます。これが最終的にボトルネックになるのです。
第20時間または第25時間に何が起こるかを推論できる能力は、あなたのように、人間として、最終的にあなたが複雑なソフトウェアを構築する際のボトルネックになるのですね。次のことはコンテキストから物を削除することです、ですね。多くのフレームワーク、システム、あるいはフレームワークがコンテキストから物を削除する方法がないことに、私はまだ驚いています、ですね。私たちの長年のデフォルト行動は、コンテキストを削除するための境界があり、あなたが必要としないものをアーカイブすることなのです、ですね。私たちが内部で「ワールドライン腐食」と呼ぶものを防ぐために――ご存知のように、テッド・ラッソが「金魚のようでありなさい」と言うことは最終的には良いことなのです。次のことは単に型で成分を分離することです。
業界として、私たちはずっとこれを再び学んでいるのですね。私がまだ大学にいた時、私たちはフォン・ノイマン・アーキテクチャを持っていて、コードとデータが分離されました。その後、PHP と CGI が出てきて、モデル、ビュー、コントローラーを分離する必要があることを学ぶのに4年かかりました。エージェントに関しても同じ話ですね。あなたが、信頼できるシステムを構築したいなら、あなたはこれら5つのことを可能な限り分離する必要があります、データ、プロンプト、制御などのようにですね。この過去1年間、私たちは多くの人々と協力し、多くの情報にアクセスし、AI生成結果の数百万語を読みました。私が言うように、それは私たちのスーパーパワーです――私たちは出力を読み、私たちはあなたのために出力を読み、私たちはこれらのものから生じるあらゆるものを読みます。10回中9回、もし何かが壊れていたら、それはあなたとエージェント間に間違った抽象的な共有があるか、またはコンテキストに留まる必要のないものが残っているからです。
ですから、私たちのより多くのものについて進みます、ですね。私たちは通常『最良の部分は部分がないことだ』という原則に基づいて構築します、ですね。ですから単純なツールは順番に機能し、私たちが話したように、あなたは絶対に必要な時だけ物を追加します。ですから、私が私たちが並列エージェントを真に必要としなかったことを言う時、これがあなたを驚かせないことを望みます、ですね。私たちが信頼性の仕事で行った仕事のために、単一のメインエージェント・スレッドは私たちに多くの放棄できない利点を提供します、ですね。多くのプログラミング言語、Python、JavaScript、多くはそれに同意するでしょう。私たちはすぐに私たちこちら側の利点をいくつか見てみましょう。しかし、私たちのバージョンのイベント・ループについて、その小さなトリックは私たちが「センチネル」と呼ぶものです。ですから、私たちは最初にこれらをエージェント実行の長期監視のためにデザインしましたが、それらは私たちの最も強力なプリミティブになっています。
ですからセンチネルは、メインループのイベント構成からトリガーされた大規模言語モデル呼び出しですね。それらはトリガーされ、その文脈がテンプレート化され、その後結果がファイルに書き込まれます。センチネルは50回のツール呼び出しごとに一度起動し、何が起こったかを要約してから再び睡眠に戻ります、ですね。しかし、多くの複雑さを生み出さずに動作を捕捉するのに優れていることが判明しました。それはあなたが評価システムをデバッグする必要があるようにします。ですから怠け者、シミュレーション、悪いデータ衛生、ファイル権限、シェル・エラーです。あなたが「センチネル」と呼ぶ再利用可能なものの中で、定義したいパターンを定義し、その後メインスレッドで修正します。ですね。フックよりもはるかに多くです。これは私たちの動作の統合にはるかに優れています。ですから、もう一つやります。もう一つやるだけです。それは予算です。ですね。
私たちのこちら側の長期システムは、すべての重要な軸で費用意識を保つだけで済みます。しかし、あなたが私がこれまでに言ったすべてをしたなら、あなたはSQL のようなもので、宣言的予算システムを作成することができます。あなたはあなたが何を持っているかを表現でき、システムは間のギャップを把握するのです。ですね。AI のような急速に発展する分野では、モデル、フレームワーク、実装の詳細は常に変化しており、宣言的なものは実際に勝つのです、なぜなら、それはあなたが物を書き直す必要がないことを防ぐからです。ですから私たちはすべての異なる軸を持っています――お金、トークン、時間、データアクセス――正しい時にさえ。構築する時、あなたはどのようにしてこれらを割り当てるべきかを表現するのです。実行時に、あなたは実際に何のリソースを持っているかを知っているのです。ですからあなたはこれら二つのことを解決できるのですね。最終的に、あなたが全てのこれらのことをすれば、あなたは道具を構築するのではなく成果を配達することができるのですね。
私はこれを一部屋の人に言います、私自身を含めて、彼らは全て工芸を非常に気にします、道具を気にします、ですね。しかし、ほとんどの人は彼らの食器洗い機がどのように機能するかについて気にしません。彼らは彼らの車にどのように給油するかについて気にしません。彼らはきれいなプレートが欲しいのです。彼らは彼らが行きたい場所に到達したいのです。ですから、私たちの北極星はずっと成果を配達することができるシステムをデプロイすることでした、ですね。これは顧客をできるだけ早く搭乗させ、研究仮説を検証し、統合時間を短縮することかもしれません、ですね。あるいは単に、Achilles と呼ぶものを埋め込まずにすべてをこのようにすることだけかもしれません あなたのデータの中に。そのために、エージェントは基盤施設となる必要があります。それらは平凡で、反復可能で、予測可能になる必要があります。ですからそれは本当に私たちの目標なのですね。遺産になることができるようなものを構築すること。遺産は本当に悪い言葉です、唯一のコードの中でのみ。
ある面では、あなたはそれをもう一度取り戻そうとしています。スピーチに収められない多くの内容がありますが、ここで長いバージョンを見つけることができます。皆さん、ありがとうございました。わあ!あ、Hershi、本当にありがとうございました。それはすばらしいスピーチでした。ご存じのように、ステージの後で Hishi と話しました。私はもう準備ができています。わあ、なんて素晴らしいスピーチなんでしょう。もう一度 Hishi に盛大な拍手をお願いします、皆さん。本当に。素晴らしい。次のスピーチは別の興奮するスピーチです。ステージの後で彼に聞きました。私は言いました、「ねえ、あなたのスピーチは何についてですか?」彼は3つの言葉を言いました。本当に3つの言葉だけ、それ以上はありません。もう何も言われていません、Henry。えっと、その3つの言葉は MCP versus CLI です。それがそのスピーチです。毎日 MCP を使っている皆さんの中でどのくらいの人がいるのか、私は非常に興奮しています。ほぼ全員。わあ。それで何をしていますか?あなた、眼鏡をかけたあの人。
それで何をしていますか?本番環境のデバッグです。素晴らしい。実際のところ、それは良いユースケースです。私たちは、私が働いている場所で、Monday という名前のプロジェクト管理ツールを使用しています。ここで Monday を使用している人はいますか?Monday は monday.com です。えっと、私は何も言うつもりはありません。とにかく、えっと、彼らはウェブ UI のような UI を持っていますが、彼らは MCP サーバーも持っています。これは本当に信じられないことです。なぜなら、私の好みの IDE である Cursor で作業することができるからです。Spawn ではありません。えっと、私はその中に Monday MCP サーバーを持っています。私はエージェント内でこの会議を Monday に追加すると言うことができます。それが実行されます。本当にクールです。だから、私は Team MCP の忠実なファンです。えっと、しかしもちろん CLI にも存在する理由があります。つまり、Claude Code は CLI エージェント、MCP クライアント機能を持つコーディング エージェントですよね?では、これはどのように機能しますか?まあ、すぐに見てみましょう。
Henry は現在ここで設定中です。あと1分で、MCP versus CLI に関するスピーチが聞けます。これは versus ではないかもしれません。MCP および CLI かもしれません。えっと、CLI は少し時代遅れだと思いますか?誰かいますか?いいえ。はい、もちろんそうではありません。なぜなら、私たちがそれを使用していなくても、エージェントがそれを使用するからです。私はそれは非常に優れたユーザーインターフェースだと思います。ゆっくり言うことがなくなってきました。あ、いいです。見てください。ねえ、聞いてください。私たちはもうすぐ会議も終わりの時間です。これは素晴らしいスピーチになるでしょう。Henry に最も熱い拍手をお願いします。>> いいえ、>> 私たちはまだ少しあります。>> 問題ありません。あ、彼は あなたは あなたは拡張する必要があります。拡張表示を選択します。私は今テクニカル サポートです。私たちは いますか 準備はいいですか?いいえ。もうすぐです。いいです。いいえ、見てください。彼たちがしていることは、彼らは拡張しています。でも彼はまだウィンドウをドラッグしていません。これは今のところコメントです、皆さん。
これは私が好きなものです。ありがとうございます。あ、残念です。ご存じのように、これは...これは...これを何と呼びますか?これを「可哀想な拍手」と呼びます。ありがとうございます。私はこれが必要です。ちなみに、私の帽子にも硬貨を入れてください。いいですね。今回は延長されました。彼らは長くしました。さて、もう一度試してみましょう。最も熱い拍手は Henry Mau へです。>>紹介をありがとうございます。私の名前は Henry です。えっと、皆さん、こんにちは。私は Smithery の共同創設者です。えっと、今日、私が話すのは MCP、CLI エコシステム、Smithery でここで見ているもの、そしてこれがあなたのエージェントにより多くの自主権を与えることにどのように関連しているかです。それで、少しの背景。えっと、以前のスタートアップ Jenny AAI では、学術研究者向けの AI 学術アシスタントを開発しました。ユーザーが私たちの製品を使用するのを見ていたとき、本当に私を困らせた1つのことは、彼らはしばしば複数のウィンドウを開くということでした。
えっと、彼らは異なるアプリケーションと track GBT を使用し、彼らはこれらのアプリケーションと彼らが選択した AI の間で膨大な時間を複写貼付けに費やします。これはすべての知識労働者に影響を与えるより広い問題です。ターミナル間をジャンプしている、コーディング エージェント間をジャンプしている、または CRM と Google Docs 間をジャンプしているかどうか、私たちはすべて複写貼付けの地獄に陥っています。人間が本質的に AI の適応層として機能しているためです。ループ内でモデルをプロンプトして、異なるサービスへのすべての読み取りおよび書き込みアクセスを実行します。プロンプトは、モデルがデータにアクセスできないか、あなたに代わって安全に行動できないときに支払う税です。この税はかなり高いです。そのため、約1年前、私は Smittery を設立してこの問題を解決しました。
MCP がステージに登場し、私はそれをエージェントとサービス間のギャップを埋めるのに役立つ方法として見ています。そのため、Smidy をオープン MCP レジストリとして立ち上げました。数千の開発者で構成されるコミュニティを追跡しており、彼らは MCP サーバーをここで公開しています。数千のサービスを集約し、認証を統一するゲートウェイを構築しました。これにより、エージェントは 1つの単一ツールボックスとしてグループ化されたすべての API に便利にアクセスできます。現在、私たちは毎日約 100,000 個のツール呼び出しをユーザーに処理しています。しかし、私たちの旅は全く順調ではありませんでした。えっと、正直なところ、えっと MCB はローンチ後に多くのハイプがありましたが、多くの問題もありました。プロトコルは確実に野心的です。エージェントがツール呼び出しをうまく行う方法を模索しながら標準を確立しようとし、2025年初頭に仕様をすぐに変更する必要がありました。
MCP クライアントとサービスの実装は非常に悪く、これはユーザーの多くの不満につながりました。2025年末までに、多くの人々が MCP は基本的に死んでいるという主張を始めたと思います。爆発と同じくらい速く。実際、このカンファレンスで少なくとも5人が、私は過去2日以内に同じ質問をしてくれたと思います。MCB は死んでいますか?私たちはこれを徹底的に解決しましょう。なぜなら、多くの人が提起する多くの批判は有効だからです。人々が MCP に悪い経験をした主な理由は、2025年に遡るほとんどのデバイスは、ツールをに追加するための非常に幼稚なアプローチを採用したからです。モデル コンテキストに追加します。彼らはすべてのツールをコンテキスト ウィンドウにダンプしていることだけです。この図表のように右側に。
ご想像ください。ご存じのように、あなたが Chrome を使って Web を閲覧していることを想像してください。しかし Chrome が HTML をまったくレンダリングしていなかったと想像してください。生の HTML と CSS をダンプするだけで、どこをクリックするかを理解してもらいます。これは基本的に私たちがモデルに対して行っていることです。デバイスはすべてのツールをモデルにダンプし、それが良く実行されることを期待します。それはモデルに情報過負荷を与えます。むしろ むしろ 使用可能なインタラクション層を提示するのではなく。だから、多くのトークンが無駄になります。コンテキスト低下につながり、モデルパフォーマンスが大幅に低下します。さらに悪いことに、2025年に構築された多くの MCB サーバーは実装が不十分で、基本的に公式 API の弱体化されたバージョンです。それらの多くは適切な認証を実装していません。
開発者は基本的にツール説明に これらのプロンプトをハンドクラフトし、より弱いモデルに对す prompt injection を試みます。これらはすべてアンチパターンで、タスク固有の動作をツール説明に結合しており、これらの動作は元々スキルに属していたはずです。したがって、良い開発者体験の欠如は、最終的に人々が代替案を探すようにつながりました。コーディング エージェントは bash で非常によく機能します。だから、人々が質問する自然な質問は、CLI を直接使用しないのですか?CLI には多くの利点があります。まず、CLI には段階的な情報公開が組み込まれています。パイプがあるので、異なるサブコマンドを組み合わせることができます。成熟した Unix スタックの上に構築されています。しかし、ここで隠れたカテゴリー エラーを犯しました-- MCP と CLI を比較しています。MCP はモデル コンテキスト プロトコルを表します。それはプロトコルであり、インターフェースではありません。
CLI と比較するのは、リンゴとオレンジを比較するようなものです。このグラフはこれをより良く説明することを望んでいます。なぜなら、REST や GraphQL などのプロトコルの作業は、必ずしもツールをモデルにレンダリングする方法を定義するのではなく、通信方法の標準を定義することだからです。足りないのは、MCP をエージェントに非常によくレンダリングできる優れたツールです。これを native MCP rendering と呼びます。良いニュースは、2026年初頭までに、Claude や Codeex などの主要なツールは、MCP をレンダリングするための正しい方法を構築していることです。そのため、Smittery でこれをテストしたかったのです。ネイティブ MCP レンダラーを使用する場合、最新のツールのパフォーマンスは Bash および CLI とどのように比較されますか?したがって、これが私たちが行った実験設定です。3つのコア API(GitHub、Linear、シンガポール公共交通 API)でベンチマークを実行しました。
異なる API スタイルおよびトレーニング データ汚染の問題を表すため、これらの API を選択しました。ここに記載されている3つの異なるモデルも選択しました。変更した主なことは、エージェントに提供したインターフェースです。したがって、エージェント ツール上にこれらのすべての API を MCP サーバーとしてインストールするか、bash インターフェースの CLI を提供するか、どちらかのです。私たちの目標は、精度とトークン効率を測定することでした。したがって、これは観客への質問です。手を上げてください。native MCP がCLI よりも優れていると思うのは何人ですか?いいですね、数人がいます。CLI が MCP よりも優れていると思うのは何人ですか?いいですね、もっと多くの人がいます。これは関係ないと思うのは何人ですか?ちょうど平手のようにです。いいですね、ここにも数人がいます。
私たちを驚かせたのは、native MCP は精度とトークン効率の両方で勝ったということです。これは本当に過去1年間に私たちが抱いていた神話を打ち砕きました。これは主にモデル ツールが自分たちを更新し、より効率的になったためです。しかし、私はここでより興味深いのは:エージェント体験設計のどの原理が本当に重要かということです。例えば、CLI を改善するために何ができるか?または、どのツール原理により MCP がそのように良好に実行されるのか?したがって、CLI の構成を変更することでネイティブ MCP のパフォーマンスを一致させることができるかどうかを確認するために、いくつかの消融実験を行いました。
そのため、CLI により良い説明を追加する実験を実行しました。また、CLI に検索機能を追加する実験も実行しました。これら2つのことが私たちが試みた多くの異なるアプローチの中で最も重要であることがわかりました。まず、自己ドキュメント化です。したがって、エージェントに発見可能で、説明がしっかりしたツールを提供すると、パフォーマンスが向上します。2番目のことは検索です。エージェント に CLI でサブコマンドを検索したり、MCP でツールを検索したりする機能を提供すると、パフォーマンスが大幅に向上します。これは、適切なツールを見つけるのに必要なステップ数を減らすためです。したがって、これら2つの原理を CLI に適用すると、基本的にネイティブ MCP とのパフォーマンスギャップを埋めることができます。完全な実験の詳細は、当社のブログにあります。
そのため、この瞬間、あなたはと思っているかもしれません、えっと、私は実は token コストについてそこまで気にしていません。私の会社は支払います。または、モデルは安くなります。えっと、ご存じのように、結果は十分に近いです。その後 CLI を使用します。あなたも正しいですよね?エンジニアとしてローカルで物を実行している場合、おそらく CLI を使用する必要があります。ちなみに、私は MCP からスポンサーシップを受けていません。えっと、Smitter で CLI 製品を立ち上げた後、このベンチマークを実行しました。だから、私たちは両方とも使用できます。しかし、MCP にふさわしい信用をやりたいのです。まず、CLI は、サンドボックスを設定したい場合に機能します。しかし、良いハーネスがあれば、MCP は直接すぐに使用できます。そのため、これらは実際にクラウド エージェントを実行したいユースケースです。えっと、これはサンドボックスなしです。
これを行いたい理由は、それはコーディングに関連しないライトウェイト タスクにとってより軽量で、レイテンシーが低いことです。そのため、移植性は MCP の利点です。別の利点は、MCP がコンテキスト エンジニアリングの責任をハーネスに置いていることです。これは、Claude Code が更新され、ハーネスと、ツールの解釈方法が改善されている場合、ツール も改善されることを意味します。しかし、MSP には別の、より微妙な利点があります。これは、エージェントにより多くの自主権がある世界に進化したい場合に重要です。権限管理。CLI の主な弱点は、開発者用に作成されたため、通常は範囲が広すぎるためです。監督が少ない状態で実行したいときは、攻撃面が非常に大きいです。CLI はあなたに王国の鍵を与えます。
つまり、バックグラウンドで長時間 CLI エージェントを実行する場合、実は 2 つの悪い選択肢に陥っています。承認をリクエストするか、実際のところスケール不可能な状況か、あるいはおそらくあなたたちの多くが犯しているように危険に権限をスキップするかのいずれかです。MCB がここで持つ利点の 1 つは、明確な立場を持つ小さなサーフェースを定義していることです。つまり、それは、えっと、それはあなたがそれを保護するのをより簡単にします。このボトルネック点により、私たちはあなたのエージェントに対してポリシーとガードレールを適用できます。例えば、spitter のゲートウェイを使用している場合、ポリシー DSL を提供しており、これによりあなたのエージェントが何ができるか、何ができないかについて細粒度の権限を実行できます。つまり、このプリミティブは、エージェントを完全な自律性にアップグレードする際にあなたに安心をもたらします。では、質問に答えると、MCB はすでに死んでいますか?私はそうは思いません。
しかし、これもこのトークのポイントではありません。私の見方では、MCP と CLI の両方にそれぞれの用途があり、エージェント体験、セキュリティ、認証の背後にある原則は常に存在します。MCP はもはや時代精神の一部ではないかもしれません。それは結構です。なぜなら、プロトコルが経験する最良のことは、HTTP のようにつまらなくなることだからです。十分につまらないほど、より野心的な問題を解決し、エージェントがプロンプト駆動ではなく成果駆動の世界へ向かうことができます。エージェントはチャットボットから完全に同僚へと卒業できます。これが人がループの中にいることからループの上にいることへ変わる方法です。ありがとうございました。エージェントの接続に興味があれば、後で外でお話しましょう。>> はい。Henry と話をしましょう。もう一度拍手をお願いします、皆さん。Henry Mau、人はループの中にいることからループの上にいることへ。
正直に言うと、私は準備ができています。聞いてください、聞いてください。次のスピーカーは、実は今日初めてお会いしたのですが、言われたことは—そして逐語的に引用すると—シンガポールのすべてのエンジニアの中で最も才能のあるエンジニアだということです。聞きましたか?ですから、聞いてください、私はさえ彼を紹介する資格がありません。ですから、私は助けが必要です。Ivan、Ivan、皆さん Ivan に拍手をしましょう。Raj については、私は幸いにも長い間 Raj を知っており、彼がやっていることは本当に信じられないほど素晴らしいです。ハッカソンを開催したことがあります。彼が来て、「あ、エージェントが協力できる方法を構築しようと思っています。」と言いました。それから、彼は完了し、私たちは「あ、週末他に何をしているのですか?」と言いました。彼は「あ、Mistral ハッカソンがあります。あなたは何をしていましたか?」と言いました。
彼は「あ、次のハッカソン用に提出物を構築するのを助けるツールを既に構築しました。」と言いました。その後、彼は Gemini ハッカソンで優勝しました。彼はほぼ Mistral ハッカソンでも優勝しました。それから彼は「あ、私はこの Claude 3.5 thinking について常に聞いていました。それはかなりクールです。」と言いました。私は「あ、それは良いですね。」と言いました。では、彼は次に何をしましたか?彼は独自の事後学習を行い、最終的にそれを打ち負かし、メインエージェントとして使用しました。Raj は本当に素晴らしく、正直に言うと、彼の発見を聞くのを本当に楽しみにしています。>> Ivan、ありがとうございました。その... えっと、はい、私は Raj で、今日は進化的フレームワークと一般的な進化アルゴリズムの作成への私の旅についてお話しします。
私がここにどのようにしてたどり着いたかについて、簡潔な紹介をさせてください。最初、これは私と友人がやっていた論文でした。私たちはスクラッチから拡散モデルを作成する方法について考えていており、特にチェスイベント用の医学的拡散モデルの一種を作成していました。このプロジェクトに取り組んでいたとき、最初はデータが非常に少なかったことに気づきました。異なる論文を閲覧していたとき、モデルが人間の 「趣味」 の概念を持つことについて議論した論文に偶然出くわしました。この論文は基本的には言語モデルをオープンエンド強化学習カリキュラムの判定者として使用しました。これはオープン性とアルゴリズムの全世界に私を露出させました。自然に浮かんできた次の質問は、エージェントがオープンエンドであると主張し、それらが常に新規性を生成している場合、それが私たち自身のエコシステム、私たち自身の生物学でどのように見えるかということです。太陽はその質問に対するかなり良い答えだと思います。
基本的に、太陽からのエネルギー粒子が地球に入り、その後、より高いエントロピーのフォトンとして宇宙に戻されます。基本的に、これをすべて可能にする勾配は生命そのものです。生命はより多くのエントロピーを生成するものです—これは非常に特定の種類のエントロピーです—三十億年またはそれ以上かかって作成し生成されました。それで、質問は、これをエージェント自身のような類似のシステムにどのようにマッピングするかになります。ですから、これが私がしようとしていることです。太陽そのものが計算であった場合、DNA はこれらのより小さな細胞生物をあなたのような複雑な存在に進化させ、私たちはコードを書き、コードを使い、考えることができ、物事に反応し、より多くのエントロピーを生成できます。これは基本的にこれらのエージェントの軌道です。
えっと、選択バイアス自体がフレームワークです。基本的にモデルの進化に沿って進化します。その後に読んだ非常に興味深い論文は、基本的にエージェントが時間とともに徐々に自らを改善する様子を示しました。それは Omni epic と呼ばれており、異なる環境があり、エージェントは最初は単一の環境で非常に専門化されており、時間が経つにつれて、ますます一般的になります。そのエージェントの一般性により、それは涌現行動を示すタスクを実行できます。これは非常に興味深いフィードバックループであり、その後、同じ著者による別の論文の作成につながりました。その中ではコード自体が... それをコードで置き換えたとき、コードになりました。
えっと、実際に大幅なパフォーマンス向上を示しており、エージェントは Swenge でのみ 20% のパフォーマンスから基本的に 50% になりました。その時点で、これらのエージェントを置く環境を進化させることができ、ツールを進化させることができるなら、えっと、これら 2 つはあなたが活用できるレバーであり、最終的にはエージェント全体のパフォーマンスを向上させる可能性があることに気づきました。すべての軌道を見ると、私たちは持っているフレームワークよりもはるかに優れたモデルを持っており、あらゆる企業がカスタムフレームワークを作成しようとしています。私はそれが正しい方向だとは思いません。自己進化するフレームワークを持つことができるとしたらどうでしょうか?これについてはすでに論文があります。メタフレームワーク、ROM、および多くの他の文献などです。
次のステップはエージェント自体になるでしょう。メモリ状態を他の場所に保存して、そのエージェントを進化させることができたとしたらどうでしょうか。その次に来るのはワールドモデルのようなものです。物理世界モデルではなく、コード的な環境や、著しく異なるコード的な環境と相互作用するワールドモデルです。ワールドモデルの非常に興味深い論文に取り組んでいる友人と話した内容の1つとして、より興味深いのはこれらのワールドモデル内のエージェントのアーキテクチャがどのようになるかを見ることだろうということです。それらは新規である可能性があり、手作りではないかもしれません。
異なるテクノロジーを使用する可能性があります。しかしこれは見る価値があるもので、今日も実際に見られています。初期の段階では、モデル成長の規模が MMLU やその他のベンチマークを飽和させるのに非常に長い時間がかかりました。しかし数週間ごとに新しい SODA モデルが現れるのが見られます。これはより多くの、より良いデータ、あるいは単により高品質なデータがあるためではなく、訓練ループがより高速になり、モデルがある程度自ら循環を閉じているためです。私の見方では、スケーリング則はある程度の範囲では依然として成立します。人間がエージェントまたはフレームワーク自体よりも興味深い限り、それらは成立し、成立し続けるでしょう。これは手作りではない異なるアーキテクチャの形式で現れる可能性があります。それらは人工的に製造される必要はありません。
これは継続していくと私は信じるものです。これまでの私の経験の中で分かったのは、私が構築した大きなメタフレームワークを作成する場合、通常モデルの性能を改善するのはトラジェクトリです。それは決して重みではありません。これは DNA が変わらない一方で、私たちがその形質を表現する方法が変わるのに類似しています。研究する価値のあるアーティファクトは、パスと推論軌跡、そしてモデルがなぜそうしたのかであり、最終的な状態ではありません。コードグラフを構築する際に学んだもう1つのことは、反復ループがこれにとって非常に重要であるということです。最も成功した生命形式は、非常に速く適応し、非常に速く死ぬものです。そのループをより速く閉じることができれば、より多くのことができるようになります。これは多くの形式を取ることができます。
この観点における良い例は言語です。何の言語でコードを書きますか。自分にとっては、現在の大部分の作業は Zig または Rust で書かれており、あるいは Zig または Rust を使って取り組んでいますが、最終的には、ツールをますます良くしたいときに、つまり、より短いコンパイル時間を持つ言語は実際に最終的により良いツールを作成し、これらのツールに対してより良いテストを作成できます。その言語がメモリセーフではないとしてもです。私は実際に、最終的には今年あるいは来年のいずれか、ほぼすべての企業が何らかの独自のメタエージェント言語を書き始めると信じています。何が起ころうとも、これらのモデルは継続的にますます良くなります。それらは人間が読める必要はありません。したがって、これらはちょうど私が自分のために構築したいくつかのツールです。内部で使用してきたもので、例えば muanry があります。これはちょうどより高速な rip grab であり、私のエージェントがより多くのコンテキストを得ることができるようにします。
では、コードの正確な行を検索します。Code DB、これも完全にオープンソースです。これは私自身のフレームワークの三角形検索であり、エージェントは変更する必要があるコードの正確な行を取得するため、コンテキスト腐敗が発生しません。では、nanobrew はその後作成されたのは、サンドボックスでこれらのエージェントを配置し始めると、つまりコーディング環境設定を取得する方法があることに気付くためです。スナップショットを撮ることができます。別のことは、abt get のようなものを引き続き取得でき、必要なパッケージと依存関係を取得できることです。しかし、これをもっと速くすることができたらどうでしょうか。こうして、その環境を解析でき、これが nanobrew がどのように生まれたかです。これは appget および homebrew 自体よりもはるかに高速です。
ちょうどそのように、私はエージェントがネットワークを閲覧するための別の並列ツールを作成する必要があることに気付きました。エージェント・ブラウザに似ていますが、同時に A1Y のような拡張機能(CDP または Chrome が人々に公開したもの)を使用してトークン使用量を削減し、これによってエージェントが大規模にネットワークを閲覧する能力を実際に向上させます。最後に、全体の進化ループに戻ると、Dev Swarm はこのようにして生まれました。Dev Swarm では、オーケストレーションの本質は、形を変えることができるツールまたはモデルのセットです。
したがって、複数の Opus コンテキストウィンドウに加えて複数の ChatGPT ウィンドウがあり、全体的なマルチエージェントフレームワークと組み合わせられ、真実のソースはより厳密な terminal bench または legacy bench のようなものです。ますます多くの人がこれを使い始めるにつれて、何が機能し、何が機能しないかについてのテレメトリデータが増加しました。簡単に言えば、これらすべてが何らかの適応度関数に組み込まれており、コーディングエージェントでは、harness は毎回書き直されます。最後に、harness は CodeGraph(コードグラフ)です。これは terminal bench 上で実行されていましたが、現在は実行されていません。本質的には、これは自己進化する harness という事実に基づいて作成されており、時間の経過とともに、異なるモデルの使用が増加し、さらに良くなり、独自のツールを作成しました。このすべての作業もオープンソースです。
これらのトラックもオープンソースですが、まだ大規模には公開していません。ただし確認することはできます。というのも、まだ進行中だからです。ですから、はい、最終的に私が構築したのはハーネスですが、それに伴うツールも進化サイクルを形成しており、これら5つすべては本質的にこのハーネスをより良くしています。これで、今年 AIE に参加していただいた皆さんに感謝を申し上げたいです。今年は、「苦い教訓」を絶えず目にするであろう数少ない年の一つだと感じています。苦い教訓。はい。ありがとうございました。ああ、ここでお辞儀をすべきだと思います。ああ、なんて素晴らしい講演でしょう。ありがとうございました。もう一度このいい人に拍手をお願いします。私の思考は衝撃を受けました。私の思考は完全に衝撃を受けました。セットアップしていただけますか?まず要約させていただいてもいいですか?
わたしたちはステージで衝突しました。わかりますか?ああ、もう狂っていますね。何という講演。何か……ここの人たちが狂ったように歓呼しているような気がします。わかりません。皆さんみんな眠ってしまいましたか?しかし、そうなんです。お名前は何ですか?Daryl。Daryl。ああ、そっか。あなたが見えました。はい、ライト。えっと、聞いてください。私は本当に彼が共有したオープンソースプロジェクトの一つを探していました。それがなければ、私は立ち往生していました。彼は私の全体的なアイデアを救ってくれました。これは狂っています。そして彼はとても若いのに、これを構築しました。私は本当に……もう一度瞑想セッションを実施できますか?そうすればそれについて考えることができます。わかりますか?ああ、Raj。それはすごい。えっと、私たちは会議の終わりに到達しました。ああ、W がここにいます。はい。残念です。残念です。えっと、でも、私たちはそこに敬意を払わなければなりません。誰も死んでいません。
私たちは……a grim の最後の講演に対して、いくらかの注目と敬意を払わなければなりません。彼を見てください。彼はシンガポールで最も多くのハッカソンに優勝しました。誰かが私に言いました。彼はこのエコシステムの中で成長した人であり、会議、チーム、ボランティアを通じて自分の貢献をしました。本当にこれを実行に移し、人工知能がシンガポール内で継続的に注目と視点を得られるようにしました。ですから、会議の背後にある脳、会議の背後にある心。私は一日中彼と一緒に歩き回っていて、すべての人が彼を知っていること、すべての人が彼を愛していることを明確に見ています。彼に対して、私たちが彼を知っていて愛していることを示してあげましょう。a grim sank に温かい拍手をお願いします。テスト。皆さん、こんにちは。えっと、これは今日の最後の講演ですので、新鮮さを保ちます。
えっと、これは3か月で会議を開催する方法についてです。この話は2025年7月16日にさかのぼります。えっと、Rachel、Sherry と私は昼食をしていて、シンガポール周辺の人工知能イベントの事務状況に対して、一般的な不満を感じています。多くの話がありますが、本当にビルダーフレンドリーな瞬間は発生していません。当時、私たちはまだ何の活動も実際に開始していませんでしたが、私たちが最終的に何をするかに関係なく、それは私たちに会議を開催させることになるだろうと感じました。その時、私はメッセージを送って、私たちは「無料パン」のような方法で町で最大の会議を運営すると思うと言いました。それが起こるとは思いませんでしたが、このウィークエンドを見ると、成功したようですね、そうですね?しかし、明らかに「無料パン」でこれをすることはできませんね、そうですね?
えっと、考えてみると、私たちは1000人をホールに詰め込んで、彼らに見つけることができるすべての人工知能のものを与えることができます。しかし、観客をテストしなければなりません。エコシステムが反応しなかったからですか?それとも、ご存知のように、エコシステムは非常に積極的に反応したが、イベントは彼らのために機能しなかったのでしょうか?ですから、私たちはいくつかのことを試しました。そのメッセージを送ってから1週間後、私たちは Cursor のためのミートアップを開催しました。当時、私たちは思いました。わかりました。たぶん、これはこのような規模で、人工知能ツールに関わる開発者ミートアップの最初のものの一つです。たぶん100人が現れるでしょう。たぶん200人が現れるでしょう。私たちは最終的に900件の登録を得ました。私たちは最終的に500人を入場させました。その時は私にとってかなり狂っていました。
数か月進みます。私たちは思いました。わかりました。ハッカソンをやりましょう。ハッカソンは私が業界に入った時代に非常に人気がありました。私たちは思いました。わかりました。24時間ハッカソンをしましょう。何人の人が登録するか見てみましょう。たぶん人々は来るでしょう。たぶん来ないでしょう。1,200人が登録しました。私たちは約500人を連れてきました。えっと、人々はオランダのような遠いところから、地域全体から飛んできました。これは私たちに非常に大きな自信を与えました。たぶん問題はイベント自体ではなく、人々は本当に集まるための空間を必要としています。ですから、90日前、私たちは Swix に会って、Swix に「私たちは AIE Singapore を運営するつもりです」と言いました。彼はその時、私たちに笑われたいと思っていたと思います。なぜなら彼は言いました。「あなたは真剣ですか?私はあなたをそんなに手伝うことができません。私は他の AIS を運営する必要があります。あなたは以前会議を開催したことがありますか?人々はお金を払いますか?
あなたはこれすべてをどうするつもりですか?」私たちの反応は通常、「はい。私たちが方法を見つけると思うので。」でした。これは、イベント全体の背後にある座右銘になりました。ですから、周りに粗い場所があれば、私はそれについて謝罪します。しかし、私たちは本当に最善を尽くしました。こうしてそれが進みました。これすべては高い意図の周りを中心にしています。私たちの意図は、これを私たちが行うことができる最もビルダーフレンドリーなイベントにすることでした。私たちはここに来たいと思う部屋の中の人々を確保したかった。チケット価格は安くありません。わかります。しかし、私たちは本当にここに来たいと思う人々がここにいることを確認したかった。私たちは来たいと思う講演者がここにいることを確認したかった。ですから、私たちは彼らを飛ばしました。
私たちは来たいと思うスポンサーがここにいることを確認したかった。そして、彼らはこの会議をスポンサーして参加することに非常に喜んでいました。ですから、すべてがそのような方法で一致しました。今日、または週末全体の間にこの部屋にいたいと本当に思う人は誰でも、ここにいます。私たちは無料のチケットを配布しませんでした。他の会議と同じように、無料のチケットが発生する可能性を待っている多くの人がいました。ここはそのようではありません。ですから、あなたすべてはこの部屋にいます。あなたはお金を払ったからです。そして、あなたは本当にここに来たかったのです。ですから、皆さんに対して温かい拍手をお願いします。あなたは出現し続けています。部屋は一日中満杯で、今は午後6時で、あなたはまだここにいます。
明らかに、トークの質、起こっていることはすべてうまく機能していて、あなたはここで一日中毎日いたいと思っています。えっと、トークはしばしば満員です。すべての講演者は彼らがステージで良い時間を過ごしたと私に言いました。なぜなら、観客は彼らが共有したいと思うすべてに対して好意的に反応したからです。そして、私たちは以前、シンガポールの観客がサンフランシスコやロンドンの観客と同じかどうかについて完全に確信していませんでした。毎日が満杯の会場を見るのは本当に活気づけられます。しかし、問題は、海外から会議をコピーして、シンガポールに貼り付けることはできないということですね?私たちにとっては、「AIE を直接コピーしてシンガポールに貼り付けましょう」と言うのは簡単でした。しかし、シンガポールは異なる観客です。シンガポールには異なる種類の人々がいます。
シンガポールは会議に対して異なる期待をしています。これが研究集約的な会議であれば、おそらくあなたのうち半分を失うでしょう。この会議が単純すぎる場合、それは人工知能エンジニアリング会議から取得することを期待する厳密性をあなたに感じさせないかもしれません。ですから、そのバランスポイントを見つけることは非常にユニークなシンガポールのことです。さらに、あなたはこの会議を自分自身のものにしなければなりません。なぜなら、何かを完全にコピーするつもりがなければ、プログラミングの顔への貢献は何ですか?Sherry は、私が約21のバージョンの講演者リストを作成したと思います。講演者をどのように分類しますか?openclaw 関連のトークを聞くときに同時に複数を聞いていることを確認するにはどうすればよいですか?そうすれば、複数の講演者の視点を見ることができ、その後自分で判断を下すことができます。
たぶんあなたは今日早くに magic path と magic pattern が連続で出現するのを聞きました。名前は似ています。分野は似ています。しかし、彼らが製品をどのように考えるかは完全に異なっています。これにより、物事がどのように機能するかについてあなた自身の見方を形成することができます。しかし、別に、私たちは AIE イベントに私たち自身のフレーバーを追加したかった。ここのすべての人はワークショップのチケットを持っています。これは通常、他の AIES のデフォルト設定ではありませんが、あなたが初めてシンガポールで「ビルダーファースト」のイベントを開催しようとしているなら、構築する誰かが必要です。これのような、これは思想的リーダーシップのイベントではありません。これは人工知能の将来についての炉辺談話パネルディスカッションではありません。これはビルダーのイベントです。これらの日の間に少なくとも1つを構築していなければ、わたしたちはこれすべての目的を失ってしまいました。ですから、ワークショップはその一部です。
私たちはいくつかのストレス軽減クラスを追加しました。なぜなら、人工知能の不安、トークンの不安がこの頃の既定の事実であると感じたからです。物事の変化が非常に速いことを考えると、人々は人工知能との関係を理解し、毎日30以上のトークの中でストレス軽減の方法を見つけるための方法が必要です。これは重要です。明らかに、本当のシンガポール風に、あなたがここで楽しむことを確認したかったです。ですから、昨夜、大きなパーティーを開催しました。Jeff Huntley と私は最終的に指導する DJ が現れる前に DJ を務めました。しかし、これは、あなたがシンガポール でイベントを開催するつもりなら、私たちがここでやることを好む方法に従う必要があるというもの、私たちが考えたことです。しかし、明らかに、トークが素晴らしく、プログラミングが素晴らしいにもかかわらず。
このようなイベントを運営する全ポイントは、起こる廊下の衝突、展示会で会う人々、話すことができる人々、ほとんどのスポンサーから主要なチームが個人的に在席していることです。あなたはいつでも会うことができる講演者を持っています。あなたがコーヒーを飲んでいるかどうか、昼食を食べているかどうか、えっと、あなたが彼らに会いたいかどうかに関係なく、彼らはあなたの隣に座って講演に参加しています。講演者へのアクセスを提供し、チームへのアクセスを提供することはシンガポールで非常にまれなことです。あなたがどんな会議にでも行くなら、人工知能であろうとなかろうと、あなたは主にマーケティング担当者がそこに座ってブランドについてあなたに言って、名刺を交換しているのを見るでしょう。それだけです。あなたが会社に会おうとするとき、これは全くの経験ではありません。これらのいくつかはシンガポールにありませんでした。
これらのいくつかはこれらの会議のいずれにも参加したことがありませんでした。ですから、劇場の外でそれらの瞬間を作成することは私たちにとって本当に重要でした。展示エリアを歩き、チームに会うチャンスがあったと思う多くの人。これらのいくつかは17時間以上飛ぶために現れました。これらのいくつかはシンガポールにいたことがありませんでした。ですから、私たちがそその経験を作ることは本当に、本当に重要でした。私たちはあなたが週末に人工知能のようにその経験を得ることをしたいです。しかし、ここの重要なことは、部屋にすでにいる人だけではありません。しかし、次の世代がどのようにそれから恩恵を受ける事が出来るか。私が述べたように、チケット価格は高いです。
しかし、次のシーンの子供たちが、ここに来るシーン、大学、学校で閉鎖されているこのレベルの会議の機会を経済的困難のために閉鎖すべきではありません。なぜなら、彼らはビルダーになるからです。ですから、私たちは奨学金を提供しました。外でこれについての情報があります。しかし、基本的に、私たちが聞いたことがあるのは、大きな組織のスポンサーであり、私たちが奨学金を発表すべき前の2日間撤退しました。これは私たちにとってかなり心が痛むものでした。なぜなら、私たちは子供たちに参加させたかったからです。ですから Rachel、Sherry と私は、私たちが自分たちのポケットからこれをするだろう決定しました。しかし、シーンの多くのビルダーは個人的な身分で参加することにしました。そして、私たちは20人の学生を連れてくることができました。
20 名のスピーカーとの面会、彼らとの交流、彼らからの学習の機会を得た学生たちは、他のどのような状況下でも得られないかもしれない生涯の機会を持っているかもしれません。舞台の側に何人かの学生がいます。彼らをステージに上げていただきたいと思っています。ですから、彼らをここに呼んでいただけますか?私たちが組織したすべてのハッカソン、実施したすべてのイベントを通じてこれらの学生たちを見つけました。この人たちは、私たちが実施したすべてのイベントに参加しています。明らかに、私たちのすべてのイベントは設計上無料です。彼らが会場に入ることができるようにしたいからです。しかし、これは私たちが提供できる機会の最高峰です。これらは明らかに、私たちがスポンサーした 20 人の中の 4 人です。あなた方はおそらく周辺で彼らを見かけているでしょう。
彼らは Twitter 上でずっと、すべての要約を作成し、それについて投稿し、彼らの経験を記録し、飛来したすべての人に会っています。これは、子どもたちがこれを楽しむことを確保するために私たちができる、少なくとも信じられないほどのことです。ですので、もう一度、皆さんありがとうございます。貢献してくださった方々に、本当に声を上げたいです。Patrick Kelly は Arise から来ました。Arise は実際のところこのカンファレンスのスポンサーですが、Patrick は自分のお金をさらに出すことを決め、子どもたちを支援しました。Neil Chang、Ivan、Leo、Casper、Suken は Iterative から来ました。Zayn、私自身、Sher、Rachel、そして 20 名の学生をスポンサーすることを決めた多くの匿名ビルダーです。ですので、再度、皆さん全員に心から拍手を送ります。さて、私たちは何度も聞いてきました。特に新加坡では。ここにはシーンがない。何も起こっていない。旧金山にあるカンファレンスに参加するために飛んでいく必要があると思います。
しかし、週末の終わりに、私は皆さん全員に、あなた方がこのシーンそのものであることを感じてほしいと思っています。あなた方は定期的に現れます。すべての講演、すべてのワークショップ、展示会の周辺で、昨日の 8:30、今朝の 9:00 のように、雨を通して、あなた方を止めるかもしれないあらゆる条件を通して。あなた方は、私たちがこのためにセットアップしたすべてのサイドイベントに現れます。すべてのイベントは超過予約されています。すべてのイベントに数百人が現れます。たとえあなたがこれらの企業を知らなくても、たとえあなたが誰が行くかを知らなくても、より大きなことが進行中であることを知っているだけで、あなたはそのパートになることができます。私は、それがあなた方が覚えているだろうことだと思います。なぜなら、これは単なるシンガポール AI を超えているからです。これは今後数年間、この国の AI ビルダー シーンを構築するでしょう。
これがこれが単なる一時的な瞬間ではない理由です。皆さんが現れ続けることを望みます。皆さんが構築し続けることを望みます。皆さんが週末に友人を作り、連絡を保つことを望みます。皆さんがハッカソンに行って構築し、おそらく一緒に何かを始めることを望みます。皆さんがそれについてコンテンツを発行することを望みます。皆さんがあなた方が行っている仕事を共有するための許可を求めないことを望みます。なぜなら、これが人々がシンガポールが行動が起きている都市だと理解する方法だからです。単にサンフランシスコが物事が起きる場所であるだけではなく。単にロンドンが物事が起きる場所であるだけではなく、シンガポール、アジアだけではなく世界中で、注目する価値がある都市です。
この点で、本当に感謝したいのは、参加してくださった全てのスピーカー、スポンサー、メインスポンサー、ダイヤモンドスポンサー、プラチナスポンサー、OpenAI、ZAI、Google Deep Mind、Cursor、Arise、眠らずに活動したボランティア、全てをまとめたチーム、そしてここにいる何千人もの皆さんです。組織チームとボランティアを舞台に呼びたいのは、彼らが週末全体のオペレーションをシームレスに機能させるための中核だったからです。彼らが皆さんが食事できるようにしました。彼らが皆さんのバッジとアクセス権を解決しました。彼らが亀裂を通り抜けるものがないようにしました。そうすることで皆さんは最高の会議体験ができるのです。我々はまだ完了していません。少々お待ちください。>> つまり明らかに、本当のマーベル映画スタイルのように、ご存じの通り、AI エンジニアは戻ってくるのです。
えっと、私たちは関心のある人たちのための署名表を持っています。えっと、私たちはいくつかの早期チケットと同様の情報を送ります。なぜなら、私たちはそれを解決できると思っているからです。しかし、私たちは確実に確認したいのは、既にあなたの意図を記録したということです。ですから、私たちが近い将来に発表するときには、あなた方が最初に知ることになります。なぜなら、あなた方は私たちのために危険を冒してくれたからです。あなたが聞いたことのない人のために、世界のこの場所で会議を開いたことのない会議のために、危険を冒して定期的に現れることは、私たちが当たり前にできることではありません。私たちは本当に、本当に、本当に、あなた方が私たちのために冒してくれたリスクに感謝しています。ですから、もう一度、本当に感謝します。>> 私たちはここで音楽を再生できますか?>> はい、もう一度写真を撮りましょう。もう一度写真を撮りましょう。>> 音楽なし。>> Swig はどこですか?Swix、上がってください。>> Swix、上がってください。
>> Swix は世界中の AI エンジニアの背後にいる人物です。昨日彼の話を聞いたなら、彼もシンガポール人で、彼が私たちにこうさせたことが、これが起こっている理由です。ですから Swix に感謝します。Swix、おやすみなさい。あなたと私だけになります。>> あなたと私だけになります。>> わかりました。3 2 1 私たちは踊ることができますか?私たちはどのように写真を撮りますか?ハイ、ハイ、ハイ。ハイ、感じてください。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。ハイ、ハイ、ハイ。
関連動画
AIE シンガポール Day 1:閣僚基調講演 + OpenAI / Google / Vercel / Cursor 主要セッション
2026-05-16 · AI Engineer Singapore · 08:00:00
AI Engineer シンガポール Day 1 全編。閣僚の開幕基調、NanoClaw のデモ、そして OpenAI、Google、Vercel、Cursor などトップチームによるエンジニアリング実戦セッション。シンガポール初の AI Engineer サミット、「エンジニア × AI」実装層に焦点を当てています。
HSC パイプラインエンジニアリング:RAG AI でエンジニアリングナレッジベースを構築
2026-03-20 · HSC Pipeline Engineering · 05:00
HSC Pipeline は AISG LADP プログラムを通じてローカルデプロイ RAG AI ナレッジベースを開発し、エンジニアリングナレッジのサイロを破壊し、意思決定効率を向上させた。
王乙康氏が AI、遺伝子スクリーニング、超高齢化シンガポールの準備について語る
2026-03-04 · Ong Ye Kung · 30:36
衛生大臣王乙康は、医療におけるAIの応用および超高齢社会に対応するためのシンガポールの戦略について深く掘り下げて論じた。
YTL PowerSeraya:LLM が電力市場ルール分析を赋能
2026-02-20 · YTL PowerSeraya · 05:00
シンガポール電力会社 YTL PowerSeraya は LADP を通じて電力市場ルール専用 LLM を構築し、レポート自動分析とルール照会を実現した。
Skybots:RPA から LLM 駆動のインテリジェントカスタマーサービスへ
2026-01-15 · Skybots · 05:00
会計科学技術企業 Skybots は LADP を通じて RPA を LLM 駆動のインテリジェントカスタマーサービスにアップグレードし、複雑な会計ワークフロー照会を処理した。
楊莉明、AI の中小企業、教育および社会における役割について語る
2025-11-19 · Josephine Teo · 06:17
楊莉明は、AI がいかに中小企業の転型を支援し、教育体系を再構築し、社会のあらゆる層に利益をもたらすかについて探究する。