Codex Goalモデルの使用に関するガイドライン:AIが特定の目標を継続できるようにする方法

2026/06/07 00:27
🌐ja

キーは長いプロンプトを書くことではありませんが、検証可能な標準、実際の環境、進捗追跡メカニズムを設定するために

Codex Goalモデルの使用に関するガイドライン:AIが特定の目標を継続できるようにする方法
原題:ガイド・ゴール
原作:@dkundel, OpenAI Developer Relations 会員
ペギーによる写真

エディタ: この記事は、OpenAI開発者のリレーションメンバーのドミニク・クンデルから、Codexの「ゴールモード/ゴール」機能の経験をまとめています。 通常のプロンプト技術ではありませんが、AIプログラミングツールの継続的なロール変更について: Codex は、単一ホイールコマンドに応答するコードアシスタントだけではありませんが、明確なターゲットを継続できるエグゼクティブタイプです。

/goalモデルでは、もはや要求を書くことは本当に重要ではありませんが、Codexのクリアで検証可能な出口基準を設定するために。 例えば、デプロイ時の30%削減「テストカバレッジ100%パシティ」「LCP2.5秒未満」。 これらのインジケータは、タスクが達成されているかどうかを判断し、目的の曖昧さの無限を回避するためにCodexを有効にします。 同時に、ユーザーは、コーデックスが進行を測定し、結果を検証できる十分な方向、ツール、および実際の環境を提供する必要があります。

特に、視覚的使命は、コーデックスを詳細な状況に得るのが最も簡単です。 100%ピクセルレベルの減少を必要とする代わりに、ビジュアルターゲットは、機能リスト、設計システム仕様、評価可能な指標に分解する必要があります。 数時間でも数日も続く長期のミッションでは、委員会の追跡、PRの草案、進捗ファイル、Slackの更新、またはサイドチャットなど、いくつかの非再帰的な変更を終わらせる必要はありません。

本記事の付加価値は、/goal を「長期タスク管理メカニズム」として再定義することです。 AI が数十時間または数百時間連続で実行できるとき、開発者のコア・コンピテンシーは、AI がコードを生成するだけでなく、目的を定義したり、測定システムを確立したり、実装環境を設定したり、レビューやディスクを確定したりすることができます。 つまり、AIプログラミングは「ライティングヒント」から「進行中のプロジェクト実行者を管理する」へと移行しています。

以下は元のテキストです

ターゲットモード(ゴールモード、または/goal)を立ち上げ、Cordexを具体的な結果に移動させるのを支援します。 ゴールを設定すると、ゴールが達成されるまで、コーデックスが機能します。 誰かが、同じ目標で120時間以上、Codexの仕事をしました。

ターゲットモデルは非常に強いです。 インパクトを最大限に引き出すには、7つの注目すべきものがあります。

明確で検証可能な標準を設定

ターゲットモードをアクティブにすると入力するヒントは、初期ヒントとして機能し、さらに重要なのは、ターゲットの終了基準になります。 作業終了後、このゴールが達成されているかどうかをCodexがチェックします。

そのため、目的のメッセージは長すぎてはいけませんが、むしろ明確な基準に焦点を合わせてください。目標を達成するとき。

ほとんどの場合、モデルの明確な数値表示器が完成しているかどうかを判断するのが良い目標です。 例えば:

「30パーセントで施工時間短縮」

「TypeScriptからRustにこの機能を追加し、100%のテストの一貫性に達する」

「生産環境で最大のコンテンツマッピングを可能にするために、スキャフォールディングの最適化(Contentful Pointの大きい、ページの重要なコンテンツの読み込み速度を測定する指標)を2.5秒以下にする

このヒントは、常に数字を含む必要はありませんが、通常、図はその後の手順を簡単に進めます。

ターゲットを定義する方法がわからない、またはCodexでプロジェクトを開始したい場合は、ターゲットモードから始める必要はありません。

Codex は独自のターゲットを設定できます。 コーデックスを起動する準備ができたら、通常は会話を開始できます。そしてコーデックスがディスカッションに基づいてターゲットを設定できるようにします。

ターゲットをいつでも編集することもできます。Codex アプリケーションで編集ボタンをクリックするか、CLI で /goal を再度使用してください。

可能な範囲へのガイダンスを提供して下さい

「建設と展開時間の30パーセント削減」のようなヒントはクールに聞こえ、コーデックスはいくつかの創造的なソリューションを見つけることができる。 しかし、問題が起きる一般的な考えを手に入れたら、このヒントは、曲線にCodexを置くこともできます。

そのため、可能な限り、コーデックスをどこから始めるか、目標を達成するためのツール、または間違った方向で行くことを避けるために他のヒントを与えるのが最善です。

たとえば、同僚、@reach vb は実験で行いました。彼は、Chome ブラウザーを使用して Google Colab にアクセスできるコーデックスと、Codex のトレーニングモデルがデータセット自体を生成できるようにするなど、いくつかの許容制限を語った。

繰り返しますが、工事時間を短縮し、すでに時間を費やしている部分を知りたい場合は、ヒントでコーデックスをポイントするのが最善です。

あるいは、Codex は、プランモードでいくつかの予備研究を行うことができ、潜在的なプログラムを文書化するための計画文書を作成することができます。 それからあなたのターゲットは計画を引用させます。

進歩のmeasurableを作る

あなたの目標が野心的である場合、またはCordexはそれに近づくための多くの方法を持っている場合は、Cordexに進捗状況を測定するためのツールを与えることが重要です。

これは、いくつかのミッションのために自然であるかもしれません。 例えば、構造時間を最適化し、テストカバレッジを増加させ、コーデックスは通常、ツールを使用するか、自然に作成することができます。

しかし、他のターゲットでは、Codexのヘッドストームから始めることをお勧めします。 どのようなツールが進行を判断するのに役立ちますか? またはターゲットに近づいていることを確認する方法のヒントを与える. たとえば、2つのスクリーンショット用の視覚的な差分マッチングツールを作成したり、デバッグしているインテリジェントなボディ用の評価セットを作成したりできます。

Codex は、スクリーンショットを比較し、違いをチェックするために、自分でツールを作成したときに、ビデオに基づいていくつかのコンポーネントを再構成しました。 その後、ツールをオーバーラップし、異なるコントラストモデルを追加します。

映像:Codexは2つのフレームの視覚比較のスクリーンショットを生成します。

マンデートに応じて、測定または検査する追加の基準があるかどうかを考慮する必要があります。 そうでなければ、コーデックスは仕事が終わったと思うかもしれませんが、完了は考えません。

たとえば、デザイン参照マップをカットし、ピクセルレベルの縮小のためにページ内に埋め込むことができます。または、テストカバレッジを100パーセントに削減することができます。 これのどれも本当にやりたい方法です。

実際の環境を作る

Codex が目標に向かって真の進捗を上げたい場合は、十分な環境で動作する必要があります。

実際には、デプロイメント時間や遅延を最適化したい場合は、Codexは、可能な限りモデル化された展開とテスト環境にアクセスできるはずです。 つまり、同じ技術スタック、同じ構成スイッチ、類似のデータベースを使用します。

例えば、users.openai.comの建設と展開時間最適化をデバッグしました。 既にデプロイメントプレビューを使用していたので、Codex はプレビュー環境を使用して、関連するログをデプロイして表示することができます。 問題は、しかし、私たちのプレビューの展開と完全な生産環境と比較して、いくつかの建設経路が無効になっていることです。

その結果、Codexは、実際に問題をチェックするために、生産構成に近い環境に手動でデプロイする必要がありました。

同様に、コーデックスを使用してコンピュータの使用を使用して実用的なアプリケーションをテストすることができます。 iOS のパフォーマンスの問題を最適化するために、@dimirian は、物理的な機器を使用して、最も正確なテスト環境を取得します。

ビジュアルターゲットを慎重に設定します

Codex は、この画像に基づいて、この UI に「100% ピクセル グレード リターン」のようなビジュアル ターゲットを与えます。 ただし、特定の設定によっては問題が発生することがあります。

そして、正しい方向と規律を与えなければ、Codexは詳細に深く、より深くなる可能性があり、代わりに全体の目標を無視します。 例えば、参照図にCordexが生成するのを期待するグラフィック要素が含まれている場合 -- SVG のアイコンや画像であっても、問題全体が解決するのではなく、「これらの材料を正確に整形する方法」に多くのエネルギーを捧げることができます。

また、コーデックスは視覚的な比較権を得るためのツールが必要です。 これは、より多くの写真入力、より全体的なトークン消費を意味しますが、必ずしも改善のための実質の機会を識別する簡単な方法とCodexを提供していません。

その結果、完成基準だけよりも、対象の文脈として、写真は通常より適切です。 機能リスト、達成規範、設計システムへの準拠など、目的が達成されているかどうかを判断するために、Codexの他の方法を見つける必要があります。

追跡の進捗状況

Codex は、他のマシンでも、時間や日の間、再びステージを動作させると、どこに行っても、何をしたかを忘れやすくなります。

異なる目的に基づいて、次の方法を見つけました

• ジャン・コーデックスは、キーノードでコードを提出し、それらをPRドラフトに送信します。 あなたがウェブサイトを作り、展開のプレビューを持っているとき、これは特に便利です。

• ジャン・コーデックスは管理指向の配達を更新します。 アプリケーションブラウザで開くことができるHTMLファイルです。サイトを通じてチームにデプロイするページです。それは、レトロフィットした進捗マップや、通常のMarkdownファイルです。

Codex を指示して、進捗状況の更新を発行します。 ターゲットにこれを置くこともできます。Codex は Slack チャンネルに更新を送信したり、録画したい場所を送信します。

別のチャットウィンドウでステータスを尋ねます。 ステートを素早く理解したい場合は、 /side を実行して新しいサイドチャットを開始し、そこで質問をすることができます。 現行のスレッドを横断するため、日付の全ての文脈がありますが、短いライフサイクルがあります。

コードレックスのアプリケーションへのもう1つの選択肢は、通常の新しいチャットを開くことです。Cordexは別のターゲットスレッドを読み、質問に答えます。 コーデックスが定期的に進捗状況をチェックするための自動化ミッションを設定している場合は、これは特に強力です。

クリーンアップと最終確認

目標はやっと完了です。 結果をチームに投げて閉じることはできますか

通常、特に最適化カテゴリでは、コーデックスが何をしたのかをレビューし、レビューするのに役立ちます。 /review でローカルコードレビューを最初に実行できますが、Codex によるさらなるリフレクション価値があります。 達成しようとしたパスは? どんな仕事ですか。 何が機能しない? したがって、コードをクリーンアップします。

コーデックスは、ターゲットが到達するまで動作するので、それは十分に良いではない方法を試してみるかもしれません、または完全に効果がないです、そして、これらの残りの変更はまだ最終的なコードに残っているかもしれません。

次回のミッションに向けて準備します

Codexのターゲット機能は、最も重要なエンジニアリング課題の一部に対処するための非常に強力なツールです。 しかし、適切な環境と指示を提供すれば、より効率的にターゲットに到達することができます。

どうすればいいですか

[ チャック ]オリジナルリンク]

QQlink

無加密後門,無妥協。基於區塊鏈技術的去中心化社交和金融平台,讓私隱與自由回歸用戶手中。

© 2024 QQlink 研發團隊. 保留所有權利.