Codex Goal 모델의 사용을 위한 가이드라인: AI를 활성화하는 방법

2026/06/07 00:28
🌐ko

키는 더 긴 프롬프트를 작성하지 않지만 검증 가능한 표준, 실제 환경 및 진행 추적 메커니즘을 설정합니다

Codex Goal 모델의 사용을 위한 가이드라인: AI를 활성화하는 방법
원본 제목: 가이드 to/goal
Original by: @dkundel, OpenAI 개발자 관계 회원
사진 Peggy

편집기: 이 문서는 OpenAI 개발자 관계 회원 Dominik Kundel에서, Codex "goal Mode//goal"기능의 경험을 요약. 그것은 일반 프롬프트 기술에 대해 아니지만 AI 프로그래밍 도구의 지속적인 역할 변화에 대해 : Codex는 더 이상 단일 휠 명령에 응답하는 코드 조수는 없지만 명확한 대상을 계속할 수있는 임원 유형이기 시작합니다。

/goal 모델에서 더 이상 수요를 작성하는 것은 정말 중요합니다. 그러나 Codex에 대한 명확하고 검증 가능한 출구 기준을 설정하십시오. 예를 들어, 배포 시간의 30 % 감소 "테스트 적용 100 % 패리티" "LCP 아래 2.5 초". 이 지표는 Codex를 사용하여 작업이 수행되고 목표의 vagueness에 대한 인피니티를 방지 할 수 있습니다. 동시에, 사용자는 코덱이 진행을 측정 할 수 있는 충분한 방향, 도구 및 실제 환경을 제공해야 합니다., 결과 검증, 오히려 지역 또는 비열한 수준에서만 볼 수 있는 솔루션을 완료하는 것보다。

특히, 기사는 시각적인 임무가 Cordex를 상세한 상황으로 얻는 것이 가장 쉽습니다. 100% 픽셀 수준 감소를 필요로 하는 대신, 시각적인 표적은 기능적인 명부, 디자인 체계 명세 및 평가할 수 있는 지시자에 분해되어야 합니다. 몇 시간 또는 심지어 일 지속되는 장기적인 임무를 위해, 위원회, 초안 PR, 진도 파일, 슬랙 업데이트 또는 sidechat을 통해 그들의 추적을 계속할 필요가 있습니다, 그래서 단지 몇 가지 비 민감 변화로 끝나지 않는。

이 문서의 추가 값은 "long-term task Management mechanism"으로 적색 /goal입니다. AI가 수십 개 이상의 연속 시간을 실행할 수 있을 때, 개발자의 핵심 역량은 AI가 코드를 생성하는 것을 허용하지 않고, 목표를 정의하고, 측정 시스템을 설정하고, 구현 환경을 구성하고, 검토 및 디스크를 최종화합니다. 즉, AI 프로그래밍은 "writing hints"에서 "진행 프로젝트 구현자"로 이동합니다。

다음은 원본 텍스트입니다:

Cordex가 콘크리트 결과를 향해 움직이는 것을 돕기 위해 Target Mode(goal Mode, or /goal)를 출시했습니다. 목표를 설정할 때, Codex는 목표가 달성될 때까지 작동합니다 -- 그것은 시간, 일이 걸립니다. 누군가는 120 시간 이상 동일한 표적을 위한 Codex 일을 만들었습니다。

표적 모형은 아주 강합니다. 영향을 극대화하기 위해 7 가지 주목할만한 것들이 있습니다。

명확하고 검증 가능한 표준 설정

대상 모드를 활성화 할 때 입력한 힌트는 초기 힌트로 제공 할 수 있으며 더 중요한 것은 대상의 출구 크리터가 될 것입니다. 각 일의 둥근 후에, Codex는 이 목표가 달성된지 검사할 것입니다。

따라서, 목적의 메시지는 너무 길지 않아야합니다. 그러나 명확한 선명도에 중점을 둡니다. 목표가 달성되면。

대부분의 경우, 좋은 목표는 완성 여부를 판단하는 모델에 대한 명확한 수치 지표를 포함하기 위해 최선을 다할 것입니다. 예를 들면:

"건축 및 배포 시간을 30 % 감소시킵니다."

"TypeScript에서 Rust로 함수를 보내고 100% 테스트 일관성을 도달합니다."

"Optimate 비계는 생산 환경에서 최대 콘텐츠 매핑을 허용 (대량 Contentful Point, 페이지의 키 콘텐츠의 로딩 속도를 측정하는 지표) 2.5 초 미만이어야합니다

이 힌트는 항상 숫자를 포함해야하지만 일반적으로 그림은 앞으로 이동하기 쉬운 단계를 만듭니다。

대상을 정의하는 방법을 모르는 경우, 또는 Codex와 프로젝트를 시작하려는 경우 대상 모드로 시작할 필요가 없습니다。

Codex는 자신의 목표를 설정할 수 있습니다. 일반적으로 대화를 시작할 수 있습니다. Cordex를 시작할 준비가되면 Cordex가 토론을 기반으로 대상을 설정할 수 있습니다。

언제든지 대상을 편집 할 수 있습니다. Codex 응용 프로그램에서 편집 버튼을 클릭하거나 CLI에서 /goal을 다시 사용합니다。

가능한 범위에 대한 안내

"건축 및 배포 시간의 30 % 감소"와 같은 힌트는 멋진 소리와 Codex가 창조적 인 솔루션을 찾을 수 있습니다. 그러나 문제가 될 수있는 일반적인 아이디어를 가지고 있다면,이 힌트는 곡선에 Codex를 넣을 수 있습니다。

그래서, 가능한 한, 그것은 시작 하는 Codex를 말하는 것이 가장 좋습니다, 목표 달성 하는 데 사용 하는 도구, 또는 잘못된 방향으로 피 하기 위해 다른 팁을 제공 합니다。

예를 들어, my colleague, @reach vb는 실험에서 그렇게했습니다. 그는 Google Colab에 액세스 할 수있는 Chome 브라우저를 사용할 수 있다고 말했으며 Codex 교육 모델을 허용하는 것과 같은 일부 허용 제한이 데이터 세트 자체를 생성 할 수 있다고 말했습니다。

다시, 당신은 건설 시간을 단축하고 이미 시간이 소요되는 것을 알고, 그것은 힌트에 Codex를 포인트하는 것이 가장 좋습니다。

또는, Codex가 계획 모드의 일부 예비 연구를 수행하고 잠재적 인 프로그램을 문서에 계획 문서를 만들 수 있습니다. 그런 다음 대상이 계획을 인용합니다。

진도 measurable 만들기

목표가 야심적 인 경우, 또는 Cordex는 그것에 더 가까이 얻을 수있는 많은 방법이 있습니다. Cordex가 진행 상황을 측정하는 도구를 제공하는 것이 중요합니다。

이것은 어떤 임무를 위해 자연일지도 모릅니다. 예를 들어, 건설 시간과 증가 테스트 범위를 최적화, Codex는 이미 일반적으로 도구를 사용하거나 자연스럽게 만들 수 있습니다。

그러나 다른 대상을 위해 Codex의 머리 폭풍으로 더 나은 시작: 어떤 도구가 진행 상황을 판단할 수 있습니까? 또는 목표에 접근하는 것을 확인하는 방법의 힌트를 제공합니다. 예를 들어, 두 개의 스크린 샷에 대한 시각적 차이 일치하는 도구를 만들거나 벌레잡기가있는 지능형 바디에 대한 평가 세트를 만듭니다。

Codex가 스크린 샷을 비교하고 차이를 확인합니다. Codex가 비디오를 만들 때 Codex가 비디오를 기반으로 한 일부 구성 요소를 다시 시작합니다. 나중에, 도구가 계속되고 다른 대조 모델을 추가합니다。

Picture: Codex는 두 프레임의 시각적 비교의 스크린 샷을 생산합니다。

mandate에 따라 측정하거나 검사 할 수있는 추가 표준이 있는지 고려해야합니다. 그렇지 않으면, Codex는 작업이 완료되었는지 생각할 수 있습니다。

Codex, 예를 들어, 디자인 참조 맵을 잘라 픽셀 레벨 감소에 대한 페이지에 삽입 할 수 있습니다; 또는 그것은 100 %에 테스트 범위를 줄일 수 있습니다. 이것의 아무도 정말 그것을 할 수있는 방법입니다。

실제 환경 만들기

Codex를 원하는 경우 실제 진행 상황을 목표로 만들고 싶다면 충분한 실제 환경에서 작동해야합니다。

실제로, 배포 시간 또는 지연을 최적화하려는 경우, Codex는 배포 및 테스트 환경에 액세스 할 수 있어야하며 가능한 한 많이 모델링됩니다. 이것은 동일한 기술 스택, 동일한 구성 스위치 및 유사한 데이터베이스를 사용하여 의미합니다。

예를 들어, 우리는 건설 및 배포 시간 최적화를 디버깅했다.openai.com. 우리는 이미 배포 미리보기를 사용하여, 그래서 Codex는 미리보기 환경을 사용하여 배포하고 관련 로그를 볼 수 있습니다. 문제이지만, 일부 건설 통로가 우리의 미리보기 배포 및 전체 생산 환경에 비해 비활성화되었습니다。

결과적으로 Codex는 결국 생산 구성에 더 가까운 환경에 수동으로 배치 할 수 있었습니다。

마찬가지로, Codex를 사용하여 컴퓨터 사용을 사용하여 실제 응용 프로그램을 테스트 할 수 있습니다. iOS의 성능 문제를 최적화하려면 @dimirian은 가장 정확한 테스트 환경을 얻기 위해 물리적 장비를 사용했습니다。

조심스럽게 시각적인 표적

이 그림에 근거한 "100% 화소 급료 반환" 같이 Codex 시각적인 표적을, 진짜로 유혹하는 이 UI에 주기. 그러나 특정 설정에 따라 문제가 될 수 있습니다。

그리고 올바른 방향과 훈련을 제공하지 않는 경우, Codex는 몇 가지 세부 사항에서 더 심하고 심하게 얻을 수 있으며, 대신 전체 목표를 무시합니다. 예를 들어, 참고 그림이 Cordex를 생성 할 것으로 예상하는 일부 그래픽 요소가 포함되면 -- SVG 아이콘 또는 그림 여부 -- 그것은 "이 자료를 정확히 재구성하는 방법"으로 많은 에너지를 열 수 있습니다, 오히려 전체적인 문제를 찢기보다。

또한 Codex는 시각적 비교를 얻기 위해 도구가 필요합니다. 이것은 더 많은 사진 입력, 더 전반적인 토큰 소비를 의미하지만, 반드시 개선을위한 실제 기회를 식별하는 간단한 방법으로 Codex를 제공하지 않습니다。

결과적으로, 그림은 보통 단지 완료 선행보다 대상의 맥락으로 더 적합합니다. Codex의 다른 방법을 찾을 수 있습니다. 목적이 달성되었는지 여부를 판단하는 기능 목록, 성과 규범, 디자인 시스템 준수 등。

추적 진행

Codex가 결국 시간 또는 심지어 일 동안 무대를 작동하면 다른 기계에서도 갔다고하는 것을 잊지 못합니다。

다른 목표에 따라, 나는 도움이 다음 방법을 발견:

• Jean Codex는 키 노드에서 코드를 제출하고 초안 PR에 보냅니다. 웹 사이트를 만들고 배포의 미리보기가있을 때 특히 유용합니다。

• Jean Codex는 관리 지향적 인 배달을 업데이트합니다. 응용 프로그램 브라우저에서 열 수 있는 HTML 파일이 될 수 있습니다. 사이트를 통해 팀에 배포하는 페이지가 될 수 있습니다. 그것은 개조 된 진행지도 또는 일반 Markdown 파일일 수 있습니다。

Codex를 사용하여 진행 상황을 확인할 수 있습니다. 대상에서 이것을 넣을 수도 있습니다. Codex가 Slack 채널에 업데이트를 보내거나 기록하려는 다른 곳에서도 볼 수 있습니다。

다른 채팅 창과 상태에 대한 질문. 상태를 빠르게 이해하려면 /side를 실행하고 새로운 측면 채팅을 시작하고 질문을 할 수 있습니다. 현재 스레드를 교차하기 때문에 날짜에 모든 컨텍스트가 있지만 짧은 수명주기가 있습니다。

Cordex의 응용 프로그램에 대한 또 다른 대안은 일반 새로운 채팅을 열고 Cordex가 다른 대상 스레드를 읽고 질문에 대답 할 수 있습니다. Cordex가 자동화된 임무를 설정하면 특히 강력합니다。

깨끗하고 최종 확인

위대한, 목표는 마지막으로 수행됩니다. 우리는 단지 팀에 결과를 던질 수 있고 그 후에 닫힐 수 있습니까

일반적으로 낙관 범주에 특히, 나는 Codex에 도움이 발견하고 그가 행한 것을 검토하고 검토합니다. 로컬 코드 리뷰를 먼저 /review로 실행할 수 있지만, Codex의 더 반영 가치가 있습니다. 어떤 경로가 달성하려고 했습니까? 무슨 일이야? 어떤 일을 하지? 그런 다음 코드를 따라 정리합니다。

Codex는 대상이 도달 할 때까지 작동하기 때문에 충분히 좋지 않은 방법을 시도 할 수 있습니다. 또는 완전하게 효과적이고 이러한 잔여 변경은 여전히 최종 코드에 남아있을 수 있습니다。

나는 당신의 다음 임무를 위해 당신을 설정할 것입니다

Codex의 타겟 기능은 가장 중요한 엔지니어링 과제를 해결하는 데 도움이되는 매우 강력한 도구입니다. 그러나 올바른 환경과 지침을 제공하면 목표를 더욱 효율적으로 도달할 수 있습니다。

당신은 무엇을 했습니까

[ 척 ]원본 링크]

QQlink

Tidak ada "backdoor" kripto, tidak ada kompromi. Platform sosial dan keuangan terdesentralisasi berdasarkan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Tim R&D QQlink. Hak Cipta Dilindungi Undang-Undang.