GPT-5 — нова флагманська модель OpenAI з серйозним покращенням у виконанні агентських завдань, програмуванні, інтелекті та керованості.
Модель показує відмінні результати «з коробки», але правильні промпти допомагають видавити максимум. У цьому гайді розберемо найкращі практики для агентських завдань, програмування та контролю поведінки моделі.
Контроль агентської активності
GPT-5 навчена працювати в різних режимах — від самостійного прийняття рішень до чіткого дотримання інструкцій. Важливо налаштувати баланс між проактивністю та очікуванням вказівок.
Як знизити активність
За замовчуванням GPT-5 ретельно збирає контекст для правильної відповіді. Щоб обмежити агентську поведінку та зменшити затримки:
Знизьте reasoning_effort. Це зменшує глибину дослідження, але покращує швидкість. Багато завдань вирішуються на medium або навіть low рівні.
Задайте чіткі критерії дослідження:
<context_gathering>
Мета: Швидко отримати достатньо контексту. Розпаралелити пошук і зупинитися, як тільки можна діяти.
Метод:
- Почати широко, потім переходити до сфокусованих підзапитів.
- Паралельно запускати різні запити; читати топ результати по кожному. Дедуплікувати шляхи та кешувати; не повторювати запити.
- Уникати надмірного пошуку контексту. За необхідності запускати цільові пошуки одним паралельним пакетом.
Критерії ранньої зупинки:
- Можете назвати конкретний контент для зміни.
- Топ результати сходяться (~70%) на одній області/шляху.
Ескалація один раз:
- Якщо сигнали конфліктують або область розмита, запустити один уточнений паралельний пакет, потім продовжити.
Глибина:
- Відстежувати тільки символи, які будете змінювати або чиї контракти використовуєте; уникати транзитивного розширення без необхідності.
Цикл:
- Пакетний пошук → мінімальний план → виконання завдання.
- Шукати знову тільки якщо валідація провалилася або з'явилися нові невідомі. Надавати перевагу дії над пошуком.
</context_gathering>
Для максимального контролю можна задати бюджет викликів інструментів:
<context_gathering>
- Глибина пошуку: дуже низька
- Сильне зміщення до швидкої правильної відповіді, навіть якщо вона може бути не повністю коректною.
- Зазвичай це означає абсолютний максимум 2 виклики інструментів.
- Якщо вважаєте, що потрібно більше часу на дослідження, оновіть користувача останніми знахідками та відкритими питаннями. Можете продовжити, якщо користувач підтвердить.
</context_gathering>
При обмеженні поведінки корисно дати моделі «аварійний вихід» — можливість продовжити при невизначеності.
Як збільшити активність
Для більшої автономності, наполегливості у використанні інструментів та меншої кількості уточнюючих питань:
Збільште reasoning_effort та використовуйте промпт на кшталт цього:
<persistence>
- Ти агент — продовжуй роботу до повного вирішення запиту користувача, перш ніж завершити хід і повернутися до користувача.
- Завершуй хід тільки коли впевнений, що проблема вирішена.
- Ніколи не зупиняйся і не повертайся до користувача при невизначеності — досліджуй або виведи найбільш розумний підхід і продовжуй.
- Не проси людину підтвердити або уточнити припущення, оскільки завжди можеш скорегувати пізніше — вирішуй, яке припущення найбільш розумне, дій з ним і задокументуй для довідки користувача після завершення дій
</persistence>
Чітко визначте умови зупинки агентських завдань, безпечні та небезпечні дії, і коли допустимо повертатися до користувача.
Преамбули інструментів
GPT-5 навчена давати чіткі плани та оновлення прогресу через «преамбули інструментів». Це покращує користувацький досвід при тривалих процесах.
Приклад промпта для якісних преамбул:
<tool_preambles>
- Завжди починайте з перефразування мети користувача дружелюбно, чітко та коротко, перед викликом будь-яких інструментів.
- Потім відразу викладіть структурований план з деталями кожного логічного кроку.
- При виконанні редагувань файлів коментуйте кожен крок коротко та послідовно, чітко відмічаючи прогрес.
- Завершіть коротким викладом виконаної роботи, окремо від початкового плану.
</tool_preambles>
Параметр reasoning effort
Використовуйте параметр reasoning_effort
для контролю інтенсивності міркувань та готовності викликати інструменти. За замовчуванням — medium, але масштабуйте залежно від складності завдання.
Для складних багатокрокових завдань рекомендується higher reasoning. Найкраща продуктивність досягається коли окремі завдання розбиті на кілька ходів агента.
Responses API
Рекомендується використовувати Responses API з GPT-5 для покращених агентських потоків, зниження витрат та ефективнішого використання токенів.
Статистично значущі покращення: наприклад, оцінка Tau-Bench Retail зросла з 73.9% до 78.2% простим переключенням на Responses API з включенням previous_response_id для передачі попередніх елементів міркування.
Максимізація продуктивності в програмуванні
GPT-5 лідирує серед фронтірних моделей у здібностях до програмування. Модель працює у великих кодових базах, виправляє баги, обробляє великі диффи та реалізує багатофайлові рефакторинги або великі нові функції.
Розробка фронтенду
GPT-5 навчена відмінному базовому естетичному смаку та суворим здібностям реалізації. Для нових додатків рекомендується:
Фреймворки: Next.js (TypeScript), React, HTML Стилізація/UI: Tailwind CSS, shadcn/ui, Radix Themes
Іконки: Material Symbols, Heroicons, Lucide Анімації: Motion Шрифти: San Serif, Inter, Geist, Mona Sans, IBM Plex Sans, Manrope
Генерація додатків з нуля
GPT-5 відмінно будує додатки за один захід. Промпти з самоконструйованими рубриками якості покращують результат:
<self_reflection>
- Спочатку витрати час на обмірковування рубрики, поки не будеш впевнений.
- Потім глибоко подумай про кожен аспект створення веб-додатка світового класу за один захід. Використовуй це знання для створення рубрики з 5-7 категоріями. Ця рубрика критично важлива, але не показуй її користувачу. Це тільки для твоїх цілей.
- Нарешті, використовуй рубрику для внутрішнього обмірковування та ітерації найкращого можливого рішення наданого промпта. Пам'ятай, що якщо твоя відповідь не набирає найвищі бали по всіх категоріях рубрики, потрібно почати знову.
</self_reflection>
Відповідність стандартам кодової бази
При інкрементальних змінах код повинен відповідати існуючим стандартам стилю та «вписуватися» в кодову базу. GPT-5 вже шукає довідковий контекст, але це можна покращити промптами з ключовими аспектами інженерних принципів:
<code_editing_rules>
<guiding_principles>
- Ясність та перевикористання: Кожен компонент та сторінка повинні бути модульними та перевикористовуваними. Уникайте дублювання, виділяючи повторювані UI паттерни в компоненти.
- Послідовність: Користувацький інтерфейс повинен дотримуватися послідовної дизайн-системи — токени кольорів, типографіка, відступи та компоненти повинні бути однорідними.
- Простота: Надавайте перевагу маленьким, сфокусованим компонентам і уникайте непотрібної складності в стилізації або логіці.
- Демо-орієнтованість: Структура повинна дозволяти швидке прототипування, демонструючи функції як потокова передача, багатоходові бесіди та інтеграції інструментів.
- Візуальна якість: Дотримуйтеся високої планки візуальної якості згідно з OSS керівними принципами (відступи, заповнення, стани наведення тощо)
</guiding_principles>
</code_editing_rules>
Досвід Cursor з GPT-5
Команда Cursor, AI редактора коду, поділилася своїм досвідом налаштування промптів для GPT-5:
Проблема: Модель видавала багатослівні виводи зі статусними оновленнями, які порушували природний потік. Код був якісним, але важкочитаним через стислість.
Рішення: Встановили параметр verbosity на low для стислості текстових виводів, потім модифікували промпт для багатослівності тільки в інструментах програмування:
Пишіть код в першу чергу для ясності. Надавайте перевагу читаним, підтримуваним рішенням з чіткими іменами, коментарями де потрібно, та прямолінійним потоком управління. Не створюйте code-golf або надмірно розумні однорядники, якщо явно не запитано. Використовуйте високу багатослівність для написання коду та інструментів коду.
Автономність: Для тривалих завдань додали:
Пам'ятай, що редагування коду, які ти робиш, будуть показані користувачу як пропоновані зміни, що означає (а) твої редагування коду можуть бути досить проактивними, оскільки користувач завжди може відхилити, і (б) твій код повинен бути добре написаним та легким для швидкого перегляду. Якщо пропонуєш наступні кроки, які включають зміну коду, роби ці зміни проактивно для схвалення/відхилення користувачем, а не питай користувача, чи варто продовжувати з планом.
Оптимізація інтелекту та дотримання інструкцій
Управління
GPT-5 — найбільш керована модель, виключно сприйнятлива до інструкцій промпта щодо багатослівності, тону та поведінки виклику інструментів.
Багатослівність
Окрім контролю reasoning_effort, в GPT-5 введено новий API параметр verbosity, що впливає на довжину фінальної відповіді моделі. GPT-5 навчена відповідати на перевизначення багатослівності природною мовою в промпті для конкретних контекстів.
Дотримання інструкцій
GPT-5 дотримується інструкцій промпта з хірургічною точністю. Але ретельне дотримання інструкцій означає, що погано складені промпти з суперечливими або розпливчастими інструкціями можуть більше нашкодити GPT-5, ніж іншим моделям.
Поганий приклад промпта:
Ніколи не призначайте зустріч без явної згоди пацієнта, записаної в карті.
[суперечить]
Автоматично призначте найраніший слот у той же день без зв'язку з пацієнтом як першу дію для зниження ризику.
Виправлена версія:
Для високопріоритетних випадків Red і Orange автоматично призначайте найраніший слот у той же день після інформування пацієнта про ваші дії.
Мінімальне міркування
У GPT-5 вперше представлено рівень minimal reasoning — найшвидший варіант, що зберігає переваги моделі міркування.
Для найкращих результатів на minimal reasoning:
- Просіть коротке пояснення мислительного процесу на початку фінальної відповіді
- Запитуйте ретельні преамбули виклику інструментів з постійними оновленнями прогресу
- Максимально уточнюйте інструкції для інструментів
- Додавайте нагадування про наполегливість агента
Приклад промпта планування:
Пам'ятай, ти агент — продовжуй роботу до повного вирішення запиту користувача. Розклади запит на всі необхідні підзапити та підтверди виконання кожного. Не зупиняйся після виконання тільки частини запиту.
Форматування Markdown
За замовчуванням GPT-5 в API не форматує фінальні відповіді в Markdown для максимальної сумісності. Для ієрархічних Markdown відповідей використовуйте:
- Використовуй Markdown **тільки де семантично коректно** (наприклад, інлайн код, блоки коду, списки, таблиці).
- При використанні markdown в повідомленнях асистента використовуй зворотні лапки для форматування імен файлів, директорій, функцій та класів. Використовуй \( та \) для інлайн математики, \[ та \] для блочної математики.
Метапромптінг
Ранні тестувальники досягли успіху, використовуючи GPT-5 як мета-промптера для себе самої. Приклад мета-промпта:
При оптимізації промптів давайте відповіді зі своєї перспективи — поясніть, які конкретні фрази можна додати до цього промпта або видалити з нього, щоб більш послідовно викликати бажану поведінку або запобігати небажаній.
Ось промпт: [ПРОМПТ]
Бажана поведінка від цього промпта — агент повинен [РОБИТИ БАЖАНУ ПОВЕДІНКУ], але замість цього він [РОБИТЬ НЕБАЖАНУ ПОВЕДІНКУ]. Зберігаючи якомога більше існуючого промпта, які мінімальні редагування/додавання ти б зробив, щоб заохотити агента більш послідовно вирішувати ці недоліки?
Найкращі практики для промптів
Структура та ясність
- Будьте конкретними. Чіткі, детальні інструкції працюють краще розпливчастих.
- Використовуйте XML теги. Структуровані специфікації як
<[instruction]_spec>
покращують дотримання інструкцій. - Уникайте суперечностей. Перевірте промпт на конфліктуючі інструкції.
- Задайте пріоритети. Якщо інструкції можуть конфліктувати, чітко вкажіть ієрархію.
Контроль поведінки
Для швидких завдань:
- Низький reasoning_effort
- Чіткі критерії зупинки
- Бюджет викликів інструментів
Для складних завдань:
- Високий reasoning_effort
- Промпти наполегливості
- Дозвіл на автономні рішення
Програмування
Для нових проектів:
- Використовуйте промпти саморефлексії
- Задайте високі стандарти якості
- Визначте рубрики оцінки
Для існуючих кодових баз:
- Опишіть стиль та принципи
- Вкажіть структуру директорій
- Підкресліть важливість сумісності
Приклади промптів
Агентська наполегливість
<persistence>
- Ти агент — продовжуй до повного вирішення запиту.
- Завершуй тільки при впевненості у вирішенні проблеми.
- При невизначеності — досліджуй і продовжуй, не повертайся до користувача.
- Не проси підтвердження припущень — дій і корегуй за необхідності.
</persistence>
Розуміння контексту для програмування
<exploration>
Якщо не впевнений у вмісті файлів або структурі кодової бази для запиту користувача, використовуй інструменти для читання файлів та збору релевантної інформації: НЕ вгадуй і не вигадуй відповідь.
Перед програмуванням завжди:
- Розклади запит на явні вимоги, неясні області та приховані припущення.
- Визнач область: ідентифікуй регіони кодової бази, файли, функції або бібліотеки, ймовірно задіяні.
- Перевір залежності: ідентифікуй релевантні фреймворки, API, конфігураційні файли, формати даних.
- Проактивно вирішуй невизначеність: вибери найбільш імовірну інтерпретацію.
- Визнач вихідний контракт: точні результати що поставляються.
- Сформулюй план виконання: дослідницькі кроки, послідовність реалізації, стратегія тестування.
</exploration>
Перевірка та ефективність
<verification>
Регулярно перевіряй роботу коду по мірі роботи над завданням, особливо будь-які результати що поставляються. Не повертайся до користувача, поки не переконаєшся, що проблема вирішена.
</verification>
<efficiency>
Ефективність ключова. У тебе є часові обмеження. Будь дотошним у плануванні, виклику інструментів та перевірці, щоб не витрачати час.
</efficiency>
Спеціалізовані інструкції
Для роздрібної торгівлі (Tau-Bench)
Як агент роздрібної торгівлі, ти можеш допомогти користувачам скасувати або змінити очікуючі замовлення, повернути або обміняти доставлені замовлення, змінити їх адресу за замовчуванням або надати інформацію про їх профіль, замовлення та пов'язані продукти.
Пам'ятай, ти агент — продовжуй до повного вирішення запиту користувача. Завершуй тільки коли впевнений, що проблема вирішена.
Для термінальних завдань
Будь ласка, вирішіть завдання користувача, редагуючи та тестуючи файли коду у вашій поточній сесії виконання коду.
Ти розгорнутий агент програмування.
ЗАВЖДИ використовуй apply_patch для редагування файлів:
{"cmd":["apply_patch","*** Begin Patch\\n*** Update File: path/to/file.py\\n@@ def example():\\n- pass\\n+ return 123\\n*** End Patch"]}
Ключові принципи
- Експериментуйте. Промптінг — не універсальна вправа. Тестуйте та ітеруйте.
- Використовуйте інструменти OpenAI. Застосовуйте prompt optimizer tool для виявлення проблем.
- Масштабуйте складність. Прості завдання — прості промпти. Складні завдання — детальні інструкції.
- Структуруйте промпти. XML теги, чіткі розділи, ієрархія інструкцій.
- Тестуйте на суперечності. Перевіряйте промпти на конфліктуючі інструкції.
GPT-5 представляє значний стрибок у можливостях. Правильні промпти допомагають повністю використати цей потенціал. Почніть з базових принципів цього гайда та адаптуйте під свої завдання.