Контекстное окно
Контекстное окно — сколько текста (в токенах) модель удерживает за раз: и твой промпт, и её ответ. Переполнил — модель «забывает» начало.
Контекстное окно — это объём текста, который модель «видит» одновременно: системный промпт, история диалога, приложенные документы и сам ответ. Измеряется в токенах. У современных моделей 2026 года это сотни тысяч токенов — целые книги.
Почему это важно на практике. Если ты вываливаешь в чат огромный бриф, три статьи и просишь ещё учесть прошлый диалог — можно упереться в потолок окна, и модель начнёт терять то, что было в начале. Симптом — ответы «плывут», ранние инструкции игнорируются.
Мой подход: не путать «большое окно» с «кидай туда всё». Чем чище и короче контекст, тем точнее ответ. Лучше дать модели 2 нужных документа, чем 20 на всякий случай.