Veo 3.1 для маркетолога: 8 промптов, 4 ограничения и реальный bill за квартал
Полный гайд по Veo 3.1 для рекламного продакшена: 8 промпт-шаблонов с примерами выхода, 4 ограничения, о которых не пишут в маркетинговых обзорах, и моя сетка стоимости — Q1 2026 я генерил 47 роликов на $312.

За первый квартал 2026 я сгенерировал 47 рекламных роликов в Veo 3.1. Бюджет — $312, без учёта подписки. Аналогичный объём через продакшн-команду в 2023-м обошёлся бы в 2.4M ₽ и занял бы 14 недель. Это не сравнение «AI-будущее vs прошлое». Это сетка реальных вычислений из моей биллинговой выписки за Q1.
Я не пишу очередной обзор «10 фишек Veo 3.1, которые перевернут маркетинг». Веду этот гайд для маркетологов, у которых уже есть бюджет на performance и которые хотят сократить продакшн в 5–10 раз. Здесь — 8 промпт-шаблонов с примерами выхода, 4 ограничения, о которых не пишут в маркетинговых обзорах, и моя сетка стоимости. Без хайпа.
Veo 3.1 не «заменяет видеографа». Он заменяет половину pipeline'а — съёмку, монтаж, цветокор, sync-аудио. Бриф и финальный вкус — по-прежнему за человеком.
Что такое Veo 3.1 в маркетинговом смысле
Veo 3.1 — text-to-video модель от Google DeepMind, генерит ролики до 60 секунд в 1080p со встроенной синхронизированной аудиодорожкой (эмбиент, шум, иногда речь). Доступна через Vertex AI, Gemini API и через сторонние агрегаторы вроде kie.ai. Появилась в ноябре 2025 как обновление Veo 3.0; ключевое изменение — стабильность качества при генерации ролика длиннее 8 секунд.
Что это значит на практике для маркетолога:
- Один промпт = одно 8-секундное видео в HD с встроенным звуком за 90 секунд генерации
- $0.50–0.75 за секунду в зависимости от провайдера (через Vertex дешевле, через kie.ai — удобнее API)
- Качество в 90% случаев такое, что отличить от живой съёмки могут только профессионалы видео — на focus-группах из обычных зрителей никто не угадывает
- API не требует звонков менеджеру по продажам, оплаты по белому/серому, можно платить картой Mastercard через Wise
8 промптов, которые работают на performance-задачах
Все промпты ниже у меня прямо сейчас в Notion. Структура промпта в Veo 3.1: subject + setting + composition + lighting + camera + style + duration. Никаких «AI меняет правила игры» — конкретные конструкции для конкретных задач.
Промпт 1. Product hero shot для e-com
Slow rotating shot of [продукт], floating against dark gradient background, cinematic studio lighting from the right, subtle particles in the air, premium product photography style, 8 seconds, smooth seamless loop, shot on Sony FX9, depth of field, no text overlays, photorealistic, 4K detail.Где использую: сайт-баннеры, retargeting в VK и Я.Директ. На ID Store такой формат заменил студийную съёмку — раньше каждый новый артикул требовал смены фотографа, реквизита, монтажа. Сейчас — 90 секунд на ролик.
Промпт 2. Lifestyle ролик для VK Clips
Young woman, 28, casual style, sitting in a sunlit Scandinavian apartment, drinking coffee, looking at her phone, smiles softly, warm morning light through window, vertical 9:16 frame, shot on Canon R5 50mm f/1.4, intimate cinematic mood, 6 seconds, soft jazz ambient audio.Где использую: vertical видео для VK Ads. Для разных кампаний меняю возраст, контекст, продукт в руках. Один шаблон — десяток вариаций под A/B-тест.
Промпт 3. B2B-серьёзная сцена для Telegram Ads
Marketing director in a modern minimalist office, looking at a dashboard with charts on a large monitor, soft natural light from floor-to-ceiling windows, focused expression, slight zoom-in over 5 seconds, shot on RED Komodo 35mm, professional confident atmosphere, no text overlays.Где использую: ролики в Telegram Ads на B2B-каналы. Тон серьёзный, никаких улыбок «в камеру». На MM AI Trading такой формат работает в 2–3× лучше lifestyle-видео.
Промпт 4. Tutorial-ролик с экранным захватом
Hands typing on a MacBook Pro keyboard, top-down view, dark wood desk with notebook and coffee mug, dimly lit room with one warm desk lamp, slow shallow depth-of-field zoom on the keyboard, no screen visible, focused intentional movement, 8 seconds, ASMR keyboard sound.Где использую: tutorial-серии, видео для лендингов про софт/курсы. Часто комбинирую с screen recording — Veo даёт hands-shot, остальное снимается через OBS.
Промпт 5. Эмоциональный B2C-ролик для retargeting
Group of friends laughing together at an outdoor BBQ in the evening, warm string lights, golden hour transitioning to dusk, handheld camera with subtle shake, Kodak Portra 400 film grain, intimate moments captured naturally, 7 seconds, ambient laughter and clinking glasses.Где использую: retargeting B2C на людях, которые посетили сайт но не купили. Эмоциональная нагрузка через атмосферу — без прямого продающего текста.
Промпт 6. Tech / SaaS demo для Habr-аудитории
Abstract data visualization, glowing nodes connecting through a dark space, neon emerald accents on connection lines, slow rotation revealing depth, cinematic technological atmosphere, premium tech aesthetic, 6 seconds, low ambient electronic drone, no text or logos visible.Где использую: B2B SaaS, fintech, любой продукт с «невидимой» сутью. Замена скучным анимированным схемам в After Effects.
Промпт 7. Местный российский context
Inside a Moscow metro train, late afternoon, passengers in business attire reading on phones, soft yellow interior lighting, slight motion blur from train movement, view from a static camera mounted at door level, 8 seconds, ambient train sounds.Где использую: B2C-кампании с географической привязкой. Veo 3.1 неплохо знает специфику московского метро (вагоны типа «Москва-2024»). На Питер уже хуже.
Промпт 8. Цикл «до и после»
Split-screen 8 seconds: left side shows a cluttered messy office desk with papers and old computer, right side shows the same desk after — minimal, clean, modern setup with one tablet and one notebook, both halves filmed in matching lighting, slow synchronized zoom-in on both sides, professional cinematic style.Где использую: продукты с «трансформационным» обещанием — клининг, курсы, организация. Сильный визуальный triggers.
4 ограничения Veo 3.1, о которых не пишут
- Текст в кадре — катастрофа. Veo не умеет генерить читаемый текст в видео. Любые надписи на табличках, экранах, бейджах — превращаются в нечитаемую кашу из псевдо-букв. Решение: не пишите «текст в кадре» в промпте; добавляйте текстовые overlay в After Effects/CapCut после рендера.
- Лица — нестабильны на длительности 8+ секунд. Если в ролике человек, на 5–6 секунде черты лица начинают «плыть». На vertical-форматах это менее заметно; на хедшотах — критично. Решение: ограничивай длительность кадров с лицом до 3–4 секунд, переходи на детали (руки, торс, окружение).
- Русский язык в речи — не работает. Если в промпте просишь персонажа сказать что-то на русском — получаешь либо тарабарщину, либо английский с акцентом. Решение: voiceover делается отдельно через ElevenLabs, накладывается в монтаже.
- Брендовые продукты — содержат hallucinations. Запрос «iPhone 15 на столе» даст девайс, похожий на iPhone, но с искажёнными деталями (логотип, кнопки, островок камер). Это юридически проблематично, особенно для рекламы конкретных брендов. Решение: либо не прорисовывай детали бренда, либо снимай реальный продукт + используй Veo для окружения.
Реальный bill за Q1 2026
| Месяц | Роликов | Total секунд | Стоимость, $ |
|---|---|---|---|
| Январь | 14 | 98 сек | $72 |
| Февраль | 19 | 142 сек | $104 |
| Март | 14 | 186 сек | $136 |
| Итого Q1 | 47 | 426 сек | $312 |
Средняя стоимость одного 8-секундного ролика: $6.6. Аналогичный ролик через продакшн-команду в 2023-м: 65 000 ₽. Разница в 100×. Полный разбор экономики моего AI-стека — в статье «Один маркетолог = команда из 5 ролей».
Сравнение с конкурентами
| Модель | Качество | Цена за 8 сек | Sync аудио | Где использую |
|---|---|---|---|---|
| Veo 3.1 | 9/10 | $6 | да | основной workflow |
| Sora 2 | 8.5/10 | $8 | частично | резерв на специфические сцены |
| Runway Gen-4 | 7.5/10 | $5 | нет | больше не использую |
| Kling 2.0 | 7/10 | $4 | нет | тестирую периодически |
Полный обзор всех инструментов в стеке — в моём сравнении AI-инструментов 2026.
Workflow: от промпта до готового ролика для VK Ads
- Бриф. Что продукт, какой target, какая эмоция. 15 минут на 5 креативов.
- Промпт-шаблон. Беру из библиотеки выше, адаптирую под продукт. 5 минут на ролик.
- Генерация в Veo. 90 секунд, паралелльно ставлю 3–5 вариантов одного промпта.
- Selection. Из 5 вариантов выбираю 2–3 годных. Минут 10.
- Voiceover в ElevenLabs. Если нужна речь — 30 секунд.
- Текстовые overlay в CapCut/After Effects. 10–20 минут.
- Загрузка в VK Ads. 5 минут.
Итого: 5 готовых креативов под кампанию за ~1.5 часа моего времени и ~$30 на API. То же количество через продакшн в 2023-м — неделя работы команды и ~325 000 ₽. Разница «в 200×» по unit-economics, как я писал в основной статье про AI-стек.
Если вы сейчас платите продакшн-команде 50K+ ₽ за один рекламный ролик — вы не на 5 лет отстаёте от рынка. Вы теряете конкурентов, которые уже считают unit-economics по-новому. Хотите, разберу ваш текущий продакшн-flow на 30-минутном discovery-колле — покажу, какие 3–5 шагов можно убрать в первый же месяц.
Связанные материалы: калькулятор ROAS, бенчмарки CTR в VK Ads, полный гайд по performance-маркетингу.