GPT
GPT — архитектура трансформера от OpenAI, на которой построены ChatGPT и большинство коммерческих LLM.
GPT расшифровывается как Generative Pre-trained Transformer. Это архитектура нейросети, которую OpenAI использует с 2018 года. ChatGPT, GPT-4o, GPT-4.5 — всё это конкретные модели на её основе. Когда в разговоре говорят «ChatGPT», обычно имеют в виду интерфейс, а не саму архитектуру.
В моей практике GPT-4o — первый инструмент, который я пробую для любой новой задачи: написать бриф, разобрать конкурента, сгенерировать варианты заголовков для A/B-теста. Он хорошо справляется с русским языком, понимает контекст длинных диалогов и умеет работать с изображениями — это важно, когда анализирую скриншоты из рекламных кабинетов.
Ограничения архитектуры GPT, которые я замечаю в работе: модель уверенно галлюцинирует цифры и даты, если её не остановить конкретным запросом. Я обычно прошу модель указывать источник для любого числа — это снижает галлюцинации раза в три. Knowledge cutoff тоже критичен: GPT не знает событий после своей даты обучения, что важно при работе с актуальными новостями или свежими алгоритмическими обновлениями.