Токены — это небольшие части текста, которые модель
ChatGPT использует для обработки данных. Они могут быть словами, частями слов или даже символами. Например, слово "машина" — это один токен, а "машинки" может разбиться на два токена: "машин" и "ки". Токены помогают модели разбивать текст на понятные части для анализа и генерации.
Контекст модели — это вся информация, которую модель "знает" в рамках одного диалога. Он включает ваш запрос, предшествующие сообщения и ответы. Однако длина контекста ограничена (в ChatGPT — несколько тысяч токенов). Если вы выходите за этот предел, старые токены начинают "забываться".
Пример: представьте, что вы ведете диалог на листе бумаги. Каждый токен — это слово, а контекст — объем текста, который вмещается на листе. Как только бумага заполняется, старые записи стираются, чтобы освободить место для новых.