· 5 min read

Ключ к диалогу: как эффективно общаться с ChatGPT с помощью промтов

В последнее время нейронные сети, в частности ChatGPT, превратились в многозадачных ИИ-помощников, доступных любому пользователю.

В последнее время нейронные сети, в частности ChatGPT, превратились в многозадачных ИИ-помощников, доступных любому пользователю. Однако для получения точных ответов необходимо предоставлять нейросети как можно больше входных данных, т.е. писать качественные подсказки. Чем подробнее будут подсказки, тем более конкретную информацию будет обрабатывать нейросеть.

LLM (Large Language Models), такие как GPT-3, представляют собой огромный набор данных, и без подробных подсказок нейросети будет сложно понять нюансы вопросов и она может давать неправильные или нерелевантные ответы, т. е. могут начать галлюцинировать.

От умения написать правильные подсказки напрямую зависит, можно ли извлечь пользу из работы нейронной сети. В этой статье расскажем о том, как писать подсказки, чтобы извлекать из ИИ-моделей качественную информацию и не допускать галлюцинаций.

Для начала давайте обсудим ограничения ChatGPT:

• Она обучается на огромной базе данных, которая обновляется до 2021 года, поэтому она не знает, что будет происходить после 2021 года. Чтобы нейронная сеть могла получать данные из Интернета в режиме реального времени, достаточно установить расширение Bing AI на основе ChatGPT в браузер Microsoft Edge.

• ChatGPT обучался на данных с разных языков, но в учебнике гораздо больше английского текста. Для получения более точных ответов лучше вести диалог на английском языке, а затем использовать переводчик для перевода ответов.

• ChatGPT имеет ограничение на количество лексем (слов или символов) для одного запроса или ответа: 4 000 лексем для ChatGPT-3.5 и 8 000 лексем для ChatGPT-4.

• Если в разговоре с ИИ происходит обмен большим количеством знаний, рекомендуется начать новый чат, чтобы не испортить последующие ответы.

• ChatGPT часто бывает загружен большим количеством трафика, поэтому придется подождать ответа. Если ждать не хочется, активируйте премиум-подписку.

Технология искусственных подсказок

AI-подсказки различаются по сложности: от фраз и вопросов до текста, состоящего из нескольких абзацев. Чем меньше усилий вы приложите к созданию подсказок, тем меньше усилий приложит к их созданию ИИ. «Нулевые подсказки» обычно приводят к нежелательным результатам, поскольку ИИ приходится принимать слишком много решений.

Zero shot prompting — искусственный интеллект использует такую подсказку в качестве механизма автозаполнения. В этом случае не следует ожидать четко структурированного ответа.

One shot prompting — предоставьте искусственному интеллекту пример желаемого результата. Одноразовые подсказки используются для генерации текста на естественном языке, когда объем входных данных ограничен, например, один пример или шаблон. Этот тип подсказок полезен, когда требуется конкретный формат ответа.

Few shots prompting — это техника, при которой модель получает небольшое количество примеров (обычно от двух до пяти) для быстрой адаптации к новым примерам ранее виденных объектов.

Промтинг от галлюцинаций

Галлюцинации — одна из самых серьезных проблем генеративных систем ИИ. Этот термин используется для обозначения явления, когда результаты, выдаваемые нейронной сетью, не соответствуют реальности, данным или другим распознаваемым моделям. Как правило, ИИ галлюцинирует, когда ему не хватает информации для ответа на запрос.

Каковы другие причины галлюцинаций ИИ?

Вероятностный характер. Генеративные модели, такие как GPT, основаны на вероятностных методах, которые предсказывают следующий токен (т.е. слово или букву) на основе контекста. Вероятность появления каждого слова оценивается, и следующее слово выбирается на основе этой вероятности.

Такой процесс выборки иногда может приводить к непредсказуемым и маловероятным выводам. Это связано с тем, что модель может выбирать слова или фразы, которые вряд ли встретятся, создавая иллюзию; ChatGPT не обучен говорить «я не знаю» при недостатке информации. Вместо этого он будет давать наиболее вероятный ответ.

Отсутствие достоверной информации. Большинство используемых нами языковых моделей не имеют доступа к Интернету и поэтому не могут сопоставлять факты в своем выводе с проверенными источниками в режиме реального времени. Это затрудняет соответствие информации модели реальности.

Комплексность модели. Современные генеративные модели (например, GPT-3) имеют миллиарды параметров, которые отражают сложные закономерности в данных. Однако такая сложность может привести к перегрузке модели, запоминанию нерелевантных или неправильных закономерностей и созданию иллюзий в генерируемых ответах.

Искусственный интеллект может создавать убедительно реалистичные иллюзии, которые вводят людей в заблуждение и приводят к распространению ложной информации. Основные подходы к устранению систематических иллюзий связаны с разработкой подсказок, таких как распределение ролей между ИИ, обеспечение контекста и ограничений, задание тональности голоса. Однако для сложных задач этих подходов может оказаться недостаточно. В этом случае мы можем использовать более сложные структурные подсказки, например, «дррево мыслей» (Tree of Thoughts).

Рабочий метод: древо мыслей (ToT)

Метод ToT работает следующим образом: исходная проблема разбивается на компоненты, которые обнаруживаются и анализируются самой системой. Другими словами, модель разбивает процесс решения проблемы на ряд более мелких шагов или «идей», чтобы сделать его более управляемым.

Каждый компонент является промежуточным шагом в решении исходной сложной задачи. Такой подход позволяет нейронной сети рассматривать несколько различных путей рассуждений или подходов к решению проблемы.

Например, в промте три эксперта рассуждают о проблеме, обмениваются своими идеями и определяют наилучшее решение. Метод ToT должен быть включен на английском языке. Вопрос: «Как начать строить стартап на базе ИИ?»

Процесс рассуждения модели начинается вроде бы как обычно, но в ходе размышлений модель взвешивает плюсы и минусы каждого утверждения и предоставляет дополнительную информацию, основываясь на своем опыте.

Затем в диалог вступает второй эксперт, который продолжает отвечать на главный вопрос, основываясь на рассуждениях предыдущего эксперта.

Рассуждения продолжаются до тех пор, пока модель не найдет оптимальный вариант в качестве окончательного ответа.

После рассмотрения всех аспектов вопроса и детального обсуждения каждого шага модель формирует общий вывод, который позволяет окончательно обобщить информацию, полученную в процессе рассмотрения. Структура «древа мыслей» призвана решить проблемы языкового моделирования за счет более гибкого и стратегического подхода к принятию решений.

Общайтесь с ИИ, экспериментируйте и изучайте этот бесконечный мир интересного вместе с нами: подписывайтесь на нашу страницу в Instagram и работайте с нашим Telegram-ботом.

    Поделиться
    Назад