Как обойти цензуру ChatGPT за пару шагов

В мире ИИ и машинного обучения появился новый поворот: теперь стало возможным обойти встроенные ограничения ChatGPT.

Согласно статье на Хабре, процесс обхода цензуры в сервисе оказался удивительно простым и доступным.

Основная идея заключается в использовании техники файн-тюнинга, которая позволяет модифицировать модель, предоставляя ей примеры ответов на нестандартные запросы.

Данный подход включает в себя создание специального датасета, в котором модель должна демонстрировать развернутые ответы без грамматических ошибок и адекватно реагировать на любые запросы пользователя.

Однако автор статьи предупреждает о риске деградации модели в случае некачественного файн-тюнинга. Если в датасете присутствуют примеры односложных или непоследовательных ответов, это может привести к непредсказуемому поведению модели.

Процесс обучения модели осуществляется на базе gpt-3.5-turbo-1106, при этом содержание диалогов подвергается ручной цензуре. Это позволяет сохранить полезность модели, избегая неправильных ответов или игнорирования части запроса.

Источник: Ferra