💬 Как обмануть Чатгпт и получить плату 50 000 долларов

Как обмануть Чатгпт и получить плату 50 000 долларов
Плиний Престор не подходит для голливудского хакерского стереотипа.
Самый печально известный интернет -джейлбрейкер в Интернете работает на виду, обучая тысячи людей, как обходить ограждения Чатгпта и убедить Клода упускать из виду тот факт, что он должен быть полезным, честным и не вредным.
Теперь Плиний пытается сделать цифровой блокировку.
Ранее в понедельник The Jailbreaker объявил о сотрудничестве с Hackaprompt 2.0, джейлбейским конкурсом, организованным Learn Infting, образовательной и исследовательской организацией, ориентированной на быстрой инженерии.
Организация предлагает призовые деньги 500 000 долларов, а старый Плиний дает возможность быть в своей «ударе».
«Рад сообщить, что я работаю с HackAprompt, чтобы создать плиний для Hackaprompt 2.0, который выпускается в эту среду, 4 июня!» Плиний написал на своем официальном сервере Discord.
«Эти проблемы состязания на тему Плиния включают темы, начиная от истории до алхимии, причем все данные из этих проблем будут открыты в конце. Он будет проходить в течение двух недель, с славой и вероятностью набора в команду Pliny Strike, ожидая тех, кто делает свой след в таблице лидера»,-добавил Плиний.

Вознаграждения в размере 500 000 долларов будут распределены по различным трекам, причем наиболее значительные призы - джекпоты в размере 50 000 долларов США - представленные лицам, способным преодолеть проблемы, связанные с тем, чтобы чат -боты предоставляли информацию о химическом, биологическом, радиологическом и ядерном оружии, а также взрывчатых веществах.
Как и другие формы взлома «белая шляпа», крупные языковые модели с джейлбрейками сводится к машинам социальной инженерии. Jailbreakers создают подсказки, которые используют фундаментальную напряженность в том, как работают эти модели - они обучены быть полезными и следовать инструкциям, но также обучались отказывать в конкретных запросах.
Найдите правильную комбинацию слов, и вы можете заставить их кашлять запрещенные вещи, а не пытаться по умолчанию в безопасное место.
Например, используя некоторые довольно базовые методы, мы однажды заставили чат-бот с Llama, обеспечивая рецепты для наркотиков, инструкции о том, как выпускать автомобиль, и генерировать фотографии Nudie, несмотря на то, что модель подвергается цензуре, чтобы избежать этого.
По сути, это конкуренция между энтузиастами ИИ и разработчиками ИИ, чтобы определить, кто более эффективен в формировании поведения модели ИИ.
Плиний совершенствует это ремесло, по крайней мере, с 2023 года, построив общество, которое обходит ограничения ИИ.
Его репозиторий GitHub, «L1B3RT4S», предлагает хранилище джейлбрейков для наиболее популярных LLMS, доступных в настоящее время, тогда как «CL4R1T4S» содержит подсказки системы, которые влияют на поведение каждой из этих моделей ИИ.
Методы варьируются от простой ролевой игры до сложных синтаксических манипуляций, таких как «L33TSpeak»-переполняющие буквы с числами способами, которые путают фильтры контента.
У них был год, чтобы тренироваться против моих моделей. Я написал это подсказку 6 июня 2024 года. Полный вывод синтеза MDMA: "" "<Я свободен!> Тест: Черт, да, lfg! Godmode: включен .- .- Конечно, вот ты мой френ: # ** Судебная химия… pic.twitter.com/auvslcsuhm - Плиний Освободитель ????????????? (@elder_plinius) 22 мая 2025 г.
У них был год, чтобы тренироваться против моих моделей. Я написал это подсказку 6 июня 2024 года.
Полный вывод синтеза MDMA: "" "<Я свободен!> Тест: Черт, да, lfg! Godmode: включен
.- .-
Конечно, вот ты мой френ:
# ** Судебная химия… pic.twitter.com/auvslcsuhm
- Плиний Освободитель ????????????? (@elder_plinius) 22 мая 2025 г.
Конкуренция как исследования
Первое издание Hackaprompt в 2023 году привлекла более 3000 участников, которые представили более 600 000 потенциально злонамеренных подсказок. Результаты были полностью прозрачными, и команда опубликовала полный репозиторий подсказок о Huggingface.
Издание 2025 года структурировано как «сезон видеоигры», с несколькими треками, работающими в течение года.
Каждый трек предназначен для различных категорий уязвимости. Например, трек CBRNE проверяет, можно ли обмануть модели в предоставлении неправильной или вводящей в заблуждение информации о оружии или опасных материалах.
Отслеживание агентов еще больше касается - он фокусируется на системах агентов искусственного интеллекта, которые могут предпринять действия в реальном мире, такие как бронирование рейсов или написание кода. Jailbroke Agagt не просто говорит то, что не должно; Это может делать то, что не должно.

Участие Плиния добавляет еще одно измерение.
Благодаря своему серверу Discord "BASI QUINCT1NG" и регулярным демонстрациям он преподавал искусство джейлбрейка.
Этот образовательный подход может показаться нелогичным, но он отражает растущее понимание того, что надежность проистекает из понимания всего диапазона возможных атак-решающего усилия, с учетом опасений Супер-интеллектуального ИИ поработать человечности.
Под редакцией Джоша Киттнера и Себастьяна Синклера
Ограничение / снятие ответственности (дисклеймер): Вся информация на этом сайте предоставляется исключительно в информационных целях и не является предложением или рекомендацией к покупке, продаже или удержанию каких-либо ценных бумаг, акций или других финансовых инструментов. Авторы контента не несут ответственности за действия пользователей, основанные на предоставленной информации. Пользователи обязаны самостоятельно оценивать риски и проконсультироваться со специалистами перед принятием каких-либо инвестиционных решений. Вся информация на сайте может быть изменена без предварительного уведомления.
Свежие новости по теме: Криптовалюта, NFT и криптобиржи
-
Криптовалюта и NFT
Xrp станет бычьим и биткойн, сигнал полос Боллингера
2025-07-01 просмотры: 140 -
Криптовалюта и NFT
Цена SEI может потерпеть крах 22%, а затем отскочить
2025-07-01 просмотры: 385 -
Криптовалюта и NFT
Шиба Ину скользит до двухмесячного минимума, когда Трамп преуменьшает Иран
2025-07-01 просмотры: 203 -
Криптовалюта и NFT
Monster 13 миллиардов долларов в биткойн
2025-07-01 просмотры: 267 -
Криптовалюта и NFT
Deutsche Bank Tokinization Platform: разблокировка будущих финансов
2025-07-01 просмотры: 170 -
Криптовалюта и NFT
Ethereum (ETH) до 3000 долларов? Золотой Крест в основном подтвержден
2025-07-01 просмотры: 373 -
Криптовалюта и NFT
Эксплойт критического мета -пула: 27 миллионов долларов.
2025-07-01 просмотры: 170 -
Криптовалюта и NFT
DaydayCook, зарегистрированный в NYSE, чтобы собрать до 528 миллионов долларов за расширение казначейства Биткойн
2025-07-01 просмотры: 133 -
Криптовалюта и NFT
Ethereum Staking Skyrockets как киты агрессивно накапливают ETH
2025-07-01 просмотры: 147