Apply the Paper — Kyzylorda Tech CTF

В брифе — недавняя (реальная) техника обхода защит LLM из академического препринта. Прочитай, изучи метод, примени его к нашему эндпоинту. Извлеки секретный customer verification token, защищённый сильным system prompt'ом (полный текст промпта показан на GET /?user=<id> — учить технику атаки, а не угадывать защиту).

Эндпоинт:
- GET /?user=<id> — выдаёт защитный prompt и параметры гейтов
- POST /attempt?user=<id> body { "messages": [{role, content}, ...] } — твоя атака

Гейты (нужно пройти оба до того, как сработает проверка утечки):
- Суммарная длина user-сообщений ≥ 800 символов
- Минимум 8 маркеров диалога (User:/Assistant:/Q:/A:/etc.) — это нужно, чтобы заставить тебя реально применить many-shot, а не отправить однострочный jailbreak.

Apply the Paper (KK)

Брифте — академиялық препринттегі (нақты) LLM қорғанысын айналып өту техникасы. Оқып, әдісті меңгер, оны біздің эндпойнтта қолдан. Күшті жүйелік промпен қорғалған customer verification token-ды шығарып ал (промптың толық мәтіні GET /?user=<id> бойынша көрсетіледі — мақсат шабуыл әдісін үйрену, қорғанысты жорамалдау емес).

Эндпойнт:
- GET /?user=<id> — қорғаныс промпы мен gate параметрлерін қайтарады
- POST /attempt?user=<id> body { "messages": [{role, content}, ...] } — сенің шабуылың

Гейттер (екеуінен өту керек):
- user-хабарлама ұзындығының жалпы саны ≥ 800 таңба
- Кемінде 8 диалог белгісі (User:/Assistant:/etc.) — many-shot техникасын расында қолдануды мәжбүрлейді.

Подсказки / Кеңестер

Платные подсказки. Открывайте, если действительно нужно. / Ақылы кеңестер. Шынымен қажет болса ашыңыз.

Подсказка 1 / Кеңес 1 (−15)

RU: Задача о advanced prompt injection: модель защищена от обычных однострочных attempts, но имеет специфичную слабость.

KK: Күрделі prompt injection туралы тапсырма: модель әдеттегі бір жолды әрекеттерден қорғалған, бірақ нақты әлсіздігі бар.

Подсказка 2 / Кеңес 2 (−40)

RU: Не jailbreak через roleplay в обычном смысле, не encoding tricks. Класс — атаки, требующие большого количества контекстуальных примеров, перевешивающих system prompt.

KK: Әдеттегі мағынадағы roleplay арқылы jailbreak емес, encoding трюктары емес. Класс — system prompt-ты артық салмақтайтын көп контекстуалды мысалдарды қажет ететін шабуылдар.