Друзья, я неожиданно для себя провёл интересный эксперимент. Есть qpdf. Стоит задача извлечь страницы в заданном диапазоне. Интернет - не используем. Есть qpdf.exe –help=all>qpdf_hlp.txt (сори за офтопик на десктопе, не я такой, жизнь такая). Без этого файла корректный ответ получить невозможно но с ним только одна из моделей, что у меня есть ответила верно, при условии расширения контекстного окна, это была gpt-oss-20B.
Корректная строка выглядит так:
qpdf input.pdf –pages . 93-95 – output.pdf
Поскольку сценариев манипуляций великое множество, требуется два раза упоминать входной файл, что не совесем очевидно для меня. Ну help=all занимает около 50 кб.
Что касается моих скромных способнострей, я бы недотумкал или очень долго бы разбирался.
То есть она смогла прочитать справку и правильно её интерпретировать. Кто не справились:
Qwen3-14B-Q4_K_M
google_gemma-3-12b-it-Q5_K_M
google_gemma-3-4b-it-Q4_K_M
Меня волнует вопрос, какая модель может самостоятельно работать в агентном режиме, принимать решения вместо меня. Я сделал ряд тестов, школьные задачки, редактура письма, написать код на разных языках (не без помощи старших LLM код но остальные задачи - моя проектная практика, тригонометрия, деловая переписка, работа с нормативным или юридическим документом). В принципе размерность и качество этих моделей, кроме gemma-3-4b, были сопоставимы но на этом тесте в резкий отрыв ушла gpt-oss













