Использую Ollama для запуска Qwen3 на 30B параметров. Почему-то на Linux скорость генерации токенов в десятки раз ниже, чем на Windows. Почему так? Почему на Windows ответ генерируется моментально, а на Linux черепашьими темпами?
Использую Debain 13 KDE. По началу грешил на драйвера, но на Manjaro KDE, где с драйверами точно порядок, проблема сохраняется. Процессор у меня Intel Core Ultra 7 255H, оперативной памяти 32 Гб. Я даже попробовал полностью отключить swap в системе, чтобы туда ни бита не попадало и расчеты не торомозились… но нет, даже не это помогло.
Как на Debain 13 получить скорость генерации токенов не хуже, чем на Windows? В чем проблема??? Чисто логически нейронки на Linux должны летать, ведь весь софт для работы с ними изначально на Linux и разрабатывался, но почему-то ситуация ровно обратная. Выходит Windows во всем лучше Linux?
P. S. Вот здесь выложил видео тест: https://disk.yandex.ru/d/amYiz4cf22o9ow
Можете наглядно увидеть разницу в скорости генерации токенов на Windows и Linux на одном и том же ноутбуке (Honor MagicBook 14 Art 2025).
P. S. S. Проблема решена: ollama на Debain не задействует GPU, а считает только на CPU и из-за этого все медленно. Официальных драйверов для встройки Inel для Debian 13 не существует, есть только под Ubuntu.









