Работа графического процессора под нагрузкой неизбежно ведет к выделению тепла. В операционной системе Ubuntu инструменты мониторинга могут быть не такими очевидными, как в Windows, что часто вызывает затруднения у пользователей. Понимание текущего теплового режима критически важно для предотвращения троттлинга, снижения производительности и продления срока службы железа.
Существует несколько проверенных методов получения этих данных, от встроенных консольных утилит до графических приложений. Выбор конкретного инструмента зависит от производителя вашего GPU: NVIDIA, AMD или интегрированных решений Intel. Мы рассмотрим самые надежные и быстрые способы диагностики.
Проверка температур для карт NVIDIA через терминал
Для владельцев дискретных видеокарт NVIDIA самым эффективным инструментом является утилита nvidia-smi. Она поставляется вместе с драйверами и не требует дополнительной установки в большинстве случаев. Этот мощный CLI-инструмент выводит детальную информацию о состоянии устройства в реальном времени.
Чтобы получить базовые данные, достаточно открыть терминал и ввести следующую команду:
nvidia-smi
В результате вы увидите таблицу, где в столбце Temp. будет отображена текущая температура ядра в градусах Цельсия. Также здесь можно увидеть загрузку видеопамяти и уровень оборотов вентиляторов.
Если стандартный вывод кажется слишком объемным, можно отфильтровать информацию, оставив только температуру и загрузку. Для этого используется флаг --query:
nvidia-smi --query-gpu=temperature.gpu,utilization.gpu,memory.used --format=csv
Такой подход позволяет быстро оценить состояние системы без лишней визуальной информации.
⚠️ Внимание: Утилитаnvidia-smiможет не показывать данные, если драйвер не загружен или работает в режиме UEFI без поддержки GSP (GPU System Processor). В таких случаях необходимо проверить загрузку модуля ядра командойlsmod | grep nvidia.
Помимо разовых запросов, можно настроить мониторинг в цикле. Это полезно при стресс-тестах или играх. Команда nvidia-smi -l 1 обновляет данные каждую секунду, создавая эффект мониторинга в реальном времени. Нажатие Ctrl+C остановит процесс и вернет вас в терминал.
Анализ температуры карт AMD и Intel
Для графических ускорителей AMD и Intel ситуация иная, так как единой команды "из коробки" может не хватать для красивого вывода данных. Здесь на помощь приходят универсальные утилиты сбора системной статистики, такие как lm-sensors или специализированные драйверы amdgpu.
Сначала необходимо установить пакет lm-sensors, который сканирует датчики материнской платы и видеокарты. Выполните в терминале:
sudo apt update && sudo apt install lm-sensors
После установки запустите команду sensors-detect и отвечайте "yes" на все вопросы, чтобы система определила доступные чипы.
Для видеокарт AMD с архитектурой GCN и новее встроенный драйвер amdgpu обычно автоматически экспортирует данные. Проверить их можно, посмотрев содержимое системного файла:
cat /sys/class/drm/card0/device/hwmon/hwmon*/temp1_input
Результат будет в миллиградусах, поэтому разделите его на 1000 для получения градусов Цельсия.
В случае с Intel GPU, особенно в ноутбуках, температура часто доступна через утилиту intel_gpu_top из пакета intel-gpu-tools. Она показывает не только температуру, но и загрузку 3D-ядер, видео-кодеков и использование памяти, что делает её незаменимой для глубокой диагностики.
☑️ Подготовка к мониторингу AMD/Intel
Графические утилиты для визуального контроля
Не всем пользователям комфортно работать в черном окне терминала. Для визуального контроля температуры и других параметров существуют удобные графические приложения, которые интегрируются в GNOME или другие рабочие окружения.
Одной из самых популярных утилит является Psensor. Она позволяет строить красивые графики изменения температуры во времени, настраивать звуковые оповещения при перегреве и выводить виджеты на панель. Установка производится через менеджер пакетов:
sudo apt install psensor
После запуска программа автоматически просканирует все доступные датчики.
Другой мощный инструмент — GKrellM или Conky. Conky позволяет выводить информацию прямо на рабочий стол в виде настраиваемого текста или графических элементов. Это требует некоторой настройки конфигурационных файлов, но дает максимальную гибкость и эстетику.
⚠️ Внимание: Графические утилиты, такие как Psensor, могут не видеть датчики видеокарты сразу после установки, если не настроены права доступа или не загружены необходимые ядра модули. Перезагрузка системы часто решает эту проблему.
Выбор между консольными и графическими методами часто зависит от ваших личных предпочтений и сценария использования. Если вы администратор сервера, терминал предпочтительнее. Если вы геймер или дизайнер, работающий в графическом интерфейсе, виджеты на рабочем столе будут удобнее.
Создание скрипта для автоматического мониторинга
Для продвинутых пользователей, желающих автоматизировать процесс сбора данных, можно написать простой Bash-скрипт. Это позволит получать отчеты о температуре в определенное время или включать запись логов при превышении пороговых значений.
Ниже приведен пример скрипта, который выводит температуру карты NVIDIA и время:
#!/bin/bash
echo "Время: $(date)"
nvidia-smi --query-gpu=temperature.gpu --format=csv,noheader
Сохраните этот код в файл, например gpu_monitor.sh, и сделайте его исполняемым командой chmod +x gpu_monitor.sh.
Такие скрипты можно запускать через cron для периодического сбора статистики. Это поможет выявить паттерны перегрева, которые невозможно заметить при разовой проверке. Например, можно настроить запись в файл каждые 5 минут в течение игрового сессии.
Как настроить cron для скрипта?
Откройте редактор crontab командой crontab -e и добавьте строку /5 * /path/to/gpu_monitor.sh >> /var/log/gpu_temp.log для записи логов каждые 5 минут.
Автоматизация особенно полезна на серверах или рабочих станциях, где нет постоянного визуального контроля. Скрипт может не только записывать данные, но и отправлять уведомления на почту или в мессенджер при критических температурах.
Таблица утилит и их характеристики
Для быстрого выбора подходящего инструмента сравним основные утилиты по их функционалу и требованиям. Это поможет сориентироваться в разнообразии доступных решений в репозиториях Ubuntu.
| Утилита | Поддержка GPU | Интерфейс | Сложность настройки |
|---|---|---|---|
| nvidia-smi | NVIDIA | Терминал | Низкая |
| lm-sensors | AMD, Intel, NVIDIA | Терминал | Средняя |
| Psensor | Все (через sensors) | Графический | Низкая |
| intel_gpu_top | Intel | Терминал | Низкая |
| Conky | Все | Рабочий стол | Высокая |
Как видно из таблицы, nvidia-smi является безальтернативным лидером для владельцев карт от NVIDIA благодаря детализации данных. Однако для комплексной системы с гибридной графикой лучше использовать комбинацию lm-sensors и графических оболочек.
Выбор инструмента также зависит от версии ядра Linux. В новых релизах Ubuntu поддержка AMD и Intel значительно улучшилась, и многие утилиты работают "из коробки" без ручной компиляции модулей.
⚠️ Внимание: Убедитесь, что вы используете актуальную версию драйверов. Старые версии драйверов могут некорректно передавать данные о температуре в системные утилиты, показывая значения 0°C или -1°C.
Интерпретация полученных данных и нормы температур
Получив числовое значение, важно понимать, является ли оно нормальным. Для современных видеокарт NVIDIA в режиме простоя температура обычно составляет 30-45°C. Под нагрузкой (игры, рендеринг) допустимым считается диапазон до 83°C, после чего начинается троттлинг.
Карты AMD имеют схожие параметры, но могут допускать кратковременные пики до 85-90°C, особенно модели серии RX 6000 и 7000. Интегрированная графика Intel обычно работает в более щадящем режиме, редко превышая 70°C даже при серьезной нагрузке.
Для ноутбуков критическим порогом часто является 85°C из-за ограниченного воздушного потока, в отличие от десктопных систем, где допустимы более высокие значения. Превышение этих значений требует проверки системы охлаждения, чистки пыли и замены термопасты.
Постоянно высокие температуры, даже в пределах нормы, могут указывать на плохую вентиляцию корпуса. Если вы видите стабильные 75-80°C в простое, стоит обратить внимание на расположение компьютера и работу вентиляторов.
Решение проблем с отсутствием датчиков
Иногда система не показывает температуру, несмотря на наличие исправного оборудования. Это может быть связано с отсутствием драйверов, неправильными правами доступа или устаревшим ядром. Первым шагом всегда должна быть проверка наличия модулей ядра.
Команда lspci -k | grep -A 2 -i vga покажет, какой драйвер используется для вашей видеокарты. Если указано kernel driver in use: nouveau для карты NVIDIA, попробуйте установить проприетарный драйвер через "Драйверы" в меню системы.
Также стоит проверить, активирован ли модуль hwmon в конфигурации ядра. В некоторых сборках Linux он отключен по умолчанию для экономии ресурсов. В таких случаях потребуется пересборка ядра или использование альтернативных методов чтения датчиков.
Что делать, если драйверы не устанавливаются?
Попробуйте отключить Secure Boot в BIOS/UEFI, так как он может блокировать загрузку неподписанных драйверов сторонних производителей.
Если проблема сохраняется, возможно, стоит обратиться к форумам сообщества Ubuntu или документации производителя видеокарты. Иногда требуются специфические флаги запуска ядра для корректного определения сенсоров.
Часто задаваемые вопросы (FAQ)
Почему nvidia-smi не показывает температуру?
Это может означать, что драйвер не загружен или карта работает в режиме энергосбережения без инициализации сенсоров. Попробуйте перезагрузить систему и убедиться, что вы используете проприетарный драйвер, а не открытый Nouveau.
Можно ли видеть температуру только в играх?
Да, утилиты вроде Psensor или GOverlay (с проектом MangoHud) позволяют выводить данные о температуре прямо поверх игрового окна, что удобно для мониторинга без переключения на рабочий стол.
Какая утилита лучше для AMD Radeon в Ubuntu?
Лучшим выбором является комбинация встроенных драйверов amdgpu с утилитой radeontop или графическим интерфейсом CoreCtrl, который предоставляет полный контроль над частотами и вентиляторами.
Как часто нужно проверять температуру видеокарты?
Рекомендуется проверять температуру при первой установке системы, после разгона, при обновлении драйверов и если вы заметили снижение производительности или шум вентиляторов.