Вы когда-нибудь задумывались, почему NVIDIA RTX 4090 с архитектурой Ada Lovelace имеет на 20% меньше CUDA-ядер, чем RTX 3090 на Ampere, но при этом демонстрирует на 50-80% большую производительность в играх и рендеринге? Или почему бюджетная GTX 1650 с 896 ядрами иногда обгоняет RTX 2060 с 1920 ядрами в старых играх? Ответ кроется не только в количестве ядер, но и в их архитектуре, тактовой частоте и эффективности распределения.
В этой статье мы детально разберём:
- 🔍 Как NVIDIA распределяет ядра между моделями в рамках одной архитектуры (и почему это не всегда логично)
- 📊 Сравнительную таблицу CUDA-ядер, тензорных и RT-ядер по всем актуальным сериям (от Pascal до Ada)
- 💡 Почему количество ядер — не главный показатель производительности (спойлер: важнее
FP32 TFLOPSиL2-кэш) - ⚠️ Типичные заблуждения при выборе видеокарты по числу ядер (и как не попасться на маркетинговые уловки)
Если вы планируете апгрейд или просто хотите разобраться в "начинке" современных GPU — эта статья поможет отделить зёрна от плевел. Начнём с главного: CUDA-ядра в NVIDIA не "исчезают" — они трансформируются в более эффективные блоки, а их количество оптимизируется под конкретные задачи.
1. Что такое CUDA-ядра и почему их количество обманчиво
CUDA-ядра (или вычислительные ядра) — это основные исполнительные блоки в графических процессорах NVIDIA, отвечающие за параллельные вычисления. Каждое ядро может обрабатывать один поток данных, но их производительность зависит от:
- 🔄 Архитектуры: ядро Ada выполняет те же операции в 2-3 раза быстрее, чем ядро Pascal при той же частоте
- ⚡ Тактовой частоты: RTX 4090 работает на 2.52 ГГц против 1.7 ГГц у GTX 1080 Ti, что компенсирует меньшее число ядер
- 🧠 Оптимизации драйверов: NVIDIA активно улучшает поддержку старых архитектур (например, Turing получил прирост в 15% за счёт драйверов 2023 года)
Ключевая ошибка новичков — сравнивать видеокарты только по числу CUDA-ядер. Например, RTX 3060 Ti (4864 ядра) обгоняет RTX 2080 Ti (4352 ядра) на 30-40% в лучевой трассировке благодаря:
- 🔥 RT-ядрам 2-го поколения (в Ampere они в 2 раза быстрее, чем в Turing)
- 🤖 Тензорным ядрам 3-го поколения (ускорение DLSS и ИИ-задач)
- 🚀 Удвоенному L2-кэшу (с 4 МБ в Turing до 8 МБ в Ampere)
Поэтому вопрос "куда деваются ядра?" некорректен — их не становится меньше в прямом смысле. NVIDIA перераспределяет вычислительные ресурсы, добавляя специализированные блоки (RT, Tensor) и увеличивая эффективность каждого ядра.
2. Таблица распределения ядер в видеокартах NVIDIA (2016–2026)
Ниже представлена сравнительная таблица CUDA-, RT- и тензорных ядер для всех актуальных архитектур. Данные основаны на официальных спецификациях NVIDIA, но учитывайте, что реальная производительность зависит от конкретной модели (например, RTX 3080 Ti и RTX 3080 имеют разное число ядер при одной архитектуре).
| Архитектура | Модель (пример) | CUDA-ядра | RT-ядра | Тензорные ядра | FP32 TFLOPS | Техпроцесс (нм) |
|---|---|---|---|---|---|---|
| Pascal | GTX 1080 Ti | 3584 | — | — | 11.3 | 16 |
| Turing | RTX 2080 Ti | 4352 | 68 (1-го поколения) | 544 (2-го поколения) | 13.4 | 12 |
| Ampere | RTX 3090 | 10496 | 82 (2-го поколения) | 328 (3-го поколения) | 35.6 | 8 |
| Ada Lovelace | RTX 4090 | 16384 | 128 (3-го поколения) | 512 (4-го поколения) | 82.6 | 4 |
| Ada Lovelace | RTX 4060 Ti | 4352 | 34 (3-го поколения) | 136 (4-го поколения) | 22.1 | 4 |
Обратите внимание на две ключевые тенденции:
- Сокращение CUDA-ядер в младших моделях: RTX 4060 Ti имеет столько же CUDA-ядер, сколько RTX 2080 Ti 2018 года, но за счёт новой архитектуры и высоких частот показывает лучшие результаты в современных играх.
- Рост специализированных ядер: в Ada Lovelace доля RT- и тензорных ядер увеличилась на 40% по сравнению с Ampere, что критично для DLSS 3 и трассировки лучей.
3. Почему в RTX 4090 меньше ядер, чем в RTX 3090 (но она мощнее)
Это самый частый вопрос среди геймеров. Давайте разберёмся на примере двух флагманов:
| Параметр | RTX 3090 (Ampere) | RTX 4090 (Ada Lovelace) | Прирост |
|---|---|---|---|
| CUDA-ядра | 10496 | 16384 | +56% |
| Базовая частота (МГц) | 1400 | 2230 | +60% |
| FP32 TFLOPS | 35.6 | 82.6 | +132% |
| L2-кэш (МБ) | 6 | 72 | ×12 |
Как видно из таблицы, RTX 4090 не только не потеряла ядра, но и получила их на 56% больше. Однако ключевые улучшения кроются в:
- 🔥 Удвоенной частоте: 2.5 ГГц против 1.7 ГГц у RTX 3090 в бусте
- 🧠 Новой организации SM-блоков: в Ada каждый Streaming Multiprocessor содержит 128 CUDA-ядер (против 64 в Ampere), что улучшает параллелизм
- 🚀 Архитектуре Ada: поддержка
FP8(8-битные операции с плавающей запятой) ускоряет ИИ-задачи в 2 раза
Но почему тогда в интернете пишут, что ядер стало "меньше"? Здесь путают два понятия:
- Физическое число CUDA-ядер (в RTX 4090 их больше).
- Эффективное число "полноценных" ядер — из-за специализации части блоков под RT и Tensor, некоторые задачи выполняются быстрее при меньшем числе "универсальных" CUDA-ядер.
Миф о "удаленных ядрах" в RTX 4060
Часть пользователей считает, что NVIDIA искусственно отключила ядра в RTX 4060 (3072 ядра вместо 4608 в полной версии AD106). На самом деле это стандартная практика "биннинга" — отбор кристаллов с дефектами для бюджетных моделей. Такой подход используется с 2000-х годов (например, GTX 1060 имела отключённые блоки по сравнению с GP104).
4. Как NVIDIA "прячет" ядра: биннинг, отключённые блоки и маркетинг
Если вы когда-нибудь слышали о "скрытых ядрах" или "разблокировке" видеокарт — речь идёт о биннинге (англ. binning). Это процесс сортировки чипов по качеству после производства. Например:
- 🔧 Полноценный кристалл: используется в флагманах (например, AD102 для RTX 4090)
- 🔄 Чип с дефектами: часть блоков отключается программно, и он идёт в младшие модели (например, AD103 для RTX 4080)
- ♻️ Брак: утилизируется или продаётся как "инженерные образцы"
Такой подход позволяет NVIDIA:
- 💰 Экономить на производстве (выход годных чипов grows с 30% до 70%)
- 📊 Сегментировать рынок (например, RTX 4070 Ti и RTX 4080 используют один чип AD103, но с разным числом активных блоков)
- 🔄 Быстро реагировать на спрос (при нехватке флагманов можно "понизить" часть чипов до среднего сегмента)
Маркетинговая уловка заключается в том, что NVIDIA никогда не афиширует максимально возможное число ядер для конкретного чипа. Например:
- GA102 (архитектура Ampere) может иметь до 10752 CUDA-ядер, но в RTX 3090 их только 10496.
- AD104 (Ada) теоретически поддерживает 7680 ядер, но в RTX 4070 Ti их 7680, а в RTX 4070 — 5888.
Откройте GPU-Z|Сравните показатель "CUDA Cores" с официальными спецификациями|Проверьте разгонный потенциал (чипы с отключёнными блоками часто имеют меньший оверклокинг)|Используйте тест стабильности (например, FurMark) для выявления скрытых дефектов-->
Можно ли разблокировать отключённые ядра? Теоретически — да, но:
⚠️ Внимание: Разблокировка ядер через модификацию BIOS или "пайку" резисторов на плате приводит к потере гарантии и риску повреждения GPU. В 90% случаев такие ядра отключены из-за физических дефектов кристалла, и их активация вызовет артефакты или перегрев.
5. Как количество ядер влияет на производительность в играх и рендеринге
Давайте разберёмся, на что именно влияет число CUDA-ядер в разных сценариях:
| Задача | Зависимость от CUDA-ядер | Что важнее? |
|---|---|---|
| Игры (DirectX 11/12) | Средняя | Тактовая частота, VRAM, ширина шины |
| Лучевая трассировка (RT) | Низкая | RT-ядра 2-го/3-го поколения, BVH-ускорение |
| Рендеринг (Blender, Octane) | Высокая | FP32/FP64 производительность, объём VRAM |
| ИИ и машинное обучение | Низкая | Тензорные ядра 4-го поколения, поддержка FP8 |
| Майнинг криптовалют | Очень высокая | Энергоэффективность, Memory Bus |
Примеры из реальных тестов:
- 🎮 В Cyberpunk 2077 с включённым RT RTX 4070 Ti (7680 ядер) обгоняет RTX 3090 Ti (10752 ядра) на 20-25% благодаря RT-ядрам 3-го поколения.
- 🖥️ В Blender (рендеринг
OptiX) RTX 4090 показывает в 2.3 раза лучший результат, чем RTX 3090, несмотря на "всего" +56% CUDA-ядер. - ⛏️ В майнинге Ethereum (до перехода на PoS) RTX 3060 Ti (4864 ядра) обгоняла RTX 2080 Ti (4352 ядра) на 30% из-за оптимизированной памяти
GDDR6X.
Вывод: CUDA-ядра важны, но не самодостаточны. Для геймеров критичнее:
- 🔥 RT-ядра (если играете с трассировкой)
- 🧠 Тензорные ядра (для DLSS 3 и FSR)
- ⚡ Тактовая частота (особенно в Full HD)
6. Как выбрать видеокарту по ядрам: практические советы
Если вы стоите перед выбором видеокарты, вот алгоритм, который поможет не ошибиться:
- Определите основную задачу:
- 🎮 Игры без RT: смотрите на
FP32 TFLOPSи частоту - 🌌 Игры с RT: приоритет — RT-ядра 3-го поколения (Ada)
- 🎨 Рендеринг/3D: важны CUDA-ядра + объём VRAM (минимум 12 ГБ)
- 🤖 ИИ/машинное обучение: тензорные ядра 4-го поколения (Ada или Hopper)
- 🎮 Игры без RT: смотрите на
- 🔹 Ada Lovelace (>2022) — лучший выбор для RT и ИИ
- 🔹 Ampere (2020–2022) — оптимальны по цене для рендеринга
- 🔹 Turing (2018–2020) — только для бюджетных сборок
- 📊 Смотрите бенчмарки в 3DMark, Unigine Heaven
- 🎥 Ищите обзоры с включённым DLSS/FSR (они покажут реальную игровую производительность)
Типичные ошибки при выборе:
- ❌ Покупка RTX 3060 для рендеринга из-за "много ядер" (12 ГБ VRAM быстро станут бутылочным горлышком)
- ❌ Выбор RTX 2080 Ti в 2026 году для игр с RT (RT-ядра 1-го поколения в 4 раза медленнее, чем в Ada)
- ❌ Игнорирование
TGP(теплового пакета) в ноутбуках: RTX 4070 Mobile может иметь на 30% меньше ядер, чем десктопная версия
⚠️ Внимание: В ноутбуках NVIDIA часто использует урезанные версии чипов (например, GA107 вместо GA106 для RTX 3060 Mobile). Всегда уточняйте точную конфигурацию через GPU-Z или спецификации производителя ноутбука.
7. Будущее ядер в видеокартах NVIDIA: что ожидать от Blackwell (2026–2026)
Согласно утечкам и патентам NVIDIA, следующая архитектура Blackwell (ожидается в конце 2026 года) принесёт кардинальные изменения в распределении ядер:
- 🔮 Гибридные ядра: CUDA-ядра будут разделены на "большие" (для сложных вычислений) и "малые" (для простых операций), как в процессорах ARM big.LITTLE.
- 🤖 Унифицированные тензорные ядра: поддержка
FP4(4-битные операции) для ускорения ИИ в 8 раз. - 🌌 RT-ядра 4-го поколения: аппаратная поддержка
SVGF(альтернатива DLSS от NVIDIA).
Ожидаемые характеристики флагмана RTX 5090:
- CUDA-ядра: ~20000 (но с разделением на типы)
- RT-ядра: 192 (4-го поколения)
- Тензорные ядра: 640 (с поддержкой
FP4/FP8) - Техпроцесс: 3 нм (TSMC)
Это означает, что:
- 🔹 Число "традиционных" CUDA-ядер может сократиться за счёт специализированных блоков.
- 🔹 Производительность на ватт вырастет в 2-3 раза (цель NVIDIA — 100 TFLOPS при TGP 300 Вт).
- 🔹 DLSS 4.0 будет работать на аппаратном уровне, без потерь в качестве.
⚠️ Внимание: Информация о Blackwell основана на слухах и может измениться. Официальные спецификации стоит проверять на сайте NVIDIA после анонса.
FAQ: Частые вопросы о ядрах в видеокартах NVIDIA
❓ Почему в GTX 1650 больше ядер, чем в RTX 2060, но она слабее?
GTX 1650 (896 ядра) использует архитектуру Turing, но без RT- и тензорных ядер. RTX 2060 (1920 ядер) имеет те же CUDA-ядра + специализированные блоки для трассировки и ИИ, что даёт прирост в современных играх. Кроме того, RTX 2060 работает на более высоких частотах и имеет шире шину памяти (192 бит против 128 бит у GTX 1650).
❓ Можно ли включить отключённые ядра в своей видеокарте?
Технически возможно через модификацию BIOS (например, для RTX 3060 12GB, где часть ядер отключена для соответствия RTX 3060 Ti). Однако:
- ⚠️ Это нарушает гарантию
- ⚠️ Отключённые ядра часто имеют дефекты (риск артефактов)
- ⚠️ Требует глубоких знаний в модинге GPU (ошибка может убить видеокарту)
Практически все "разблокированные" видеокарты на рынке — это либо подделки, либо чипы с нестабильной работой.
❓ Сколько ядер должно быть в видеокарте для Full HD gaming в 2026?
Для комфортного гейминга в 1920×1080 с настройками Ultra достаточно:
- 🎮 Без RT: 2000–3000 CUDA-ядер (RTX 3060 или RTX 4060)
- 🌌 С RT: 4000–5000 CUDA-ядер + RT-ядра 2-го/3-го поколения (RTX 4070)
Для 1440p и 4K требования вырастают в 1.5–2 раза. Также учитывайте, что современные игры (например, Alan Wake 2) требуют не менее 12 ГБ VRAM для Ultra-настроек с RT.
❓ Почему в ноутбуках видеокарты имеют меньше ядер, чем десктопные версии?
Это связано с:
- Ограничением TGP (теплового пакета). Например, RTX 4070 Mobile имеет TGP 80–100 Вт против 200 Вт у десктопной версии, поэтому часть ядер отключена.
- Охлаждением: в ноутбуках сложно обеспечить стабильное охлаждение для полноценного чипа.
- Маркетингом: NVIDIA разделяет десктопные и мобильные линейки, чтобы избежать каннибализации продаж.
Чтобы узнать точную конфигурацию, ищите в названии суффиксы:
Max-Q— сильно урезанная версия (низкое энергопотребление)- Без суффикса — "полноценная" мобильная версия (но всё равно слабее десктопной)
❓ Какая архитектура NVIDIA самая выгодная по соотношению ядер/цена?
На начало 2026 года:
- 💰 Бюджетный сегмент: RTX 3060 Ti (Ampere) — 4864 ядра за ~$250 (б/у). Лучшее соотношение для рендеринга.
- 🎮 Средний сегмент: RTX 4070 (Ada) — 5888 ядра + DLSS 3 за ~$550. Оптимально для 1440p с RT.
- 🚀 Флагманы: RTX 4080 Super (Ada) — 10240 ядер за ~$1000. Лучший выбор для 4K и продуктивности.
Для майнинга (если он ещё актуален) выгоднее RTX 30xx из-за лучшей энергоэффективности на ядро.