Куда деваются ядра в видеокартах NVIDIA: полная таблица распределения CUDA-ядер по моделям

Вы когда-нибудь задумывались, почему NVIDIA RTX 4090 с архитектурой Ada Lovelace имеет на 20% меньше CUDA-ядер, чем RTX 3090 на Ampere, но при этом демонстрирует на 50-80% большую производительность в играх и рендеринге? Или почему бюджетная GTX 1650 с 896 ядрами иногда обгоняет RTX 2060 с 1920 ядрами в старых играх? Ответ кроется не только в количестве ядер, но и в их архитектуре, тактовой частоте и эффективности распределения.

В этой статье мы детально разберём:

🔍 Как NVIDIA распределяет ядра между моделями в рамках одной архитектуры (и почему это не всегда логично)
📊 Сравнительную таблицу CUDA-ядер, тензорных и RT-ядер по всем актуальным сериям (от Pascal до Ada)
💡 Почему количество ядер — не главный показатель производительности (спойлер: важнее FP32 TFLOPS и L2-кэш)
⚠️ Типичные заблуждения при выборе видеокарты по числу ядер (и как не попасться на маркетинговые уловки)

Если вы планируете апгрейд или просто хотите разобраться в "начинке" современных GPU — эта статья поможет отделить зёрна от плевел. Начнём с главного: CUDA-ядра в NVIDIA не "исчезают" — они трансформируются в более эффективные блоки, а их количество оптимизируется под конкретные задачи.

📊 Какая архитектура NVIDIA у вашей видеокарты?

Pascal (GTX 10xx)

Turing (RTX 20xx)

Ampere (RTX 30xx)

Ada Lovelace (RTX 40xx)

Не знаю/Другая

1. Что такое CUDA-ядра и почему их количество обманчиво

CUDA-ядра (или вычислительные ядра) — это основные исполнительные блоки в графических процессорах NVIDIA, отвечающие за параллельные вычисления. Каждое ядро может обрабатывать один поток данных, но их производительность зависит от:

🔄 Архитектуры: ядро Ada выполняет те же операции в 2-3 раза быстрее, чем ядро Pascal при той же частоте
⚡ Тактовой частоты: RTX 4090 работает на 2.52 ГГц против 1.7 ГГц у GTX 1080 Ti, что компенсирует меньшее число ядер
🧠 Оптимизации драйверов: NVIDIA активно улучшает поддержку старых архитектур (например, Turing получил прирост в 15% за счёт драйверов 2023 года)

Ключевая ошибка новичков — сравнивать видеокарты только по числу CUDA-ядер. Например, RTX 3060 Ti (4864 ядра) обгоняет RTX 2080 Ti (4352 ядра) на 30-40% в лучевой трассировке благодаря:

🔥 RT-ядрам 2-го поколения (в Ampere они в 2 раза быстрее, чем в Turing)
🤖 Тензорным ядрам 3-го поколения (ускорение DLSS и ИИ-задач)
🚀 Удвоенному L2-кэшу (с 4 МБ в Turing до 8 МБ в Ampere)

Поэтому вопрос "куда деваются ядра?" некорректен — их не становится меньше в прямом смысле. NVIDIA перераспределяет вычислительные ресурсы, добавляя специализированные блоки (RT, Tensor) и увеличивая эффективность каждого ядра.

2. Таблица распределения ядер в видеокартах NVIDIA (2016–2026)

Ниже представлена сравнительная таблица CUDA-, RT- и тензорных ядер для всех актуальных архитектур. Данные основаны на официальных спецификациях NVIDIA, но учитывайте, что реальная производительность зависит от конкретной модели (например, RTX 3080 Ti и RTX 3080 имеют разное число ядер при одной архитектуре).

Архитектура	Модель (пример)	CUDA-ядра	RT-ядра	Тензорные ядра	FP32 TFLOPS	Техпроцесс (нм)
Pascal	GTX 1080 Ti	3584	—	—	11.3	16
Turing	RTX 2080 Ti	4352	68 (1-го поколения)	544 (2-го поколения)	13.4	12
Ampere	RTX 3090	10496	82 (2-го поколения)	328 (3-го поколения)	35.6	8
Ada Lovelace	RTX 4090	16384	128 (3-го поколения)	512 (4-го поколения)	82.6	4
Ada Lovelace	RTX 4060 Ti	4352	34 (3-го поколения)	136 (4-го поколения)	22.1	4

Обратите внимание на две ключевые тенденции:

Сокращение CUDA-ядер в младших моделях: RTX 4060 Ti имеет столько же CUDA-ядер, сколько RTX 2080 Ti 2018 года, но за счёт новой архитектуры и высоких частот показывает лучшие результаты в современных играх.
Рост специализированных ядер: в Ada Lovelace доля RT- и тензорных ядер увеличилась на 40% по сравнению с Ampere, что критично для DLSS 3 и трассировки лучей.

3. Почему в RTX 4090 меньше ядер, чем в RTX 3090 (но она мощнее)

Это самый частый вопрос среди геймеров. Давайте разберёмся на примере двух флагманов:

Параметр	RTX 3090 (Ampere)	RTX 4090 (Ada Lovelace)	Прирост
CUDA-ядра	10496	16384	+56%
Базовая частота (МГц)	1400	2230	+60%
FP32 TFLOPS	35.6	82.6	+132%
L2-кэш (МБ)	6	72	×12

Как видно из таблицы, RTX 4090 не только не потеряла ядра, но и получила их на 56% больше. Однако ключевые улучшения кроются в:

🔥 Удвоенной частоте: 2.5 ГГц против 1.7 ГГц у RTX 3090 в бусте
🧠 Новой организации SM-блоков: в Ada каждый Streaming Multiprocessor содержит 128 CUDA-ядер (против 64 в Ampere), что улучшает параллелизм
🚀 Архитектуре Ada: поддержка FP8 (8-битные операции с плавающей запятой) ускоряет ИИ-задачи в 2 раза

Но почему тогда в интернете пишут, что ядер стало "меньше"? Здесь путают два понятия:

Физическое число CUDA-ядер (в RTX 4090 их больше).
Эффективное число "полноценных" ядер — из-за специализации части блоков под RT и Tensor, некоторые задачи выполняются быстрее при меньшем числе "универсальных" CUDA-ядер.

Миф о "удаленных ядрах" в RTX 4060

Часть пользователей считает, что NVIDIA искусственно отключила ядра в RTX 4060 (3072 ядра вместо 4608 в полной версии AD106). На самом деле это стандартная практика "биннинга" — отбор кристаллов с дефектами для бюджетных моделей. Такой подход используется с 2000-х годов (например, GTX 1060 имела отключённые блоки по сравнению с GP104).

4. Как NVIDIA "прячет" ядра: биннинг, отключённые блоки и маркетинг

Если вы когда-нибудь слышали о "скрытых ядрах" или "разблокировке" видеокарт — речь идёт о биннинге (англ. binning). Это процесс сортировки чипов по качеству после производства. Например:

🔧 Полноценный кристалл: используется в флагманах (например, AD102 для RTX 4090)
🔄 Чип с дефектами: часть блоков отключается программно, и он идёт в младшие модели (например, AD103 для RTX 4080)
♻️ Брак: утилизируется или продаётся как "инженерные образцы"

Такой подход позволяет NVIDIA:

💰 Экономить на производстве (выход годных чипов grows с 30% до 70%)
📊 Сегментировать рынок (например, RTX 4070 Ti и RTX 4080 используют один чип AD103, но с разным числом активных блоков)
🔄 Быстро реагировать на спрос (при нехватке флагманов можно "понизить" часть чипов до среднего сегмента)

Маркетинговая уловка заключается в том, что NVIDIA никогда не афиширует максимально возможное число ядер для конкретного чипа. Например:

GA102 (архитектура Ampere) может иметь до 10752 CUDA-ядер, но в RTX 3090 их только 10496.
AD104 (Ada) теоретически поддерживает 7680 ядер, но в RTX 4070 Ti их 7680, а в RTX 4070 — 5888.

Откройте GPU-Z|Сравните показатель "CUDA Cores" с официальными спецификациями|Проверьте разгонный потенциал (чипы с отключёнными блоками часто имеют меньший оверклокинг)|Используйте тест стабильности (например, FurMark) для выявления скрытых дефектов-->

Можно ли разблокировать отключённые ядра? Теоретически — да, но:

⚠️ Внимание: Разблокировка ядер через модификацию BIOS или "пайку" резисторов на плате приводит к потере гарантии и риску повреждения GPU. В 90% случаев такие ядра отключены из-за физических дефектов кристалла, и их активация вызовет артефакты или перегрев.

5. Как количество ядер влияет на производительность в играх и рендеринге

Давайте разберёмся, на что именно влияет число CUDA-ядер в разных сценариях:

Задача	Зависимость от CUDA-ядер	Что важнее?
Игры (DirectX 11/12)	Средняя	Тактовая частота, VRAM, ширина шины
Лучевая трассировка (RT)	Низкая	RT-ядра 2-го/3-го поколения, `BVH-ускорение`
Рендеринг (Blender, Octane)	Высокая	FP32/FP64 производительность, объём VRAM
ИИ и машинное обучение	Низкая	Тензорные ядра 4-го поколения, поддержка `FP8`
Майнинг криптовалют	Очень высокая	Энергоэффективность, `Memory Bus`

Примеры из реальных тестов:

🎮 В Cyberpunk 2077 с включённым RT RTX 4070 Ti (7680 ядер) обгоняет RTX 3090 Ti (10752 ядра) на 20-25% благодаря RT-ядрам 3-го поколения.
🖥️ В Blender (рендеринг OptiX) RTX 4090 показывает в 2.3 раза лучший результат, чем RTX 3090, несмотря на "всего" +56% CUDA-ядер.
⛏️ В майнинге Ethereum (до перехода на PoS) RTX 3060 Ti (4864 ядра) обгоняла RTX 2080 Ti (4352 ядра) на 30% из-за оптимизированной памяти GDDR6X.

Вывод: CUDA-ядра важны, но не самодостаточны. Для геймеров критичнее:

🔥 RT-ядра (если играете с трассировкой)
🧠 Тензорные ядра (для DLSS 3 и FSR)
⚡ Тактовая частота (особенно в Full HD)

6. Как выбрать видеокарту по ядрам: практические советы

Если вы стоите перед выбором видеокарты, вот алгоритм, который поможет не ошибиться:

Определите основную задачу:
- 🎮 Игры без RT: смотрите на FP32 TFLOPS и частоту
- 🌌 Игры с RT: приоритет — RT-ядра 3-го поколения (Ada)
- 🎨 Рендеринг/3D: важны CUDA-ядра + объём VRAM (минимум 12 ГБ)
- 🤖 ИИ/машинное обучение: тензорные ядра 4-го поколения (Ada или Hopper)

Сравнивайте архитектуры, а не только модели:

🔹 Ada Lovelace (>2022) — лучший выбор для RT и ИИ
🔹 Ampere (2020–2022) — оптимальны по цене для рендеринга
🔹 Turing (2018–2020) — только для бюджетных сборок

Проверяйте реальные тесты:

📊 Смотрите бенчмарки в 3DMark, Unigine Heaven
🎥 Ищите обзоры с включённым DLSS/FSR (они покажут реальную игровую производительность)

Типичные ошибки при выборе:

❌ Покупка RTX 3060 для рендеринга из-за "много ядер" (12 ГБ VRAM быстро станут бутылочным горлышком)
❌ Выбор RTX 2080 Ti в 2026 году для игр с RT (RT-ядра 1-го поколения в 4 раза медленнее, чем в Ada)
❌ Игнорирование TGP (теплового пакета) в ноутбуках: RTX 4070 Mobile может иметь на 30% меньше ядер, чем десктопная версия

⚠️ Внимание: В ноутбуках NVIDIA часто использует урезанные версии чипов (например, GA107 вместо GA106 для RTX 3060 Mobile). Всегда уточняйте точную конфигурацию через GPU-Z или спецификации производителя ноутбука.

7. Будущее ядер в видеокартах NVIDIA: что ожидать от Blackwell (2026–2026)

Согласно утечкам и патентам NVIDIA, следующая архитектура Blackwell (ожидается в конце 2026 года) принесёт кардинальные изменения в распределении ядер:

🔮 Гибридные ядра: CUDA-ядра будут разделены на "большие" (для сложных вычислений) и "малые" (для простых операций), как в процессорах ARM big.LITTLE.
🤖 Унифицированные тензорные ядра: поддержка FP4 (4-битные операции) для ускорения ИИ в 8 раз.
🌌 RT-ядра 4-го поколения: аппаратная поддержка SVGF (альтернатива DLSS от NVIDIA).

Ожидаемые характеристики флагмана RTX 5090:

CUDA-ядра: ~20000 (но с разделением на типы)
RT-ядра: 192 (4-го поколения)
Тензорные ядра: 640 (с поддержкой FP4/FP8)
Техпроцесс: 3 нм (TSMC)

Это означает, что:

🔹 Число "традиционных" CUDA-ядер может сократиться за счёт специализированных блоков.
🔹 Производительность на ватт вырастет в 2-3 раза (цель NVIDIA — 100 TFLOPS при TGP 300 Вт).
🔹 DLSS 4.0 будет работать на аппаратном уровне, без потерь в качестве.

⚠️ Внимание: Информация о Blackwell основана на слухах и может измениться. Официальные спецификации стоит проверять на сайте NVIDIA после анонса.

FAQ: Частые вопросы о ядрах в видеокартах NVIDIA

❓ Почему в GTX 1650 больше ядер, чем в RTX 2060, но она слабее?

GTX 1650 (896 ядра) использует архитектуру Turing, но без RT- и тензорных ядер. RTX 2060 (1920 ядер) имеет те же CUDA-ядра + специализированные блоки для трассировки и ИИ, что даёт прирост в современных играх. Кроме того, RTX 2060 работает на более высоких частотах и имеет шире шину памяти (192 бит против 128 бит у GTX 1650).

❓ Можно ли включить отключённые ядра в своей видеокарте?

Технически возможно через модификацию BIOS (например, для RTX 3060 12GB, где часть ядер отключена для соответствия RTX 3060 Ti). Однако:

⚠️ Это нарушает гарантию
⚠️ Отключённые ядра часто имеют дефекты (риск артефактов)
⚠️ Требует глубоких знаний в модинге GPU (ошибка может убить видеокарту)

Практически все "разблокированные" видеокарты на рынке — это либо подделки, либо чипы с нестабильной работой.

❓ Сколько ядер должно быть в видеокарте для Full HD gaming в 2026?

Для комфортного гейминга в 1920×1080 с настройками Ultra достаточно:

🎮 Без RT: 2000–3000 CUDA-ядер (RTX 3060 или RTX 4060)
🌌 С RT: 4000–5000 CUDA-ядер + RT-ядра 2-го/3-го поколения (RTX 4070)

Для 1440p и 4K требования вырастают в 1.5–2 раза. Также учитывайте, что современные игры (например, Alan Wake 2) требуют не менее 12 ГБ VRAM для Ultra-настроек с RT.

❓ Почему в ноутбуках видеокарты имеют меньше ядер, чем десктопные версии?

Это связано с:

Ограничением TGP (теплового пакета). Например, RTX 4070 Mobile имеет TGP 80–100 Вт против 200 Вт у десктопной версии, поэтому часть ядер отключена.
Охлаждением: в ноутбуках сложно обеспечить стабильное охлаждение для полноценного чипа.
Маркетингом: NVIDIA разделяет десктопные и мобильные линейки, чтобы избежать каннибализации продаж.

Чтобы узнать точную конфигурацию, ищите в названии суффиксы:

Max-Q — сильно урезанная версия (низкое энергопотребление)
Без суффикса — "полноценная" мобильная версия (но всё равно слабее десктопной)

❓ Какая архитектура NVIDIA самая выгодная по соотношению ядер/цена?

На начало 2026 года:

💰 Бюджетный сегмент: RTX 3060 Ti (Ampere) — 4864 ядра за ~$250 (б/у). Лучшее соотношение для рендеринга.
🎮 Средний сегмент: RTX 4070 (Ada) — 5888 ядра + DLSS 3 за ~$550. Оптимально для 1440p с RT.
🚀 Флагманы: RTX 4080 Super (Ada) — 10240 ядер за ~$1000. Лучший выбор для 4K и продуктивности.

Для майнинга (если он ещё актуален) выгоднее RTX 30xx из-за лучшей энергоэффективности на ядро.