Куда деваются ядра в видеокартах NVIDIA: полная таблица распределения CUDA-ядер по моделям

Вы когда-нибудь задумывались, почему NVIDIA RTX 4090 с архитектурой Ada Lovelace имеет на 20% меньше CUDA-ядер, чем RTX 3090 на Ampere, но при этом демонстрирует на 50-80% большую производительность в играх и рендеринге? Или почему бюджетная GTX 1650 с 896 ядрами иногда обгоняет RTX 2060 с 1920 ядрами в старых играх? Ответ кроется не только в количестве ядер, но и в их архитектуре, тактовой частоте и эффективности распределения.

В этой статье мы детально разберём:

  • 🔍 Как NVIDIA распределяет ядра между моделями в рамках одной архитектуры (и почему это не всегда логично)
  • 📊 Сравнительную таблицу CUDA-ядер, тензорных и RT-ядер по всем актуальным сериям (от Pascal до Ada)
  • 💡 Почему количество ядер — не главный показатель производительности (спойлер: важнее FP32 TFLOPS и L2-кэш)
  • ⚠️ Типичные заблуждения при выборе видеокарты по числу ядер (и как не попасться на маркетинговые уловки)

Если вы планируете апгрейд или просто хотите разобраться в "начинке" современных GPU — эта статья поможет отделить зёрна от плевел. Начнём с главного: CUDA-ядра в NVIDIA не "исчезают" — они трансформируются в более эффективные блоки, а их количество оптимизируется под конкретные задачи.

📊 Какая архитектура NVIDIA у вашей видеокарты?
Pascal (GTX 10xx)
Turing (RTX 20xx)
Ampere (RTX 30xx)
Ada Lovelace (RTX 40xx)
Не знаю/Другая

1. Что такое CUDA-ядра и почему их количество обманчиво

CUDA-ядра (или вычислительные ядра) — это основные исполнительные блоки в графических процессорах NVIDIA, отвечающие за параллельные вычисления. Каждое ядро может обрабатывать один поток данных, но их производительность зависит от:

  • 🔄 Архитектуры: ядро Ada выполняет те же операции в 2-3 раза быстрее, чем ядро Pascal при той же частоте
  • Тактовой частоты: RTX 4090 работает на 2.52 ГГц против 1.7 ГГц у GTX 1080 Ti, что компенсирует меньшее число ядер
  • 🧠 Оптимизации драйверов: NVIDIA активно улучшает поддержку старых архитектур (например, Turing получил прирост в 15% за счёт драйверов 2023 года)

Ключевая ошибка новичков — сравнивать видеокарты только по числу CUDA-ядер. Например, RTX 3060 Ti (4864 ядра) обгоняет RTX 2080 Ti (4352 ядра) на 30-40% в лучевой трассировке благодаря:

  • 🔥 RT-ядрам 2-го поколенияAmpere они в 2 раза быстрее, чем в Turing)
  • 🤖 Тензорным ядрам 3-го поколения (ускорение DLSS и ИИ-задач)
  • 🚀 Удвоенному L2-кэшу (с 4 МБ в Turing до 8 МБ в Ampere)

Поэтому вопрос "куда деваются ядра?" некорректен — их не становится меньше в прямом смысле. NVIDIA перераспределяет вычислительные ресурсы, добавляя специализированные блоки (RT, Tensor) и увеличивая эффективность каждого ядра.

2. Таблица распределения ядер в видеокартах NVIDIA (2016–2026)

Ниже представлена сравнительная таблица CUDA-, RT- и тензорных ядер для всех актуальных архитектур. Данные основаны на официальных спецификациях NVIDIA, но учитывайте, что реальная производительность зависит от конкретной модели (например, RTX 3080 Ti и RTX 3080 имеют разное число ядер при одной архитектуре).

Архитектура Модель (пример) CUDA-ядра RT-ядра Тензорные ядра FP32 TFLOPS Техпроцесс (нм)
Pascal GTX 1080 Ti 3584 11.3 16
Turing RTX 2080 Ti 4352 68 (1-го поколения) 544 (2-го поколения) 13.4 12
Ampere RTX 3090 10496 82 (2-го поколения) 328 (3-го поколения) 35.6 8
Ada Lovelace RTX 4090 16384 128 (3-го поколения) 512 (4-го поколения) 82.6 4
Ada Lovelace RTX 4060 Ti 4352 34 (3-го поколения) 136 (4-го поколения) 22.1 4

Обратите внимание на две ключевые тенденции:

  1. Сокращение CUDA-ядер в младших моделях: RTX 4060 Ti имеет столько же CUDA-ядер, сколько RTX 2080 Ti 2018 года, но за счёт новой архитектуры и высоких частот показывает лучшие результаты в современных играх.
  2. Рост специализированных ядер: в Ada Lovelace доля RT- и тензорных ядер увеличилась на 40% по сравнению с Ampere, что критично для DLSS 3 и трассировки лучей.

3. Почему в RTX 4090 меньше ядер, чем в RTX 3090 (но она мощнее)

Это самый частый вопрос среди геймеров. Давайте разберёмся на примере двух флагманов:

Параметр RTX 3090 (Ampere) RTX 4090 (Ada Lovelace) Прирост
CUDA-ядра 10496 16384 +56%
Базовая частота (МГц) 1400 2230 +60%
FP32 TFLOPS 35.6 82.6 +132%
L2-кэш (МБ) 6 72 ×12

Как видно из таблицы, RTX 4090 не только не потеряла ядра, но и получила их на 56% больше. Однако ключевые улучшения кроются в:

  • 🔥 Удвоенной частоте: 2.5 ГГц против 1.7 ГГц у RTX 3090 в бусте
  • 🧠 Новой организации SM-блоков: в Ada каждый Streaming Multiprocessor содержит 128 CUDA-ядер (против 64 в Ampere), что улучшает параллелизм
  • 🚀 Архитектуре Ada: поддержка FP8 (8-битные операции с плавающей запятой) ускоряет ИИ-задачи в 2 раза

Но почему тогда в интернете пишут, что ядер стало "меньше"? Здесь путают два понятия:

  1. Физическое число CUDA-ядерRTX 4090 их больше).
  2. Эффективное число "полноценных" ядер — из-за специализации части блоков под RT и Tensor, некоторые задачи выполняются быстрее при меньшем числе "универсальных" CUDA-ядер.
Миф о "удаленных ядрах" в RTX 4060

Часть пользователей считает, что NVIDIA искусственно отключила ядра в RTX 4060 (3072 ядра вместо 4608 в полной версии AD106). На самом деле это стандартная практика "биннинга" — отбор кристаллов с дефектами для бюджетных моделей. Такой подход используется с 2000-х годов (например, GTX 1060 имела отключённые блоки по сравнению с GP104).

4. Как NVIDIA "прячет" ядра: биннинг, отключённые блоки и маркетинг

Если вы когда-нибудь слышали о "скрытых ядрах" или "разблокировке" видеокарт — речь идёт о биннинге (англ. binning). Это процесс сортировки чипов по качеству после производства. Например:

  • 🔧 Полноценный кристалл: используется в флагманах (например, AD102 для RTX 4090)
  • 🔄 Чип с дефектами: часть блоков отключается программно, и он идёт в младшие модели (например, AD103 для RTX 4080)
  • ♻️ Брак: утилизируется или продаётся как "инженерные образцы"

Такой подход позволяет NVIDIA:

  • 💰 Экономить на производстве (выход годных чипов grows с 30% до 70%)
  • 📊 Сегментировать рынок (например, RTX 4070 Ti и RTX 4080 используют один чип AD103, но с разным числом активных блоков)
  • 🔄 Быстро реагировать на спрос (при нехватке флагманов можно "понизить" часть чипов до среднего сегмента)

Маркетинговая уловка заключается в том, что NVIDIA никогда не афиширует максимально возможное число ядер для конкретного чипа. Например:

  • GA102 (архитектура Ampere) может иметь до 10752 CUDA-ядер, но в RTX 3090 их только 10496.
  • AD104 (Ada) теоретически поддерживает 7680 ядер, но в RTX 4070 Ti их 7680, а в RTX 4070 — 5888.

Откройте GPU-Z|Сравните показатель "CUDA Cores" с официальными спецификациями|Проверьте разгонный потенциал (чипы с отключёнными блоками часто имеют меньший оверклокинг)|Используйте тест стабильности (например, FurMark) для выявления скрытых дефектов-->

Можно ли разблокировать отключённые ядра? Теоретически — да, но:

⚠️ Внимание: Разблокировка ядер через модификацию BIOS или "пайку" резисторов на плате приводит к потере гарантии и риску повреждения GPU. В 90% случаев такие ядра отключены из-за физических дефектов кристалла, и их активация вызовет артефакты или перегрев.

5. Как количество ядер влияет на производительность в играх и рендеринге

Давайте разберёмся, на что именно влияет число CUDA-ядер в разных сценариях:

Задача Зависимость от CUDA-ядер Что важнее?
Игры (DirectX 11/12) Средняя Тактовая частота, VRAM, ширина шины
Лучевая трассировка (RT) Низкая RT-ядра 2-го/3-го поколения, BVH-ускорение
Рендеринг (Blender, Octane) Высокая FP32/FP64 производительность, объём VRAM
ИИ и машинное обучение Низкая Тензорные ядра 4-го поколения, поддержка FP8
Майнинг криптовалют Очень высокая Энергоэффективность, Memory Bus

Примеры из реальных тестов:

  • 🎮 В Cyberpunk 2077 с включённым RT RTX 4070 Ti (7680 ядер) обгоняет RTX 3090 Ti (10752 ядра) на 20-25% благодаря RT-ядрам 3-го поколения.
  • 🖥️ В Blender (рендеринг OptiX) RTX 4090 показывает в 2.3 раза лучший результат, чем RTX 3090, несмотря на "всего" +56% CUDA-ядер.
  • ⛏️ В майнинге Ethereum (до перехода на PoS) RTX 3060 Ti (4864 ядра) обгоняла RTX 2080 Ti (4352 ядра) на 30% из-за оптимизированной памяти GDDR6X.

Вывод: CUDA-ядра важны, но не самодостаточны. Для геймеров критичнее:

  • 🔥 RT-ядра (если играете с трассировкой)
  • 🧠 Тензорные ядра (для DLSS 3 и FSR)
  • Тактовая частота (особенно в Full HD)

6. Как выбрать видеокарту по ядрам: практические советы

Если вы стоите перед выбором видеокарты, вот алгоритм, который поможет не ошибиться:

  1. Определите основную задачу:
    • 🎮 Игры без RT: смотрите на FP32 TFLOPS и частоту
    • 🌌 Игры с RT: приоритет — RT-ядра 3-го поколения (Ada)
    • 🎨 Рендеринг/3D: важны CUDA-ядра + объём VRAM (минимум 12 ГБ)
    • 🤖 ИИ/машинное обучение: тензорные ядра 4-го поколения (Ada или Hopper)
  • Сравнивайте архитектуры, а не только модели:
    • 🔹 Ada Lovelace (>2022) — лучший выбор для RT и ИИ
    • 🔹 Ampere (2020–2022) — оптимальны по цене для рендеринга
    • 🔹 Turing (2018–2020) — только для бюджетных сборок
  • Проверяйте реальные тесты:
    • 📊 Смотрите бенчмарки в 3DMark, Unigine Heaven
    • 🎥 Ищите обзоры с включённым DLSS/FSR (они покажут реальную игровую производительность)
  • Типичные ошибки при выборе:

    • ❌ Покупка RTX 3060 для рендеринга из-за "много ядер" (12 ГБ VRAM быстро станут бутылочным горлышком)
    • ❌ Выбор RTX 2080 Ti в 2026 году для игр с RT (RT-ядра 1-го поколения в 4 раза медленнее, чем в Ada)
    • ❌ Игнорирование TGP (теплового пакета) в ноутбуках: RTX 4070 Mobile может иметь на 30% меньше ядер, чем десктопная версия
    ⚠️ Внимание: В ноутбуках NVIDIA часто использует урезанные версии чипов (например, GA107 вместо GA106 для RTX 3060 Mobile). Всегда уточняйте точную конфигурацию через GPU-Z или спецификации производителя ноутбука.

    7. Будущее ядер в видеокартах NVIDIA: что ожидать от Blackwell (2026–2026)

    Согласно утечкам и патентам NVIDIA, следующая архитектура Blackwell (ожидается в конце 2026 года) принесёт кардинальные изменения в распределении ядер:

    • 🔮 Гибридные ядра: CUDA-ядра будут разделены на "большие" (для сложных вычислений) и "малые" (для простых операций), как в процессорах ARM big.LITTLE.
    • 🤖 Унифицированные тензорные ядра: поддержка FP4 (4-битные операции) для ускорения ИИ в 8 раз.
    • 🌌 RT-ядра 4-го поколения: аппаратная поддержка SVGF (альтернатива DLSS от NVIDIA).

    Ожидаемые характеристики флагмана RTX 5090:

    • CUDA-ядра: ~20000 (но с разделением на типы)
    • RT-ядра: 192 (4-го поколения)
    • Тензорные ядра: 640 (с поддержкой FP4/FP8)
    • Техпроцесс: 3 нм (TSMC)

    Это означает, что:

    • 🔹 Число "традиционных" CUDA-ядер может сократиться за счёт специализированных блоков.
    • 🔹 Производительность на ватт вырастет в 2-3 раза (цель NVIDIA — 100 TFLOPS при TGP 300 Вт).
    • 🔹 DLSS 4.0 будет работать на аппаратном уровне, без потерь в качестве.
    ⚠️ Внимание: Информация о Blackwell основана на слухах и может измениться. Официальные спецификации стоит проверять на сайте NVIDIA после анонса.

    FAQ: Частые вопросы о ядрах в видеокартах NVIDIA

    ❓ Почему в GTX 1650 больше ядер, чем в RTX 2060, но она слабее?

    GTX 1650 (896 ядра) использует архитектуру Turing, но без RT- и тензорных ядер. RTX 2060 (1920 ядер) имеет те же CUDA-ядра + специализированные блоки для трассировки и ИИ, что даёт прирост в современных играх. Кроме того, RTX 2060 работает на более высоких частотах и имеет шире шину памяти (192 бит против 128 бит у GTX 1650).

    ❓ Можно ли включить отключённые ядра в своей видеокарте?

    Технически возможно через модификацию BIOS (например, для RTX 3060 12GB, где часть ядер отключена для соответствия RTX 3060 Ti). Однако:

    • ⚠️ Это нарушает гарантию
    • ⚠️ Отключённые ядра часто имеют дефекты (риск артефактов)
    • ⚠️ Требует глубоких знаний в модинге GPU (ошибка может убить видеокарту)

    Практически все "разблокированные" видеокарты на рынке — это либо подделки, либо чипы с нестабильной работой.

    ❓ Сколько ядер должно быть в видеокарте для Full HD gaming в 2026?

    Для комфортного гейминга в 1920×1080 с настройками Ultra достаточно:

    • 🎮 Без RT: 2000–3000 CUDA-ядер (RTX 3060 или RTX 4060)
    • 🌌 С RT: 4000–5000 CUDA-ядер + RT-ядра 2-го/3-го поколения (RTX 4070)

    Для 1440p и 4K требования вырастают в 1.5–2 раза. Также учитывайте, что современные игры (например, Alan Wake 2) требуют не менее 12 ГБ VRAM для Ultra-настроек с RT.

    ❓ Почему в ноутбуках видеокарты имеют меньше ядер, чем десктопные версии?

    Это связано с:

    1. Ограничением TGP (теплового пакета). Например, RTX 4070 Mobile имеет TGP 80–100 Вт против 200 Вт у десктопной версии, поэтому часть ядер отключена.
    2. Охлаждением: в ноутбуках сложно обеспечить стабильное охлаждение для полноценного чипа.
    3. Маркетингом: NVIDIA разделяет десктопные и мобильные линейки, чтобы избежать каннибализации продаж.

    Чтобы узнать точную конфигурацию, ищите в названии суффиксы:

    • Max-Q — сильно урезанная версия (низкое энергопотребление)
    • Без суффикса — "полноценная" мобильная версия (но всё равно слабее десктопной)

    ❓ Какая архитектура NVIDIA самая выгодная по соотношению ядер/цена?

    На начало 2026 года:

    • 💰 Бюджетный сегмент: RTX 3060 Ti (Ampere) — 4864 ядра за ~$250 (б/у). Лучшее соотношение для рендеринга.
    • 🎮 Средний сегмент: RTX 4070 (Ada) — 5888 ядра + DLSS 3 за ~$550. Оптимально для 1440p с RT.
    • 🚀 Флагманы: RTX 4080 Super (Ada) — 10240 ядер за ~$1000. Лучший выбор для 4K и продуктивности.

    Для майнинга (если он ещё актуален) выгоднее RTX 30xx из-за лучшей энергоэффективности на ядро.