DeepSeek оприлюднила дані про вартість навчання своєї моделі ШІ

Китайська компанія DeepSeek оприлюднила дані про вартість навчання своєї моделі штучного інтелекту R1. Корпорація заявила, що цей процес обійшовся їй у 294 000 доларів. Порівняно з американськими гігантами, які оцінюють витрати на створення базових моделей у сотні мільйонів, результат виглядає сенсаційним.

Оновлену інформацію компанія опублікувала у статті в науковому журналі Nature, де серед співавторів зазначений засновник DeepSeek Лян Веньфен. За його словами, модель R1, зосереджена на завданнях із логічним міркуванням, навчалася протягом 80 годин на кластері зі 512 графічних процесорів Nvidia H800.

Виклик американським витратам

Для порівняння, генеральний директор OpenAI Сем Альтман ще у 2023 році наголошував, що навчання базових моделей обходиться у більше ніж 100 мільйонів доларів. Витрати на подібні розробки традиційно складаються з тривалих запусків кластерів передових чіпів, здатних обробляти величезні обсяги текстів та коду.

Заява DeepSeek одразу викликала хвилю скепсису серед американських компаній та посадовців. Особливу увагу привернули твердження про використані ресурси, адже США ще у 2022 році заборонили постачання до Китаю найпотужніших графічних процесорів Nvidia H100 та A100. Для китайського ринку Nvidia розробила спрощені H800, і саме вони, за офіційними даними, використовувалися DeepSeek.

Читайте далі

Як штучний інтелект трансформує український бізнес у 2026 році

У 2026 році штучний інтелект остаточно перейшов зі статусу...

Тенденції розвитку українського IT-аутсорсингу на тлі глобальних змін ринку

Українська індустрія IT-аутсорсингу продовжує адаптуватися до трансформацій світового технологічного...

У чіпах Apple знайшли вразливість, яка небезпечна для старих iPhone

У процесорах Apple для iPhone виявили вразливість, яка зачіпає низку старіших пристроїв і може бути використана для обходу систем захисту.

OpenAI запускає програму для виправлення вразливостей у відкритому коді

Компанія OpenAI запускає програму, яка допоможе розробникам відкритого ПЗ швидше знаходити та виправляти помилки безпеки.

Imec показала нові рішення для пам’яті ШІ

Бельгійський дослідницький центр Imec представив дві нові розробки у сфері пам’яті для комп’ютерів та систем штучного інтелекту.