DeepSeek анонсує модель ШІ, що зменшує витрати на API удвічі

Китайська компанія DeepSeek випустила нову експериментальну модель V3.2-exp. Вона створена для оптимізації роботи з довгим контекстом та зниження вартості обчислень. За словами розробників, під час тестування модель продемонструвала здатність зменшувати витрати на виклики API майже на 50%.

Як функціонує модель V3.2-exp

Знизити витрати на виклики вдалося завдяки механізму DeepSeek Sparse Attention (“розсіяної уваги”).  Його архітектура поєднує два компоненти: “індексатор блискавки”, що відбирає важливі уривки тексту, та “систему детального вибору токенів”, яка визначає, які саме елементи варто обробляти у вузькому вікні уваги. Завдяки цьому модель може працювати з великими обсягами інформації, не перевантажуючи сервери.

Розробники підкреслюють, що результати поки попередні. Відкрите розміщення моделі на Hugging Face дозволить незалежним дослідникам перевірити ефективність підходу та підтвердити заявлене зниження витрат.

Проблема вартості логічного висновку (inference) сьогодні є однією з найгостріших у сфері штучного інтелекту. Якщо навчання моделей потребує колосальних ресурсів, то їхня подальша експлуатація для масових користувачів теж виявляється надто дорогою. DeepSeek прагне вирішити цю задачу на рівні самої архітектури трансформаторів, роблячи їх більш ощадними.

Читайте далі

Як штучний інтелект трансформує український бізнес у 2026 році

У 2026 році штучний інтелект остаточно перейшов зі статусу...

Тенденції розвитку українського IT-аутсорсингу на тлі глобальних змін ринку

Українська індустрія IT-аутсорсингу продовжує адаптуватися до трансформацій світового технологічного...

У чіпах Apple знайшли вразливість, яка небезпечна для старих iPhone

У процесорах Apple для iPhone виявили вразливість, яка зачіпає низку старіших пристроїв і може бути використана для обходу систем захисту.

OpenAI запускає програму для виправлення вразливостей у відкритому коді

Компанія OpenAI запускає програму, яка допоможе розробникам відкритого ПЗ швидше знаходити та виправляти помилки безпеки.

Imec показала нові рішення для пам’яті ШІ

Бельгійський дослідницький центр Imec представив дві нові розробки у сфері пам’яті для комп’ютерів та систем штучного інтелекту.