Компанія OpenAI запускає новий режим API під назвою Flex, який дозволяє користувачам працювати з моделями ШІ за вдвічі нижчими тарифами. Однак з деякими обмеженнями у пріоритетності обробки запитів.
Що таке Flex
Режим Flex, який наразі доступний у бета-версії для моделей o3 та o4-mini, орієнтований на завдання, які не вимагають миттєвої реакції. Йдеться про асинхронні процеси, тестування, пошук даних та інші непродуктивні робочі навантаження.
Ціни приємно здивували розробників. Для моделі o3 – $5 за мільйон вхідних токенів та $20 за мільйон вихідних, у той час як стандартна ціна вдвічі вища. Для більш компактної o4-mini вартість знижується до $0,55 та $2,20 відповідно. Але в обмін на це користувач повинен змиритися з потенційними затримками та тимчасовою недоступністю обчислювальних ресурсів.
Поява Flex – це відповідь OpenAI на жорстку конкуренцію. Наприклад, Google нещодавно презентував свою модель Gemini 2.5 Flash, яка демонструє високу продуктивність і нижчі тарифи на обробку, фактично кидаючи виклик навіть найпотужнішим пропозиціям на ринку.
У світлі цього OpenAI прагне надати розробникам гнучкіші інструменти, особливо тим, хто не має критичних вимог до швидкості.
