Інженер і колишній квантовий дослідник Ніл Сомані перевіряв можливості нової моделі від OpenAI та отримав результат, який здивував досвідчених фахівців. Він передав ChatGPT задачу високого рівня та дав їй 15 хвилин. Повернувшись, побачив повне рішення. Перевірка через інструмент Harmonic підтвердила, що відповідь коректна.
Моделі ШІ стають кращими в математиці
Сомані хотів з’ясувати, де саме проходить межа між тим, що LLM-моделі вже здатні розв’язувати, і тим, що їм не під силу. З виходом моделі GPT 5.2 ця межа посунулась уперед. Модель змішувала аксіоми та теореми, серед яких формула Лежандра, постулат Бертрана й теорема Зірки Давида, а далі знайшла публікацію Noam Elkies на Math Overflow з подібним розв’язанням. Проте фінальний результат ChatGPT виявився іншим і дав повнішу відповідь на задачу, що походить від Пола Ердеша.
Це не поодинокий випадок. Після появи GPT 5.2 спільнота почала помічати, що модель упевнено працює з задачами Ердеша – набором із понад тисячі проблем різної складності. З Різдва на сайті Ердеша 15 задач перейшли зі статусу відкритих до розв’язаних, і в 11 випадках у процесі фігурували моделі ШІ. Раніше перші автономні рішення надала система AlphaEvolve на базі Gemini.
Математик Теренс Тао на своїй GitHub-сторінці рахує вже вісім задач, де ШІ забезпечив суттєвий автономний прогрес. І ще шість, де моделі допомогли розвинути попередні ідеї. Тао вважає, що масштабованість таких систем робить їх ефективними для розв’язання значної частини задач Ердеша.
