Команда дослідників з MIT представила революційну модель навчання для роботів, яка застосовує методологію великих мовних моделей (LLM), подібну до підходу GPT-4. Замість використання спеціалізованих наборів даних, нова система забезпечує роботів можливістю працювати з великим масивом різноманітної інформації.
Про це повідомляє TechCrunch.
Науковці підкреслюють, що традиційне навчання через імітацію людських дій не є достатньо гнучким для ситуацій із непередбачуваними умовами на кшталт зміни освітлення чи появи нових об’єктів. Тому це може обмежувати роботів у практичних завданнях.
Гетерогенний попередньо навчений трансформер: єдина система для збирання даних
Щоб подолати обмеження звичайних методів, MIT розробив архітектуру під назвою “гетерогенний попередньо навчений трансформер” (HPT). Цей підхід дозволяє збирати та об’єднувати різнорідні дані з численних сенсорів і середовищ у єдину навчальну систему. Провідний автор дослідження Ліруї Ван зазначив, що на відміну від текстових даних у мовних моделях, в робототехніці потрібна особлива структура для обробки неоднорідної інформації. Трансформер дозволяє збільшити обсяг навчальних даних, що позитивно впливає на ефективність та адаптивність роботів.
Універсальний “мозок” для роботів: крок до автономної робототехніки
Система HPT дозволяє вводити в роботів параметри їхнього дизайну, конфігурацію та завдання, які вони повинні виконати. Асистент професора CMU Девід Хелд прокоментував потенціал дослідження. Він зазначив, що метою є створення універсального “роботизованого мозку”, який можна буде застосовувати без додаткового навчання. Це дослідження підтримується Toyota Research Institute (TRI), який, співпрацюючи з Boston Dynamics, планує інтегрувати новітні досягнення для впровадження універсальних роботизованих рішень.
