Исследователи создали конкурента ChatGPT и DeepSeek-R1 всего за $50 💡
Группа исследователей из Стэнфорда и Университета Вашингтона разработала модель ИИ, которая стала конкурентоспособной с известными решениями, такими как ChatGPT и DeepSeek-R1. Впечатляюще, что обучение модели s1 стоило менее $50 благодаря использованию облачных вычислений.
Ключевым элементом успеха стало использование метода дистилляции, при котором новая модель обучается на ответах более развитых моделей. Эта техника позволила добиться высоких результатов уже на старте. Доступ к данным и коду для обучения s1 открыт на GitHub, что делает этот проект в высокой степени доступным для широкой аудитории.