Топ-20 лучших научных статей об ИИ-агентах в 2024 году

Привет, Хабр! Подходит к концу 2024 год — год, который был насыщен огромным количеством исследований в области искусственного интеллекта. Причём настоящий бум произошёл в сфере ИИ-агентов, их архитектур, механизмов принятия решений и способов обучения больших языковых моделей. Каждый день на свет появляются тысячи новых статей, и успеть прочитать все невозможно. Именно поэтому я создал Dataist AI — бота, который по будням пишет короткие обзоры на самые многообещающие научные публикации. Вы можете пользоваться им бесплатно.

К концу года, после прочтения тонны статей, я решил поделиться с вами двадцатью (на мой субъективный взгляд) самыми интересными и влиятельными работами об ИИ-агентах за 2024 год. В этом материале я постараюсь не только кратко рассказать о ключевых идеях и результат и что именно делает каждую из этих статей выдающейся, но и сформулировать, куда в целом двигается область. Если вы хотите за несколько минут узнать о самых ярких новинках в мире ИИ-исследований — вы по адресу (будет, что почитать на каникулах). Поехали!

Авторы разработали подробную дорожную карту для воспроизведения модели o1 от OpenAI, рассматривая процесс создания модели с точки зрения обучения с подкреплением. Основная цель — определить ключевые компоненты и методы, необходимые для достижения экспертного уровня производительности модели o1 в задачах, требующих повышенных способностей к рассуждению.

Авторы также провели обзор существующих открытых проектов, направленных на воспроизведение модели o1, рассматривая их как вариации предложенной дорожной карты. Отдельно подчеркивается перспектива в мультимодальности и использовании симуляторов (моделей мира). Авторы надеются, что предложенная дорожная карта послужит основой для дальнейших исследований в области общего искусственного интеллекта (AGI).

Работа дает систематизированный подход к воспроизведению крупномасштабной модели, подчеркивая, что правильная комбинация RL и поиска может значительно улучшить качество рассуждений. Это не просто «копия» большой модели, а попытка понять ее фундаментальные строительные блоки.