Исследователи из Иллинойсского университета представили новый фреймворк s3 для RAG-систем

Исследователи из Иллинойсского университета в Урбана-Шампейн представили s3 — новый открытый фреймворк, который значительно упрощает создание систем retrieval-augmented generation (RAG). Этот инструмент обещает облегчить разработку приложений на основе больших языковых моделей, снижая затраты и время на создание моделей поиска внутри RAG-структур.

Качество любой RAG-системы зависит от ее компонента поиска. Исследователи выделили три этапа эволюции подходов к RAG. Они отметили, что текущие модели, основанные на RL-Zero, часто оптимизируют поиск, игнорируя полезность для последующих этапов и требуя дорогостоящей донастройки LLM. Это подчеркивает необходимость модульного фреймворка, где поиск и генерация находятся в чистом раздельном состоянии.

s3 решает эту задачу, используя модельно-агностичный подход. В нем выделяется отдельная поисковая LLM, которая взаимодействует с поисковым движком, а затем предоставленная ею информация используется для генерации финального ответа другой, замороженной LLM. Это нововведение значительно увеличивает качество поиска.

Исследования показали, что s3 превосходит традиционные RAG-системы по эффективности настройки и использованию данных.

Исследование s3 открыло новые горизонты для применения в сфере здравоохранения, управления знаниями и научной поддержки, особенно в условиях недостатка помеченных данных.

*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена