Новые модели для эмбеддингов и ранжирования текстов - Новости нейросетей и искусственного интеллекта (ИИ) со всего мира на русском языке

Мы рады анонсировать новую серию моделей для создания текстовых эмбеддингов, которые превращают слова и предложения в числовые векторы. Эти технологии являются основой для умного поиска и работы с большими объемами данных. Модели эмбеддингов помогают компьютерам осваивать скрытый смысл и контекст фраз, а не просто находить слова.

Одним из значительных достижений является внедрение RAG-систем, которые связывают корпоративные базы знаний с языковыми моделями (LLM). Семантический поиск позволяет находить ответы, основанные на смысле запроса, даже если формулировка отличается.

К тому же, мы добавили в наш каталог модели ранжирования текстов (реранкеры), которые сортируют результаты поиска по их релевантности. Эти модели работают на паре с эмбеддингами, что значительно улучшает качество поиска.

Обратите внимание на мультиязычную модель Multilingual-e5-large от Microsoft и Bge-m3 от BAAI, которые поддерживают множество языков, включая русский. Также есть Qwen3-embedding-8b от Alibaba, оптимизированный для экосистемы Qwen. Все они легко интегрируются с популярными векторными базами данных.

Загляните в Foundation Models Catalog, выбирайте подходящую модель и подключайте ее к вашим проектам через API.

*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена