Google представила новый метод активного обучения, который значительно уменьшает потребности в обучающих данных для тонкой настройки крупных языковых моделей (ЛЛМ). Эта инновация особенно актуальна для классификации небезопасного рекламного контента, что требует глубокого контекстуального понимания, характерного для ЛЛМ.
Метод позволяет сократить количество необходимых обучающих примеров с 100,000 до менее чем 500, улучшая при этом соответствие модели экспертным мнениям до 65%. Новый процесс активно идентифицирует примеры, которые имеют наибольшую ценность для аннотирования, создавая предварительно размеченные данные, используемые для обучения модели.
В ходе экспериментов проводилась настройка моделей на разных задачах, где каждая модель проанализировала разнородные примеры с различными аннотациями, что позволило достичь высокая согласованности между экспертными оценками, измеряемую с помощью коэффициента Каппа Кохена. Выводы показывают, что целевая курация данных может не только повысить качество, но и существенно сократить объем необходимых данных, освободив таким образом модели от узких мест в обучении.
Эти результаты могут иметь значительное влияние на области, где ясные аннотации являются сложными из-за неоднозначности самого контента. Таким образом, метод, предложенный Google, открывает новые горизонты в повышении эффективности использования ЛЛМ в разнообразных сценариях.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
