Speaker
Description
В докладе рассматриваются подходы к агрегированию результатов, полученных с использованием трех различных эмбеддинговых моделей при оценке семантической близости текстов. Исследуются следующие подходы к агрегации: усреднение косинусных расстояний, конкатенация эмбеддингов с последующим расчетом расстояний, а также выбор одного из трех косинусных расстояний на основе метода анализа главных компонент. Для анализа полученных результатов использовались статистические меры оценки, позволяющие выявить степень согласованности рассматриваемых подходов. Установлено, что наибольшее соответствие с исходными расстояниями демонстрирует метод усреднения косинусных расстояний. Полученные результаты могут быть использованы для повышения устойчивости моделей оценки семантической близости текстов при использовании ансамблей эмбеддингов.