Сравнительный анализ и оценка согласованности методов интеграции семантических представлений текстов

11 Jul 2025, 12:00
15m
Room 420

Room 420

Speaker

Анна Ильина (MLIT JINR)

Description

В докладе рассматриваются подходы к агрегированию результатов, полученных с использованием трех различных эмбеддинговых моделей при оценке семантической близости текстов. Исследуются следующие подходы к агрегации: усреднение косинусных расстояний, конкатенация эмбеддингов с последующим расчетом расстояний, а также выбор одного из трех косинусных расстояний на основе метода анализа главных компонент. Для анализа полученных результатов использовались статистические меры оценки, позволяющие выявить степень согласованности рассматриваемых подходов. Установлено, что наибольшее соответствие с исходными расстояниями демонстрирует метод усреднения косинусных расстояний. Полученные результаты могут быть использованы для повышения устойчивости моделей оценки семантической близости текстов при использовании ансамблей эмбеддингов.

Authors

Petr Zrelov (LIT JINR) Анна Ильина (MLIT JINR)

Presentation materials

There are no materials yet.