11th International Conference "Distributed Computing and Grid Technologies in Science and Education" (GRID'2025)

Name: 11th International Conference "Distributed Computing and Grid Technologies in Science and Education" (GRID'2025)
Start: 2025-07-07T09:00:00+03:00
End: 2025-07-11T18:00:00+03:00
Location: No location set

7–11 Jul 2025

Europe/Moscow timezone

Support

grid2025@jinr.ru

Сравнительный анализ и оценка согласованности методов интеграции семантических представлений текстов

11 Jul 2025, 12:00

15m

Room 420

Sectional talk Round Table on Information and Analytical Platforms

Анна Ильина (MLIT JINR)

В докладе рассматриваются подходы к агрегированию результатов, полученных с использованием трех различных эмбеддинговых моделей при оценке семантической близости текстов. Исследуются следующие подходы к агрегации: усреднение косинусных расстояний, конкатенация эмбеддингов с последующим расчетом расстояний, а также выбор одного из трех косинусных расстояний на основе метода анализа главных компонент. Для анализа полученных результатов использовались статистические меры оценки, позволяющие выявить степень согласованности рассматриваемых подходов. Установлено, что наибольшее соответствие с исходными расстояниями демонстрирует метод усреднения косинусных расстояний. Полученные результаты могут быть использованы для повышения устойчивости моделей оценки семантической близости текстов при использовании ансамблей эмбеддингов.

Petr Zrelov (LIT JINR) Анна Ильина (MLIT JINR)

GRID.pdf

11th International Conference "Distributed Computing and Grid Technologies in Science and Education" (GRID'2025)

Support

Сравнительный анализ и оценка согласованности методов интеграции семантических представлений текстов

Room 420

Speaker

Description

Authors

Presentation materials

Choose timezone

11th International Conference "Distributed Computing and Grid Technologies in Science and Education" (GRID'2025)

Support

Speaker

Description

Authors

Presentation materials