Для анализа научных публикаций, с целью оценки качества, новизны, достоверности и актуальности проводимых исследований, сегодня используются цифровые репозитории. Однако, такие репозитории имеют множество ограничений, что делает актуальной задачу создания программного комплекса автоматизированного сбора метаданных из различных источников, исключающего дублирование и необходимость ввода метаданных вручную. Данный комплекс представляет собой набор инструментов и программных модулей для сбора информации, её анализа и хранения. Он включает в себя средства для обработки больших объёмов данных, работы с базами данных и многого другого. Автоматизированный сбор метаданных публикаций очень важен для цифровых репозиториев, так как он позволяет автоматически собирать и структурировать информацию о публикациях, что облегчает поиск и использование информации. Кроме того, он позволяет собирать информацию о публикациях быстрее и точнее, чем это можно сделать вручную. Это также помогает улучшить качество данных и экономит время и ресурсы. В докладе представлен алгоритм работы программного комплекса, выполняющего автоматизированный сбор и систематизацию научных публикаций для цифрового репозитория на платформе Dspace.
Software package for automated collection and systematization of scientific publications
Digital repositories are used today to analyze scientific publications in order to assess the quality, novelty, reliability and relevance of ongoing research. However, such repositories have many limitations, which makes it urgent to create a software package for automated collection of metadata from various sources, eliminating duplication and the need to enter metadata manually. The software package is a set of tools and software modules for collecting information, analyzing and storing it. It includes tools for processing large volumes of data, working with databases and much more. Automated collection of publication metadata is very important for digital repositories, as it allows information about publications to be automatically collected and structured, making the information easier to find and use. In addition, it allows you to collect information about publications faster and more accurately than can be done manually. It also helps improve data quality and saves time and resources. The report presents an algorithm for the operation of a software package that performs automated collection and systematization of scientific publications for a digital repository on the Dspace platform.