Back to Search
Start Over
ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ВИЗНАЧЕННЯ КОРИСНИХ ДАНИХ ПРИ ОПТИМІЗАЦІЇ СТРУКТУРИ ТА МІНІМІЗАЦІЇ ОБСЯГІВ ВУЗЛА РОЗПОДІЛЕНОЇ БД
- Source :
- Вісник Черкаського державного технологічного університету; № 4 (2019); 26-35, Bulletin of Cherkasy State Technological University; № 4 (2019); 26-35, Вестник Черкасского государственного технологического университета. Серия: Технические науки; № 4 (2019); 26-35, urn:2306:44554.2019
- Publication Year :
- 2020
- Publisher :
- Черкаський державний технологічний університет = Cherkasy State Technological University, 2020.
-
Abstract
- Дослідження ставить на меті підвищення рівня загальної доступності даних в окремому вузлі розподіленої бази даних та ефективності використання програмних систем по роботі з даними за рахунок зменшення кількості розподілених запитів. Мета досягається шляхом оптимізації структури вузла розподіленої бази даних та мінімізації обсягів даних, що зберігаються у ньому. Для досягнення мети було створено підсистему обліку користувацьких запитів, граматику мови T-SQL та виконано парсинг коду SQL-запитів. В результаті запити класифікуються за списком таблиць бази даних, які трапляються у запиті, а також, після виконання більш детального аналізу, за списком атрибутів та кортежів відношення. Останнє досягається за рахунок виконання набору запитів зі зверненням до первинного ключа кожного відношення, що входить до складу запиту. Виконання повного аналізу оцінки корисності атрибутів та кортежів таблиць бази даних є досить ресурсоємною операцією, тому не може виконуватися при кожній зміні даних. У рамках дослідження запропоновано реалізувати вирішення задачі класифікації нових даних із використанням нейронної мережі прямого поширення, що навчається на базі оцінених попередньо даних на базі парсингу SQL-запитів. Враховуючи необхідність виконання аналізу накопичених даних з точки зору множинності вимірів, а також, ймовірно, великі їх обсяги, було виконано представлення даних, необхідних для аналізу, у вигляді багатовимірної моделі.<br />The paper deals with the tendency to move from "universal" accounting systems to specialized solutions usage. This requires the synchronization of distributed database data. It is noted that among the strategies of data distribution between distributed database nodes, the combined one is the most justified, but the main disadvantage consists in the existence of distributed transactions when handling data. The research aims to improve the general availability of data in the separate node of the distributed database and the efficiency of using software systems to work with database data by reducing the number of distributed requests. The goal is achieved by optimizing the structure of the distributed database node and minimizing the amount of data stored in it. To achieve the goal, users' query accounting subsystem and T-SQL grammar have been created, and SQL query code has been parsed. As a result, the queries are classified by the list of database tables that are found in the query, and, after performing more deyailed analysis, by the list of attributes and relation tuples. The last one is achieved by executing a set of queries with getting the primary key of each relation included in the query. Performing the complete analysis of the database tables attributes and tuples estimation is a very resource-intensive operation, so it cannot be performed every time the database data is changed. The research proposes to solve the problem of classification of new data by using the perceptron, which learns on the basis of pre-evaluated data based on SQL query parsing. Also, according to the need of performing the analysis of received data from the point of view of multiple dimensions, as well as probably their large amount, the data required for the analysis has been presented in the form of a multidimensional model.
- Subjects :
- distributed transaction
database management system
distributed database
distributed SQL-query
data replication
text parsing
parse tree
profiling, ANTLR
multidimensional analysis
classification task
neural network
data mining
розподілена транзакція
система керування базами даних
розподілена база даних
розподілений SQL-запит
реплікація даних
парсинг тексту
дерево парсингу
профайлінг
ANTLR
OLAP
задача класифікації
нейронна мережа
інтелектуальний аналіз даних
Subjects
Details
- Language :
- Ukrainian
- ISSN :
- 23064412 and 23064455
- Database :
- OpenAIRE
- Journal :
- Вісник Черкаського державного технологічного університету
- Accession number :
- edsair.scientific.p..48679a79d4fc3e717a2c5bfeab16e44a