- июль 24, 2019
Усов А.Е., Варламов А.А., Бабкин О.В., Дос Е.В., Мостовщиков Д.Н.
Email: Адрес электронной почты защищен от спам-ботов. Для просмотра адреса в вашем браузере должен быть включен Javascript.
Усов Алексей Евгеньевич – ведущий архитектор;
Варламов Александр Александрович – старший архитектор;
Бабкин Олег Вячеславович – старший архитектор;
Дос Евгений Владимирович – архитектор;
Мостовщиков Дмитрий Николаевич – старший архитектор,
системный интегратор «Li9 Technology Solutions»,
г. Райли, Соединенные Штаты Америки
Аннотация: рассмотрены методы разработки алгоритмов обнаружения знаний в базах данных как базового подхода выделения значимых образцов (шаблонов) в структуре больших наборов данных. В рамках разработанной методологии выделены две группы алгоритмов обнаружения знаний: кластеризация объектов, классы которых изначально не определены, и методы индуктивного обучения, в рамках которых на основе заданного набора классов определяется принадлежность к ним объекта исследования. Предложен оригинальный подход в области обнаружения знаний в базах данных, в основу которого положены методы классификации, что базируются на таком средстве поддержки принятия решений, как дерево принятия решений. Разработанная методика позволяет проводить анализ как на основе заданных шаблонов классификации данных, так и выделять новые признаки информационных объектов исследуемого набора и его классов, включая признаки высокого порядка, как, например, сходство между классами, характеристики классов и потенциальные ошибки представленного набора данных.
Ключевые слова: информационные системы, методы классификации, обнаружение знаний в базах данных, дерево принятия решений, C4.5, ID3, FTree.
APPLICATION OF DECISION TREES AT DEFINING INFORMATION SYSTEM PATTERNS
Usov A.Yе., Varlamov A.A., Babkin O.V., Dos E.V., Mostovshchikov D.N.
Usov Aleksey Yevgenyevich – Lead Systems Architect;
Varlamov Aleksandr Aleksandrovich – Senior Solution Architect;
Babkin Oleg Vyacheslavovich – Senior System Architect;
Dos Evgeniy Vladimirovich – System Architect;
Mostovshchikov Dmitriy Nikolayevich – Senior System Architect,
IT INTEGRATOR «LI9 TECHNOLOGY SOLUTIONS»,
RALEIGH, UNITED STATES OF AMERICA
Abstract: methods for the development of knowledge discovery algorithms in databases are considered as a basic approach of significant samples detection at big data sets. Within the framework of the developed methodology, two groups of knowledge detection algorithms are distinguished: clustering objects with undefined classes and methods of inductive learning for determined objects by given set of classes. An original approach in the field of knowledge discovery at databases is proposed, which is based on classification methods based on a decision support tool such as a decision tree. The developed technique allows analyzing both on the basis of predetermined data classification patterns and highlighting new features of information objects of the data set and its classes, including patterns of a higher order, such as the similarity between classes, characteristics of classes and potential errors of the presented data set.
Keywords: information systems, classification methods, databases’ knowledge discovery, decision tree, C4.5, ID3, FTree.
Список литературы / References
- Maimon О. and Rokach L., editors. Data Mining and Knowledge Discovery Handbook, 2nd ed. Springer, 2010.
- Luo J., Wu, Q. & Zhu L., Object-oriented full-time domain moving object data model. Journal of Computer Applications, 33(4), 1015-1017. doi:10.3724/sp.j.1087.2013.01015.
- Rajamohamed R. & Manokaran J., Improved credit card churn prediction based on rough clustering and supervised learning techniques. Cluster Computing, 21 (1), 65-77. doi:10.1007/s10586-017-0933-1.
- Zenghong W., Yufen C. & Jun Z., Adaptive rules mining in ACVis based on ID3 algorithm in decision tree. 2010 The 2nd Conference on Environmental Science and Information Application Technology. doi:10.1109/esiat.2010.5568899.
- Symbology of the Logical Decision Tree, 2017. Decision-Making Management, 99-100. doi:10.1016/b978-0-12-811540-4.09979-8.
- Radoglou-Grammatikis P.I. & Sarigiannidis P.G., An Anomaly-Based Intrusion Detection System for the Smart Grid Based on CART Decision Tree. 2018 Global Information Infrastructure and Networking Symposium (GIIS). doi:10.1109/giis.2018.8635743.
- Pazzani M.J. Knowledge discovery from data? IEEE Intelligent Systems, 15(2):10–13, 2000.
- Armengol Е. Building partial domain theories from explanations. Knowledge Intelligence, 2/08:19–24, 2008.
- Armengol Е. and Plaza Е. Discovery of toxicological patterns with lazy learning. In V. Palade, R.J. Howlett and L. Jain, editors, KES-2003, number 2774 in Lecture Notes in Artificial Intelligence. Рages 919–926. Springer, 2003.
- Armengol Е. Usages of generalization in CBR. In R.O. Weber and M. M. Richter, editors, ICCBR-2007. Case-based Reasoning and Development, number 4626 in Lecture Notes in Artificial Intelligence, pages 31–45. Springer-Verlag, 2007.
- Armengol Е., García-Cerdaña А. and Dellunde Р. Experiences Using Decision Trees for Knowledge Discovery. Springer International Publishing AG,
- Moulana M. & Hussain M.A., An Optimized Decision Trees Approach for Knowledge Discovery Using Orthogonal Radom Matrix Projection with Outlier Detection. International Journal of Database Theory and Application, 9 (3), 87-94. doi:10.14257/ijdta.2016.9.3.10.
- López R. de Mántaras. A distance-based attribute selection measure for decision tree induction. Machine Learning, 6:81–92, 1991.
- Shafer J.C., Agrawal R. and Mehta М. Sprint: A scalable parallel classifier for data mining. InVLDB, pages 544–555, 1996.
- Gehrke J., Ramakrishnan R. and Ganti V. RainForest - a framework for fast decision tree construction of large datasets. Data Mining and Knowledge Discovery, 4(2/3):127–162, 2000.
Ссылка для цитирования данной статьи
Тип лицензии на данную статью – CC BY 4.0. Это значит, что Вы можете свободно цитировать данную статью на любом носителе и в любом формате при указании авторства. | ||
Усов А.Е., Варламов А.А., Бабкин О.В., Дос Е.В., Мостовщиков Д.Н. ПРИМЕНЕНИЕ ДЕРЕВЬЕВ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ОПРЕДЕЛЕНИИ ШАБЛОНОВ ДАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ // Наука, техника и образование № 6(59), 2019. - С.{см. журнал}. |