ЗАДАЧА ПІДГОТОВКИ ДАНИХ ДО ЕКОНОМЕТРИЧНОГО АНАЛІЗУ

Автор(и)

  • В.А. Дмитрієва Дніпровський державний аграрно-економічний університет, Дніпро, Україна https://orcid.org/0000-0002-2410-4504

DOI:

https://doi.org/10.31319/2709-2879.2024iss1(8).306473pp84-91

Ключові слова:

репрезентативність даних, валідність результату, адекватність моделі, точність прогнозу, препроцесинг даних

Анотація

Економетричний аналіз ґрунтується на релевантних даних, які мають відповідати вимогам актуальності та репрезентативності. Під час формування інформаційної бази дослідник має вирішувати питання, повязані з їх повнотою, часовими рамками аналізу, масштабами досліджуваних обєктів та процесів, неоднорідністю сукупності, різними рівнями агрегації показників та шкалами їх вимірювання, мультиколінеарністю факторів та іншими проблемами. Лише після ретельного вивчення джерел інформації та усунення цих проблем можна приступати до процесу моделювання.

Подібний апріорний аналіз даних є першим важливим етапом в будь-якому дослідженні, яке претендує на отримання обґрунтованих результатів. Неправильно сформована база даних та наявність в ній недоліків призводить до отримання моделей, які можуть бути ідеальними на перший погляд, але не відповідати дійсності, що, як наслідок, призводить до хибних прогнозів та висновків.

В статті висвітлено проблеми, які постають перед дослідником при формуванні бази даних для аналізу процесів в економіці. Розглянуто основні підходи щодо їх вирішення.

Посилання

Sotiris Kotsiantis, & Kanellopoulos, Dimitris & Pintelas, P. (2006). Data Preprocessing for Supervised Learning. International Journal of Computer Science, 1, 111-117. URL: https://www.researchgate.net/publication/228084519_Data_Preprocessing_for_Supervised_Learning (дата звернення: 08.04.2024)

Cho E, Chang T-W, Hwang G. (2022). Data Preprocessing Combination to Improve the Performance of Quality Classification in the Manufacturing Process. Electronics; 11(3):477. https://doi.org/10.3390/electronics11030477 (дата звернення: 01.03.2024)

Ковтун Н. В., Фаталієва А.-Н. Я. (2020). Програмна реалізація відновлення пропущених даних: порівняльний аналіз. Статистика України, 4, С. 12–20. DOI:10.31767/su.4(91)2020.04.02. (дата звернення: 20.03.2024).

Гордійчук-Бублівська О.В., Бешлей М.І., Кирик М.І., Климаш М.М. (2021). Підвищення ефективності оброблення великих обсягів інформації з використанням методу розподіленого аналізу даних. Телекомунікаційні та інформаційні технології, 2 (71), С. 15-23. URL: https://doi.org/10.31673/2412-4338.2021.021523 (дата звернення: 02.04.2024).

Кононова І.В., Дубина В.О. (2023). Комплексне використання надлишковості для підвищення надійності комунікаційного обладнання. Вчені записки ТНУ імені В.І. Вернадського: Технічні науки, 34 (73), 5, С. 40-45. DOI https://doi.org/10.32782/2663-5941/2023.5/08. (дата звернення: 06.04.2024).

Duong, HT., Nguyen-Thi, TA. (2021). A review: preprocessing techniques and data augmentation for sentiment analysis. Comput Soc Netw 8, 1. URL: https://doi.org/10.1186/s40649-020-00080-x (дата звернення: 08.04.2024).

Ясінська-Дамрі Л.М., Дурняк Б.В. (2016). Модель оцінки якості нормалізації даних на основі застосування критеріїв якості класифікації об’єктів. Наукові записки, 1(52), С. 35-44. URL: http://pvs.uad.lviv.ua/static/media/1-81/6.pdf. DOI: 10.32403/0554-4866-2021-1-81-35-44 (дата звернення: 20.03.2024).

Піскун О.В. (2019). Застосування методів машинного навчання для побудови моделі рішення задачі класифікації. Вісник Черкаського національного університету імені Богдана Хмельницького. Серія «Прикладна математика. Інформатика», 2019, 1, 42-53. DOI 10.31651/2076-5886-2019-1-42-53. URL: https://eprints.cdu.edu.ua/2585/1/3696-8968-1-SM.pdf (дата звернення: 06.04.2024).

Dmytriieva, V., & Sviatets, Y. (2023). Agricultural business in independent Ukraine: thirty-year dynamics of the reorganization process. Agricultural and Resource Economics: International Scientific E-Journal, 9(2), 136-162. URL: https://doi.org/10.51599/are.2023.09.02.06 (дата звернення: 08.04.2024).

Kotsiantis, Sotiris & Kanellopoulos, Dimitris & Pintelas, P. (2006) Data Preprocessing for Supervised Learning. International Journal of Computer Science. No. 1, pp. 111-117. Available at: https://www.researchgate.net/publication/228084519_Data_Preprocessing_for_Supervised_Learning (accessed 8 April 2024).

Cho E, Chang T-W, Hwang G. (2022) Data Preprocessing Combination to Improve the Performance of Quality Classification in the Manufacturing Process. Electronics; no. 11(3):477. Available at: https://doi.org/10.3390/electronics11030477 (accessed 1 March 2024).

Kovtun N. V., & Fataliieva A.-N. Ya. (2020) Prohramna realizatsiia vidnovlennia propushchenykh danykh: porivnialnyi analiz [Software Implementation of Missing Data Recovery: Comparative Analysis]. Statystyka Ukrainy – Statistics of Ukraine, 4, pp. 12–20. Doi: 10.31767/su.4(91)2020.04.02. (accessed 20 March 2024).

Hordiichuk-Bublivska O.V., Beshlei M.I., Kyryk M.I., Klymash M.M. (2021) Pidvyshchennia efektyvnosti obroblennia velykykh obsiahiv informatsii z vykorystanniam metodu rozpodilenoho analizu danykh [Increasing the efficiency of processing large volumes of information using the method of distributed data analysis]. Telekomunikatsiini ta informatsiini tekhnolohii, no. 2 (71), pp. 15-23. Available at: https://doi.org/10.31673/2412-4338.2021.021523. (accessed 2 April 2024).

Kononova I.V., Dubyna V.О. (2023) Integrated use of redundancy to improve the reliability of communications equipment. Academic notes of TNU named after V.I. Vernadskyi: Technical Sciences, no. 34 (73), pp. 40-45. DOI: https://doi.org/10.32782/2663-5941/2023.5/08 (accessed 6 April 2024).

Duong H.T., Nguyen-Thi T.A. (2021) A review: preprocessing techniques and data augmentation for sentiment analysis. Comput Soc Netw 8, 1. Available at: https://doi.org/10.1186/s40649-020-00080-x (accessed 8 April 2024).

Yasinska-Damri L.M., Durnyak B.V. (2016) Model of the data normalization quality evaluation on the basis of application of the objects classification quality criteria, Scientific papers, no. 1(52), pp. 35-44. http://pvs.uad.lviv.ua/static/media/1-81/6.pdf. DOI: 10.32403/0554-4866-2021-1-81-35-44 (accessed 20 March 2024).

Piskun O. (2019) Classification model building using machine learning methods. Bulletin of the Cherkasy National University named after Bohdan Khmelnytskyi, Series "Applied mathematics, no. 1, pp. 42-53. DOI 10.31651/2076-5886-2019-1-42-53 (accessed 6 April 2024).

Dmytriieva, V., & Sviatets, Y. (2023). Agricultural business in independent Ukraine: thirty-year dynamics of the reorganization process. Agricultural and Resource Economics: International Scientific E-Journal, no. 9(2), pp. 136-162. Available at: https://doi.org/10.51599/are.2023.09.02.06 (accessed 8 April 2024).

##submission.downloads##

Опубліковано

2024-06-20

Номер

Розділ

ЕКОНОМІКА ТА УПРАВЛІННЯ ПІДПРИЄМСТВАМИ