A framework for establishing a national data vault for Data Governance institution
Subject Areas :Nader naghshineh 1 , fatima fahimnia 2 , hamidreza Ahmadian chashmi 3
1 - University of Tehran
2 - University of Tehran
3 - University of Tehran
Keywords: data governance, data vault, national data, data management, data and information strategy ,
Abstract :
the goal of this research is mainly presenting a framework for national data with the concentration on parameters respecting data governance in order to design an effective and comprehensive pattern for all spots interacting with national data. The author has adopted descriptive approach and mixed method for this research. In the first step, the articles regarding national data organization are extracted and subsequently accorded with the articles based on technology ecosystem design patterns, 10 key components are formed as main modules. Thereafter, for each module, indexes and sub-indexes are taken into account by considering articles and also taking advantages of interviews and Delphi method. by designing two questionnaires, strategy-management and technical-lawful oriented, total number of 22 indexes and 154 sub-indexes are collected. the research has the capacity of being a scientific reference for the national data vault. it is recommended that development of technical infrastructure and data governance patterns in national level accorded with indexes and sub-indexes counted in this research
. بنائی، سیدمجتبی و محسن صابری (1396). دریاچه داده، بستری ضروری برای حکمرانی داده در سازمانها، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
2. پایمرد، جلال (1394) رتبهبندی موانع ایجاد پایگاه داده ملی برای درآمد افراد و شرکتها با رویکرد تصمیمگیری چندمعیاره (MADM). پایان نامه کارشناسی ارشد. رشته مدیریت. دانشگاه آزاد اسلامی واحد تهران مرکزی، دانشکده مدیریت.
3. جان نثاری، مصطفی؛ امیرزاده گوغری، احسان؛ عبداله زاده، علیرضا (1398). حکمرانی داده محور. کار و جامعه. 320. ص 17-32.
4. رحتمی اصل، سعید (1393). بررسی مراکز داده موجود و ارائهی یک ساختار پشتیبان ماژولار جهت طراحی مراکز داده ملی در ایران. پایان نامه کارشناسی ارشد. رشته: مهندسی کامپیوتر - نرمافزار. دانشگاه آزاد اسلامی واحد تهران مرکزی، دانشکده مدیریت.
5. سامنی، سارا؛ رامین نصیری و مهران محسن زاده (1398). مقایسه مدلها و چارچوبهای حاکمیت داده با هدف دستیابی به پیش نیازها، موانع و مؤلفههای یک برنامه حاکمیت داده برای دادههای حوزه سلامت، ششمین کنفرانس بین المللی فناوری اطلاعات، کامپیوتر و مخابرات، گرجستان، دانشگاه پیام نور مرکز بین الملل گرجستان.
ه صدیقی، امیر حسین (1396). ارائه رویکردی برای ارزیابی حکمرانی داده در کسب و کارها، اولین کنفرانس ملی اندیشههای نوین در مدیریت کسب و کار، تهران، دانشگاه علم و فرهنگ.
7. صدیقی، امیرحسین (1396). حکمرانی مسئولانه داده از منظر اجتماعی، سومین کنفرانس بین المللی مدیریت و مهندسی صنایع، تهران، دانشگاه مقدس اردبیلی.
8. صدیقی، امیرحسین (1396). کاربست مصورسازی جغرافیایی در حکمرانی داده: مطالعه موردی پژوهشگاه علوم و فناوری اطلاعات ایران، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
9. فتح اله زاده، فرحناز (1396). الزامات ارزیابی مدل بلوغ داده: آیا مدلهای حکمرانی داده این الزامات را برآورده میکنند، دهمین همایش ملی ادکا، تهران، اتحادیه انجمنهای علمی دانشجویی علم اطلاعات و دانش شناسی ایران.
10. فتح اله زاده، فرحناز (1396). مدیریت کیفیت داده؛ سازماندهی پاسخگویی ومدل حکمرانی داده آن، هفتمین کنفرانس ملی مدیریت، اقتصاد و حسابداری، تبریز، سازمان مدیریت صنعتی تبریز.
11. فتح اله زاده، فرحناز و مصطفی امینی (1396). مروری بر مدلهای بلوغ حکمرانی دادهها در بنگاههای اقتصادی، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
12. لگزائی، علیرضا؛ نسرین کاظمی و مسعود عسگری مهر (1397). چارچوبی جهت پیاده سازی حاکمیت داده در صنعت بانکداری ایران، دومین کنفرانس بین المللی مدیریت وسیستم های فازی، ایوان کی، دانشگاه ایوان کی- موسسه بین المللی مهد پژوهش ره پویان حقیقت.
13. محمدشفیعی، مجید و عاطفه خوش فطرت (1396). حکمرانی دادهها در بازاریابی، هوش کسب و کار و مزیت رقابتی: مطالعه یک گروه تولیدی لوازم خانگی، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
14. مرتضوی، محمدرضا (1394). طراحی چارچوب حاکمیت داده در مراکز تبادل داده و اطلاعات ملی (مورد مطالعه: وزارت علوم، تحقیقات، و فناوری). پایان نامه دکتری.: : مدیریت - مدیریت فناوری اطلاعاترشته: مدیریت - مدیریت فناوری اطلاعات.
15. مرعشی پور، امید (1393) پژوهشی با عنوان «ارائه چارچوب حاکمیت دادههای بزرگ توانمندساز مدیریت جریان دانش (مورد مطالعه: بانک مرکزی جمهوری اسلامی ایران). پایان نامه کارشناسی ارشد. مدیریت - مدیریت فناوری اطلاعات ـ مدیریت دانش. دانشگاه آزاد اسلامی واحد تهران مرکزی، دانشکده مدیریت.
16. میرزایی؛ پری، یحیی؛ مهدی خلیلی و اطهر رضایی (1397). حکمرانی داده؛ ضرورتی برای مواجهه با تحولات پیش روی صنعت بیمه، بیست و پنجمین همایش ملی بیمه و توسعه، تهران، پژوهشکده بیمه.
17. نامداریان، لیلا (1396). بررسی و تحلیل راهبردهای حکمرانی داده در مؤسسات مالی، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
18. طالبی, سجاد (1398). پردازش پایگاه دادهها و مقایسه بین روشهای داده کاوی، سومین کنفرانس ملی ایدههای نوین در فنی و مهندسی، رشت، سازمان بسیج مهندسی صنعتی استان گیلان
19. لطفی احمدآبادی, محمد و محبوبه ثقفی (1398). ارائه یک روش جدید برای ذخیره سازی و دسترسی به دادهها در پایگاه دادههای بزرگ توزیع شده مبتنی بر ipfs و etl، ششمین کنفرانس بین المللی یافتههای نوین علوم و تکنولوژی با محوریت علم در خدمت توسعه، تهران، دبیرخانه دائمی کنفرانس،
20. پدیداران مقدم, فرهنگ و سیما سنگ سفیدی (1398). مروری بر جوانب مختلف انبار دادهها، سومین همایش ملی دانش و فناوری مهندسی برق، کامپیوتر و مکانیک ایران، تهران، موسسه برگزار کننده همایشهای توسعه محور دانش و فناوری سام ایرانیان.
21. رجبی, سارا (1398). الگوریتمهای داده کاوی در پایگاه داده، کنگره ملی تحقیقات بنیادین در مهندسی کامپیوتر و فن اوری اطلاعات، تهران - دانشگاه شهید بهشتی، دبیرخانه دائمی کنفرانس.
22. بنائی، سیدمجتبی و محسن صابری (1396). دریاچه داده، بستری ضروری برای حکمرانی داده در سازمانها، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
23. Berkani, N., Bellatreche, L., Khouri, S., Ordonez, C. (2019). Value-driven approach for designing extended data warehouses. In DOLAP
24. Kern, Rafał. Adrianna Kozierkiewicz, Marcin Pietranik, (2020). The data richness estimation framework for federated data warehouse integration, Information Sciences, Volume 513, 2020, Pages 397-411, ISSN 0020-0255.
25. Public Sector, OECD Publishing, Paris, https://doi.org/10.1787/24131962.
26. Office of the Government Chief Information Officer (2019), Public Service Data Strategy 2019-2023, Government of Ireland, https://www.osi.ie/wp-content/uploads/2018/12/Public-Service-Data-Strategy-2019-2023.pdf (accessed on 23 August 2019).
27. Pauleen, D. and Wang, W. (2017), "Does big data mean big knowledge? KM perspectives on big data and analytics", Journal of Knowledge Management, Vol. 21 No. 1, pp. 1-6.
28. Pechacek, J.; Cerra, F.; Brandt, B.; Lutfiyya, M.N.; Delaney, C. (2015). Creating the Evidence through Comparative Effectiveness Research for Interprofessional Education and Collaborative Practice by Deploying a National Intervention Network and a National Data Repository. Healthcare 2015, 3, 146-161.
29. Sorani, M. D., Yue, J. K., Sharma, S., Manley, G. T., Ferguson, A. R., Cooper, S. R., et al. (2015). Genetic data sharing and privacy. Neuroinformatics, 13(1), 1–6. doi:10.1007/s12021-014-9248-z.
30. Stats NZ (2019), Data Leadership Quarterly Dashboard, New Zealand Government, https://www.data.govt.nz/about/government-chief-data-steward-gcds/data-dashboard (accessed on 26 August 2019).
31. Sweeney, K. (2019), “An operational data governance framework for New Zealand government”, Stats NZ, Wellington, https://statsnz.contentdm.oclc.org/digital/collection/p20045coll1/id/2657 (accessed on 27 August 2019).
32. Tenopir, C., Dalton, E. D., Allard, S., Frame, M., Pjesivac, I., Birch, B., (2015). Changes in data sharing and data reuse practices and perceptions among scientists worldwide. Plos One, 10(8). doi: 10.1371/journal.pone.0134826.
33. The Economist (2017), “The world’s most valuable resource is no longer oil, but data: Regulating the Internet giants”, The Economist.
34. Bindley Phil (2019). Joining the dots: how to approach compliance and data governance, Network Security, 2: 14-16.
35. Bouaziz Senda, Ahlem Nabli, Faiez Gargouri (2019). Design a Data Warehouse Schema from Document-Oriented database, Procedia Computer Science, 159: 221-230.
36. Boulil Kamal, François Pinet, Sandro Bimonte, Nadia Carluer, Claire Lauvernet, Bruno Cheviron, André Miralles, Jean-Pierre Chanet (2013). Guaranteeing the quality of multidimensional analysis in data warehouses of simulation results: Application to pesticide transfer data produced by the MACRO model, Ecological Informatics, 16: 41-52.
37. Broek Tijs van den, Anne Fleur van Veenstra (2018). Governance of big data collaborations: How to balance regulatory compliance and disruptive innovation, Technological Forecasting and Social Change,129: 330-338.
38. Calvanese Diego, Luigi Dragone, Daniele Nardi, Riccardo Rosati, Stefano M. Trisolini (2006). Enterprise modeling and Data Warehousing in Telecom Italia, Information Systems, 31 (1): 1-32.
39. Chander Anupam (2016). National Data Governance in a Global Economy. Columbia School of International and Public Affairs Issues Brief, UC Davis Legal Studies Research Paper No. 495.
40. Chang, Chih-Hung Fuu-Cheng Jiang, Chao-Tung Yang, Sheng-Cang Chou (2019). On construction of a big data warehouse
accessing platform for campus power usages, Journal of Parallel and Distributed Computing, Volume 133, Pages 40-50. 41. E. Malinowski, E. Zimányi (2008). A conceptual model for temporal data warehouses and its transformation to the ER and the object-relational models, Data & Knowledge Engineering, 64 (1): 101-133.
42. Guoqing Zhang, Tatsushi Nishi, Sarina D.O. Turner, Keisuke Oga, Xindan Li (2017). An integrated strategy for a production planning and warehouse layout problem: Modeling and solution approaches, Omega, 68: 85-94.
43. Halawa Farouq, Husam Dauod, In Gyu Lee, Yinglei Li, Sang Won Yoon, Sung Hoon Chung (2019). Introduction of a real time location system to enhance the warehouse safety and operational efficiency, International Journal of Production Economics, 107541, ISSN 0925-5273.
44. Hardy Ian,, M Obaidul Hamid, Vicente Reyes(2018). Data for learning? Confirming and contesting performative practices of data governance. Global Studies of Childhood.Vol 8, Issue 4.
45. He Tieke; Shenghao Chen; Lian Hao; Jia Liu (2019). Quality Driven Judicial Data Governance. International Conference on Software Quality, Reliability and Security Companion (QRS-C). IEEE Access Volume: 7.
46. Hee Yeong Kim, June-Suh Cho(2018). Data governance framework for big data implementation with NPS Case Analysis in Korea. Journal of Business & Retail Management Research. 12(03).
47. Broek Tijs van den, Anne Fleur van Veenstra (2018). Governance of big data collaborations: How to balance regulatory compliance and disruptive innovation, Technological Forecasting and Social Change, Volume 129, Pages 330-338.
48. Buffenoir, E.; Bourdon, I. (2013). Managing extended organizations and data governance. Adv. Intell. Syst. Comput.205, 135–145.
49. Bulla, C.M.; Bhojannavar, S.S.; Danawade, V.M. (2013). Cloud Computing: Research Activities and Challenges. Int. J. Emerg. Trends Technol. Comput. Sci, 2, 206–21.
50. BZK (2019), Data Agenda Government (Data Agenda Overhead), Ministry of the Interior and Kingdom Relations, https://www.nldigitalgovernment.nl/wp-content/uploads/sites/11/2019/04/data-agenda-government.pdf (accessed on 23 August 2019).
51. Cervone, H. (2016), "Organizational considerations initiating a big data and analytics implementation", Digital Library Perspectives, Vol. 32 No. 3, pp. 137-141.
52. Chawngsangpuii, R.; Das, R.K. (2014). A challenge for security and service level agreement in cloud computing. Int. J. Res. Eng. Technol., 2319–2322.
53. Cochran, M.; Witman, P.D. (2011). Governance and service level agreement issues in a cloud computing environment computing environment. J. Inf. Technol. Manag. 2011, 22, 41–55.
54. Coyne, E., Coyne, J. and Walker, K. (2018), "Big Data information governance by accountants", International Journal of Accounting & Information Management, Vol. 26 No. 1, pp. 153-170.
55. Farid,M. H.., A. Roatis, I. F. Ilyas, H. Hoffmann, and X. Chu. (2016). CLAMS: bringing quality to data lakes. In SIGMOD, pages 2089--2092, 2016.
56. Federal Data Strategy Development Team (2019), 2019-2020 Draft Federal Data Strategy Action Plan, US Government, Washington, DC, https://strategy.data.gov/action-plan (accessed on 26 August 2019).
57. Felici, M.; Koulouris, T.; Pearson, S. (2013). Accountability for Data Governance in Cloud Ecosystems. In Proceedings of the 2013 IEEE 5th International Conference on Loud Computing Technology and Science (Cloudcom), Bristol, UK, 2–5 December 2013; pp. 327–332.
58. Firican, George (2018). Data governance maturity models – Stanford. Lightsondata. Published aug 29, 2018 in data governance. https://www.lightsondata.com/data-governance-maturity-models-stanford/ 2019.12.22.
59. Firican, George (2018. B). Data governance maturity models – DataFlux. Lightsondata. Published aug 29, 2018 in data governance. https://www.lightsondata.com/data-governance-maturity-models-dataflux/
60. Firican, George (2018. C). Data governance maturity models – Gartner. Published Oct, 03, 2018 in data governance https://www.lightsondata.com/data-governance-maturity-models-gartner/
61. Flyverbom Mikkel, Ronald Deibert, Dirk Matten (2017). The Governance of Digital Technology, Big Data, and the Internet: New Roles and Responsibilities for Business. Business & Society. Vol 58, Issue 1.
62. Fukaya, T. (2019), “Is evidence contributing to public accountability? Evidence from Japan”, presentation at the OECD Expert Meeting on Standards of Evidence, Ministry of Internal Affairs and Communications, Japan.
63. Gao, Y., S. Huang, and A. Parameswaran. (2018). Navigating the data lake with datamaran: Automatically extracting structure from log datasets. In SIGMOD, pages 943--958, 2018.
64. Goals, S.; Dyche, J.; Levy, E. (2015). Data Governance: Getting It Right! GFT: Stuttgart, Germany, 2015; pp. 1–3.
65. Guston, D. (2014), “Understanding ‘anticipatory governance’”, Social Studies of Science, Vol. 44/2, pp. 218-242, http://dx.doi.org/10.1177/0306312713508669.
66. Hai, R., S. Geisler, and C. Quix. (2016). Constance: An intelligent data lake system. In SIGMOD, pages 2097--2100, 2016.
67. Han, Z., Huang, S., Li, H. and Ren, N. (2016), "Risk assessment of digital library information security: a case study", The Electronic Library, Vol. 34 No. 3, pp. 471-487.
68. Hardy Ian, M Obaidul Hamid, Vicente Reyes (2018). Data for learning? Confirming and contesting per formative practices of data governance. Global Studies of Childhood.Vol 8, Issue 4.
69. He Tieke; Shenghao Chen; Lian Hao; Jia Liu (2019). Quality Driven Judicial Data Governance. International Conference on Software Quality, Reliability and Security Companion (QRS-C). IEEE Access Volume: 7.
70. Hee Yeong Kim, June-Suh Cho (2018). Data governance framework for big data implementation with NPS Case Analysis in Korea. Journal of Business & Retail Management Research. 12(03).
71. Jack R. Sticke, Anita Vandervalk (2014). Data Business Plans and Governance Programs: Aligning Transportation Data to Agency Strategic Objectives. Transportation Research Record: Journal of the Transportation Research Board. Vol 2460, Issue 1.
72. Jansen, W.; Grance, T. (2017). Guidelines on Security and Privacy in Public Cloud Computing. Available online:http://nvlpubs.nist.gov/nistpubs/Legacy/SP/nistspecialpublication800-824.
73. Jules, T. (2019), "Big “G” and Small “g”: The Variable Geometries of Educational Governance in an Era of Big Data", Jules, T. and Salajan, F. (Ed.) The Educational Intelligent Economy: Big Data, Artificial Intelligence, Machine Learning and the Internet of Things in Education (International Perspectives on Education and Society, Vol. 38), Emerald Publishing Limited, pp. 15-32.
74. Kamioka, T.; Luo, X.; Tapanainen, T. (2016). An Empirical Investigation of Data Governance: The Role of Accountabilities. In Proceedings of the 20th Pacific Asia Conference on Information Systems.
75. Keil Mark, Mary Culnan Tamara Dinev, Heng Xu (2019). Data Governance, Consumer Privacy, and Project Status Reporting: Remembering H. Jeff Smith. Information Systems Frontiers. Volume 21, Issue 6, pp 1207–1212.
76. Kern, Rafał. Adrianna Kozierkiewicz, Marcin Pietranik, (2020). The data richness estimation framework for federated data warehouse integration, Information Sciences, Volume 513, 2020, Pages 397-411, ISSN 0020-0255.
77. Kim, S. and Lee, W. (2014), "Global data repository status and analysis: based on Korea, China and Japan", Library Hi Tech, Vol. 32 No. 4, pp. 706-722.
78. Kitchin, R., Collins, S. and Frost, D. (2015), "Funding models for Open Access digital data repositories", Online Information Review, Vol. 39 No. 5, pp. 664-681.
79. Kofi, J.; Kwame, K. (2017). Who ‘owns’ the cloud? An empirical study of cloud governance in cloud computing in Ghana. In Proceedings of the 28th European Regional Conference of the International Telecommunications Society (ITS), Passau, Germany, 30 July–2 August.
80. Koltay Tibor (2016). Data governance, data literacy and the management of data quality. IFLA Journal. Vol 42, Issue 4.
81. Li, F. and Zhang, J. (2014), "Case study: a metadata scheme for multi-type manuscripts for the T.D. Lee Archives Online", Library Hi Tech, Vol. 32 No. 2, pp. 219-228.
82. Lindpainter, J. (2019), “The US Data Federation wants to make it easier to collect, combine, and exchange data across government”, 18F, https://18f.gsa.gov/2019/03/05/the-us-data-federation.
83. Loshin, D. (2010). Operationalizing Data Governance through Data Policy Management; Knowledge Integrity, Inc.: Washington, DC, USA, 132–144.
84. Mägi, M. (2019), Data for law making. Presentation in the context of the OECD meeting on Measuring Regulatory Performance. Oslo, Norway. 2019, Statistics Estonia, Oslo.
85. Marín Ruiz, N., Martínez-Rojas, M., Molina Fernández, C., Soto-Hidalgo, J., Rubio-Romero, J. and Vila Miranda, M. (2018), "Flexible Management of Essential Construction Tasks Using Fuzzy OLAP Cubes", Fayek, A. (Ed.) Fuzzy Hybrid Computing in Construction Engineering and Management, Emerald Publishing Limited, pp. 357-388.
86. Merkus Jan, Remko Helms, and Rob Kusters (2019). Data Governance and Information Governance: Set of Definitions in Relation to Data and Information as Part of DIKW. International Conference on Enterprise Information Systems.
87. Nargesian, F., K. Q. Pu, E. Zhu, B. G. Bashardoost, and R. J. Miller. (2018). Optimizing organizations for navigating data lakes, 2018. ArXiv: 1812.07024.
88. Neto Susana (2016). Water governance in an urban age. Utilities Policy. Volume 43, Part A, Pages 32-41.
89. New Zealand Digital Skills Forum (2018), Digital Skills for a Digital Nation: An Analysis of the Digital Skills Landscape of New Zealand, New Zealand Digital Skills Forum, https://digitalskillsforum.files.wordpress.com/2018/01/digital-skills-for-a-digital-nation-online.pdf (accessed on 27 August 2019).
90. Nokkala Tina, Hannu Salmela, Jouko Toivonen (2019). Data Governance in Digital Platforms. Conference: AMCIS 2019, At Cancún, México.
91. OECD (2019), Digital Government Review of Sweden: Towards a Data-driven Public Sector, OECD Publishing, Paris, https://doi.org/10.1787/24131962.
92. Office of the Government Chief Information Officer (2019), Public Service Data Strategy 2019-2023, Government of Ireland, https://www.osi.ie/wp-content/uploads/2018/12/Public-Service-Data-Strategy-2019-2023.pdf (accessed on 23 August 2019).
نادر نقشینه و ... دو فصلنامه فناوری اطلاعات و ارتباطات ایران، سال سیزدهم، شمارههای 49 و 50، پاییز و زمستان1400، صفحه 57 الی 84
دو فصلنامه علمي فناوري اطلاعات و ارتباطات ایران | سال سیزدهم، شمارههاي49و50، پاییز و زمستان 1400 صص: 57_84 |
|
ارائه چارچوبی برای داده گان ملی با تمرکز بر توسعه حاکمیت داده
نادر نقشینه* فاطمه فهیم نیا** حمیدرضا احمدیان***1
* دانشیار، دکتری علم اطلاعات و دانش شناسی ، دانشیار دانشکده مدیریت ، دانشگاه تهران
** دانشیار، دکتری علم اطلاعات و دانش شناسی ، دانشیار دانشکده مدیریت ، دانشگاه تهران
*** دانشجوی دکتری علم اطلاعات و دانش شناسی ، دانشگاه تهران
تاریخ دریافت: 24/10/1399 تاریخ پذیرش: 18/02/1400
نوع مقاله: پژوهشی
چکیده:
هدف این پژوهش طراحی جامع برای دادگان ملی میباشد و صرفاً به مفهوم جمعآوری و یا ذخیرهسازی اطلاعات نمیباشد؛ بلکه سناریوهای راهبری، توسعه، دسترسپذیری، ارتقا زیرساخت و نظایر آن را به عنوان اهداف فرعی در نظر دارد. مهمترین مؤلفههای برنامه موفقیت حاکمیت داده براساس الگوریتم ژنتیک مشخص شد و شاخصهای کلیدی بر اساس مدل دلفی احصاء شدند و شناسایی مؤلفههای حاکمیت داده در ساماندهی دادگان ملی با استفاده از تحلیل عاملی اکتشافی و روش متدولوژی سیستمهای نرم، استخراج مؤلفههای دادگان ملی در راستای توسعه حاکمیت دادهها صورت گرفت. در نهایت از روش واریماکس برای ماتریس همبستگی و تأثیر مؤلفهها بر همدیگر استفاده شد و با استفاده از الگوریتم ژنتیک، بهینهسازی لازم صورت گرفت و با تحلیل عاملی مرتبه اول و دوم، مدل نهایی شد. با استفاده از روش کتابخانهای و تحلیل متون لیستی از مؤلفهها و شاخصها استخراج شد. سپس با اعمال نظر 22 خبره و متخصص، 10 مؤلفه اساسی نهایی شدند. برای تحلیل دادهها از نرم افزار smartPLS استفاده شده است و جامعه آماری پرسشنامه مدیران فناوری اطلاعات، اساتید دانشگاه، صاحبان کسبوکارها بودهاند. روش ترکیبی اکتشافی، مدل پیشنهادی و شاخصهای استخراج شده مبتنی بر مدل مفهومی، مبنای ارائه چارچوب دادگان ملی برای توسعه حاکمیت داده میباشد. سپس شناسایی شاخصهای احصاء شده در فراترکيب در پنج گروه شاخصهای ورودی، خروجی، نتیجه، فرآیند و تأثیر دلفی خلاصه شدند.
[1] نویسنده مسئول: حمیدرضا احمدیان ، hr.ahmadian@ut.ac.ir
واژگان کلیدی: حاکمیت داده، خزانه داده، دادگان ملی، راهبری داده، نظام داده و اطلاعات، مدیریت داده.
1. مقدمه
دادگان ملی، یعنی مجموعه از دادههای منتج شده از تعامل سیستمی در کشورکه اندازه آنها فراتر از حدی است که با نرم افزارها یا روشهای معمول بتوان آنها را در یک زمان قابل قبول؛ دریافت، ذخیره، مدیریت و پردازش کرد [1 و 2]. مهمترین مولفه دادگان ملی حجم می باشد و دلیل این امر، تولید مداوم داده توسط ابزارها و سیستمهای دیجیتال است. نکته بعدی در ساختار است که دادگان ملی بر خلاف نگاه سنتی؛ غیرمتمرکز و توزیع شده است و ساختار منسجمی ندارد (بدون ساختار/ نیمه ساختار) [3] از سوی دیگر مدل دادهها در دادههای سنتی، مدلی ثابت است در حالی که داده ملی، مدل مشخص و ثابتی ندارند. ارتباطات داخلی بین دادههای سنتی پیچیده است در حالی که در دادگان ملی ارتباط داخلی پیچیدهای بین دادهها وجود ندارد. فرآیند جمع آوری دادگان ملی، در ابتدا با هدف ثابتی نیست. مقدار زیادی داده جمع آوری میشود و این که ارزش یا پتانسیل استفاده از داده چقدر است بعد از جمع آوری مشخص میگردد. به همین دلیل گفته میشود که دادهها برای اهدافی جمع آوری شدهاند که از قبل بطور دقیق مشخص نشدهاند [4 و 5] دادگان ملی به این دلیل که صرفاً حجم زیادی از اطلاعات را در اختیار دارند اهمیت چندانی ندارند؛ بلکه این نحوه ذخیرسازی، بازیافت، استفاده و نحوه بهرهبرداری از این اطلاعات است که اهمیت دارد. پژوهش های متعدد، کمتر به موضوع سناریوهای یکپارچه مدیریت داده های ملی پرداخته شده است و نگاه در طرح مدل به سمت داده و اطلاعات یک سازمان متصور شده است. نکته دیگر توجه به این موضوع است که در اکثر مطالعات معماری ذخیره سازی داده های با ابعاد متوسط مبنا قرار گرفته شده است.
در حالی که امروزه گفتمان «داده به عنوان دارایی» به خوبی پذیرفته شده است، سازمانها، از جمله بخش دولتی، اغلب در مدیریت و ارزش گذاری دادهها به مانند سایر داراییهای مرتبط با موفقیت آنها ناکام هستند. این امر امکان استفاده از فرصتهای ایجاد شده توسط «دادههای گستردهای از اطلاعات که قبلاً غیرممکن بود» را تضعیف میکند. سازمانهای دولتی و خصوصی اغلب با چالشهایی نظیر میراثی که از مدلهای تجاری آنالوگ به ارث رسیدهاند، زیرساختهای دادههای منسوخ شده تا شکاف مهارت، موانع نظارتی، عدم رهبری و پاسخگویی و و فرهنگ سازمانی مستعد ابتکار و نوآوری دیجیتالی و تغییر روبرو هستند [6]. چالشهای جدیدی نیز ناشی از سوءاستفاده از دادههای شهروندان و موارد سوءاستفاده، بطور عمده توسط سازمانهای بخش خصوصی است. این امر با ناتوانی دولتها در انجام اقدامات پیشگیرانه، همگام با تحولات فناوری و درک پیامدهای سیاسی دادهها از نظر اعتماد و حقوق اساسی یکی شده است [7]. بنابراین نقش و جایگاه حاکمیت داده نه تنها در شفافیت دادگان، بلکه در توسعه و توزیع بهینه آن می تواند موثر باشد. حاکمیت داده (حکمرانی داده1).
مهمترین جنبه های مدلسازی از دادگان، راهبرد حاکمیت صحیح آن با اهداف متعدد از جمله توسعه کسب و کار همراه است. طی همه سالها با مفاهیمی همچون بانک اطلاعاتی، دریاچه داده، بازارگاه داده مواجه بوده ایم که در سناریوی یکپارچگی دادگان و مدیریت یکنوا در سطح ملی پاسخگو نمی باشد زیرا در کنار تبعات سیاسی و مالکیت دادگان، مشکلات دوچندان در مدیریت و اصالت پذیری دادگان را مواجه هستیم. بنابراین طرح خزانه داده ملی می تواند راهکاری مطمئن برای برون رفت از مکانیزمهای اشتباه در حوزه دادگان ملی باشد. خزانه دادهها2 یعنی دسترسی به دادههای بسیارزیادی که طی سالیان متمادی در ارتباط با موضوعات متعدد گردآوری شده است تا در فرایند پرسوجو، تلفیق یا ترکیب اطلاعات به تصمیم گیری ویا در شرایط تصمیم سازی به آنها کمک نماید. مخزن داده همچنین به عنوان یک کتابخانه داده یا بایگانی دادهها شناخته میشود [8]. خزانه داده یک اصطلاح کلی برای مراجعه به مجموعه دادههای جدا شده جهت استخراج برای گزارش و تجزیه و تحلیل دادهها است. خزانه داده داده یک زیرساخت بزرگ دیتابیس است که مجموعه دادهها را برای تجزیه و تحلیل داده، به اشتراک گذاری و گزارش جمع آوری، مدیریت و ذخیره میکند و یک اصطلاح تا حدودی کلی است که برای مراجعه به مقصد تعیین شده برای ذخیره دادهها استفاده میشود.
"خزانه داده" شامل ايجاد و نگهداری يك مجموعه دادهای و فرآيند اکتساب اطلاعات سودمند از دادههای ذخیره شده است؛ به عبارت سادهتر، روشي است برای فرآيند جمع آوری داده ها (از انواع مختلف که برای سازمان داخلي يا خارجي هستند)، ثبت آن در يك قالب خاص، و ايجاد امکان بازرسي دادهها برای کاربران نهايي سازمان به روشهای مختلف به منظور ارزش سنجي دادهها صورت میگیرد [9]. مخازن داده با بهره گيـري از معمـاري، متـدلوژي، و فنـاوري ويـژه يـك سـازمان را قـادر میسازد كـه دادههای خـود را به نحوي بهينه بكار گرفتـه تـا بـار كـاري بـر روي سیستمهای پايگـاه داده اصـلي بـه كمتـرين مقـدار برسـد. يـك خزانـه داده، دادههای خود را از يـك پايگـاه اصـلي و عمليـاتي گرفتـه و بـا انجـام پردازشهایی بـر روي آنها بـه گونهای آنها را ذخيره میکند كـه ايـن دادهها بـه فرمـت و اشـكال بـسيار مـوثرتري قابـل دريافـت باشـند [6].
خزانه داده ملی 3 همانند یک بانک اطلاعات است که به دنبال حفظ و ترویج دادههای مربوط به منابع یک کشور است. یک خزانه ملی داده معمولاً توسط نهادهای مستقر، با رویکرد کنترل و پشتیبانی از تبادل، ضبط، انتقال و توزیع اطلاعات تأسیس میشود، و هدف نهایی برای ارائه ابزار و اطلاعات به کشور برای اطمینان از رشد، توانایی دولت، کنترل، استقلال و حاکمیت اطلاعات است [10]. دو دلیل اساسی هر کشور برای ایجاد مخزن دادههای ملی، حفظ دادههای تولید شده در داخل کشور توسط صنعت و ترویج سرمایه گذاری در کشور با استفاده از دادهها برای کاهش خطرات اکتشاف، تولید و حمل و نقل است. برخی از مخازن دادههای ملی کاملاً توسط دولت یک کشور تأمین میشوند و برخی از آنها سیستمهای ترکیبی هستند که بخشی از آن توسط صنعت و دولت تأمین میشوند. مخزن دادههای ملی معمولاً هزینههای درخواست داده و بارگیری داده را میپردازند [11]. یک مخزن داده باید دارای 4 ویژگی باشد که عبارت است از: موضوع گرا، یکپارچه، غیرفرار و متغیر با زمان است
2. مرور پیشینه پژوهش
الف - مطالعات حوزه حاکمیت داده در ایران
با توجه به اهمیت توجه به دادگان ملی و تسری موضوعات حاکمیت داده، انتظار میرود این موضوع در پژوهشهای حوزه مدیریت کشور مورد توجه قرارگرفته باشد؛ اما مروری بر متون مدیریت دادگان در ایران نشان می دهدکه علیرغم اهمیت روزافزونی که مدل و معماری سازماندهی و استفاده از دادگان ملی در کشور دارد ولی کمتر به این موضوع پرداخته شده است. بخش زیادی از پژوهشها طی سالهای اخیر به موضوع حاکمیت داده در سازمانها و بخش های کاری از قبیل بانک و بیمه پرداخته و پیشنهادات حاصل شده از تحقیقات قابلیت انشار به کل کشور به عنوان یک اکوسیستم کامل را نداشته است از جمله این پژوهش ها می توان به مطالعه حاکمیت داده در حوزه سلامت [12] و حاکمیت داده محور با رویکرد دولت الکترونیکی [13] ، مدلسازی داده های بزرگ [14]، بررسی جوانب انبارداده [15]، بهبود کارایی در انبار داده [16]، حاکمیت داده در صنعت بیمه [17]، حاکمیت داده در صنعت بانکی [18]، چارچوب های حاکمیت داده [19] اشاره نمود.
تعدادی از پژوهشها نیازمندی و مولفه های کلیدی موردنیاز ازجمله کیفیت داده و استانداردسازی و کدینگ را هدف قرار دادند از جمله می توان به مطالعاتی نظیر مدیریت کیفیت داده، سازماندهی و پاسخگویی[20]، الزامات ارزیابی بلوغ مدیریت داده [21]، خوشه بندی داده ها با هدف کاهش زمان جستجو [22]، بررسی امنیت در انبار داده ها [23]، بهبود عملکردی امنیت یکپارچگی پایگاه دادههای تجاری [24]، تهدیدات و تمهیدات پایگاه داده [25] می توان اشاره داشت.
از زمره مطالعات اندکی که در ارتباط با موضوع می توان اشاره داشت، مطالعه ارائه یک روش جدید برای ذخیره سازی و دسترسی به دادهها در پایگاه دادههای بزرگ توزیع شده مبتنی بر استخراج، پالایش و بارگذاری اطلاعات [26] و طراحی چارچوب حاکمیت داده در مراکز تبادل داده و اطلاعات ملی [27] می باشد. بنابراین پژوهشگر نتوانست پژوهشی با هدف یافتن مدل مرجعی برای حاکمیت دادگان بزرگ و یا مدلسازی راهبردی دادگان ملی بیابد.
ب - مطالعات حوزه خزانه داده
نوکالا4 و همکاران (2019) در پژوهشی با عنوان «حاکمیت دادهها در سیستم عاملهای دیجیتال» یک چارچوب مقدماتی مبتنی بر ادبیات برای مدیریت دادههای پلتفرم با پنج حوزه کیفیت دادههای اصلی، مالکیت و دسترسی؛ مباشرت کیفیت دادههای پلت فرم و ارزش استفاده از دادهها پیشنهاد دادند [28]. الحسن5 و همکاران (2019) پژوهشی با عنوان «عوامل موفقیت بحرانی برای مدیریت دادههاانجام دادند. هدف از این تحقیق، ارائه فاکتورهای مهم موفقیت برای حاکمیت دادهها است. این مقاله به یک مطالعه موردی واحد میپردازد که دادهها از طریق مصاحبههای نیمه ساختار یافته به دنبال رویکرد فاکتورهای مهم موفقیت جمع آوری شده و با استفاده از تکنیکهای کدگذاری باز، محوری و انتخابی مورد تجزیه و تحلیل قرار میگیرد. این یافتهها به عنوان هفت فاکتور مهم موفقیت ارائه شده است که به ترتیب از نظر اهمیت رتبه بندی میشوند. علاوه بر این، نیاز به درک بهتر روابط (بهم پیوسته) بین فاکتورهای مهم موفقیت را برجسته شده است [29].
3. هدف و پرسش های پژوهش
هدف پژوهش حاضر تعیین شاخص های کلیدی راهبری دادگان ملی با هدف ایجاد چارچوبی برای دادگان ملی با هدف توسعه حاکمیت داده است. در این راستا پژوهش حاضر درصدد است که به سوالات زیر پاسخ دهد.
1. مولفه های کلیدی و تاثیرگذار حاکمیت داده برای داده گان ملی چیست؟
2. ناحیه دانشی حاکمیت داده برای داده گان ملی دارای چه ویژگی هایی می باشد؟
3. مدل مفهومی مبتنی بر شاخص های مورد انتظار و میزان همبستگی شاخص ها برای داده گان ملی چیست؟
4. بازیگران اصلی و ارتباط بین بازیگران چگونه است؟
5. معماری نگهداری و مدیریت داده گان ملی چگونه است؟
6. پارامترهای حفظ داده گان ملی و تحقق حداکثری امنیت داده گان چیست؟
7. مدل بهینه برای دادگان ملی باهدف تحقق حاکمیت در بخش فناوری اطلاعات چگونه است؟
4. روش پژوهش
رویکرد پژوهش حاضر کیفی است از روش فراترکیب جهت ارزیابی منابع علمی استفاده شده است فراترکیب به عنوان یکی از حوزه های فرامطالعه6، رویکردی نظام مند برای ترکیب پژوهش های کیفی مختلف در راستای کشفِ زمینههای فرعی و اصلی است که موجب ارتقای دانش جدید شده و دید جامعی از حوزه مورد بررسی به وجود میآورد. این روش مستلزم آن است که پژوهشگر بازنگری دقیق و عمیقی پیرامون موضوع پژوهش انجام دهد و یافته های پژوهش های کیفی مرتبط را ترکیب و از این طریق نمایش جامعی از پدیده های مورد بررسی را نشان دهد. به عبارت دیگر استفاده از فراترکیب خاصیت هم افزایی دارد و نتیجه را به دست می دهد که بزرگتر از مجموعه بخش هایش است. به طور معمول بررسی مقاله ها و مستندات علمی با توجه به عمق مطالعه در این رویکرد کمتر از ۷۰ مورد است [30 و31].
این روش به طور ویژه در علومی که مطالعات آن بیشتر مبتنی بر تحلیل کیفی است و مبانی نظری وسیعی را شامل نمی شوند کاربرد دارد از آنجا که مطالعات مرتبط با مفهوم خزانه داده در حال حاضر بیشترکیفی است و تا زمان انجام پژوهش حاضرمدل جامعی که ابعاد مختلف خزانه داده ملی را در برگیرد یافت نشده است؛ روش فراترکیب به عنوان روش مناسبی برای شناسایی و به دست آوردن ترکیب جامعی از مولفه ها و ابعاد اصلی تحقیق بکار گرفته شده است. از این رو برای بهره گیری از روش فراترکیب در این پژوهش ، از
روش هفت مرحله ای سندلوسکی و بارسو7(2007) استفاده شده است که در شکل(1) نشان داده شده است.
شکل 1. مراحل هفت گانه فراترکیب [32]
روش فراترکیب به عنوان روشی کامل شناخته می شود، زیرا از فنون، روش ها و ابزارهای مختلفی جهت شناسایی پدیده موردنظر استفاده می کند و پایش های مختلفی در بین تعداد زیادی از منابع مورد استفاده قرار می گیرد. اعتبار این روش نیز در خود آن تأیید می شود. جامعه آماری پژوهش شامل کلیه آثار علمی مربوط به مبانی و ابعاد خزانه داده شامل 187 مقاله مرتبط بین سالهای 2010 تا 2020 میلادی برای منابع انگلیسی و 1388 تا 1399 خورشیدی برای منابع فارسی است که از این تعداد و پس از طی مراحل غربالگری تعداد 45 اثر برای استخراج مدنظر قرار گرفت.
گام اول : تعیین مؤلفههای کلیدی مدل
برای پاسخ به سوال اول پژوهش، جستجوی مقالات در پایگاه های اطلاعاتی WOS, Scopus, Science Direct, ProQuest با کلید واژههای Models ، Structure، Priority به همراه عبارات Data Aggregation، Data Governance، Security،Distributed Networks ، data Managements با اعمال محدودیت های زبان انگلیسی انجام گرفت. در این مطالعه، کلیة مطالعات تحت پوشش پایگاهها که تا آخر خرداد سال 1399 منتشر شده بودند، در نظر گرفته شد. پس از حذف موارد تکراری و کمتر وابسته،47 مقاله برای بررسی بیشتر باقی ماند وپس از بررسی نتایج و روش مدلسازی و چکیدة مقالات، 31 مقاله به عنوان مقالات مرتبط با طراحی مولفه های کلیدی مدنظر قرار گرفت. در ادامه نیز با استفاده از روش طوفان فکر با متخصصان و تطابق با پارامترهای استخراج شده از مصاحبه ها، مولفه ها نهایی گردید.
گام دوم : ترسیم ناحیه دانشی چارچوب حاکمیت داده
نیازمند توجه به مولفه های راهبردی حاکمیت داده در حوزه راهبری دادگان می باشیم و برای ترسیم ناحیه دانشی حاکمیت داده که در واقع پاسخ به سوال دوم پژوهش می باشد . جستجوی مقالات در پایگاه های اطلاعاتی WOS, Scopus, Science Direct, ProQuest با کلید واژه های Models ، schema به همراه عبارات Data trust ، Data Governance، Data Security ، data Managements با اعمال محدودیت های زبان انگلیسی انجام گرفت. در این پژوهش، کلیة مطالعات تحت پوشش پایگاه ها که تا آخر خرداد سال 1399 منتشر شده بودند، در نظر گرفته شد.در مجموع 82 مقاله مرتبط بررسی گردید و با استخراج مولفه های دانشی حاکمیت ، شاخص های موردنیاز احصا شد. ناحیه دانشی بر اساس مطالعات پژوهشگران پیشین بر سه محور استانداردسازی، مدیریت و انتشار، شفافیت پیش بینی گردید.
مراحل جمع آوری اطلاعات با توجه به استفاده از الگوی پژوهش به شرح ذیل انجام شد:
مرحلة اول: سوالات تحقیق مشخص شد و با توجه به سؤالهای " مولفه های کلیدی و تاثیرگذار حاکمیت داده برای داده گان ملی چیست؟" و "ناحیه دانشی حاکمیت داده برای داده گان ملی دارای چه ویژگی هایی می باشد؟" به یک چارچوب اولیه از مولفه ها و ناحیه کاری مورد نظر رسیدیم.
مرحلة دوم: مقالات مناسب برای احصاء شاخص ها شناسایی شد؛
مرحلة سوم: اطلاعات مدنظر برای شناسایی زیر شاخص ها انجام پذیرفت؛
مرحله چهارم : مدل مفهومی اولیه متناسب با مولفه ها، شاخص ها و زیر شاخص ها تبیین شد؛
مرحله پنجم: مولفه ها با بررسی و تحلیل خبرگانی نهایی شد؛
مرحله ششم : به منظور تطبیق و نهایی سازی زیر شاخص ها مصاحبه با 20 خبره در حوزه مدیریت داده صورت پذیرفت؛
مرحله هفتم : شاخص ها و زیر شاخص ها احصا شده در دو گروه "مدیریت و راهبری" و "فنی، حقوقی" بصورت پرسشنامه منتشر گردید؛
مرحله هشتم: داده های گردآوری شده از پرسشنامه تحلیل و واکاوی آماری شد؛
مرحله نهم : مدل ارزیابی و نهایی گردید؛
5. یافته ها
5-1- مولفه های کلیدی و تاثیرگذار حاکمیت داده برای داده گان ملی چیست؟
پس از بررسی مطالعاتی که به حاکمیت داده پرداخته اند و مصاحبه با صاحبنظران، ده مولفه اصلی طبقه بندی شده اند (جدول 1). حروف بیانگر کد تخصیص داده شده به هر مولفه می باشند. همچنین طی مصاحبه ها هدفگذاری تبیین برخی شاخص های کلیدی برای هر مولفه مدنظر قرار گرفت و منطبق با مطالعات بالادستی ، لیستی از این شاخص ها احصاء گردید.
جدول 1. پارامترهای کلیدی
مدیریت /راهبری | امنیت | کسب وکار | معماری | تکنولوژی | داده/اطلاعات | قوانین | محیط توسعه | زیرساخت | کاربران |
M | S | B | A | T | DI | R | ED | I | U |
5-2- ناحیه دانشی حاکمیت داده برای داده گان ملی دارای چه ویژگی هایی می باشد؟
از مجموع بررسی 82 مقالات حوزه حاکمیت دانش با تمرکز بر مهمترین ظرفیت های آن بر دادگان ملی، جدول زیر (جدول2: پارامترهای احصائ شده برای ناحیه دانشی حاکمیت داده) استخراج گردید. مهمترین دلیل احصاء ناحیه دانشی توجه به مهمترین ویژگیهای مورد انتظار در راهبری و سازماندهی دادگان ملی می باشد.
جدول 2. ویژگی های احصا شده برای دادگان
ردیف | موضوع | منبع |
1 | استفاده از محیط مناسب فرهنگی، سیاسی، قانونی، نظارتی، نهادی، سازمانی و فنی | [33]؛ [1] |
2 | نظام سیاست گذاری منسجم در حوزه داده | [34]؛ [1] |
3 | مدلهای نگهداری و دسترسی به دادگان | [35]؛ [36]؛ [34] [37]؛ [38]
|
4 | محرمانگی، امنیت، دسترس پذیری در نحوه ذخیره سازی | [34]؛ [36]؛ [39]؛ [28] |
5 | تضمین مدیریت منابع دادهای | [40]؛ [41] |
6 | یکپارچگی، قابلیت استفاده | [34] |
7 | نظارت بر دادهگان، شیوههای بهینه در سازماندهی | [37]؛ [42] |
8 | اطمینان از کیفیت و اطلاعات | [43]؛ [44]؛ [28] |
9 | مستند سازی و تهی نسخه پشتیبان از داده | [45] |
10 | ضرورت وجود مدل و معماری مطلوب | [40]؛ [46]؛ [41] |
ویژگی ها با بسامد تکرار بالاتر و تمرکز بر راهبری دادگان با توجه به احصا و کد گذاری نظر خبرگانی به صورت شکل زیر جمع بندی گردید. بنابراین ناحیه دانشی برای دادگان ملی به صورت شکل (2) ترسیم گردید.
شکل 2. ناحیه دانشی احصا شده
5-3- مدل مفهومی منطبق بر شاخص های مورد انتظار و میزان همبستگی شاخص ها مبتنی بر حاکمیت داده برای داده گان ملی چیست؟
با استخراج مصاحبه های انجام شده و تطبیق شاخص های احصاء شده با مقالات نمونه ( بررسی 82 مقاله مرتبط تا تاریخ خرداد 1399 مدنظر قرار گرفته است) جدول زیر (جدول3) به عنوان جدول شاخص های راهبری دادگان ملی ترسیم گردید.
جدول3. جمع بندی شاخص ها راهبری دادگان ملی
ردیف | مولفه | نماد | شاخص |
1 | مدیریت / راهبری | M | منابع / پشتیبانی بهینه خدمات / حریم شخصی کاربران /توسعه سرزمینی / ساختار/ برنامه راهبردی |
2 | امنیت | S | دسترس پذیری / احراز هویت / مالکیت معنوی |
3 | کسب و کار | B | مدیریت دانش / کسب و کار |
4 | معماری | A | معماری داده،اطلاعات / متدلوژی توسعه |
5 | تکنولوژی | T | پلت فرم های نرم افزاری |
6 | داده / اطلاعات | DI | داده استاندارد / داده باز/ مدیریت داده / فراداده |
7 | قوانین و مقررات | R | قوانین و مقررات |
8 | محیط توسعه | ED | مهارت و دانش |
9 | زیرساخت فنی | I | زیر ساخت فنی، ارتباطی |
10 | کاربران | U | کاربران بالقوه |
برای تحلیل جدول فوق ، پرسشنامه لازم تهیه و به طرق مختلف منتشر گردید. تحلیل ضریب مسیر به عنوان یکی از تحلیل های این جدول مدنظر قرار گرفت . تحلیل ضریب مسیر، بیان کننده وجود رابطه علی خطی و شدت و جهت این رابطه بین متغیرهاست. در حقیقت همان ضریب رگرسیون در حالت استاندارد است که در مدل های ساده تر رگرسیون ساده و چندگانه مشاهده می شود. عددی بین 1- تا +1 است که اگر برابر با صفر شوند ، نشان دهنده ی نبود رابطه ی علی خطی بین دو متغیر پنهان است. با توجه به شاخص های احصا شده در این قسمت، نسبت به بررسی و تحلیل عاملی مرتبه دوم مولفه های مورد مطالعه، به شرح زیر اقدام می شود:
شکل 3. تحلیل ضریب بتا
با توجه به نتایج حاصل شده در این قسمت مشاهده شد که بیشترین علیت را مدیریت/راهبری با ضریب 0.3 دارد. همچنین در ادامه نیز کاربران با ضریب 0.05، زیر ساخت فنی با ضریب 0.05، محیط توسعه با ضریب 0.04، قوانین و مقررات با ضریب 0.06، داده و اطلاعات با ضریب 0.2، تکنولوژی با ضریب 0.04، معماری با ضریب 0.1و کسب و کار با ضریب 0.1و امنیت با ضریب 0.1 از علیت های متفاوتی برخوردار هستند.
شکل4. برازش مدل در مقطع T-value
با توجه به نتایج حاصل شده در این قسمت مشاهده شد که بیشترین علیت را مدیریت/راهبری با ضریب 16.84 دارد. همچنین در ادامه نیز کاربران با ضریب 10.76، زیر ساخت فنی با ضریب 6.69، محیط توسعه با ضریب 6.67، قوانین و مقررات با ضریب 15.39، داده و اطلاعات با ضریب 23.26، تکنولوژی با ضریب 5.66، معماری با ضریب 13.53 و کسب و کار با ضریب 16.44 امنیت با ضریب 16.30 از علیت های متفاوتی برخوردار هستند.
همچنین با تحلیل برای پایایی و روایی مولفه ها مشاهده شد که تمامی مولفه های مورد مطالعه در سطح معناداری کمتر از 5 درصد، ضریب تی ولیو بیشتر از 1.96 و همچنین ضرایب بتای قابل قبولی برخوردار هستند. شاخص آلفای کروبناخ برای تمامی مولفه های مورد مطالعه بیشتر از 0.7 میباشد، شاخص CR نیز در مقدار عددی قابل قبولی است.
روایی واگرای قابل قبول یک مدل، حاکی از آن است که یک سازه در مدل تعامل بیشتری با شاخصهای خود دارد تا با سازههای دیگر. روایی واگرا وقتی در سطح قابل قبول است که AVE برای هر سازه بیشتر از واریانس اشتراکی بین آن سازه و سازههای
جدول4. بررسی پایایی مولفه های مدل شده
دیگر(یعنی مربع مقدار ضرایب همبستگی بین سازهها)در مدل باشد.
جدول 5. بررسی روایی واگرا توسط ماتریس فورنر لارکر
با توجه به نهایی شدن مولفه ها و شاخص های مورد انتظار می توان مدل مفهومی برای دادگان ملی را ترسیم نمود. کسب وکار و یا هر مکانیزم خدمت، نیازمند داده است و اساساً داده و اطلاعات عامل هویت ابزار هستند. بنابراین در مورد دادگان ملی علاوه بر پارادایم های مدیریت دادگان و تضمین امنیت و کیفیت، نیازمند ترسیم یک اکوسیستم جامع در تحقق حاکمیت با رویکرد سیاستگذاری و نظارت هستیم. این ادبیات در قالب ساختار یکپارچه و توزیع یافته بلوغ می یابد. خزانه داده به مفهوم ایجاد یک ساختار یکسان و یکباره برای دادگان یک کشور نیست و نباید تلقی شود که به دنبال یک انبار داده بزرگ در ابعاد ملی باشیم. بنابراین با توجه به شاخص های احصا شده که پیشتر به آن پرداخته شد نیازمند طراحی یک مدل مفهومی اولیه برای دادگان ملی هستیم. این مدل مفهومی ارتباط بین سازماندهی دادگان ملی و شاخص های احصا شده را نشان می دهد و می تواند به ایه های تصمیم گیری کمک به طراحی مدل اجرایی و تجاری نماید.
مباحث حاکمیت داده دارای نقاط مشترک زیادی با حوزه فناری اطلاعات میباشد از جمله در زمینههای دادههای بزرگ، هوش تجاری، سیستم عامل منابع سازمانی، مدیریت چرخه محصول، مدیریت اطلاعات تولید محصول، مهارت مدیریت داده، مهارت حاکمیت داده. بنابراین می توان انتظار داشت بسیاری از شاخص ها و رویکرد طراحی مدل مطلوب دارای نقاط اشتراک واضحی با طرحهای فناوری اطلاعات داشته باشد. زیرا غایت اجرایی رسیدن به مدلی است که قابل ممیزی و نظارت فنی نیز باشد. در شکل (5) مدل مفهومی پژوهش ترسیم شده است.
شکل 5. مدل مفهومی نگهداری دادگان ملی (خزانه داده)
[1] . Water Governance
[2] . Data Repository
[3] . National Data Repository (NDR)
[4] . Nokkala
[5] . Alhassan
[6] . Meta Study
[7] . Sandelowski & Barroso
5-4- بازیگران اصلی و ارتباط بین بازیگران چگونه است؟
توجه به بازیگران در طراحی مدل، جزئی از اقدامات اصلی در موفقیت مدل می باشد زیرا یکی از مهمترین سوالات در زمینه طراحی، پاسخ به سوال "چه کسی" می باشد. بنابراین این سوال به عنوان یکی از سوالات اصلی پژوهش مطرح می باشد. اقدامات کلان در حوزه دادگان، در هسته اصلی خود به تیمهای اجرایی نیاز دارند تا میزان آمادگی آنها را برای اجرای پروژه ارزیابی کنند. این ارزیابی شامل تعیین چگونگی دستیابی به داده و اطلاعات است. در مسیر تعامل ذی نفعان، کیفیت دادهها باید ارزیابی شوند و همچنین بررسی اینکه آیا دادهها میتوانند نیازهای تجاری همه سیستمها را پشتیبانی کنند. رهبری سازمان نیاز به ایجاد ضرورتهای تجاری دارد. هر ذی نفع نیاز به مستندسازی و اولویتبندی کارهای کیفیت دادهای دارد که باید تکمیل شوند و چالشهای طولانی مدت مانند فقدان استانداردهای مستند، درک ابرداده و کیفیت پایین دادهها باید مورد توجه قرار گیرد (لوشین، 2010).توجه به ذی نفعان که می توانند داخلی و یا خارجی باشند از اهمیت بالایی برخوردار است. ذی نفع داخلی شامل افراد یا گروههای هستند که متولی نگهداری و تضمین کیفیت و استاندارد داده ای می باشند. در مطالعه 5گروه ذینفع شناسایی گردید که هم تولید کننده و هم استفاده کننده از دادگان می باشند. همانطور که در شکل زیر (شکل 6) مشاهده می شود فارغ از حجم تراکنش ها می توان بازیگران اصلی را رصد نمود.
شکل 6. ماهیت بازیگران مدل
5-5- معماری نگهداری و مدیریت داده گان ملی چگونه است؟
پیچیدگی فرآیند توسعه مخزن (خزانه) داده برای موفقیت نیاز به پیروی از یک روش شناختی دارد. یک رویکرد گسترده پذیرفته شده برای توسعه، روش ترکیبی است که در آن الزامات و منابع داده باید در مدل جدید مخزن (خزانه) داده جای بگیرند (مته وتروجلی، 2012). از سوی دیگر برای راهبری داده در یک سازمان نوین داده محور، نیاز به معماری یکپارچه برای ذخیره داده در مرحله اول و سپس پردازش آن هست که مباحث مدیریتی و راهبری داده هم در آن لحاظ شده باشد [47]. در طراحی خزانه داده، ترکیبی از هر دو معماری متمرکز و نیمه متمرکز را خواهیم داشت و مهمترین دلیل آن گستردگی و عدم تطابق فرآیندی در حوزه های مختلف می باشد. بنابراین موضوع اول مولفه های مدنظر در معماری و مسئله بعدی شاخص های معماری می باشد. در شکل (7) مولفه های معماری مطلوب در طراحی خزانه داده به تصویر کشیده شده است. توسعه مخزن (خزانه) داده یک کار مداوم است که در آن دائماً الزامات جدید اضافه میشود بنابراین نیازمند یک معماری مدل محور هستیم. برای اینکه بتوان شاهد حکمرانی داده در تمامی واحدهای اداری بود یعنی تمامی دادههای سازمانی را به صورت یکپارچه و مدیریت شده و در راستای افزایش بهره وری و تصمیم سازی های کلان به کار برد، نیازمند یک معماری داده جدید منطبق با نیازهای عصر کلان داده هستیم. ساختاری که ضمن حفظ استقلال نرم افزارها و دادهها در بخشهای مختلف، به تحلیلگران و مدیران اجازه بررسی و استفاده از تمامی اطلاعات سازمان را به صورت مدیریت شده بدهد و انواع گزارش گیریها و تحلیلها را برای آنها میسر سازد [47].
با بررسی 56 مقاله و تفکیک 23 مقاله مجموعه ای از مهمترین پارامترهای موثر بر معماری خزانه داده استخراج گردید و پارامترها استخراج شده در مصاحبه های تخصصی با صاحبنظران به بررسی و چالش قرارداده شد و مجموعه عوامل در جدول پارامترهای موثر بر معماری (جدول 6 ) و شکل 7 (نمودار احصا شده عوامل موثر بر معماری) نمایش داده شده است. اهمیت این سوال در پژوهش به جهت ضرورت پرداختن به چارچوب معماری در کنار شاخص های احصا شده دو چندان می باشد.
جدول 6. پارامترهای موثر بر چارچوب معماری
ردیف | موضوع | منبع | |
1 | امکان دید یکپارچه ، ادغام طرح واره های جزیی | [48]، [49]. [50] | |
2 | توجه به نیازمندی های کاربران نهایی | [51]، [50] | |
3 | منبع حمايت و پشتیباني | [50]، [52]، [53] | |
4 | سطح مورد نیاز برای مديريت اطلاعات | [50]، [54] | |
5 | مسائل فني | [50]، [55]، [56] | |
6 | مخزن داده در طول حیات خود، مجموعهای از عملیات را تکرار ميکند |
| |
7 | نمای خزانه داده قبل از پیاده سازی، تشخیص مقادير پیش محاسباتي، طراحي جدول های ابعاد و واقعي، دریافت و سازماندهی | [57]، [56]، [52] | |
8 | توجه به چارچوب های امن سازی | [53] | |
9 | توجه به معماری همبسته اطلاعات | [55]، [53] | |
10 | درک و تحلیل درست از نیازمندی ها | [56]، [58] |
در ادامه از بعد اجرایی، لازم است تا زیر شاخص های لازم برای شاخص معماری به عنوان یکی از مولفه های کلیدی طراحی دادگان ملی در نظر گرفته شود. در پروسه مصاحبه با خبرگان و مستند بر کلمات کلیدی استخراج شده، 13 زیرشاخص استاندارد، کدینگ سرویس ها، تعداد SLA، قوانین اجرایی، سرویس دیکشنری، سرویس کاتالوگ، سیستم پیگیری فرآیندها، سیستم پردازش فرآیندها، نرخ تبادل، استاندارد شبکه، استاندارد دسترسی، ساختار دادگان، ظرفیت زیرساخت فنی، احصا شد. و با گردآوری اطلاعات از پرسشنامه و تحلیل لازم وابستگی و همگرایی زیرشاخص های احصا شده تعیین گردید.
شکل 8. بررسی رابطه مولفه ها در متغیر معماری
با مشاهده شد که زیرشاخص دهم که نرخ تبادل داده بده است در رابطه شدید تری به نسبت سایر مولفه ها با مقدار عددی 0.907 میباشد.
5-6- پارامترهای حفظ داده گان ملی و تحقق حداکثری امنیت داده گان چیست؟
امنیت یکی از مولفه های اصلی مدل مدنظر ی باشد و دلیل طرح مجزای آن، اهمیت پایه ای آن در مدل و تحقق حداکثری آن می باشد. شاخص های دسترس پذیری، امنیت داده/اطلاعات، احراز هویت، مالکیت معنوی، حریم شخصی کاربران، پلتفرم، زیرساخت و تبادل برای آن احصا شده و پس از ارزیابی و بهینه یابی سه شاخص دسترس پذیری، مالکیت معنوی، احراز هویت طبق جدول (7) نهایی گردید:
جدول 7 . نمای مولفه و شاخص های اصلی در امنیت
مولفه | امنیت | ||
شاخص ها | دسترس پذیری | مالکیت معنوی | احراز هویت |
مبتنی بر هریک از از شاخص ها ، زیرشاخص های قابل پیش بینی با استناد به مقالات و مصاحبه خبرگانی احصا گردید که در جدول (8) نشان داده شده است:
جدول 8. شاخص ها و زیر شاخص های امنیت
دسترس پذیری | احراز هویت | مالکیت معنوی |
دسترسی مجاز آدرس دهی کتابخانه داده ای کاتالوگ داده سیستم لاگ سرویس های امن احراز هویت حسابرسی SLA تبادل امن | امضاء دیجیتال استاندارد پذیرش الگوریتم نفوذ | علائم تجاری حقوق تجاری حقوق ثبت داده حق نشر حق استفاده حق دادههای محرمانه |
با توجه به داده های جمع آوری شده از پرسشنامه، همبستگی شاخص ها بررسی گردید که در نمودارهای زیر قابل رویت می باشد:
شکل 9. بررسی رابطه مولفه ها در متغیر احراز هویت
نتایج حاکی از وجود رابطه معنادار علی در مولفه های خرد در تبیین مولفه ی هدف که احراز هویت میباشد، است. در بررسی ها مشخص گردید که زیرشاخص الگوریتم نفوذ در رابطه شدید تری به نسبت سایر مولفه ها با مقدار عددی 0.950 میباشد.
شکل10. بررسی رابطه مولفه ها در متغیر مالکیت معنوی
با توجه به نتایج حاصل شده در این قسمت مشاهده میشود که مولفه های مورد مطالعه در ضرایب عددی بیشتر از 0.1 میباشند که این امر نشان دهنده وجود رابطه معنادار علی در مولفه های خرد در تبیین مولفه ی هدف که مالکیت معنوی میباشد، است و زیر شاخص حق نشر در رابطه شدیدتری نسبت به سایر مولفه ها قرار دارد.
شکل 11. بررسی رابطه مولفه های سازنده دسترس پذیری
با توجه به نتایج حاصل شده در این قسمت مشاهده میشود که مولفه های مورد مطالعه در ضرایب عددی بیشتر از 0.3 میباشند که این امر نشان دهنده وجود رابطه معنادار علی در زیرشاخص ها در تبیین مولفه ی هدف که دسترس پذیری میباشد، وجود دارد. همچنین تحلیل ها نشان می دهد زیر شاخص سرویس های امن، در رابطه شدید تری به نسبت سایر مولفه ها با مقدار عددی 0.887 میباشد.
5-7- مدل بهینه برای دادگان ملی باهدف تحقق حاکمیت در بخش فناوری اطلاعات چگونه است؟
شاخص های برازش و نکویی محاسبه شده حاکی از مطلوبیت مدل طراحی شده می باشد. در مدل نهایی 10 مولفه ، 21 شاخص و 154 زیرشاخص احصا گردید که در جدول 9 قابل مشاهده می باشد.
جدول 9. نمای کلی از مولفه ها، شاخص ها
ردیف | مولفه | نماد | شاخص | تعداد زیرشاخص |
1 | مدیریت / راهبری | M | منابع / پشتیبانی بهینه خدمات / حریم شخصی کاربران /توسعه سرزمینی / ساختار/ برنامه راهبردی | 35 |
2 | امنیت | S | دسترس پذیری / احراز هویت / مالکیت معنوی | 18 |
3 | کسب و کار | B | مدیریت دانش / کسب و کار | 13 |
4 | معماری | A | معماری داده،اطلاعات / متدلوژی توسعه | 10 |
5 | تکنولوژی | T | پلت فرم های نرم افزاری | 11 |
6 | داده / اطلاعات | DI | داده استاندارد / داده باز/ مدیریت داده / فراداده | 32 |
7 | قوانین و مقررات | R | قوانین و مقررات | 6 |
8 | محیط توسعه | ED | مهارت و دانش | 5 |
9 | زیرساخت فنی | I | زیر ساخت فنی، ارتباطی | 17 |
10 | کاربران | U | کاربران بالقوه | 7 |
در مجموع شاخص های احصاءشده، 154 زیر شاخص که دارای بیشترین تاثیر در استقرار و پایداری خزانه داده را دارا می باشند ، انتخاب شدند. هدف غائی برای دادگان ملی استقرار خزانه داده ای می باشد که بتوان در کنار پارامترهای مدیریتی لازم، حاکمیت داده را نیز تثبیت نمود. پیچیدگی فرآیند توسعه مخزن (خزانه) داده برای موفقیت نیاز به پیروی از یک روش شناختی دارد. یک رویکرد گسترده پذیرفته شده برای توسعه ،روش ترکیبی است که در آن الزامات و منابع داده باید در مدل جدید مخزن (خزانه) داده جای بگیرند [59]. از سوی دیگر برای راهبری داده در یک سازمان نوین داده محور، نیاز به معماری یکپارچه برای ذخیره داده در مرحله اول و سپس پردازش آن هست که مباحث مدیریتی و راهبری داده هم در آن لحاظ شده باشد [47]. بنابراین معماری انتخاب شده برای محصول نهایی استقرار خزانه داده با یک معماری سه لایه منطبق بر اهداف، شاخص ها و زیر شاخص های می باشد. و این معماری سه لایه می تواند ذات داده گان را بیان نماید. در جدول 10 لیستی از مولفه ها، شاخص ها و زیر شاخص های نهایی شده قابل مشاهده می باشد.
جدول 10. شاخص ها و زیر شاخص های نهایی شده برای خزانه دادگان
مولفه | شاخص | زیرشاخص |
داده / اطلاعات | داده های باز | شفافیت |
دسترس پذیری | ||
API | ||
داده های استاندارد | مرجع پذیری | |
قابل انتشار | ||
عدم دستکاری | ||
توکن بندی | ||
پاک بودن داده | ||
کدینگ داده ای مستند | ||
کاتالوگ داده ای | ||
کیفیت داده | ||
حجم داده | ||
دسترس پذیری | ||
توسعه و انتشار | ||
مدیریت داده | مالکیت داده | |
حذف | ||
آرشیو | ||
استاندارد پذیرش | ||
Open API | ||
حجم داده | ||
داده های تمیز | ||
قابل انتشار | ||
دسترس پذیری | ||
کاتالوگ داده | ||
دیکشنری داده | ||
قواعد و مقررات تبادل | ||
کیفیت داده | ||
SLA | ||
فرا داده | دیکشنری متا داده | |
دسترس پذیری | ||
استاندارد | ||
توزیع پذیری | ||
مدیریت/راهبری | مدیریت منابع | بهینه سازی |
سازماندهی تجهیزات | ||
دسترسی | ||
آرشیو | ||
توزیع مطلوب | ||
میزان پذیرش | ||
برنامه راهبردی | توسعه بازار | |
اولویت های راهبردی | ||
نظارت | ||
برنامه مالی | ||
تعهد مدیریتی | ||
اعتماد سازی | ||
پشتیبانی متمرکز و بهینه | اثربخشی | |
مدیریت هزینه | ||
پاسخگویی مطلوب | ||
مرکز تماس | ||
سرویس در لحظه | ||
اولویت بندی سرویس | ||
استاندارد خدمات | ||
دردسترس بودن | ||
حجم صف درخواستها | ||
پشتیبانی برخط | ||
پرسش و پاسخ | ||
پوشش جغرافیایی | ||
دسترس پذیری به دادگان | ||
ساختار | نیروی انسانی | |
مدل اقتصادی | ||
توسعه سرزمینی | توزیع پذیری | |
دسترس پذیری | ||
شبکه ملی اطلاعات | ||
قوانین و مقررات | قوانین و مقررات | جامعیت قوانین |
مجوزهای دسترسی | ||
توافق تعامل داده ای | ||
حمایت های حاکمیت | ||
همکاری بین بخشی | ||
راهبری خزانه داده | ||
قانون گذاری | حریم خصوصی | |
داده گان عمومی | ||
قانون استفاده | ||
مالکیت داده | ||
اصالت سنجی | ||
امنیت | ||
تسری پذیری | ||
اتکا پذیری | ||
تنظیم مقررات | ||
اپراتور | ||
مالکیت معنوی | ||
امنیت | دسترس پذیری | دسترسی مجاز |
آدرس دهی | ||
کتابخانه داده ای | ||
کاتالوگ داده | ||
سیستم لاگ | ||
سرویس های امن | ||
احراز هویت | ||
حسابرسی | ||
SLA تبادل امن | ||
احراز هویت | امضاء دیجیتال | |
استاندارد پذیرش | ||
الگوریتم نفوذ | ||
مالکیت معنوی | علائم تجاری | |
حقوق تجاری | ||
حقوق ثبت داده | ||
حق نشر | ||
حق استفاده | ||
حق داده های محرمانه | ||
کسب و کار | مدیریت دانش | کتابخانه دانش |
اطلاعات آزاد | ||
ذخیره دانش | ||
هوش تجاری | ||
کسب وکار | سفارشی سازی اطلاعات | |
دسترس پذیری | ||
مدل داده | ||
مدل کسب و کار | ||
کسب و کار داده محور | ||
هوش تجاری | ||
میز خدمت | ||
زمان ارائه | ||
پاسخگویی | ||
مستند سازی | ||
کاربران | کاربران بالقوه | هویت دیجیتال |
امضاء دیجیتال | ||
کاربران همزمان | ||
دسترس پذیری | ||
میزان آگاهی | ||
مسئولیت پذیری | ||
امنیت کاربران | ||
معماری | معماری داده/اطلاعات | کدینگ سرویس ها |
سرویس دیکشنری | ||
سرویس کاتالوگ | ||
نرخ تبادل | ||
ساختار دادگان | ||
متدولوژی توسعه | ساختار پروژه | |
استاندارد توسعه | ||
ترافیک داده | ||
زمان دسترسی | ||
شبکه امن | ||
تکنولوژی | پلت فرم های نرم افزاری | رابط کاربری |
هوش تجاری | ||
داده های آزاد | ||
open API | ||
پایگاه قواعد و مقررات | ||
تبادل پذیری | ||
امضاء دیجیتال | ||
حسابرسی | ||
فایروال | ||
سیستم مانیتورینگ | ||
قواعد دسترسی | ||
زیرساخت فنی | زیرساخت فنی، ارتباطی | شبکه ارتباطی |
پهنای باند | ||
توان محاسباتی | ||
فرکانس ارتباطی | ||
دسترسی پرسه(roaming) | ||
اتصال اختصاصی پرسرعت | ||
پهنای باند مبتنی بر تقاضا | ||
سرویس یک به یک | ||
سرویس یک به چند | ||
مدیریت IP | ||
شبکه اختصاصی مجازی | ||
سرویس مبتنی بر زیرساخت شبکه | ||
سرویس ابری | ||
توزیع سرورها | ||
مراکز داده | ||
دسترسی فیبری | ||
سیستم عامل | ||
محیط توسعه | مهارت و دانش | مشاوره |
آموزش | ||
مستند سازی | ||
فرهنگ سازی | ||
محتوای آموزشی |
6. بحث و نتیجه گیری
برای نکویی و برازش مدل، 5 شاخص را مدنظر قرار گرفت. شاخص RMR یکی از شاخص هایی است که بد بودن مدل تجربی را نشان می دهد هر دو شاخص RMR و SRMR ریشه مربعات حاصل از تفاوت بین ماتریس کوواریانس نمونه باقی مانده و مدل کوواریانس فرض شده می باشد. شاخص SRMR بین ۰ تا ۱ تغییر می کند که برای مدلهایی با برازش خوب این مقدار زیر ۰٫۰۵ است که در تحقیق مقدار 0.209 حاصل شد. میزان شاخص خی-دو نیز 712.15 محاسه گرید که مطلوب می باشد و شاخص NFI ازشاخص های برازش نسبی ، شامل گروهی از شاخص ها می شوند که مقادیر کای اسکوئر را با مدل پایه ای مقایسه می نماید در واقع این شاخص ها بدنبال مقایسه بین یک مدل خاص با سایر مدلهای ممکن می پردازد. با توجه به نتایج حاصل شده در این قسمت مقدار عددی آن برابر با0.91 و شاخص R2 نیز 0.92 بدست آمد که بیان از پذیرش مدل می باشد.
از معیار یا شاخص Gof برای بررسی اعتبار یا كیفیت مدل در تحلیل pls استفاده شد. این شاخص عددی بین صفر تا یك است كه هر چه مقدار آن به یك نزدیكتر باشد نشان از اعتبار و كیفیت بالاتر مدل است. معمولا مقادیر به دست آمده از این فرمول كه بالاتر از ٣٥ درصد یا ٣٥٠ هزارم باشد نشان از اعتبار قابل قبولی در مدل pls است در تحلیل نهایی مقدار این شاخص 0.5 بوده که بانگر مطلوبیت مدل می باشد. بنابراین با توجه به نتایج حاصل شده در این قسمت مشاهده میشود که شاخصهای برازش در مقادیر عددی مطلوبی بوده و در نهایت میتوان بیان نمود که مدل برازش یافته از نیکویی برخوردار است.
اولین اهمیت توجه به دادگان ملی و ایجاد خزانه داده، تمرکز بر توسعه کسب و کار در کشور می باشد و یکی از اهداف این تحقیق، توجه به چارچوب های این مهم می باشد. در توسعه فضای کسب و کار بایستی به ادبیات و مکانیزم های راهبردی، همچون حاکمیت داده1 و حاکمیت اطلاعات متناسب با سطح کاربردی و مشتریان توجه داشت. در مدل مورد تحقیق ایجاد جنبه های کسب و کار و توسعه متوزان مدنظر بوده و توجه شده است که حاکمیت داده، مجموعه ای از شیوه ها و فرآیندهای است که به تضمین مدیریت منابع داده ای در یک سازمان کمک می کند. گرچه اهمیت توجه به موضوع تسری حاکمیت داده با توجه به این مفهوم که حاکمیت داده اغلب شامل مفاهیمی همچون نظارت بر داده ها، کیفیت داده ها و نظایر آن با رویکرد کمک به شرکت در کنترل بهتر منابع اطلاعاتی، از جمله روش ها، فن آوری ها و رفتارها در کنار مدیریت مناسب داده ها می باشد، بوده است اما سایر جنبه های مورد نظر در قالب مفاهیم اولیه از در کنار هم قرار گرفتن داده های ملی با مفهومی همچون پارامترهای اولیه در مدل در نظر گرفته شده است. از سوی دیگر شامل موضوعاتی همچون امنیت و حفظ حریم خصوصی، یکپارچگی، قابلیت استفاده، ادغام، انطباق، در دسترس بودن، نقش ها و مسئولیت ها، و مدیریت کلی جریان های داده های داخلی و خارجی در یک سازمان می باشد [60]. باید توجه داشت که حاکمیت داده، یک سیستم تصمیم درست و مسئولیت پذیر برای فرآیندهای مرتبط با اطلاعات است که بر اساس مدل های توافق شده ای و با رویکرد دسترسی کنترل شده، شرایط استفاده بهینه و مشخص و متدهای اجرایی قابل قبول، اجرا میشود (61).
مدل طراحی شده می تواند مبنای برنامه ریزیهای اجرای در کشور در حوزه دغدغه افزایش دادگان قرار گیرد و می توان از آن به عنوان الگویی پایه در مطالعات بعدی نیز استفاده نمود.
مراجع
[1] Pauleen, D. and Wang, W. (2017), "Does big data mean big knowledge? KM perspectives on big data and analytics", Journal of Knowledge Management, Vol. 21 No. 1, pp. 1-6.
[2] Tan, K. (2018), "Managerial perspectives of big data analytics capability towards product innovation", Strategic Direction, Vol. 34 No. 8, pp. 33-35.
[3] Cervone, H. (2016), "Organizational considerations initiating a big data and analytics implementation", Digital Library Perspectives, Vol. 32 No. 3, pp. 137-141.
[4] Ahmed, W. and Ameen, K. (2017), "Defining big data and measuring its associated trends in the field of information and library management", Library Hi Tech News, Vol. 34 No. 9, pp. 21-24.
[5] Amankwah- Amoah, J. (2015), "A unified framework for incorporating decision making into explanations of business failure", Industrial Management & Data Systems, Vol. 115 No. 7, pp. 1341-1357. https://doi.org/10.1108/IMDS-03-2015-0085
[6] Alhassan, I., Sammon, D. and Daly, M. (2019), "Data governance activities: a comparison between scientific and practice-oriented literature", Journal of Enterprise Information Management, 31 (2): 300-316.
[7] فتح اله زاده، فرحناز و مصطفی امینی (1396). مروری بر مدلهای بلوغ حکمرانی دادهها در بنگاههای اقتصادی، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
[8] طالبی, سجاد (1398). پردازش پایگاه دادهها و مقایسه بین روشهای داده کاوی، سومین کنفرانس ملی ایدههای نوین در فنی و مهندسی، رشت، سازمان بسیج مهندسی صنعتی استان گیلان.
[9] Alam Khan Fakhri, Awais Ahmad, Muhammad Imran, Mafawez Alharbi, Mujeeb-ur-rehman, Bilal Jan (2017). Efficient data access and performance improvement model for virtual data warehouse, Sustainable Cities and Society, Volume 35, Pages 232-240.
[10] Serrano-Vicente, R., Melero, R. and Abadal, E. (2018), "Evaluation of Spanish institutional repositories based on criteria related to technology, procedures, content, marketing and personnel", Data Technologies and Applications, Vol. 52 No. 3, pp. 384-404.
[11] Treloar, Andrew (2009). Design and Implementation of the Australian National Data Service. The International Journal of Digital Curation 1(4)-137-125
[12] سامنی، سارا؛ رامین نصیری و مهران محسن زاده (1398). مقایسه مدلها و چارچوبهای حاکمیت داده با هدف دستیابی به پیش نیازها، موانع و مؤلفههای یک برنامه حاکمیت داده برای دادههای حوزه سلامت، ششمین کنفرانس بین المللی فناوری اطلاعات، کامپیوتر و مخابرات، گرجستان، دانشگاه پیام نور مرکز بین الملل گرجستان.
[13] جان نثاری، مصطفی؛ امیرزاده گوغری، احسان؛ عبداله زاده، علیرضا (1398). حکمرانی داده محور. کار و جامعه. 320. ص 17-32.
[14] صادقی هفشجانی، اسماعیل و درویشی، اصغر،1398،مدل سازی داده های بزرگ با رویکرد کاهش افزونگی در پایگاه داده های پردازش موازی،ششمین کنفرانس بین المللی یافته های نوین علوم و تکنولوژی با محوریت علم در خدمت توسعه، تهران، https://civilica.com/doc/920117
[15] پدیداران مقدم, فرهنگ، سنگ سفیدی، سیما (1398). مروری بر جوانب مختلف انبار دادهها، سومین همایش ملی دانش و فناوری مهندسی برق، کامپیوتر و مکانیک ایران، تهران، موسسه برگزار کننده همایشهای توسعه محور دانش و فناوری سام ایرانیان.
[16] پدیداران مقدم، فرهنگ و معصومه رجبی (1397). افزایش امنیت در انبار داده، دومین کنفرانس ملی فناوریهای نوین در مهندسی برق و کامپیوتر، اصفهان، موسسه آموزش عالی جهاد دانشگاهی استان اصفهان.
[17] میرزایی پری، یحیی، خلیلی، مهدی، رضایی، اطهر (1397). حکمرانی داده؛ ضرورتی برای مواجهه با تحولات پیش روی صنعت بیمه، بیست و پنجمین همایش ملی بیمه و توسعه، تهران، پژوهشکده بیمه.
[18] لگزائی، علیرضا؛ نسرین کاظمی و مسعود عسگری مهر (1397). چارچوبی جهت پیاده سازی حاکمیت داده در صنعت بانکداری ایران، دومین کنفرانس بین المللی مدیریت وسیستم های فازی، ایوان کی، دانشگاه ایوان کی- موسسه بین المللی مهد پژوهش ره پویان حقیقت.
[19] مرعشی پور، امید (1393) پژوهشی با عنوان «ارائه چارچوب حاکمیت دادههای بزرگ توانمندساز مدیریت جریان دانش (مورد مطالعه: بانک مرکزی جمهوری اسلامی ایران). پایان نامه کارشناسی ارشد. مدیریت - مدیریت فناوری اطلاعات ـ مدیریت دانش. دانشگاه آزاد اسلامی واحد تهران مرکزی، دانشکده مدیریت.
[20] فتح اله زاده، فرحناز (1396). مدیریت کیفیت داده؛ سازماندهی پاسخگویی ومدل حکمرانی داده آن، هفتمین کنفرانس ملی مدیریت، اقتصاد و حسابداری، تبریز، سازمان مدیریت صنعتی تبریز.
[21] فتح اله زاده، فرحناز (1396). الزامات ارزیابی مدل بلوغ داده: آیا مدلهای حکمرانی داده این الزامات را برآورده میکنند، دهمین همایش ملی ادکا، تهران، اتحادیه انجمنهای علمی دانشجویی علم اطلاعات و دانش شناسی ایران.
[22] سدیدی، جواد؛ صاحبی وایقان، سعیده؛ رضائیان، هانی (1396). بررسی استفاده از خوشه بندی جهت کاهش زمان پرس و جوهای تجمیع داخل پایگاه داده مکانی مطالعه موردی: رسترهای بارش. اطلاعات جغرافیایی. 103، ص 5-16.
[23] پدیداران مقدم، فرهنگ؛ حاتمی، سید شهلا (1396). بررسی مدل امنیتی انبار داده مبتنی بر متادیتا. تهران: کنفرانس بین المللی فناوری اطلاعات، مهندسی كامپيوتر و مخابرات. حامی؛ انجمن هماندیشان مبتکر رادمان.
[24] نوایی راد، سمیه؛ میرعابدینی، سید جواد (1395) پژوهشی با عنوان «بهبود عملکردی امنیت یکپارچگی پایگاه دادههای تجاری به کمک الگوریتم. شباک. 2(14). ص 1-12.
[25] رفیعی کرکوندی، مجتبی؛ ایزدی، سید کامیار؛ خوش صفت، ابوالفضل (1394). تهدیدات و تمهیدات پایگاه داده به عنوان سرویس در رایانش ابری از دیدگاه پدافند غیر عامل. پدافند غیرعامل. 22، ص 63-74.
[26] لطفی احمدآبادی، محمد، ثقفی، محبوبه (1398). ارائه یک روش جدید برای ذخیره سازی و دسترسی به دادهها در پایگاه دادههای بزرگ توزیع شده مبتنی بر ipfs و etl، ششمین کنفرانس بین المللی یافتههای نوین علوم و تکنولوژی با محوریت علم در خدمت توسعه، تهران، دبیرخانه دائمی کنفرانس.
[27] مرتضوی، محمدرضا (1394). طراحی چارچوب حاکمیت داده در مراکز تبادل داده و اطلاعات ملی (مورد مطالعه: وزارت علوم، تحقیقات، و فناوری). پایان نامه دکتری.: : مدیریت - مدیریت فناوری اطلاعاترشته: مدیریت - مدیریت فناوری اطلاعات.
[28] Nokkala, T., Hannu, S., Jouko T., (2019). Data Governance in Digital Platforms. Conference: AMCIS 2019, At Cancún, México
[29] Alhassan I., Sammon, D., Daly., M (2019). Critical Success Factors for Data Governance: A Theory Building Approach, Information Systems Management, 36:2, 98-110
[30] سهرابي، بابك, اعظمي، امير، يزداني، حميدرضا (1390). آسيب شناسي پژوهش هاي انجام شده در زمينه مديريت اسلامي با رويکرد فرا ترکيب. چشم انداز مديريت دولتي. (6) 2، 9- 24
[31] نيرومند، پوراندخت، رنجبر، محبوبه، بامداد صوفي، جهانيار (1390). شايستگيهاي حرفهاي مديران و توسعه پايدار منطقه ويژه اقتصادي انرژي پارس (ارائه يك چارچوب پيشنهادي). فصلنامه مديريت و منابع انساني در صنعت نفت، ( 8)2، 73- 101.
[32] Sandelowski, M., Barros, J. (2007). Handbook for Synthesizing Qualitative Research. Springer publishing company Inc.
[33] صدیقی، امیرحسین (1396). حکمرانی مسئولانه داده از منظر اجتماعی، سومین کنفرانس بین المللی مدیریت و مهندسی صنایع، تهران، دانشگاه مقدس اردبیلی.
[34] Gartner. (2009). Gartner EXP Worldwide Survey of More than 1,500 CIOs Shows IT Spending to Be Flat in 2009. STAMFORD, Conn
[35] Golfarelli M. and Rizzi S. (2009) Data warehouse design, McGraw Hill 2009.
[36] Dori, D., Feldman, R., Sturm, A. (2008) From conceptual models to schemata: An object-process-based data warehouse construction method, Information Systems, V33, Issue 6, Elsevier.
[37] Chang, Chih-Hung Fuu-Cheng Jiang, Chao-Tung Yang, Sheng-Cang Chou (2020). On construction of a big data warehouse accessing platform for campus power usages, Journal of Parallel and Distributed Computing, Volume 133, Pages 40-50.
[38] Parn, E., Edwards, D. (2019), "Cyber threats confronting the digital built environment: Common data environment vulnerabilities and block chain deterrence", Engineering, Construction and Architectural Management, Vol. 26 No. 2, pp. 245-266.
[39] Wang, Y. and Zhang, J. (2017), "Exploring topics related to data mining on Wikipedia", The Electronic Library, Vol. 35 No. 4, pp. 667-688.
[40] Tenopir, C., Dalton, E. D., Allard, S., Frame, M., Pjesivac, I., Birch, B., (2015). Changes in data sharing and data reuse practices and perceptions among scientists worldwide. Plos One, 10(8). doi: 10.1371/journal.pone.0134826
[41] Hardy Ian, M., Obaidul, H., Vicente, R., (2018). Data for learning? Confirming and contesting per formative practices of data governance. Global Studies of Childhood. Vol 8, Issue 4.
[42]Buffenoir, E.; Bourdon, I. (2013). Managing extended organizations and data governance. Adv. Intell. Syst. Comput.205, 135–145.
[43]Loshin, D. (2010). Operationalizing Data Governance through Data Policy Management; Knowledge Integrity, Inc.: Washington, DC, USA, 132–144
[44] Kim, S. and Lee, W. (2014), "Global data repository status and analysis: based on Korea, China and Japan", Library Hi Tech, Vol. 32 No. 4, pp. 706-722.
[45] Berro, A., Megdiche, I., Teste, O. (2015). Graph-based ETL processes for warehousing statistical open data. In ICEIS, (Vol. 2015 pp. 271–278).
[46] Merkus Jan, Remko Helms, and Rob Kusters (2019). Data Governance and Information Governance: Set of Definitions in Relation to Data and Information as Part of DIKW. International Conference on Enterprise Information Systems.
[47] بنائی، سیدمجتبی و محسن صابری (1396). دریاچه داده، بستری ضروری برای حکمرانی داده در سازمانها، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
[48] Kern, Rafał. Adrianna Kozierkiewicz, Marcin Pietranik, (2020). The data richness estimation framework for federated data warehouse integration, Information Sciences, Volume 513, 2020, Pages 397-411, ISSN 0020-0255
[49] Amuthabala, P., Santhosh, R., (2019).Robust analysis and optimization of a novel efficient quality assurance model in data warehousing. Computer Science, DOI:10.1016/J.COMPELECENG.2019.02.003Corpus ID: 86672089
[50] Astriani, W., Trisminingsih, R. (2016). Extraction, Transformation, and Loading (ETL) Module for Hotspot Spatial Data Warehouse Using Geokettle, Procedia Environmental Sciences, Volume 33, Pages 626-634.
[51] Bouaziz Senda, Ahlem Nabli, Faiez Gargouri (2019). Design a Data Warehouse Schema from Document-Oriented database, Procedia Computer Science, 159: 221-230
[52] Mourtzis Dimitris, Vasilios Samothrakis, Vasilios Zogopoulos, Ekaterini Vlachos (2019). Warehouse Design and Operation using Augmented Reality technology: A Papermaking Industry Case Study, Procedia CIRP, 79: 574-579
[53] Van der Heide G., N.D. Van Foreest, K.J. Roodbergen (2018). Optimizing stock levels for rental systems with a support warehouse and partial backordering, European Journal of Operational Research, 265 (1): 107-118
[54] Zekri Manel, Sahbi Zahaf, Faiez Gargouri (2019). Specification of the data warehouse for the decision-making dimension of the Bid Process Information System, Procedia Computer Science, 159: 1190-1197
[55] Smith J. S,. Ansari, M. N (2019). Robust analysis and optimization of a novel efficient quality assurance model in data warehousing. Computer Science, DOI:10.1016/J.COMPELECENG.2019.02.003Corpus ID: 86672089
[56] Horta, M., Coelho, F., Relvas, S. (2016). Layout Design Modelling for a Real World Just-in-Time Warehouse. Computers & Industrial Engineering 101:1-9. DOI:10.1016/j.cie.2016.08.013
[57] Vela Belén, Carlos Blanco, Eduardo Fernández-Medina, Esperanza Marcos (2012). A practical application of our MDD approach for modeling secure XML data warehouses, Decision Support Systems, 52 (4): 899-925.
[58] Gosain Anjana, Heena (2015). Literature Review of Data Model Quality Metrics of Data Warehouse, Procedia Computer Science, 48: 236-24.
[59] Maté Alejandro, Juan Trujillo (2014). Tracing conceptual models' evolution in data warehouses by using the model driven architecture, Computer Standards & Interfaces, 36(5): 831-843.
[60] Michel knight, dataversity, 2019
[61] DG (DG: Data Governance Institute; It is a non-government organization that work on data governance framework solutions), 2019.
[1] . Data Governance
A framework for establising a national data vault for Data Governance institution
Abstract:
according to national data development and increasing need of businesses to data, considering mechanisms to maintain and develop data with the approach of providing people and corporations to platforms for delivering services is highly important which the least achievement of this way of thinking would be developing services of E-government in society. Thus the goal of this research is mainly presenting a framework for national data with the concentration on parameters respecting data governance in order to design an effective and comprehensive pattern for all spots interacting with national data. The author has adopted descriptive approach and mixed method for this research.
In the first step, the articles regarding national data organization are extracted and subsequently accorded with the articles based on technology ecosystem design patterns, 10 key components are formed as main modules.
Thereafter, for each module, indexes and sub-indexes are taken into account by considering articles and also taking advantages of interviews and Delphi method. by designing two questionnaires, strategy-management and technical-lawful oriented, total number of 22 indexes and 154 sub-indexes are collected. the research has the capacity of being a scientific reference for the national data vault. it is recommended that development of technical infrastructure and data governance patterns in national level accorded with indexes and sub-indexes counted in this research.
Key words:
Data Governance, Data Vault, Data and Information strategy, Data Models, National Data