A framework for establishing a national data vault for Data Governance institution
Subject Areas :Nader naghshineh 1 , fatima fahimnia 2 , hamidreza Ahmadian chashmi 3
1 - University of Tehran
2 - University of Tehran
3 - University of Tehran
Keywords: data governance, data vault, national data, data management, data and information strategy ,
Abstract :
the goal of this research is mainly presenting a framework for national data with the concentration on parameters respecting data governance in order to design an effective and comprehensive pattern for all spots interacting with national data. The author has adopted descriptive approach and mixed method for this research. In the first step, the articles regarding national data organization are extracted and subsequently accorded with the articles based on technology ecosystem design patterns, 10 key components are formed as main modules. Thereafter, for each module, indexes and sub-indexes are taken into account by considering articles and also taking advantages of interviews and Delphi method. by designing two questionnaires, strategy-management and technical-lawful oriented, total number of 22 indexes and 154 sub-indexes are collected. the research has the capacity of being a scientific reference for the national data vault. it is recommended that development of technical infrastructure and data governance patterns in national level accorded with indexes and sub-indexes counted in this research
. بنائی، سیدمجتبی و محسن صابری (1396). دریاچه داده، بستری ضروری برای حکمرانی داده در سازمانها، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
2. پایمرد، جلال (1394) رتبهبندی موانع ایجاد پایگاه داده ملی برای درآمد افراد و شرکتها با رویکرد تصمیمگیری چندمعیاره (MADM). پایان نامه کارشناسی ارشد. رشته مدیریت. دانشگاه آزاد اسلامی واحد تهران مرکزی، دانشکده مدیریت.
3. جان نثاری، مصطفی؛ امیرزاده گوغری، احسان؛ عبداله زاده، علیرضا (1398). حکمرانی داده محور. کار و جامعه. 320. ص 17-32.
4. رحتمی اصل، سعید (1393). بررسی مراکز داده موجود و ارائهی یک ساختار پشتیبان ماژولار جهت طراحی مراکز داده ملی در ایران. پایان نامه کارشناسی ارشد. رشته: مهندسی کامپیوتر - نرمافزار. دانشگاه آزاد اسلامی واحد تهران مرکزی، دانشکده مدیریت.
5. سامنی، سارا؛ رامین نصیری و مهران محسن زاده (1398). مقایسه مدلها و چارچوبهای حاکمیت داده با هدف دستیابی به پیش نیازها، موانع و مؤلفههای یک برنامه حاکمیت داده برای دادههای حوزه سلامت، ششمین کنفرانس بین المللی فناوری اطلاعات، کامپیوتر و مخابرات، گرجستان، دانشگاه پیام نور مرکز بین الملل گرجستان.
ه صدیقی، امیر حسین (1396). ارائه رویکردی برای ارزیابی حکمرانی داده در کسب و کارها، اولین کنفرانس ملی اندیشههای نوین در مدیریت کسب و کار، تهران، دانشگاه علم و فرهنگ.
7. صدیقی، امیرحسین (1396). حکمرانی مسئولانه داده از منظر اجتماعی، سومین کنفرانس بین المللی مدیریت و مهندسی صنایع، تهران، دانشگاه مقدس اردبیلی.
8. صدیقی، امیرحسین (1396). کاربست مصورسازی جغرافیایی در حکمرانی داده: مطالعه موردی پژوهشگاه علوم و فناوری اطلاعات ایران، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
9. فتح اله زاده، فرحناز (1396). الزامات ارزیابی مدل بلوغ داده: آیا مدلهای حکمرانی داده این الزامات را برآورده میکنند، دهمین همایش ملی ادکا، تهران، اتحادیه انجمنهای علمی دانشجویی علم اطلاعات و دانش شناسی ایران.
10. فتح اله زاده، فرحناز (1396). مدیریت کیفیت داده؛ سازماندهی پاسخگویی ومدل حکمرانی داده آن، هفتمین کنفرانس ملی مدیریت، اقتصاد و حسابداری، تبریز، سازمان مدیریت صنعتی تبریز.
11. فتح اله زاده، فرحناز و مصطفی امینی (1396). مروری بر مدلهای بلوغ حکمرانی دادهها در بنگاههای اقتصادی، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
12. لگزائی، علیرضا؛ نسرین کاظمی و مسعود عسگری مهر (1397). چارچوبی جهت پیاده سازی حاکمیت داده در صنعت بانکداری ایران، دومین کنفرانس بین المللی مدیریت وسیستم های فازی، ایوان کی، دانشگاه ایوان کی- موسسه بین المللی مهد پژوهش ره پویان حقیقت.
13. محمدشفیعی، مجید و عاطفه خوش فطرت (1396). حکمرانی دادهها در بازاریابی، هوش کسب و کار و مزیت رقابتی: مطالعه یک گروه تولیدی لوازم خانگی، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
14. مرتضوی، محمدرضا (1394). طراحی چارچوب حاکمیت داده در مراکز تبادل داده و اطلاعات ملی (مورد مطالعه: وزارت علوم، تحقیقات، و فناوری). پایان نامه دکتری.: : مدیریت - مدیریت فناوری اطلاعاترشته: مدیریت - مدیریت فناوری اطلاعات.
15. مرعشی پور، امید (1393) پژوهشی با عنوان «ارائه چارچوب حاکمیت دادههای بزرگ توانمندساز مدیریت جریان دانش (مورد مطالعه: بانک مرکزی جمهوری اسلامی ایران). پایان نامه کارشناسی ارشد. مدیریت - مدیریت فناوری اطلاعات ـ مدیریت دانش. دانشگاه آزاد اسلامی واحد تهران مرکزی، دانشکده مدیریت.
16. میرزایی؛ پری، یحیی؛ مهدی خلیلی و اطهر رضایی (1397). حکمرانی داده؛ ضرورتی برای مواجهه با تحولات پیش روی صنعت بیمه، بیست و پنجمین همایش ملی بیمه و توسعه، تهران، پژوهشکده بیمه.
17. نامداریان، لیلا (1396). بررسی و تحلیل راهبردهای حکمرانی داده در مؤسسات مالی، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
18. طالبی, سجاد (1398). پردازش پایگاه دادهها و مقایسه بین روشهای داده کاوی، سومین کنفرانس ملی ایدههای نوین در فنی و مهندسی، رشت، سازمان بسیج مهندسی صنعتی استان گیلان
19. لطفی احمدآبادی, محمد و محبوبه ثقفی (1398). ارائه یک روش جدید برای ذخیره سازی و دسترسی به دادهها در پایگاه دادههای بزرگ توزیع شده مبتنی بر ipfs و etl، ششمین کنفرانس بین المللی یافتههای نوین علوم و تکنولوژی با محوریت علم در خدمت توسعه، تهران، دبیرخانه دائمی کنفرانس،
20. پدیداران مقدم, فرهنگ و سیما سنگ سفیدی (1398). مروری بر جوانب مختلف انبار دادهها، سومین همایش ملی دانش و فناوری مهندسی برق، کامپیوتر و مکانیک ایران، تهران، موسسه برگزار کننده همایشهای توسعه محور دانش و فناوری سام ایرانیان.
21. رجبی, سارا (1398). الگوریتمهای داده کاوی در پایگاه داده، کنگره ملی تحقیقات بنیادین در مهندسی کامپیوتر و فن اوری اطلاعات، تهران - دانشگاه شهید بهشتی، دبیرخانه دائمی کنفرانس.
22. بنائی، سیدمجتبی و محسن صابری (1396). دریاچه داده، بستری ضروری برای حکمرانی داده در سازمانها، پنجمین همایش مدیران فناوری اطلاعات، تهران، پژوهشگاه علوم و فناوری اطلاعات ایران و نهاد ریاست جمهوری.
23. Berkani, N., Bellatreche, L., Khouri, S., Ordonez, C. (2019). Value-driven approach for designing extended data warehouses. In DOLAP
24. Kern, Rafał. Adrianna Kozierkiewicz, Marcin Pietranik, (2020). The data richness estimation framework for federated data warehouse integration, Information Sciences, Volume 513, 2020, Pages 397-411, ISSN 0020-0255.
25. Public Sector, OECD Publishing, Paris, https://doi.org/10.1787/24131962.
26. Office of the Government Chief Information Officer (2019), Public Service Data Strategy 2019-2023, Government of Ireland, https://www.osi.ie/wp-content/uploads/2018/12/Public-Service-Data-Strategy-2019-2023.pdf (accessed on 23 August 2019).
27. Pauleen, D. and Wang, W. (2017), "Does big data mean big knowledge? KM perspectives on big data and analytics", Journal of Knowledge Management, Vol. 21 No. 1, pp. 1-6.
28. Pechacek, J.; Cerra, F.; Brandt, B.; Lutfiyya, M.N.; Delaney, C. (2015). Creating the Evidence through Comparative Effectiveness Research for Interprofessional Education and Collaborative Practice by Deploying a National Intervention Network and a National Data Repository. Healthcare 2015, 3, 146-161.
29. Sorani, M. D., Yue, J. K., Sharma, S., Manley, G. T., Ferguson, A. R., Cooper, S. R., et al. (2015). Genetic data sharing and privacy. Neuroinformatics, 13(1), 1–6. doi:10.1007/s12021-014-9248-z.
30. Stats NZ (2019), Data Leadership Quarterly Dashboard, New Zealand Government, https://www.data.govt.nz/about/government-chief-data-steward-gcds/data-dashboard (accessed on 26 August 2019).
31. Sweeney, K. (2019), “An operational data governance framework for New Zealand government”, Stats NZ, Wellington, https://statsnz.contentdm.oclc.org/digital/collection/p20045coll1/id/2657 (accessed on 27 August 2019).
32. Tenopir, C., Dalton, E. D., Allard, S., Frame, M., Pjesivac, I., Birch, B., (2015). Changes in data sharing and data reuse practices and perceptions among scientists worldwide. Plos One, 10(8). doi: 10.1371/journal.pone.0134826.
33. The Economist (2017), “The world’s most valuable resource is no longer oil, but data: Regulating the Internet giants”, The Economist.
34. Bindley Phil (2019). Joining the dots: how to approach compliance and data governance, Network Security, 2: 14-16.
35. Bouaziz Senda, Ahlem Nabli, Faiez Gargouri (2019). Design a Data Warehouse Schema from Document-Oriented database, Procedia Computer Science, 159: 221-230.
36. Boulil Kamal, François Pinet, Sandro Bimonte, Nadia Carluer, Claire Lauvernet, Bruno Cheviron, André Miralles, Jean-Pierre Chanet (2013). Guaranteeing the quality of multidimensional analysis in data warehouses of simulation results: Application to pesticide transfer data produced by the MACRO model, Ecological Informatics, 16: 41-52.
37. Broek Tijs van den, Anne Fleur van Veenstra (2018). Governance of big data collaborations: How to balance regulatory compliance and disruptive innovation, Technological Forecasting and Social Change,129: 330-338.
38. Calvanese Diego, Luigi Dragone, Daniele Nardi, Riccardo Rosati, Stefano M. Trisolini (2006). Enterprise modeling and Data Warehousing in Telecom Italia, Information Systems, 31 (1): 1-32.
39. Chander Anupam (2016). National Data Governance in a Global Economy. Columbia School of International and Public Affairs Issues Brief, UC Davis Legal Studies Research Paper No. 495.
40. Chang, Chih-Hung Fuu-Cheng Jiang, Chao-Tung Yang, Sheng-Cang Chou (2019). On construction of a big data warehouse
accessing platform for campus power usages, Journal of Parallel and Distributed Computing, Volume 133, Pages 40-50. 41. E. Malinowski, E. Zimányi (2008). A conceptual model for temporal data warehouses and its transformation to the ER and the object-relational models, Data & Knowledge Engineering, 64 (1): 101-133.
42. Guoqing Zhang, Tatsushi Nishi, Sarina D.O. Turner, Keisuke Oga, Xindan Li (2017). An integrated strategy for a production planning and warehouse layout problem: Modeling and solution approaches, Omega, 68: 85-94.
43. Halawa Farouq, Husam Dauod, In Gyu Lee, Yinglei Li, Sang Won Yoon, Sung Hoon Chung (2019). Introduction of a real time location system to enhance the warehouse safety and operational efficiency, International Journal of Production Economics, 107541, ISSN 0925-5273.
44. Hardy Ian,, M Obaidul Hamid, Vicente Reyes(2018). Data for learning? Confirming and contesting performative practices of data governance. Global Studies of Childhood.Vol 8, Issue 4.
45. He Tieke; Shenghao Chen; Lian Hao; Jia Liu (2019). Quality Driven Judicial Data Governance. International Conference on Software Quality, Reliability and Security Companion (QRS-C). IEEE Access Volume: 7.
46. Hee Yeong Kim, June-Suh Cho(2018). Data governance framework for big data implementation with NPS Case Analysis in Korea. Journal of Business & Retail Management Research. 12(03).
47. Broek Tijs van den, Anne Fleur van Veenstra (2018). Governance of big data collaborations: How to balance regulatory compliance and disruptive innovation, Technological Forecasting and Social Change, Volume 129, Pages 330-338.
48. Buffenoir, E.; Bourdon, I. (2013). Managing extended organizations and data governance. Adv. Intell. Syst. Comput.205, 135–145.
49. Bulla, C.M.; Bhojannavar, S.S.; Danawade, V.M. (2013). Cloud Computing: Research Activities and Challenges. Int. J. Emerg. Trends Technol. Comput. Sci, 2, 206–21.
50. BZK (2019), Data Agenda Government (Data Agenda Overhead), Ministry of the Interior and Kingdom Relations, https://www.nldigitalgovernment.nl/wp-content/uploads/sites/11/2019/04/data-agenda-government.pdf (accessed on 23 August 2019).
51. Cervone, H. (2016), "Organizational considerations initiating a big data and analytics implementation", Digital Library Perspectives, Vol. 32 No. 3, pp. 137-141.
52. Chawngsangpuii, R.; Das, R.K. (2014). A challenge for security and service level agreement in cloud computing. Int. J. Res. Eng. Technol., 2319–2322.
53. Cochran, M.; Witman, P.D. (2011). Governance and service level agreement issues in a cloud computing environment computing environment. J. Inf. Technol. Manag. 2011, 22, 41–55.
54. Coyne, E., Coyne, J. and Walker, K. (2018), "Big Data information governance by accountants", International Journal of Accounting & Information Management, Vol. 26 No. 1, pp. 153-170.
55. Farid,M. H.., A. Roatis, I. F. Ilyas, H. Hoffmann, and X. Chu. (2016). CLAMS: bringing quality to data lakes. In SIGMOD, pages 2089--2092, 2016.
56. Federal Data Strategy Development Team (2019), 2019-2020 Draft Federal Data Strategy Action Plan, US Government, Washington, DC, https://strategy.data.gov/action-plan (accessed on 26 August 2019).
57. Felici, M.; Koulouris, T.; Pearson, S. (2013). Accountability for Data Governance in Cloud Ecosystems. In Proceedings of the 2013 IEEE 5th International Conference on Loud Computing Technology and Science (Cloudcom), Bristol, UK, 2–5 December 2013; pp. 327–332.
58. Firican, George (2018). Data governance maturity models – Stanford. Lightsondata. Published aug 29, 2018 in data governance. https://www.lightsondata.com/data-governance-maturity-models-stanford/ 2019.12.22.
59. Firican, George (2018. B). Data governance maturity models – DataFlux. Lightsondata. Published aug 29, 2018 in data governance. https://www.lightsondata.com/data-governance-maturity-models-dataflux/
60. Firican, George (2018. C). Data governance maturity models – Gartner. Published Oct, 03, 2018 in data governance https://www.lightsondata.com/data-governance-maturity-models-gartner/
61. Flyverbom Mikkel, Ronald Deibert, Dirk Matten (2017). The Governance of Digital Technology, Big Data, and the Internet: New Roles and Responsibilities for Business. Business & Society. Vol 58, Issue 1.
62. Fukaya, T. (2019), “Is evidence contributing to public accountability? Evidence from Japan”, presentation at the OECD Expert Meeting on Standards of Evidence, Ministry of Internal Affairs and Communications, Japan.
63. Gao, Y., S. Huang, and A. Parameswaran. (2018). Navigating the data lake with datamaran: Automatically extracting structure from log datasets. In SIGMOD, pages 943--958, 2018.
64. Goals, S.; Dyche, J.; Levy, E. (2015). Data Governance: Getting It Right! GFT: Stuttgart, Germany, 2015; pp. 1–3.
65. Guston, D. (2014), “Understanding ‘anticipatory governance’”, Social Studies of Science, Vol. 44/2, pp. 218-242, http://dx.doi.org/10.1177/0306312713508669.
66. Hai, R., S. Geisler, and C. Quix. (2016). Constance: An intelligent data lake system. In SIGMOD, pages 2097--2100, 2016.
67. Han, Z., Huang, S., Li, H. and Ren, N. (2016), "Risk assessment of digital library information security: a case study", The Electronic Library, Vol. 34 No. 3, pp. 471-487.
68. Hardy Ian, M Obaidul Hamid, Vicente Reyes (2018). Data for learning? Confirming and contesting per formative practices of data governance. Global Studies of Childhood.Vol 8, Issue 4.
69. He Tieke; Shenghao Chen; Lian Hao; Jia Liu (2019). Quality Driven Judicial Data Governance. International Conference on Software Quality, Reliability and Security Companion (QRS-C). IEEE Access Volume: 7.
70. Hee Yeong Kim, June-Suh Cho (2018). Data governance framework for big data implementation with NPS Case Analysis in Korea. Journal of Business & Retail Management Research. 12(03).
71. Jack R. Sticke, Anita Vandervalk (2014). Data Business Plans and Governance Programs: Aligning Transportation Data to Agency Strategic Objectives. Transportation Research Record: Journal of the Transportation Research Board. Vol 2460, Issue 1.
72. Jansen, W.; Grance, T. (2017). Guidelines on Security and Privacy in Public Cloud Computing. Available online:http://nvlpubs.nist.gov/nistpubs/Legacy/SP/nistspecialpublication800-824.
73. Jules, T. (2019), "Big “G” and Small “g”: The Variable Geometries of Educational Governance in an Era of Big Data", Jules, T. and Salajan, F. (Ed.) The Educational Intelligent Economy: Big Data, Artificial Intelligence, Machine Learning and the Internet of Things in Education (International Perspectives on Education and Society, Vol. 38), Emerald Publishing Limited, pp. 15-32.
74. Kamioka, T.; Luo, X.; Tapanainen, T. (2016). An Empirical Investigation of Data Governance: The Role of Accountabilities. In Proceedings of the 20th Pacific Asia Conference on Information Systems.
75. Keil Mark, Mary Culnan Tamara Dinev, Heng Xu (2019). Data Governance, Consumer Privacy, and Project Status Reporting: Remembering H. Jeff Smith. Information Systems Frontiers. Volume 21, Issue 6, pp 1207–1212.
76. Kern, Rafał. Adrianna Kozierkiewicz, Marcin Pietranik, (2020). The data richness estimation framework for federated data warehouse integration, Information Sciences, Volume 513, 2020, Pages 397-411, ISSN 0020-0255.
77. Kim, S. and Lee, W. (2014), "Global data repository status and analysis: based on Korea, China and Japan", Library Hi Tech, Vol. 32 No. 4, pp. 706-722.
78. Kitchin, R., Collins, S. and Frost, D. (2015), "Funding models for Open Access digital data repositories", Online Information Review, Vol. 39 No. 5, pp. 664-681.
79. Kofi, J.; Kwame, K. (2017). Who ‘owns’ the cloud? An empirical study of cloud governance in cloud computing in Ghana. In Proceedings of the 28th European Regional Conference of the International Telecommunications Society (ITS), Passau, Germany, 30 July–2 August.
80. Koltay Tibor (2016). Data governance, data literacy and the management of data quality. IFLA Journal. Vol 42, Issue 4.
81. Li, F. and Zhang, J. (2014), "Case study: a metadata scheme for multi-type manuscripts for the T.D. Lee Archives Online", Library Hi Tech, Vol. 32 No. 2, pp. 219-228.
82. Lindpainter, J. (2019), “The US Data Federation wants to make it easier to collect, combine, and exchange data across government”, 18F, https://18f.gsa.gov/2019/03/05/the-us-data-federation.
83. Loshin, D. (2010). Operationalizing Data Governance through Data Policy Management; Knowledge Integrity, Inc.: Washington, DC, USA, 132–144.
84. Mägi, M. (2019), Data for law making. Presentation in the context of the OECD meeting on Measuring Regulatory Performance. Oslo, Norway. 2019, Statistics Estonia, Oslo.
85. Marín Ruiz, N., Martínez-Rojas, M., Molina Fernández, C., Soto-Hidalgo, J., Rubio-Romero, J. and Vila Miranda, M. (2018), "Flexible Management of Essential Construction Tasks Using Fuzzy OLAP Cubes", Fayek, A. (Ed.) Fuzzy Hybrid Computing in Construction Engineering and Management, Emerald Publishing Limited, pp. 357-388.
86. Merkus Jan, Remko Helms, and Rob Kusters (2019). Data Governance and Information Governance: Set of Definitions in Relation to Data and Information as Part of DIKW. International Conference on Enterprise Information Systems.
87. Nargesian, F., K. Q. Pu, E. Zhu, B. G. Bashardoost, and R. J. Miller. (2018). Optimizing organizations for navigating data lakes, 2018. ArXiv: 1812.07024.
88. Neto Susana (2016). Water governance in an urban age. Utilities Policy. Volume 43, Part A, Pages 32-41.
89. New Zealand Digital Skills Forum (2018), Digital Skills for a Digital Nation: An Analysis of the Digital Skills Landscape of New Zealand, New Zealand Digital Skills Forum, https://digitalskillsforum.files.wordpress.com/2018/01/digital-skills-for-a-digital-nation-online.pdf (accessed on 27 August 2019).
90. Nokkala Tina, Hannu Salmela, Jouko Toivonen (2019). Data Governance in Digital Platforms. Conference: AMCIS 2019, At Cancún, México.
91. OECD (2019), Digital Government Review of Sweden: Towards a Data-driven Public Sector, OECD Publishing, Paris, https://doi.org/10.1787/24131962.
92. Office of the Government Chief Information Officer (2019), Public Service Data Strategy 2019-2023, Government of Ireland, https://www.osi.ie/wp-content/uploads/2018/12/Public-Service-Data-Strategy-2019-2023.pdf (accessed on 23 August 2019).