ارائه یک مدل مفهومی جدید برای حوزه کلان¬داده¬ها و تحلیل کسب¬وکارهای داده¬محور در ایران برمبنای مدل ارائه¬شده
محورهای موضوعی :مژگان فرهودی 1 , رضوان کلانتری هرمزی 2 , حسام زند حسامی 3
1 - هیت علمی
2 - دانشجو
3 - دانشگاه آزاد اسلامی واحد قزوین
کلید واژه: کلان¬داده, مدل مفهومي , کسب¬ و کار داده¬محور, شرکت¬های دانش¬بنیان,
چکیده مقاله :
پیش بینی افزایش ده برابری داده های جهانی تا سال 2025 توسط IDC نشان می دهد که سفر داده ها برای سازمان ها تازه آغاز شده است. جمع آوری، ذخیره، تجزیه و تحلیل و استفاده از این طلای با ارزش به نوآوری در شرکت ها و سازمان ها کمک می کند و مشاغل را به سمت آینده رقابتی سوق می دهد. هدف از این مقاله شناسایی و بررسی زمینه های مختلف ارزش آفرینی و کسب وکاری با محوریت کلان داده برای شرکت های نوپایی است که به داده ها به عنوان منبع اصلی کسب و کارشان اعتماد دارند. لذا در این راستا پس از بررسی ابعاد مختلف کلان داده، به ارائه مدل مفهومی جدیدی در این حوزه پرداخته شده است. این مدل به شرکت ها کمک می کند تا بتوانند فعالیت های خود را در این حوزه با آگاهی و تمرکز بیشتری پیش ببرند. همچنین در ادامه این مقاله، نتایج پیمایش شرکت های متقاضی دانش بنیان با کسب وکارهای داده محور ارائه میشود. نتایج بررسیها حاکی از آن است که اغلب این شرکت ها بر روی دو حوزه «تحلیل» و «مصورسازی داده» تمرکز بیشتری نموده اند. همچنین، دو حوزه «فینتک» و «رسانه» بیش از سایرین پذیرای فناوریهای این دو حوزه بودهاند. از طرفی محصولات مربوط به «مدیریت و پردازش کلان دادهها» که شامل ارائه راهکار و راهاندازی خدمات پردازش و ذخیرهسازی کلان دادهها میشود، بیشترین حجم فروش را به خود اختصاص داده است و میزان قابل توجهی از فعالیت این شرکت ها بر روی محتوای اخبار، شبکه های اجتماعی و اطلاعات مربوط به معاملات بورس اختصاص یافته اند.
Forecasting a 10-fold increase in global data till 2025 by IDC indicates that the data journey for organizations has just begun. Collecting, storing, analyzing and using this valuable gold contributes to innovation in companies and organizations and leads businesses to a competitive future. The purpose of this article is to examine the various contexts of value creation and big-data-driven business for startups that rely on data as their primary source of business. Therefore, in this regard, after examining the various dimensions of big data, a conceptual model of this field has been presented. This model helps companies to carry out their activities in this field with more awareness and focus. Also in the continuation of this article, the results of the survey of knowledge-based companies with data-driven businesses are presented. The results show that most of these companies are more focused on the two areas of data analysis and visualization. Also, the two areas of "Fintech" and "Media" have been more receptive to the technologies of these two areas. On the other hand, products related to "big data management and processing", which includes providing solutions and launching big-data processing and storage services, have the highest sales volume and a significant amount of activity of these companies on Content of news, social networks and information related to stock exchange transactions.
Reinsel, David (2018), John Gantz, John Rydning. The Digitization of the World from Edge to Core, IDC White Paper, 2018
Maroufkhani, Parisa (2019), RalfWagner, Wan KhairuzzamanWan Ismail, Mas Bambang Baroto and Mohammad Nourani, Big Data Analytics and Firm Performance: A Systematic Review, Information, Vol. 10, No. 226, 2019
Balachandran, Bala M. (2017), Shivika Prase, Challenges and Benefits of Deploying Big Data Analytics in Cloud for Business Intelligence, Jornal of Computer Science, Vol. 112, P. 1112-1122 2017
European Council Conclusion (2019). Building a Data Economy in the European Union Data. Innovation. Growth., 2019
Ronald, Vatananan-Thesenvitz (2010), Nathasit Gerdsri. The current state of technology roadmapping (TRM) research and practice, International Journal of Innovation and Technology Management 09(04):1 – 10
Hartmann, Philipp (2014). Max Hartmann, Mohamed Zaki, Niels Feldmann and Andy Neely. Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms, University of Cambridge, 2014
Karamizadeh, S. (2014). Shahidan, A., & Zamani, M., Pattern Recognition Techniques: Studies on Appropriate Classification, ARPN Journal of Engineering and Applied Sciences, 9(8)
Park, Grace (2020). Lawrence Chung, Haan Johng, Vijayan Sugumaran,Sooyong Park, Liping Zhao, Sam Supakkul, A Big Data Conceptual Model to Improve Quality of Business Analytics, International Conference on Research Challenges in Information Science, PP 20-37, 2020
Mohanad Halaweh (2015). Ahmed E. Massry, Conceptual Model for Successful Implementation of Big Data in Organizations, Journal of International Technology and Information Management, Vol. 24, Issue 2, PP. 21-34, 2015
Aisha Siddiqa (2016). Ibrahim Abaker Targio Hashem, Ibrar Yaqoob, Mohsen Marjani, Shahabuddin Shamshirband, Abdullah Gania, Fariza Nasaruddin, A survey of big data management: Taxonomy and state-of-the-art, Journal of Network and Computer Applications, Vol. 71, PP. 151-166, 2016
محمودی، مریم، همایون بهشتی و عليرضا ياري. (1389). مدل مفهومي موتورجستجوي فارسي، پژوهشگاه ارتباطات و فناوری اطلاعات (مركز تحقيقات مخابرات ايران)
محمودی، مریم، مژگان فرهودی، علی شریفی، علیرضا یاری و کامبیز بدیع. (1394). ارائه مدل مفهومی پیشنهادی جویش در فضای وب، اولین همایش ملی جویشگر بومی.
فرهودی، مژگان، شهریار سموری و عليرضا ياري. (1389). مدل مفهومي سامانه پرسش و پاسخ، پژوهشگاه ارتباطات و فناوری اطلاعات.
عظیم¬زاده، معصومه، محمد امین فرجیان و عليرضا ياري (1389). مدل مفهومي ترجمه ماشینی با هدف تهیه قالب¬های تعریف پروژه¬ها و تدوین برنامه اجرایی آن، پژوهشگاه ارتباطات و فناوری اطلاعات.
یاری، عليرضا، احسان آريانيان و مژگان فرهودي. (1393). ارائه مدل مفهومي روندها و حوزه¬هاي تحقيقاتي داده¬هاي عظيم، همايش داده¬هاي عظيم، پژوهشگاه ارتباطات و فناوري اطلاعات.
فرهودی، مژگان، مریم محمودی و معصومه عظیم¬زاده. (1398)، ارائه مدل مفهومي پيشنهادي خط و زبان فارسی در فضای مجازی، پنجمین همایش ملی زبانشناسی رایانشی.
درودی، فریبرز، عادل سلیمانی¬نژاد. (1388). ارتباط تصویری و پردازش دیداری اطلاعات: آشنایی با مبانی نظری حوزه مصورسازی، مجله مطالعات ایرانی کتابداری و اطلاع¬رسانی، شماره 86.
برزگر، نکیسا، وحید رادمهر. (1395). کاربردهای کلان داده، پروژه تدوین نقشه راه کلان داده، پژوهشگاه ارتباطات و فناوری اطلاعات.
ملکی، داود، محمدرضا احمدی و سیدمحمدرضا میرصراف. (1395). ذخیره¬سازی داده¬ها، پروژه تدوین نقشه راه کلان داده، پژوهشگاه ارتباطات و فناوری اطلاعات.
سخایی، محمدجواد. (1394). تجزیه و تحلیل داده و انواع آن، فناوری اطلاعات برای کسب و کار.
جم¬پور، مهدی، نکیسا برزگر، اکبر دارابی و سمیه فتاحی. (1395). تحلیل کلان¬داده¬ها، پروژه تدوین نقشه راه کلان داده، پژوهشگاه ارتباطات و فناوری اطلاعات.
بنائی، سیدمجتبی. (1396). دریاچه داده به عنوان بستر حکمرانی داده در سازمان، چارچوب¬های پردازش کلان داده.
دو فصلنامه علمي فناوري اطلاعات و ارتباطات ایران | سال سیزدهم، شمارههاي 47 و 48، بهار و تابستان 1400 صص: 23_34
|
|
ارائه یک مدل مفهومی جدید برای حوزه کلاندادهها و تحلیل کسبوکارهای دادهمحور در ایران برمبنای مدل ارائهشده
مژگان فرهودي1 رضوان کلانتر هرمزي** حسام زندحسامي***
* عضو هيات علمي، پژوهشگاه ارتباطات و فناوري اطلاعات، پژوهشکده فناوري اطلاعات
** عضو کارگروه ارزیابی و تشخیص صلاحیت شرکتها و موسسات دانش بنیان
*** عضو هيات علمي، دانشگاه آزاد اسلامي واحد علوم و تحقيقات، دانشکده مديريت و اقتصاد
تاريخ دریافت: 05/04/1399 تاريخ پذیرش: 28/11/1399
نوع مقاله: پژوهشي
چكيده
پيشبيني افزايش ده برابري دادههاي جهاني تا سال 2025 نشان ميدهد که سفر دادهها براي سازمانها تازه آغاز شده است. جمعآوري، ذخيره، تجزيه و تحليل و استفاده از اين طلاي باارزش به نوآوري در شرکتها و سازمانها کمک ميکند و مشاغل را به سمت آينده رقابتي سوق ميدهد. هدف از اين مقاله شناسايي و بررسي زمينههاي مختلف ارزشآفريني با محوريت کلانداده براي شرکتهاي نوپايي است که به دادهها به عنوان منبع اصلي کسبوکارشان تکيه دارند. در اين راستا پس از بررسي ابعاد مختلف کلانداده، مدل مفهومي جديدي در اين حوزه ارائه میگردد. اين مدل به شرکتها کمک ميکند تا بتوانند فعاليتهاي خود را با آگاهي و تمرکز بيشتري پيش ببرند. در ادامه، نتايج پيمايش شرکتهاي متقاضي دانشبنيان با کسبوکارهاي دادهمحور ارائه ميشود. نتايج بررسيها نشان میدهد که اغلب شرکتها بر روي دو حوزه «تحليل» و «مصورسازي داده» تمرکز بيشتري نمودهاند. همچنين، حوزههای «فينتک» و «رسانه» بيش از سايرين پذيراي فناوريها بودهاند. از طرفي محصولات مربوط با «مديريت و پردازش کلاندادهها» که شامل ارائه راهکار و راهاندازي خدمات پردازش و ذخيرهسازي ميشود، بيشترين حجم فروش را به خود اختصاص دادهاند و ميزان قابل توجهي از فعاليت شرکتها بر روي محتواي اخبار، شبکههاي اجتماعي و اطلاعات مربوط به معاملات بورس اختصاص يافتهاند.
واژگان کليدي: کلانداده، مدل مفهومي، کسب و کار دادهمحور، شرکتهای دانشبنیان
[1] نويسنده مسئول: مژگان فرهودی، farhoodi@itrc.ac.ir
1 مقدمه
به باور بسیاری از صاحبنظران، علم داده جذابترین و پرکاربردترین علم قرن بیست و یکم است. در جهان امروز که فناوری حرف اول را میزند، همه افراد سؤالهایی دارند که تنها راه جواب دادن به آنها بررسی دقیق و کامل حجم قابلتوجهی از دادهها خواهد بود. از سازمانهای تجاری کوچکتر گرفته تا مؤسسات دولتی، همه دادههای نامحدودی در اختیار دارند که با دستهبندی، تفسیر و بهکار گرفتن آنها، میتوان مقاصد گوناگونی را برآورده کرد؛ البته این کار ساده نیست و میتواند چالشبرانگیز باشد. به عبارتی دیگر، سرمایه اساسی در حال انتقال از نفت به داده است و به همین دلیل است که از داده به عنوان نفت جدید نام میبرند. البته واضح است که داده نه تنها تمام شدنی نیست، بلکه با انجام هر تراکنش مالی، هر کلیک کاربر، نوشتن هر پیغام در شبکههای اجتماعی و بارگزاری هر تصویر جدید به حجم آن اضافه میشود. از سوی دیگر، تحلیلهای نتیجه شده از تحلیل دادهها خود نیز دادههای جدید هستند. حجم دادههای موجود بصورت نمایی در حال افزایش است. همین حقیقت ساده نشان میدهد که ما تا چه حد به علم داده و دانشمند داده نیاز خواهیم داشت.
همانطور که گفته شد، در عصر حاضر، دادهها از ارزش بسیار زیادی برخوردارند و شرکتهای مختلف با استخراج و تحلیل کلاندادهها به مزیت رقابتی دست مییابند؛ به عنوان مثال در خردهفروشیها با تحلیل رفتار خرید مشتریان در آن واحد، میتوان به سود بیشتری دست یافت. رشد داده که در سال 2020، 40 زتابایت1 تخمین زده شده بود، در سال 2025 به 175 زتابایت خواهد رسید که 90 زتابایت آن توسط دستگاههای مربوط به اینترنت اشیاء2 ایجاد میشود [1]. همچنین پیشبینی میشود که تا سال 2025، هر فرد بطور متوسط روزانه 5000 تراکنش دیجیتال با دستگاههای مختلف خواهد داشت [1] که این نشاندهنده حجم بسیار بالای تولید داده در آینده خواهد بود. از طرفی بنابر جمعبندی اتحادیه اروپا [2]، اقتصاد داده با رشد 12 درصدی از سال 2020 تا سال 2025 به 1.054 میلیارد یورو خواهد رسید. تعداد شرکتها و میزان اشتغال حوزه داده نیز که در سال 2018، به ترتیب 20 و 15 درصد از کل شرکتها بوده است، سالانه با رشد چشمگیری مواجه هستند.
بهرهبری از این موج جدید نیاز به سرمایه چندانی ندارد و بازار بسیار بکری برای فعالان اقتصادی فراهم آمده است. تنها مسئله حال حاضر، آشنا کردن صاحبان کسبوکارهای فناوری اطلاعات با سودهای سرشاری است که در شرکتهایشان راکد مانده است. پیشرفت تکنولوژی باعث کاهش هزینه جمعآوری اطلاعات و تحلیل آن توسط کسب و کارها شده است، لذا امروزه کسبوکارها میتوانند با صرف هزینه و زمان کمتر نسبت به گذشته به اطلاعات دقیقتری دست یافته، تصمیمهای آگاهانهتر و منطقیتری در مورد کسب و کار خود بگیرند. برخی از مزایایی که فناوری کلان دادهها برای کسبوکارها به همراه دارد عبارتند از [3]:
- کاهش هزینه: فناوریهای کلانداده مانند هدوپ3 و تجزیه و تحلیل مبتنی بر ابر میتواند کاهش چشمگیری در هزینهها داشته باشد. به عنوان مثال، شرکت ها به جای پردازش و ذخیره مقادیر زیادی از دادههای جدید در انبار دادهها، میتوانند از امکانات هادوپ استفاده کرده و دادهها را در صورت نیاز به انبارهای سازمانی منتقل نمایند.
- تصمیمگیری سریعتر و بهتر: امروزه تمامی سازمانها حتی سازمانهای کوچک نیز دارای وبسایت و صفحههای اجتماعی هستند. اطلاعات مربوط به استفاده کاربران از این صفحات میتواند منجر به تشکیل بانک دادهای برای سازمان باشد. این بدان معنی است که تمامی سازمانها میتوانند با اجرای روشها و الگوریتمهای مناسب، اطلاعات مناسبی را در مورد فضای کسبوکار، مشتریان خود و سلایق آنها به دست آورند و تصمیمگیریها خود را بهتر و سریعتر آنجام دهند.
- محصولات و خدمات جدید: کلانداده به شرکتها توانایی ارائه محصولات و خدمات جدید با امکان دریافت بازخورد مشتری را داده است. سازمانها برخلاف گذشته منتظر درخواست مشتری نیستند، بلکه از قبل نیاز مشتری را پیشبینی کرده و محصول را تولید میکنند. این مهم با کمک بررسی اطلاعات مربوط به عادات خرید مشتریان، سابقه جستجوهای آنها، و حتی سناریوهای فرضی به دست میآیند.
- توصیه محصول: با توجه به بررسی الگوهای موجود در جستجوهای اینترنتی فرد (و اطلاعات دیگری همچون محلهایی که فرد بیشتر به آنها مراجعه میکند)، میتوان ذائقهی وی در جستجویهای اینترنتی را شناسایی و پیشبینی کرده و محصولات یا محتوای جدید را به وی پیشنهاد داد، و بدین ترتیب از حضور وی در وبسایت مراقبت شود.
- تشخیص تقلب: سازمانهایی که فعالیتهای مالی بزرگی دارند، همواره به دنبال راههایی ارزانتر و موثرتر برای جلوگیری از سوءاستفادههای مالی هستند. برای مثال بیمههای درمانی سالانه هزینههای چشمگیری را به دلیل خسارت ناشی از کلاهبرداریهای مختلف متحمل میشوند. در گذشته بیمهها اطلاعات مربوط به صورتهزینههای مدعیان را با استانداردهای خود مقایسه کرده، به واقعی بودن یا نبودن ادعا پی میبردند، که این فرایند از چند هفته تا چند ماه زمان نیاز داشت. امروزه به کمک بررسی فاکتورهای مختلف، تشخیص ویدئویی، تشخیص مکالمه، و یادگیری ماشین (با کمک کلانداده) به شناخت الگوهای تقلب پرداخته و از ضررهای ناشی از سوءاستفادههای مالی میکاهند.
در این مقاله، ابتدا به مزایای استفاده از کلاندادهها در کسبوکارها پرداخته و سپس مدل مفهومی حوزه داده ارائه میگردد. در انتها نیز یک پیماش جامع بر روی شرکتهای متقاضی دانشبنیانی در داخل کشور که محوریت کسبوکار آنها بر روی داده میباشد انجام شده و نتایج بررسی ارائه میگردد.
2 کارهای انجام شده
طبق بررسیهای بعمل آمده، پژوهشهای متعددی به ارائه ابعاد داده از منظرهای مختلف پرداختهاند. به عنوان مثال در [4] یک درختواره4 برای مدلهای کسبوکار حوزه داده ارائه شده که از اطلاعات شرکتهای استارتاپ برای تهیه این مدل استفاده نموده است. [5] با تمرکز بر چالشهای حوزه داده به ارائه مدل مفهومی این حوزه پرداخته است و تلاش کرده تا سه بعد مرتبط بودن، جامعیت و اولویتهای نسبی را در آن نشان دهد. هدف از ارائه مدل مربوطه، افزایش کیفیت فرایند تصمیمگیری میباشد. در مقاله [6]، هدف اصلی توسعه یک مدل جامع برای کلانداده میباشد که شامل عواملی است که در موفقیت یا عدم موفقیت اجرای کلاندادهها در سازمانها نقش دارند. و لذا مدل پیشنهادی در این مقاله عوامل مهمی را در اختیار مدیران فناوری اطلاعات و تصمیمگیران قرار میدهد که برای اطمینان از دستیابی به مزیت رقابتی باید در هنگام تصمیمگیری برای استفاده از کلانداده در نظر بگیرند. همچنین در [7] و [8] و [9]، درختواره یا بعبارتی ابعاد مختلفی برای کلانداده براساس مقالات مرتبط ارائه دادهاند. در مقاله [10] نیز با هدف تاکید بر ذخیرهسازی، پیشپردازش، پردازش و امنیت، به ارائه یک درختواره برای مدیریت حوزه کلانداده پرداخته است.
نتایج پژوهشهای انجام شده نشان میدهد که هر یک از مدلهای ارائه شده در این پژوهشها، تمرکز خود را بر روی بخشی از موضوع کلانداده گذاشتهاند؛ بعنوان مثال مدل ارائه شده در [5] با تمرکز بر تصمیمگیری در سازمان و افزایش کارایی آن به ایجاد و ترسیم مدل پرداخته است و لذا تمام جنبههای حوزه کلانداده را شامل نمیشود. اما در مقاله حاضر، سعی شده است با دید کلیتری به موضوع نگاه شود و به منظور درک دانش و مفاهیم مطرح در این حوزه به ترسیم یک تصویر کلان5 و یا نمایش مفاهیم این حوزه و ارتباط بین آنها با عنوان مدل مفهومی پرداخته شود. روش مورد استفاده در این مقاله براساس مطالعه پژوهشهای مرتبط با حوزه کلانداده و استخراج مفاهیم این حوزه و سپس تعیین ارتباطات بین مفاهیم میباشد. لازم به ذکر است برای تکمیل و پوشش حداکثری مفاهیم مرتبط در حوزه داده و تعیین ارتباطات بین آنها از نظرات خبرگان و صاحبنظران این حوزه نیز استفاده شده است.
از طرفی برای بازنمایی دانش ذکر شده از مدل درختواره استفاده شده است. لذا هدف از این مقاله ارائه یک تصویر کلان از ابعاد مختلف موضوع کلان داده است که از مدل مذکور برای ترسیم مفاهیم و ارتباط بین آنها استفاده شده است.
بطور کلی، يكي از مدلهاي بازنمايي دانش، مدل بازنمايي مبتني بر هستانشناسي (یا درختواره) است [11]. فعالیتهای زیادی درخصوص ارائه مدل مفهومی از یک مسئله یا موضوع انجام شده است ولی تعداد محدودی از آنها جهت بازنمایی دانش حوزه از مدل مفهومی مبتنی بر هستانشناسی استفاده کردهاند [11] تا [14]، [15] و [16]. در تمامی موارد یاد شده، مدل مفهومی موضوع مربوطه ترسیم شده و در برخی از آنها با استفاده از مدل مفهومی به استخراج پروژهها و یا حوزههای فعالیت ارائه شده است. در [17]، با ارائه يك مدل مفهومي متشكل از دو سطح فني و غیرفنی به معرفي جامعي از روندها و حوزههاي تحقيقاتي نوين دادههاي عظيم (کلان دادهها) پرداخته شده است.
3 مدل مفهومي حوزه داده
در این بخش به تشریح مدل مفهومی پیشنهادی در حوزه کلانداده پرداخته و ابعاد مختلف آن را از منظرهای مختلف بررسی خواهیم کرد. مدل مفهومی در واقع چارچوبی است که در آن به شکلی نظاممند نیازمندیهای فنی و محيطی يك موضوع بیان ميشود [11]. برای بازنمایی این مدل مفهومی لازم است تا شناخت خوبی بر روی نیازمندیهای موضوع داده وجود داشته باشد تا بتوان این نیازمندیها را با فرایندها، روشها، ابزار و استانداردهای موجود تطبیق داد. مدل مفهومی یک واژه شناخته شده است و عموماً به درک مفهومی مسئلهای قبل از تحلیل و طراحی اطلاق میگردد.
در اين بخش ابتدا ابعاد مختلف حوزه داده معرفي ميشوند و پس از آن مدل مفهومي مبتني بر درختواره ارائه خواهد شد.
1،3 ابعاد مختلف مطرح در حوزه کلانداده
همانطور که بطور ضمنی اشاره شد، موضوع داده و توسعه کاربردهای آن، ابعاد مختلفی دارد. در شکل 1، جنبههای گوناگون این مسئله نمایش داده شده است که در ادامه هریک از این ابعاد و مباحث پیرامون آن مورد بررسی قرار گرفته است:
§
شکل 1. ابعاد مختلف حوزه کلان داده |
§ قالب: در این بخش به قالب دادههای گردآوری و یا تولید شده توسط سازمانها، افراد، ابزارها و یا نرمافزارها اشاره میشود.
§ کاربرد: دادهها معمولا با هدف کاربردهای مختلف مورد تحلیل یا پردازش قرار میگیرند که در این بخش، به این کاربردها اشاره شده است.
§ فناوری: امروزه بدلیل اهمیت داده، بسیاری از فناوریهای روز دنیا مبتنی بر داده هستند که مصادیق آن در این بخش نام برده شده است.
§ ذينفعان: در اين بعد به ذينفعان این حوزه از جمله مشتريان و نقشآفرينان كه در واقع همان تولیدکنندگان و صاحبان داده، کاربران داده و نیز توسعهدهندگان خدمات هستند اشاره میگردد.
2،3 مدل مفهومی مبتنی بر درختواره
جهت تهيه مدل مفهومي این حوزه تلاش گردید تا با مطالعه تطبيقي نمونههاي موجود و بررسي پژوهشهاي انجام شده و همچنين مشورت با افراد متخصص و صاحبنظر این حوزه، به بررسی ابعاد مختلف ذکر شده در بالا بپردازیم. شکل2، مدل مفهومي تهيه شده حوزه داده را نشان ميدهد. در اين شكل به منظور بازنمايي دانش اين حوزه، از درختواره استفاده شده است. همانگونه كه پيش از اين بيان شد براي تعيين روابط اصلي و گرههاي مربوطه آن در ترسيم مدل مفهومي ابتدا ابعاد مختلف این حوزه شناسایی شد و در مرحله بعد، هر یک از این جنبه ها بسط داده شدند.. براي آشنايي بيشتر با مباحث مطروحه در هر يك از ابعاد موضوع داده در ادامه به شرح هر يك از آنها پرداخته ميشود.
1.2.3 انواع داده
دادههای موجود در فضای مجازی اعم از وب و شبکههای اجتماعی، به شکلهای مختلفی تولید شده و در دسترس وجود دارد. این انواع عبارتند از دادههای متنی، صوتی (یا گفتاری)، تصویری و ویدئویی.
2.2.3 قالب داده
همانطور که در شکل 2 نیز مشخص است، قالب دادهها را میتوان در سه دسته ساختیافته، نیمهساختیافته و غیرساختیافته یا بدون ساختار دستهبندی کرد [18]. هر دادهای که قابلیت ذخیره شدن، دسترسی و پردازش را داشته باشد و به یک قالب ثابت باشد، به عنوان یک «داده ساختیافته» در نظر گرفته میشود. مقابل این تعریف، دادههای غیرساختاری میشوند. دادههای نیمه ساختیافته میتوانند هر دو نوع داده (ساختیافته و غیرساختیافته) را شامل شوند. ما میتوانیم دادههای نیمه ساختیافته را به صورت ساختیافته ببینیم اما در صورتی که بخواهیم آنها را به عنوان یک جدول رابطهای در نظر بگیریم، درDBMS تعریف نشده است. به عنوان مثالی از آن میتوان به دادههای موجود در یک فایل اکسل اشاره نمود.
3.2.3 منابع داده
منابع داده در کسبوکارهای دادهمحور را میتوان به دو دسته منابع داده داخلی و خارجی تقسیم کرد. دادههای داخل شرکت شامل دادههایی است که یا در شرکت موجود هستند و یا توسط شرکت تولید میشوند. تولید داده در داخل شرکت یا از طریق کارمندان و بوسیله سنسورها و ابزار ردیابی صورت میگیرد و یا از طریق جمع سپاری6 بدست میآید. دادههای خارجی نیز به سه دسته دادههای ارائهشده توسط مشتری، دادههای رایگان و دادههای اکتساب شده از عامل سوم تقسیم میشود. دادههای رایگان خود شامل دادههای باز در دسترس، دادههای بدست آمده از شبکههای اجتماعی و دادههایی که از خزش وب بدست میآیند میباشد [4].
4.2.3 کاربرد داده
امروزه داده به سرعت در حال گسترش است و بدلیل استفاده روزافزون از سامانههای دیجیتال و منابع تولید اطلاعات، کاربرد داده در تمامی حوزههایی که با دادهها و تحلیل آنها سر و کار دارند، گسترش یافته است و نتایج بسیار قابل توجهی نیز منتج شده است [7]. با توجه به تعدد حوزههای کاربردی دادهها، ذکر تمامی کاربردهای موجود امکانپذیر نیست و در شکل 2 به برخی از این موارد از قبیل حوزههای بانکداری، سلامت، حمل و نقل، آموزش، بورس، رسانه و سرگرمی، تبلیغات و غیره اشاره شده است [19].
5.2.3 فناوریهای مرتبط
با توجه به فرصت های کسب و کاری حوزه و همچنین اهمیت روزافزون دادههای تولید شده از ابزارها و یا افراد مختلف، میتوان گفت داده، محوریت اغلب فناوریهای روز دنیا را تشکیل میدهد. به عنوان مثال فناوریهایی از قبیل اینترنت اشیاء، بیومتریک، زنجیره بلوکی، واقعیت مجازی، هوش مصنوعی و ... در زمره این فناوریها قرار داد.
6.2.3 ذینفعان
ذينفعان اين حوزه را به طور كلي ميتوان در دو گروه مشتريان و نقشآفرينان دستهبندي نمود [12] و [15]. در ادامه تعريف هر يك از این دو گروه و نقشهاي مؤثر آنها فهرست شده است. لازم به توضيح است كه بسياري از شركتها ميتوانند نقشهاي مختلفي را ايفا نمايند به عنوان مثال يك شركت توسعهدهنده خدمات میتواند خود تولیدکننده داده و از طرفی مشتری یکی از خدمات حوزه دادهای باشد.
الف) مشتريان: مشتريان حوزه داده را ميتوان در دو گروه حقيقي و حقوقي دستهبندي كرد:
§ حقيقي: اين گروه از مشتريان، در واقع كاربران نهایی یا همان استفادهکنندگان داده یا خدمات مبتنی بر داده هستند. افرادی از قبیل گردشگران، مدیران، کاربران عمومی که اغلب از نتایج تحلیل و پردازش دادهها استفاده میکنند یا پژوهشگرانی که علاوه بر استفاده از دادههای پردازش شده، خود میتوانند با استفاده از دادههای خام، به تحلیل آنها پرداخته و اطلاعات و یا دانش مربوطه را ایجاد نمایند.
§ حقوقي: كاربران حقوقي شامل سازمانها و شركتهايي هستند كه به عنوان مصرفكننده داده چه به لحاظ استفاده از خود داده و چه به لحاظ استفاده داده جهت پردازش و تحلیل محسوب ميشوند. شرکتهای خصوصی و بینالمللی، بانکها، مراکز پژوهشی مصادیقی از این نوع مشتریان هستند.
ب) نقشآفرينان: معمولا به سه دسته حاکمیت، صاحبان و یا تولیدکنندگان داده و همچنین ارائهدهندگان خدمات مبتنی بر داده تقسیم میشوند.
شایان ذکر است موارد ذکر شده در شکل 2 تنها مصاديقي از انواع مشتريان و نقشآفرينان هستند كه مسلماً ميتوان برای هر دسته نمونههای بیشتری را نیز نام برد.
7.2.3 مدل درآمد
هر شرکت برای دوام و ماندگاری در طولانی مدت، حداقل نیاز به یک مدل درآمدی دارد. مدلهای درآمدی در کسبوکارهای دادهمحور عبارتند از: فروش دارایی، وام دادن و اجاره دادن، صدور مجوز، هزینه بر حسب استفاده، حق عضویت، حق کمسیون و تبلیغات [4].
8.2.3 حوزههای فعالیت داده
در مدل مفهومی ارائه شده، باید گفت بخشی که استارتاپهای حوزه داده میتوانند از داده خلق ارزش یا ثروت نمایند، همان بخش مربوط به حوزههای فعالیت داده به همراه زیرمجموعههای مطرح شده در آنها میباشد که عبارتند از: تولید و جمعآوری داده، ذخیره و بازیابی، تحلیل، مصورسازی، حکمرانی داده و بازکردن داده.
الف) تولید/جمعآوری داده
معمولا دادهها بطور مستمر در فضای مجازی از طریق افراد و یا ابزارهای مختلف در حال تولید و انتشار هستند؛ لذا جمعآوری دادههای پراکنده موجود در سایتها و یا سازمانهای مختلف و دستهبندی آنها به منظور انجام پردازش از فعالیتهای مهمی است که در حوزه داده انجام میشود. برخی شرکتهای مطرح دنیا تنها به پردازش بر روی آرشیو اطلاعات و مستندات موجود در وب پرداخته و سپس آن را بر اساس نیاز دراختیار شرکتهای تحلیلگر قرار میدهند. منابع تولید دادهها بسیار مختلف و متنوع است. داده معمولا از روشهای مختلف تولید و یا جمعآوری میشود که عبارتند از: حسگرهای اینترنت اشیاء، بستر جمعسپاری، خزش وب و غیره.
ب) ذخیره و بازیابی داده
ذخیره و بازیابی کلاندادهها به دلیل ويژگیهای کلان داده از قبیل حجم، سرعت تولید، تنوع، صحت و غیره از اهمیت زیادی برخودار است و چالشهای زیادی را به دنبال دارد. به عنوان مثال، دادهها در کلانداده بصورت جریانی تولید میشود. داده جریانی به دادهای گفته میشود که دارای فرایند پردازشی بصورت بلادرنگ است. موضوع ذخیرهسازی در تمامی فرایندهای از قبیل استخراج داده، پیشپردازش، پردازش و انتقال داده نقش بازی میکند.
ذخیرهسازی دادهها میتواند بصورت رابطهای (مانند SQL) و یا غیررابطهای (مانند No SQL) باشد که در مبحث کلانداده عمدتا از روش غیررابطه ای برای ذخیره استفاده میشود. روش غیررابطهای خود شامل انواع مختلفی از قبیل ذخیرهسازی مبتنی بر سند، مبتنی بر ستون، مبتنی بر گراف و مبتنی بر کلید/مقدار میباشد [8].
ج) تحلیل داده
با گسترش روزافزون استفاده از فناوری اطلاعات و نرخ بالای تولید اطلاعات دیجیتال، توسعه فناوریها و روشهای تحلیل کلان دادهها از اهمیت بسزایی برخوردار شدهاند. با توجه به میزان خودکار بودن فرایند تجزیه و تحلیل میتوان آن را به چهار گروه توصیفی، تشخیصی، پیشگویانه و تجویزی تقسیم نمود [20]. در تجزیه و تحلیل توصیفی، هدف پاسخ به این نوع سوالات است: چه اتفاقی افتاده است و یا چه چیزی دارد اتفاق میافتد. در این روش با دستیابی به سوابق که ریشه در گذشته و حال دارد، امکان تحلیل داده مبتنی بر رویدادهای گذشته و حال و همچنین تولید بینش میسر میشود. از این نوع تحلیل میتوان به خوشهبندی اشاره نمود.
در تجزیه و تحلیل تشخیصی، هدف اصلی پاسخ به این نوع سوالات است: چرا این اتفاق افتاده است و یا چرا دارد این اتفاق میافتد؟ روند به چه صورت است؟ چه الگویی وجود دارد؟ در این روش با بررسی سوابق داده، بینش ایجاد میگردد. تجزیه و تحلیل احساسات، تحلیل لاگ، کشف الگوهای تقلب و غیره مصادیقی از این نوع تحلیل هستد.
در تجزیه و تحلیل پیشگویانه، هدف اصلی پاسخ به این نوع سوالات است: چه چیزی اتفاق خواهد افتاد؟ چگونه میتوان واکنش نشان داد؟ در این نوع، با تحلیل داده و تولید بینش امکان پیشبینی داده جدید در رابطه با حال و آینده وجود دارد. پیشبینی رفتار مشتری نمونهای از این نوع تحلیل است. در تجزیه و تحلیل تجویزی، هدف اصلی پاسخ به این نوع سوالات است: چه کاری بایستی انجام شود تا این اتفاق بیفتد.
از طرفی، روشهای متعددی برای تحلیل وجود دارد [9] که به عنوان نمونه میتوان یادگیری ماشین و پردازش زبان طبیعی را برشمرد. روشهای یادگیری ماشین بصورت خودکار و مقیاس پذیر اجازه بینش دادههای کلان و چندبعدی را امکانپذیر میسازند.
د) مصورسازی داده
مصورسازی در واقع عبارت است از شیوههای بازنمایی و ارائه داده یا اطلاعات در قالبهای تصویری. این روش نمایش با بهرهگیری از فنون خاص انجام میپذیرد و قادر است اطلاعات را در یک فرایند دیداری با قدرت بیشتر در درک و شناخت آن عرضه نماید.
مصورسازی عمدتا در جهت کاربردپذیر ساختن دادهها است [21]. کاربردهای مختلفی برای این امر وجود دارد. نکتهای که در رابطه با تفاوت میان مصورسازی علمی و مصورسازی اطلاعات باید بیان کرد این است که مصورسازی علمی عمدتا به منظور کاربردپذیر ساختن دادههای فیزیکی بکار میرود، درصورتیکه مصورسازی اطلاعات، به شیوههای تصویرسازی عملی دادههای انتزاعی میپردازد.
همچنین مصورسازی میتواند به یکی از روشها یا شکلهای دوبعدی، چندبعدی، سلسله مراتبی، شبکهای و سیر زمانی صورت پذیرد.
ه) حکمرانی داده
هدف از حکمرانی یا حاکمیت داده این است که به سازمان کمک کند تا دادههای خود را به عنوان یک دارایی مهم سازمانی مدیریت نماید.
حکمرانی داده، مجموعهای از اصول، سیاستها، فرایندها، چارچوبها و سنجهها را فراهم میآورد و سعی میکند تا بر مدیریت دادهها نظارت کند و فعالیتهای مدیریت داده را در تمامی سطوح هدایت کند. حکمرانی داده شامل بخشهای متنوعی است [22] که در شکل 11 نشان داده شده است. برخی از این موارد عبارتند از: یکپارچهسازی داده، معماری داده، مدیریت محتوا و اسناد، مدلسازی و طراحی داده، ذخیرهسازی و عملیات داده و ... .
ی) توزیع و باز کردن داده
تا چند سال پیش، اشتراک دادهها و یا باز کردن آنها ایدهای غیرقابل تصور بود؛ زیرا صاحبان داده نگران از بین رفتن زحمتها و یا مزیت رقابتی خود بودند. اما امروزه با تمرکز جامعه علمی بر روی دسترسی آزاد، محققان متوجه مزایا و نیاز به دسترسی و اشتراکگذاری آزاد دادهها شدهاند. با گذشت زمان، موسسات، انتشارات، حامیان مالی و محققان بیشتری به مزایای دسترسی آزاد اطلاعات پی میبرند. نمونهای از انواع دادههایی که میتواند بصورت آزاد در دسترس قرار گیرد عبارت است از: دادههای علمی و پژوهشی دانشگاهها و مراکز پژوهشی، دادههای سازمانی و دادههای دولتی.
از طرفی بسته به نیاز متقاضیان داده، هر یک از انواع دادهها را میتوان به یکی از صور خام (بدون هیچگونه پردازشی بر روی داده)، دادههای پردازش شده و یا دادههای گرافیکی (مانند اینفوگرافی یا نمودارهای مختلف) و یا به هر سه شکل آزادرسانی نمود.
4 بررسی و تحلیل کسبوکارهای دادهمحور در کشور
همانطور که در مدل مفهومی پیشنهادی نشان داده شد، حوزههای فعالیت بر روی دادهها عبارتند از: تولید و جمعآوری داده، ذخیره و بازیابی، تحلیل، مصورسازی، حکمرانی و توزیع و بازکردن داده.
[1] Zettabytes
[2] Internet of Things (IOT)
[3] Hadoop
[4] Taxonomy
[5] Big Picture
[6] Crowdsourcing
شکل 2. مدل مفهومی حوزه داده مبتنی بر درختواره |
در این مقاله، برای بررسی وضعیت کسب و کارهای دادهمحور در کشور، یک مطالعه موردی بر روی شرکتهای متقاضی دانشبنیانی این حوزه انجام شد. در این خصوص، 275 محصول فعال در کشور که توسط 189 شرکت توسعه داده شدهاند، مورد بررسی قرار گرفته است.
مبنای استخراج محصولات، دستهبندی جامع و استاندارد تصویب شده در «کارگروه ارزیابی و تشخیص صلاحیت شرکتها و موسسات دانش بنیان حوزه فناوری اطلاعات» بوده است که از طریق سامانه دانشبنیان1 در دسترس عموم است.
بر اساس این سطحبندی، دستههایی که محصولات و خدمات مرتبط با پردازش و تحلیل دادهها را تحت پوشش دارند، انتخاب شدهاند. تحلیل آماری در دو سطح 3 و 4 دستهبندی محصولات دانش بنیان حوزه فناوری اطلاعات انجام شده است. نتایج این بررسی همراه با جزئیات در ادامه ارائه شده است.
شکل 3، سیر زمانی ثبت شرکتهای فعال در حوزه داده را در کشور نشان میدهد. همانطور که در شکل مشخص است، از سال 93 الی 96، بیشترین نرخ ثبت شرکتها در این حوزه را داشتهایم. شاید بتوان دلیل عدم رشد ثبت این شرکتها در سالههای اخیر را نرخ بالای تورم و هزینهبر بودن خرید سختافزار و زیرساختهای ارائه سرویس، تحریمها و ... دانست که متاسفانه مانعی برای ورود افراد توانمند به این حوزه شده است.
شکل 3. سیر زمانی ثبت شرکتهای حوزه داده
همچنین این شرکتها در 23 استان کشور، ثبت و در حال فعالیت هستند (از سایر استانها، اطلاعاتی در این خصوص ثبت نشده است). پراکندگی جغرافیایی این شرکتها در شکل 4 نشان داده شده است.
بدلیل تعداد بالای شرکتها در استان تهران، در شکل 4 وضعیت استانهای دیگر خیلی واضح نیست؛ لذا صرفنظر از استان تهران که به تنهایی دارای 134 شرکت در حوزه داده است، وضعیت مابقی استانها در شکل 5 ارائه شده است.
شکل 4. پراکندگی استانی شرکتها
شکل 5. پراکندگی استانی شرکتها ( بدون در نظر گرفتن تهران)
در شکل 6 مجموع درآمد شرکتهای دارای محصولات حوزه داده به تفکیک سال مشخص شده است. این درآمد بر اساس اظهارنامه ارائه شده شرکتها محاسبه شده است.
شکل 6. درآمد اظهار شده شرکتها به تفکیک سال (میلیارد تومان)
همانطور که در شکل فوق هم مشخص است، درآمد اظهار شده شرکتها در سال 1396 بیش از سالهای 1397 و 1398 بوده است. متاسفانه آمار نشان میدهد که در یکی دو سال اخیر بدلیل اعمال تحریمهای بیشتر از جمله تحریمهای سختافزاری و نرمافزاری و نیز مشکلات اقتصادی شرکتها، فعالیت آنها چه به لحاظ رونق تولید محصولات و چه به لحاظ درآمدزایی با افت محسوسی مواجه شده است.
شکل 7. تعداد محصولات حوزه داده به تفکیک دستههای مختلف
شکل 7، تعداد محصولات هر یک از سه دسته محصولات مرتبط با داده را نمایش میدهد. همانطور که در نمودار نمایان است، بدلیل اهمیت و کاربرد روزافزون مباحث مربوط به تحلیل و مصورسازی دادهها، نرمافزارهای توسعه داده شده در این دو دسته نیز تعداد قابل توجهی را به خود اختصاص دادهاند که میتواند بیانکننده بلوغ نسبی محصولات موجود در کشور در هر دسته باشد.
شکل 8، بیانگر سن شرکتهای توسعهدهنده محصولات است. همانطور که در شکل مشخص است، درصد شرکتهای با رده سنی زیر 10 سال بیش از سایرین است که میزان توجه به محصولات این حوزه با زمان ظهور و گسترش فناوریهای پردازش و تحلیل داده مطابقت دارد.
شکل 8.تعداد محصولات شرکتها در بازههای سنی مختلف
در شکل 9 مقایسهای میان تعداد و فروش محصولات با توجه به سن شرکتهای توسعه دهنده محصولات، انجام شده است.
شکل 9. میزان فروش محصولات با توجه به سن شرکتها |
نکته جالب توجه در دو نمودار ارائه شده در شکل 9، میزان فروش محصولات شرکتهای زیر 3 سال و بین 3 تا 10 سال است. نتایج نشان میدهد علیرغم نزدیک بودن تعداد محصولات در این دو گروه، فروش حاصل شده در شرکتهای بین 3 تا 10 سال، حدود صد برابر فروش محصولات در شرکتهای نوپا است.
بررسی دیگری که بر روی اطلاعات مستخرج صورت گرفت، بازار هدف محصولات است؛ بدین مفهوم که آیا این محصولات برای کاربرد عام توسعه داده شدهاند و یا بازار خاصی برای فروش و ارائه خدمت مدنظر ارائهکنندگان آنها بوده است. بر این اساس و با مطالعه ویژگیهای تکتک محصولات مشخص شد که در بین بازارهای عمودی، دو حوزه «فینتک» و «رسانه» بیش از سایرین مورد توجه بوده است.
شکل 10: سهم هريک از حوزههای کاربردی محصولات |
شکل 11 نیز نشان میدهد که در دسته «نرمافزارهای تجمیع، تحلیل، اشتراک و مصورسازی» درصد بیشتری از محصولات برای استفاده در بازارهای خاص توسعه داده شدهاند.
شکل11: تفکیک حوزههای کاربردی محصولات توسعه داده شده
همانطور که در ابتدای این بخش توضیح داده شد، هر یک از سه دسته مورد بررسی در بالا، خود شامل زیردستههایی است که ویژگیها و کارکرد محصولات را بیشتر نمایان میسازد. لذا در ادامه، آمار مربوط به هریک از زیردستهها بصورت مجزا ارائه شده است.
شکل12: محصولات حوزه مدیریت داده |
شکل13: محصولات حوزه تجمیع، اشتراک و مصورسازی داده |
شکل14: محصولات حوزه تحلیل محتوا |
از آنجائیکه محصولات در سالهای مختلفی تولید و ارائه شدهاند، لذا نمیتوان رقم فروش محصولات را با یکدیگر مقایسه کرد. اما با توجه به توزیع محصولات هر زیردسته در سالهای مختلف و برای اینکه تصویری نسبی از اقبال بازارهای داخل کشور به محصولات مذکور ایجاد شود، در جدول1، مقایسهای از فروش محصولات زیردستههای مختلف آورده شده است. البته با توجه به توضیحاتی که در بالا ذکر شده است، بجای ذکر ارزش ریالی، به سهم هر دسته از مجموع فروش محصولات مورد بررسی اکتفا شده است.
جدول1: مقایسه تعداد و سهم فروش محصولات زیردستههای مختلف
| تعداد محصولات | سهم فروش از کل |
پلتفرمهای اشتراکگذاری و تجمیع داده | 1 | 0.32% |
ابزارها و خدمات دادهکاوی | 48 | 5.83% |
هوش تجاری | 57 | 23.96% |
مدیریت پایگاه داده | 12 | 6.02% |
مدیریت و پردازش کلان دادهها | 35 | 55.09% |
نرمافزارهای آنالیز متن | 63 | 7.04% |
نرمافزارهای آنالیز و سنتز صدا | 24 | 0.23% |
نرمافزارهای آنالیز ویدئو و تصویر | 25 | 1.06% |
ابزار جستجو و توصیهگر | 10 | 0.45% |
جدول 1 نشان میدهد که زیردسته «مدیریت و پردازش کلان دادهها» که شامل ارائه راهکار و راهاندازی خدمات پردازش و ذخیرهسازی کلان دادهها میشود، بیشترین حجم فروش را به خود اختصاص داده است. راهاندازی و ارائه خدماتی مانند Spark، Hadoop و Zookeeper در این دسته قرار دارند.
نکته لازم به ذکر در رابطه با حوزه کاربردی محصولات، استفاده قابلتوجه از محصولات دو زیردسته «ابزارها و خدمات دادهکاوی» و «نرمافزارهای آنالیز متن» به ترتیب در حوزههای فین تک و محصولات رسانهای است. طبق بررسیهای صورت گرفته، از بین محصولات ارزیابی شده در این دو زیردسته، 34 درصد از نرمافزارهای تحلیل متن در حوزه رسانه با محوریت خزش اخبار و شبکههای اجتماعی و 35 درصد از ابزارها و خدمات دادهکاوی در حوزه فینتک با محوریت الگوریتمهای معاملاتی بورس و سرمایهگذاری توسعه داده شدهاند.
5 نتیجهگیری و کارهای آتی
امروزه بسیاری از شرکتها با تحلیل دادهها، ایجاد پایگاههای داده، مدیریت دانش و فروش خدمات مبتنی بر داده به درآمدهای هنگفتی رسیدهاند. همانطور که میدانیم روزانه تصمیمات زیادی در سطح خرد و کلان گرفته میشود که این تصمیمها اثرات زیادی بر موفقیت کسب و کارها دارد. همین امر سبب شده که کسب و کارهایی شکل بگیرند که به دنبال سنجش اثرات تصمیمها با استفاده از دادهها هستند. لذا فعالیتهای زیادی از قبیل فروش گزارشات تحلیلی رفتار مشتریان و ذائقهسنجی کاربران، پیشبینی رویدادها یا رفتار مشتری، کشف تقلب و غیره از جمله مواردی هستند که شرکتها به آنها پرداختهاند. از طرفی از آنجا که در فناوریهای نوظهور از قبیل اینترنت اشیاء و غیره، دادگان نقش بسیار زیادی دارد و بصورت جریانی تولید میشود بحث کلان داده و پردازشهای مربوطه از اهمیت فوقالعادهای برخوردار است. لذا در این مقاله سعی شد تا از طریق یک مدل مفهومی مبتنی بر درختواره به تشریح ابعاد مختلف داده بپردازیم. در ادامه تلاش کردیم تا با پیمایش وضعیت استارتاپهای حوزه داده به استخراج و تحلیل جنبههایی از داده که قابلیت بیشتری برای خلق ارزش و درآمد دارند، برسیم. نتایج بررسیها نشان داد که دو حوزه تحلیل و مصورسازی داده بیش از دیگر حوزهها در داخل کشور مورد توجه قرار گرفته است که دلیل آن هم کاربرد و نیز ارزشآفرینی بیشتر این دو حوزه در صنایع و کسبوکارهای مختلف است. همچنین نتایج نشان داده که جدا از کاربردهای عمومی دو حوزه «فینتک» و «رسانه» بیش از سایرین مورد توجه بوده است. همچنین پس از بررسی سهم فروش محصولات این دسته در کشور، مشخص شد که محصولات مربوط به «مدیریت و پردازش کلاندادهها» که شامل ارائه راهکار و راهاندازی خدمات پردازش و ذخیرهسازی کلان دادهها میشود، بیشترین حجم فروش را به خود اختصاص داده است. لازم به ذکر است که میزان قابل توجهی از شرکتهای مورد بررسی بر روی محتوای اخبار، شبکههای اجتماعی و اطلاعات مربوط به معاملات بورس سرمایهگذاری کردهاند. البته بدلیل وجود دادههای کلان و با ارزش در اغلب شرکتها، نهادها و سازمانهای مختلف هنوز جای کار زیادی در این حوزه وجود دارد که میتوان با درک اهمیت آن به ارزشآفرینی بیشتری در حوزهها و صنایع مختلف از قبیل گردشگری، سلامت، کشاورزی، بانکداری و غیره پرداخت.
مراجع
[1] D. Reinsel, J. Gantz, J. Rydning, "The Digitization of the World from Edge to Core", IDC White Paper, 2018
[2] European Council Conclusion, Building a Data Economy in the European Union Data. Innovation. Growth., 2019
[3] B. M.Balachandran, Sh. Prasad, "Challenges and Benefits of Deploying Big Data Analytics in Cloud for Business Intelligence", Procedia Computer Science, vol. 112, pp. 1112-1122, 2017
[4] Ph. Hartmann, M. Zaki, N. Feldmann, A. Neely, "Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms", University of Cambridge, 2014
[5] E. Park, L. Chung, H. M. Johng, V. Sugumaran, et al., "A Big Data Conceptual Model to Improve Quality of Business Analytics", in Research Challenges in Information Science, pp 20-37, June 2020
[6] M. Halaweh, A. E. Massry, "Conceptual Model for Successful Implementation of Big Data in Organizations", Journal of International Technology and Information Management, vol. 24, Issue 2, pp. 21-34, 2015
[7] محمدشهرام معین، برزگر، نکیسا، وحید رادمهر، کاربردهای کلان داده، پروژه تدوین نقشه راه کلان داده، پژوهشگاه ارتباطات و فناوری اطلاعات، 1395
[8] محمدشهرام معین، ملکی، داود، محمدرضا احمدی و سیدمحمدرضا میرصراف، ذخیرهسازی دادهها، پروژه تدوین نقشه راه کلان داده، پژوهشگاه ارتباطات و فناوری اطلاعات، 1395
[9] محمدشهرام معین، جمپور، مهدی، نکیسا برزگر، اکبر دارابی و سمیه فتاحی، تحلیل کلاندادهها، پروژه تدوین نقشه راه کلان داده، پژوهشگاه ارتباطات و فناوری اطلاعات، 1395
[10] A. Siddiqa, I. A. T. Hashem, I. Yaqoob, et al., "A survey of big data management: Taxonomy and state-of-the-art", Journal of Network and Computer Applications, vol. 71, pp. 151-166, 2016
[11] محمودی، مریم، همایون بهشتی و عليرضا ياري، مدل مفهومي موتورجستجوي فارسي، پژوهشگاه ارتباطات و فناوری اطلاعات، 1389
[12] محمودی، مریم، مژگان فرهودی، علی شریفی، علیرضا یاری و کامبیز بدیع، ارائه مدل مفهومی پیشنهادی جویش در فضای وب، اولین همایش ملی جویشگر بومی، 1394
[13] فرهودی، مژگان، شهریار سموری و عليرضا ياري، مدل مفهومي سامانه پرسش و پاسخ، پژوهشگاه ارتباطات و فناوری اطلاعات، 1389
[14] عظیمزاده، معصومه، محمد امین فرجیان و عليرضا ياري، مدل مفهومي ترجمه ماشینی با هدف تهیه قالبهای تعریف پروژهها و تدوین برنامه اجرایی آن، پژوهشگاه ارتباطات و فناوری اطلاعات، 1389
[15] محمدشهرام معین، ملکی، داود، محمدرضا احمدی و سیدمحمدرضا میرصراف، ذخیرهسازی دادهها، پروژه تدوین نقشه راه کلان داده، پژوهشگاه ارتباطات و فناوری اطلاعات، 1395
[16] R. Vatananan-Thesenvitz, N. Gerdsri. "The current state of technology roadmapping (TRM) research and practice", International Journal of Innovation and Technology Management, vol. 9, no. 4, pp. 1 – 10, 2010
[17] یاری، عليرضا، احسان آريانيان و مژگان فرهودي، "ارائه مدل مفهومي روندها و حوزههاي تحقيقاتي دادههاي عظيم"، همايش دادههاي عظيم، پژوهشگاه ارتباطات و فناوري اطلاعات، 1393
[18] S. Karamizadeh, Sh. M. Abdullah, M. Zamani, A. Kheirkhah, "Pattern Recognition Techniques: Studies on Appropriate Classification", ARPN Journal of Engineering and Applied Sciences, vol. 9, no. 8, pp. 1215-1219, August 2014
[19] P. Maroufkhani, R. Wagner, W. Kh. W. Ismail, M. Nourani, "Big Data Analytics and Firm Performance: A Systematic Review", Jornal of Information, vol. 10, No. 226, pp. 1-21, july 2019
[20] سخایی، محمدجواد، تجزیه و تحلیل داده و انواع آن، فناوری اطلاعات برای کسب و کار، 1394
[21] درودی، فریبرز، عادل سلیمانینژاد، "ارتباط تصویری و پردازش دیداری اطلاعات: آشنایی با مبانی نظری حوزه مصورسازی"، مجله مطالعات ایرانی کتابداری و اطلاعرسانی، شماره 86، 1388
[22] بنائی، سیدمجتبی، دریاچه داده به عنوان بستر حکمرانی داده در سازمان، چارچوبهای پردازش کلان داده، 1396
سپاسگزاري
بدینوسیله از کارگروه محترم ارزیابی و تشخیص صلاحیت شرکتها و موسسات دانش بنیان که ما را در انجام این تحقیق یاری نمودند صمیمانه تشکر می نمایم.
[1] http://daneshbonyan.isti.ir/
Presenting a new conceptual model for the field of big data and analyzing the data-driven business in Iran based on the proposed model
Abstract:
Forecasting a 10-fold increase in global data till 2025 by IDC indicates that the data journey for organizations has just begun. Collecting, storing, analyzing and using this valuable gold contributes to innovation in companies and organizations and leads businesses to a competitive future. The purpose of this article is to examine the various contexts of value creation and big-data-driven business for startups that rely on data as their primary source of business. Therefore, in this regard, after examining the various dimensions of big data, a conceptual model of this field has been presented. This model helps companies to carry out their activities in this field with more awareness and focus. Also in the continuation of this article, the results of the survey of knowledge-based companies with data-driven businesses are presented. The results show that most of these companies are more focused on the two areas of data analysis and visualization. Also, the two areas of "Fintech" and "Media" have been more receptive to the technologies of these two areas. On the other hand, products related to "big data management and processing", which includes providing solutions and launching big-data processing and storage services, have the highest sales volume and a significant amount of activity of these companies on Content of news, social networks and information related to stock exchange transactions.
Keywords: Big Data, Conceptual Model, Data-driven Business, Knowledge-based Company