عن مدونة نسيج

تهدف مدونة نسيج الى توفير مساحات تشاركيه تتسع لكل المتخصصين والمهتمين بكل ما هو جديد في مجال المكتبات والتعليم العالي والتعلم عن بعد وتقنيات المعلومات والاتصالات وتقنيات الأرشفة وحلول المعرفة المتقدمة في التعليم العالي، المكتبات، ومراكز الأبحاث.

سجل بريدك الالكتروني هنـا لتصلك أحدث التدوينات

أكاديمية نسـيج على الفيسبوك

 
 

مقــالات حديثة

أولويات البنية التحتية للبيانات الكبيرة

نُـشر بواسطة هيام حايك on 26/11/2017 08:55:29 ص

Big-Data-trends-2015.jpg 

في الوقت الذي يزداد فيه حجم البيانات والذي يصل بها إلى حد الانفجار، تتزايد التحديات المرتبطة بالتخزين، والتحليل ومتطلبات الأمن. في هذا المشهد الجديد، الشركات بحاجة إلى بنية تحتية لتقنية المعلومات قابلة للتطوير والتوسع من جهة، وفعالة من حيث التكلفة وبما يمكنها لتكون مؤسسة قادرة على استخدام البيانات الضخمة.

البيانات:  الأصول الأكثر أهمية للمؤسسات

واحدة من أكثر الشعارات المعروفة التي يعبر عنها بانتظام قادة الأعمال هي: "موظفونا هم أغلى أصولنا". ومع ذلك، فإن معظم هؤلاء القادة سيعترفون اليوم بأن هناك أصولا أخرى أصبحت ذات قوة محورية لضمان نجاحها، ألا وهي البيانات الرقمية. بدون هذا المورد الذي يغذي عملياتها ويساعدها في عمليات صنع القرار، فإن معظم الشركات اليوم لن يكون لها وجود. وعند التفكير في حقيقة أن الموارد الهامة سوف تنضب يوما ما، سنجد أن البيانات تنحرف عن هذه القاعدة، ففي حين أن الموارد الأخرى لديها حدود ويمكن أن تنضب مع مرور الوقت، البيانات تنمو بوتيرة مذهلة. وبحسب بعض التقديرات، فإن العالم سيكون غارقا في 40 زيتابايت (40 تريليون غيغابايت) من البيانات الرقمية بحلول عام 2020. هذا الحجم من ثروات البيانات الهائلة يمثل للمؤسسات الفرص والتحدي في نفس الوقت. حيث لم يسبق لها الوصول إلى مثل هذه البيانات الواسعة والعميقة عن عملائهم وموظفيهم وعملياتهم ومنافسيهم وأسواقهم. ذلك يجعل من قيام أي شركة باستخلاص رؤى هادفة قابلة للتنفيذ من هذا البحر من البيانات، والقيام بذلك بشكل أسرع وأكثر فعالية من منافسيها، ليس بالمهمة البسيطة، فأداء هذه المهمة بشكل جيد أصبح أولوية قصوى لقادة تقنية المعلومات في سعيهم لتقديم الأعمال القيمة لمؤسستهم.

في الواقع، البيانات الكبيرة ومبادرات تحليلات الأعمال ستكون أعلى مجال للاستثمار في تقنية المعلومات هذا العام، وفقا لتقرير مسح مدراء تقنية المعلومات لعام 2017 والذي تجريه سنويا المجموعة الدولية للتوظيف International Deployment Group (IDG). كما أن هذه الاستثمارات ستتجاوز حتى تلك التي تتطلبها هذه التقنية مثل الحوسبة السحابية وإدارة الأمن والمخاطر، وذلك حسب ما أشار إليه مدراء تقنية المعلومات وغيرهم من صناع القرار في مجال تقنية المعلومات الذين شملتهم الدراسة.

أحد أهم القرارات الأساسية التي يجب على قادة تقنية المعلومات اتخاذها هو نوع البنية التحتية التي سيتم استعمالها كأساس لأنشطة البيانات الضخمة، ففي نهاية المطاف يتطلب جمع البيانات من مصادر متعددة وتخزينها وتأمينها وتحليلها وإزالتها، بنية تحتية لتقنية المعلومات يسهل نشرها وترقيتها مع العمل ضمن حدود ميزانيات تقنية المعلومات وإدارة الأعمال التي غالبا ما تكون محدودة.

ولتلبية هذه القائمة المرجعية الشاقة من المتطلبات، فإن العديد من المؤسسات تبحث دائما عن بنية تحتية سهلة الاستخدام وفاعلة من حيث التكلفة، تجمع بين الخوادم والتخزين، والشبكات، والتقنيات الافتراضية وتدار ضمن برمجيات المؤسسة، وبما يزيل أعباء التكامل وإدارة مستودعات البنية التحتية المتعددة وتدعم المشاركة.

تطور حلول البيانات الكبيرة 

حلول البيانات الكبيرة تقدم خطوات كبيرة في مجال الأعمال وقد وجدت حلول تحليل البيانات منذ عقود، إلا أنها عملت على اجتذاب كميات هائلة من البيانات الرقمية الجديدة في السنوات الأخيرة أجبرت هذه الحلول على أن تتطور بسرعةـ لتتمكن من التعامل مع بيانات تأتي من كل صوب وحدب، حيث أن مصادر هذه البيانات لا تشمل الخوادم التقليدية وأجهزة الحاسوب الشخصية وحسب، ولكن تضم كذلك مليارات الهواتف النقالة والأجهزة  اللوحية المتحركة على نحو متزايد، و إنترنت الأشياء (IoT) وأجهزة الاستشعار، وأجهزة التحكم، وغيرها من الأجهزة المتصلة. إن أجهزة إنترنت الأشياء وحدها ستتجاوز أكثر من 8 مليارات وحدة هذا العام وستزيد عن 20 مليارا بحلول عام 2020، وفقا لشركة غارتنر Gartner Inc.

أولويات البنية التحتية للبيانات الكبيرة

هيــام (002).jpg

يعمل على رأس هذا الكم المتنوع من منصات الحوسبة تطبيقات تتراوح من حزم برمجيات الشركات إلى الشبكات الاجتماعية لمواقع التجارة الإلكترونية. كل ذلك يولد باستمرار البيانات ذات الصلة الأعمال التي لن يكون لها أي قيمة إلا في حال استطاعت   الشركات استخراج كتل البيانات ذات المعنى والأكثر وضوحا من هذا السيل الرقمي. ولكن المفاجأة الفعلية أن أكثر من نصف الشركات وحسب استقصاء للرأي أجرته مؤسسة "أي. دي. جي" للأبحاث (IDG Research) قد استخدمت مشاريع البيانات الكبيرة، حيث أن ثلثها تقريبا يقوم بذلك على نطاق المؤسسة.   كما أشارت في مؤشر آخر على أن مبادرات البيانات الضخمة تسير في الاتجاه السائد، حيث إن هذه المشاريع تسير على قدم المساواة من القمة إلى القاعدة ومن القاعدة إلى القمة ومن المناصرين داخل المنظمات. المحرك الرئيس وراء مبادرات البيانات الكبيرة، وعلى نحو متوقع، هو محاولة تحسين سرعة اتخاذ القرار وتحري الدقة. وقد أشار ما يقرب من 60٪ من الذين شملهم الاستطلاع إلى أن هذه الفائدة تمثل حافزا رئيسا لجهودهم. ومن بين أبرز العوامل الأخرى: زيادة فرص الإيرادات بنسبة 43٪، وانخفاض التكاليف بنسبة 38٪، وزيادة الإنتاجية بنسبة 33٪. وإلى جانب الفوائد الأساسية المتوقعة، ترى المؤسسات أن البيانات الكبيرة تلعب دورا محوريا في مجموعة متنوعة من حالات الاستخدام، بما في ذلك تحسين التخطيط / التنبؤ، والكفاءة، وتحليل اتجاهات وأنماط سلوك العملاء. وهناك حالتان أخريان من حالات الاستخدام - هما اكتشاف البيانات ودعم مختلف مصادر البيانات الجديدة -وهما عنصران هامان في إنشاء "بحيرة البيانات" (Data lake) التي تعد المرحلة الأولى الضرورية لأي مشروع يعمل على البيانات الضخمة.

 وبالرغم من فوائد حلول البيانات الكبيرة، إلا أنها أيضا تواجه بعض التحديات والمعوقات الشاقة.

ومن بين أهم المعوقات التي أشار إليها أولئك الذين شملهم الاستطلاع والذين صنفوها على أنها إما صعبة للغاية أو تمثل تحديا عاليا:

  • الميزانية / التكلفة (62٪)
  • وقت التنفيذ / التهيئة (62٪)
  • إدارة الأمن / المخاطر / الامتثال (56٪)
  • مخاوف الأداء / السرعة (47٪)

وعلى رأس هذه التحديات المختلفة، تواجه الشركات عادة عقبات أخرى تعرقل تقدمها في مشاريع البيانات الضخمة:

  • التغييرات في نطاق المشروع
  • تأخير المشروع
  • تجاوز التكاليف

البيانات الكبيرة تضع مطالب كبيرة على البنية التحتية، حيث يعتمد النجاح على استغلال الفوائد المحتملة للبيانات الكبيرة، فضلا عن مواجهة العديد من التحديات الأكثر صعوبة، يعتمد بقدر كبير على قدرات البنية التحتية الأساسية لتقنية المعلومات. فالشركات لديها قائمة طويلة من المتطلبات لبيئات البنية التحتية للبيانات الكبيرة، وعلى رأسها الأمن والمخاطر الامتثال، وتوافر الجهوزية، والأداء والسرعة.

تعد قائمة متطلبات البنية التحتية مطولة جزئيا بسبب تنوع تطبيقات البيانات الكبيرة ونماذج النشر التي تريد الشركات استخدامها لهذه المبادرات. على سبيل المثال، يمكن أن تشتمل على تطبيقات البيانات الكبيرة وقواعد البيانات العلائقية، وتصور البيانات، وإطار برنامج Hadoop، واستضافة مجموعة من الأنشطة الأخرى.

البيانات الكبيرة: رؤية مستقبلية

تقوم الشركات التي تستخدم بالفعل حلول البيانات الكبيرة في المتوسط بدعم ثلاث بيئات مختلفة، وفقا لمسح "أي. دي. جي". وتتوقع الشركات أيضا الاستفادة من مجموعة متنوعة من نماذج النشر لاحتياجاتها الكبيرة من البيانات المستقبلية. وهي تشمل ما يلي:

  • البيئات السحابية الهجينة التي تشمل العناصر السحابية الخاصة والعامة (التي ينظر فيها 29٪ من المشاركين في الاستطلاع)
  • الأجهزة الافتراضية المحلية والبيئات السحابية الخاصة ((التي ينظر فيها 27٪ من المشاركين في الاستطلاع) 
  • استضافة السحابة الخاصة (التي ينظر فيها 14٪ من المشاركين في الاستطلاع)
  • جميع السحابة العامة (التي ينظر فيها 11٪ من المشاركين في الاستطلاع)
  • الاشتراك في البرمجيات كخدمة (Software as a Service أو SaaS) (التي يتم النظر فيها 6٪ من المشاركين في الاستطلاع)

وكما هو واضح من نتائج الاستطلاع، فإن البيئات الافتراضية سوف تهيمن على مشهد البنية التحتية للبيانات الكبيرة. وهذا هو الحال بالفعل، مع ما يقرب من 90٪ من تلك التي تعمل بيئات البيانات الكبيرة، والتي بالفعل البرمجيات الافتراضية جزئيا أو كليا عبر منصاتها.