حوادثخاصمقالات الرأي

أشنين: علم تنقيب البيانات بالمحكمة الرقمية وشهود الزور

هدفه العثور على أنماط مثيرة للاهتمام تمثل المعرفة (3/1)

هدفنا من هذه الورقة البحثية، استكشاف إمكانية استخدام تنقيب البيانات في الإدارة القضائية أداة لتحسين كفاءتها وجودتها، والى أي حد يمكن استخدام تقنيات تنقيب البيانات من خلال قواعد بيانات المحكمة الرقمية للحد من ظاهرة شهود الزور مثلا.

بقلم: رشيد أشنين *

تقاس درجة التقدم والتنمية في جميع أنحاء العالم، بمدة الولوج إلى المعلومات وبدرجات استخدامها، فالأمم المتقدمة والغنية حققت مؤشرا مرتفعا بخصوص قدرتها على إنتاج واستخدام المعلومات (المغرب الرقمي 2013).
تدرك الإدارة القضائية بالمغرب اليوم، أكثر من أي وقت مضى الأهمية الإستراتيجية لـ”حوكمة” وإدارة البيانات، إذ أن أحد أبرز آثار المحكمة الرقمية هو تضخم المعلومات الهائل، والذي يحدث باضطراد مستمر، حيث أصبحت مخازن البيانات وقواعد البيانات التي تعتمد عليها أغلب النظم والتطبيقات بمحاكم المملكة، ممتلئة بكم كبير وضخم من البيانات العشوائية والتاريخية، إذ يمكن أن نتخيل كم البيانات الناتج عن ذلك، إذا احتسبنا بكل ملف يوجد مدع ومدعى عليه وشهود ومحامون ومفوض قضائي وخبير وتاريخ جلسة ورقم قاعة، بالإضافة إلى الهيأة القضائية وكاتب الضبط، حيث إذا ضربنا عدد المتدخلين بالملف الواحد في مجموع الملفات ستصبح محكمة رقمية ذات بيانات ضخمة.
فاليوم، أصبحنا أمام تحد كبير يتمثل في كيفية الاستفادة من هذه البيانات المخزنة، وكيفية القيام بعملية استخراج المعلومة المفيدة منها، وهذا التحدي أصبح لا يمكن حله بواسطة الطرق التقليدية لتحليل البيانات، لذلك فإننا بحاجة إلى علم تنقيب البيانات، خصوصا للحد من ظاهرة شهود الزور. وهو ما سنتناوله من خلال المحاور التالية:
المحور الأول- تنقيب البيانات (Data Mining) وإمكانية استخدامها بالإدارات العمومية:
أولا: ماهية تنقيب البيانات والهدف منها:
يقدم موقع مؤسسة “IGI Global ” 82 تعريفا لمفهوم التنقيب في البيانات. وبعد المرور على جميع هذه التعريفات، تم اختيار التعريفات التالية:
– عملية البحث داخل كميات كبيرة من البيانات للكشف عن العلاقات التي لم يتم كشفها سابقا بين عناصر البيانات، والمعروفة أيضا باسم اكتشاف المعرفة في قواعد البيانات (KDD).
– هي النشاط الذي يقوم باستخراج المعلومات الموجودة في كميات كبيرة من البيانات، بهدف البحث عن أنماط معرفية واكتشاف الحقائق الخفية الواردة في قواعد البيانات.
– هي خطوة واحدة في اكتشاف المعرفة داخل قواعد البيانات (KDD) حيث تستخدم أساليب التحليل مثل: الشبكات العصبية (NeuralNetworks) أو الخوارزميات الجينية (Genetic Algorithms) أو شبكة القرارات (Decision Trees) والتقنية والنماذج الهجينة (Hybrid Models) لتحديد الأنماط والعلاقات في مجموعات البيانات.
– عملية اكتشاف المعرفة في قواعد البيانات عن طريق تحديد الأنماط والاتجاهات في البيانات التي تم جمعها باستخدام طرق مختلفة مثل: التصنيف أو التحليل التسلسلي أو العنقدة (التجميع clustering) أو قواعد الارتباط.
يعد تنقيب البيانات عبارة عن تحليل لمجموعات بيانات الرصد (غالبا ما تكون كبيرة) للعثور على علاقات غير متوقعة ولتلخيص البيانات بطرق جديدة مفهومة ومفيدة لمالك البيانات، بمعنى آخر، يعد استخراج البيانات طريقة أخرى للعثور على المعلومات القيمة في البيانات، إلى جانب الإحصاءات والمعالجة وجداول البيانات والوصول إلى البيانات الأساسية.
توجد تقنيات التنقيب عن البيانات لعدة سنوات ولم يتم تقديم المصطلح نفسه إلا أخيرا نسبيا، في التسعينات نتيجة لزيادة قوة الكمبيوتر (informatique quantique) وتحسين أساليب جمع البيانات وإدارتها.
الهدف من أساليب تنقيب البيانات هو العثور على أنماط مثيرة للاهتمام تمثل المعرفة. يمكن تصنيف طرق تنقيب البيانات إلى مجموعتين: المهام الوصفية والتنبئية. تجد المهام الوصفية أنماطا يمكن تفسيرها من قِبل الإنسان وتصف البيانات، وتستخدم المهام التنبئية بعض المتغيرات للتنبؤ بقيم غير معروفة أو مستقبلية للمتغيرات الأخرى. يمكن اكتشاف الأنواع التالية من الأنماط بواسطة تقنيات استخراج البيانات (وصف المفهوم، الفصل، تحليل تجميعي، التصنيف، والتنبؤ، تحليل الكتلة، التحليل الخارجي وتحليل التطور).
في السنوات العشر الأخيرة، أصبح التنقيب عن البيانات إحدى أكثر النغمات شعبية في عالم الأعمال. الاستخدامات الشائعة لتنقيب البيانات هي المعلوماتية الحيوية، وتحليل البيانات المالية والنمذجة المالية، تعدين بيانات البيع بالتجزئة وإدارة علاقات العملاء والاتصالات والعلوم. ومع ذلك، فإن الحكومات والإدارات العمومية لم تعمل على استعمال علم التنقيب عن البيانات إلا في الآونة الأخيرة.
ثانيا: مجالات تطبيق تنقيب البيانات بالإدارات العمومية:
في هذه الفقرة سنعطي مجالات التطبيق الممكنة في بعض الإدارات العمومية لبعض الدول المتقدمة وهي: (1) المالية والاقتصاد، (2) قطاع الصحة، (3) قطاع الأمن.
– المالية والاقتصاد:
تستخدم وكالات الضرائب الحكومية برامج Clementine و Intelligent Miner لبناء نموذج تنبؤي يمكن أن يحسن من أداء الإدارة واختيار التدقيق من خلال الإجابة على أسئلة مثل: «ما هي الإقرارات الضريبية التي من المحتمل أن تكون غير متوافقة؟”، مثل هذه النماذج تقلل من فرص الاحتيال. يمكن تحديد دافعي الضرائب المحتملين أو السيئين بطريقة شجرة القرار( décision tree method) وأيضا، يمكن أن يكتشف تحليل تجميعي (association analysis) مجموعات من الضرائب التي يحاول دافعو الضرائب السيئة عادة التهرب منها. تم ذكر أربعة أمثلة مماثلة في الصفحات الأخرى لمواقع SPSS و IBM، وواحد على موقع SAS Enterprise Miner على الويب (SAS، 2003). تقارير مايكل (2003) عن تطبيق إضافي واحد لاستخراج البيانات حول اكتشاف الاحتيال الضريبي.
قدمت الشبكات العصبية (Neural networks) رؤى قيمة للمحللين الذين يتوقعون عائدات الضرائب، والتي تعتبر مهمة للغاية لأن ميزانيات الوكالات ودعم التعليم وتحسين البنية التحتية كلها تعتمد على دقتها.
* منتدب قضائي بالمحكمة الابتدائية بكلميم
باحث في علوم البيانات والتحليل الجنائي

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

شاهد أيضاً
إغلاق
زر الذهاب إلى الأعلى
إغلاق