جرس

نظرية الألعاب

1 ديسمبر 2021، 10:00 صباحاً.

  • مصدر البيانات: لا تتطلب بيانات، يتم تحديد بيئة اللعبة والقوانين التي تحكمها
  • موضوع التحليل: نظرية الألعاب Game Theory
  • الأدوات المستخدمة للتحليل: Javascript, p5
  • هذه المقالة تمت بمشاركة زميلنا عالم البيانات علي الناصر

لعبة

ما يتم وصفه بلعبة في هذا المبحث قد يختلف قليلا عما يتبادر إلى الذهن للوهلة الأولى. في الرياضيات، اللعبة تصف تفاعل الفرد مع أفراد/بيئة حيث القوانين والخطوات والمخرجات التي تحكم تفاعلهم مع بعضهم البعض معلومة وواضحة وقابلة للنمذجة.

نظرية الألعاب هي مبحث تحديد أفضل استراتيجية ممكنة للعب بافتراض أن جميع اللاعبين عقلانيين ويبحثون عن الفوز. هذه الدراسة تساهم في محاكاة كيف يتفاعل الفرد مع المتغيرات التي قد تحدث في محيطه، فلو أردنا تقدير اكتظاظ السيارات على طريق الدائري إذا أغلقنا مخرج 2 مقارنة بمخرج 5 فنظرية الألعاب قد تكون الوسيلة الأنسب لإجابة هذا السؤال.

حجر ورقة مقص

لنمذجة أي لعبة يجب تحديد ثلاثة عناصر أساسية: القوانين، الخطوات، المخرجات. بناء على العناصر السابقة، يقوم اللاعب باختيار استراتيجيته. تم تعريف المخرجات عن طريق المصفوفة التالية.

حجر ورقة مقص
حجر 0 -1 1
ورقة 1 0 -1
مقص -1 1 0

تم تعريف القوانين كالتالي:

  • اللعبة تتمثل من جولة واحدة يحدد فيها الفوز، التعادل، الخسارة
  • يقوم اللاعب باختيار شكل واحد فقط من الأشكال لكل جولة
  • يقوم اللاعب باختيار الشكل لهذه الجولة دون معرفة شكل اللاعب الآخر

بعد ذلك قمنا بتحديد سبع استراتيجيات قد يتخذها اللاعبون وكانت كالتالي:

احتمالية المقص احتمالية الورقة احتمالية الحجر اللاعب استراتيجية
0 0 1 🧒 الحجر دائما
0 1 0 👩 الورقة دائما
1 0 0 👨‍🦳 المقص دائما
¼ ¼ ½ 👳 الحجر نصف المرات
¼ ½ ¼ 👴 الورقة نصف المرات
½ ¼ ¼ 🧕 المقص نصف المرات
🧔 الاختيار العشوائي

تمت محاكاة اللعبة بقيام اللاعب باللعب مع اللاعب الذي عن يمينه، ثم يتم احتساب النتائج بناء على عدد مرات الفوز. لمعرفة أفضل استراتيجية للعب قمنا بمحاكاة 1000 جولة كما هو مستعرض بالأسفل.

نلاحظ أن اللعب بإستراتيجية واحدة يحقق العائد الأقل أما اللعب بإستراتيجية منوعة فقد يحقق العائد الأعلى لكنه كذلك قد يحقق عائد منخفض جدا فهذا التذبذب ناتج عن تأثير الحظ.

افتراض أن اللاعب سيمارس استراتيجية واحدة طوال اللعب دون مراعاة ما لعبه اللاعب الآخر في الجولة السابقة لا يحاكي الواقع بصورة دقيقة. الاستراتيجيات المذكورة آنفا تمثل استراتيجيات حتمية (deterministic) يقوم اللاعب فيها بممارسة استراتيجيته دون تحديثها بناء على نتائجه. لمعالجة ذلك قمنا بإضافة استراتيجية ثامنة استكشافية (explorative) 🤖 تقوم بتحديث احتمالية اختيار الشكل بناء على النتائج المحققة. يبدأ فيها اللاعب بتجربة الأشكال الثلاثة عشوائيا وبناء على النقاط المحصلة يقوم برفع احتمالية اختياره لكل شكل بما يعظم العائد.

نلاحظ أن الاستراتيجية الاستكشافية تفوقت على الاستراتيجيات الحتمية باستثناء العشوائية مما يجعلها الاستراتيجية الحتمية الأفضل. الاستراتيجية الاستكشافية هي الأقرب لما نمارسه كبشر من ناحية السلوك. في المحاكاة التالية نعكس ماذا لو كان جميع اللاعبين مستكشفين فكيف ستكون المحصلة.

مجددا نلحظ أن الاستراتيجية العشوائية هي الأنسب عندما يكون جميع اللاعبين لديهم نفس المعلومات وبالتالي تصل اللعبة إلى مرحلة توازن حيث جميع اللاعبين يستخدمون نفس الاستراتيجية فيكون الفاصل بينهما هو الحظ لذلك هي لعبة اقتراع مثالية.

توازن ناش ونمذجة الالعاب

تنص نظرية توازن ناش في نظرية الألعاب أن كل لعبة لها عدد نهائي من اللاعبين وعدد نهائي من الاستراتيجيات تصل إلى مرحلة من التوازن يكون فيها كل لاعب توصل إلى استراتيجية لا يستطيع زيادة مكاسبه بتغييرها. هذا ما شاهدناه في محاكاة حجرة ورقة مقص حيث وصل جميع اللاعبون إلى استراتيجية واحدة وهي اللعب بشكل عشوائي ولا يمكن لأحد اللاعبين التفوق على الآخر بتغيير استراتيجيته. عند نمذجة الألعاب يجب مراعاة أربع عناصر تحليلية تحدد مسار النمذجة وهي كالتالي:

  • هل اللعبة تعاونية (cooperative)؟ هي الألعاب التي يحقق فيها اللاعبون أعلى عائد بالتعاون مثل لعبة البلوت
  • هل اللعبة متناظرة (symmetric)؟ هي الألعاب التي تكون مخرجات الاستراتيجية لا تتأثر بمن يلعبها مثل البلوت
  • هل اللعبة صفرية (zero-sum) ؟ هي الألعاب التي يكون فيها عائد اللاعب يساوي خسارة اللاعبين مثل البلوت
  • هل اللعبة متتابعة (sequential)؟ هي الألعاب التي يكون يتبادل فيها اللاعبون الأدوار للعب مثل البلوت

كذلك يجب تحديد نوع المعلومات التي توفرها اللعبة للاعبين وهي كالتالي:

  • لعبة كاملة مثالية: وهي عندما تتوفر معلومات المعطيات والاستراتيجية والمخرجات لجميع اللاعبين مثل الشطرنج
  • لعبة كاملة غير مثالية: وهي عندما تتوفر معلومات الاستراتيجية والمخرجات وتجهل معطيات الخصم مثل البلوت
  • لعبة مثالية غير كاملة: وهي عندما تتوفر معلومات الاستراتيجية والمعطيات وتجهل مخرجات الخصم مثل المزاد

حجرة ورقة مقص تعد لعبة كاملة غير مثالية متناظرة صفرية غير تعاونية وغير متتابعة (متزامنة).

مكيف المكتب

نعاني في مكتب العمل من اختلاف وجهات النظر حول درجة حرارة المكيف الأمثل لتوفير بيئة عمل مريحة للجميع. في محاولة يائسة لإيجاد حل لهذه المعضلة قررنا نمذجة محطتي عمل مكونة من أربع مكاتب بينهما مكيف كما هو متواجد في مكتبنا. لمحاكاة البيئة بأدق صورة ممكنة قمنا بافتراض القوانين التالية:

  1. درجة حرارة المكتب قبل بدء العمل تكون 40 درجة مئوية
  2. كل موظف له نطاق من درجات الحرارة يكون مرتاحا فيه
  3. كل موظف له معدل حساسية يمثل مدى انزعاجه من درجة الحرارة التي تكون خارج نطاق راحته ويزداد كلما ابتعدت درجة حرارة المكتب عن نطاق الراحة (كلما اقترب المؤشر من 1 كلما كان الموظف سريع التضجر “حقنة”)
  4. عند تشغيل المكيف في بداية اليوم ينتظر الموظفين لمدة من الزمن قبل البدء بالتذمر تجاه الحرارة أو البرودة
  5. درجة حرارة الغرفة تتفاعل مع درجة حرارة المكيف بحسب قربها أو بعدها منه وحسب المدة الزمنية المنصرمة
  6. عندما يتذمر أحد الموظفين من درجة الحرارة يقوم بتعديل درجة حرارة المكيف برفع أو خفض درجة حرارة مئوية واحدة
  7. الحق بتغيير درجة حرارة المكيف قد يكون انتخابا وقد يكون حق شخصي يمارسه كل موظف بذاته

تم بناء بيئة المحاكاة تبعا لهذه القوانين ثم تدوين مخرجات اللاعبين (الموظفين) وهي نطاقاتهم الحرارية ومعدل حساسيتهم حيث كل لاعب لديه استراتيجيتين وهي تغيير درجة حرارة المكيف أو الرضا بما قسمه الله. في محاولة لحل الإشكال وضعنا مجموعة من الحلول وهي القدرة على وضع نظام انتخابي لتغيير درجة الحرارة مع إمكانية تحديد عدد الأصوات اللازمة، في حال غياب (تغيير مكتب) موظف معين ما الذي يمكن أن يحدث.