Stochastic programming — البرمجة التصادفية
البرمجة التصادفية (بالإنجليزية: stochastic programming) هي فرع من البرمجة الرياضية، يطور النماذج والأساليب لحل مسائل الأمثلية في ظل ظروف عدم اليقين، حيث تكون بعض معلمات النموذج غير معروفة بدقة، بل يتم تمثيلها كمتغيرات عشوائية ذات توزيعات احتمالية معروفة أو مقدرة[1][2].
على عكس المسائل الحتمية، حيث تعتبر جميع البيانات ثوابت محددة، تهدف البرمجة التصادفية إلى إيجاد حل (أو سياسة لاتخاذ القرار) يكون أمثل بمعنى إحصائي معين. غالبًا ما يعني هذا تقليل أو تعظيم القيمة المتوقعة لدالة الهدف[1]. تتمثل الفكرة الرئيسية في إيجاد سياسة اتخاذ قرار تكون الأفضل «في المتوسط» عبر جميع التحققات الممكنة للمعلمات العشوائية، وهو أمر مهم بشكل خاص للمسائل التي تُتخذ فيها القرارات بشكل متكرر في ظروف متشابهة (على سبيل المثال, في إدارة المخزون أو أنظمة الطاقة)[3].
Mathematical formulation - الصياغة الرياضية
بشكل عام، يمكن صياغة مسألة البرمجة التصادفية على النحو التالي: حيث:
- — متجه متغيرات التحكم (القرارات) التي يجب تحديدها.
- — مجموعة الحلول الممكنة للمتجه ، والتي تحددها القيود الحتمية.
- — متجه عشوائي يمثل المعلمات غير المؤكدة في المسألة (مثل الطلب، الأسعار، الظروف الجوية).
- — دالة الهدف، التي تعتمد قيمتها على كل من القرار المتخذ وتحقق المتجه العشوائي .
- — عامل القيمة المتوقعة، والذي يتم حسابه وفقًا للتوزيع الاحتمالي للمتجه .
من أهم المبادئ التي تقوم عليها النماذج التصادفية متعددة المراحل هو مبدأ عدم التوقع (بالإنجليزية: non-anticipativity principle). ينص هذا المبدأ على أن القرارات المتخذة في أي مرحلة يمكن أن تعتمد فقط على المعلومات المتاحة حتى تلك اللحظة، ولا يمكنها «استبصار المستقبل»[2].
Two-stage stochastic program with recourse - مسألة المرحلتين مع حق التعويض
النموذج الأكثر شيوعًا هو مسألة المرحلتين مع حق التعويض (بالإنجليزية: two-stage stochastic program with recourse)[1]. تنقسم عملية اتخاذ القرار إلى مرحلتين:
- المرحلة الأولى: يتم اتخاذ قرار «هنا والآن» (here-and-now) — بتحديد المتجه . يجب اتخاذ هذا القرار قبل معرفة التحقق المحدد للمتجه العشوائي .
- المرحلة الثانية: بعد وقوع الحدث العشوائي، يتم اتخاذ قرار تصحيحي أو تعويضي (recourse decision) — المتجه ، يهدف إلى تقليل العواقب السلبية أو استغلال الفرص المواتية التي نشأت نتيجة للجمع بين قرار المرحلة الأولى ونتيجة .
رياضيًا، تصاغ مسألة البرمجة الخطية التصادفية ذات المرحلتين على النحو التالي: مع مراعاة قيود المرحلة الأولى: . هنا هي دالة التعويض (recourse function)، والتي تمثل القيمة المثلى لمسألة المرحلة الثانية: حيث هو متجه عشوائي يشمل المعلمات و ؛ بينما و هي معلمات حتمية[2].
الخصائص والنظريات الرئيسية
- المحدّبية (Convexity): من النتائج الأساسية في هذه النظرية أن دالة التعويض المتوقعة في مسألة البرمجة الخطية التصادفية ذات المرحلتين هي دالة محدبة. لهذه الخاصية أهمية كبيرة لأنها تضمن أن مسألة المرحلة الأولى الإجمالية هي مسألة برمجة محدبة، والتي توجد لها طرق حل فعالة ويتطابق فيها الحل الأمثل العام مع الحل الأمثل المحلي[1].
- المكافئ الحتمي (Deterministic equivalent): إذا كان للمتجه العشوائي عدد محدود من التحققات الممكنة (السيناريوهات) باحتمالات ، فيمكن إعادة صياغة مسألة البرمجة التصادفية في شكل مسألة أمثلية حتمية واحدة كبيرة. في هذه الحالة، يتم استبدال القيمة المتوقعة بمجموع مرجح لجميع السيناريوهات. ومع ذلك، يزداد حجم هذه المسألة خطيًا مع عدد السيناريوهات، مما يؤدي إلى «لعنة الأبعاد» ويجعل هذا النهج غير قابل للحل حسابيًا لعدد كبير من السيناريوهات[2].
Comparison with robust optimization - المقارنة مع الأمثلية المتينة
تعد البرمجة التصادفية أحد المناهج المتعددة للأمثلية في ظل عدم اليقين. ويكمن اختلافها الرئيسي عن الأمثلية المتينة في طريقة نمذجة عدم اليقين ومعيار الأمثلية[4].
| المعيار | الأمثلية التصادفية | الأمثلية المتينة |
|---|---|---|
| تمثيل عدم اليقين | المعلمات هي متغيرات عشوائية ذات توزيع احتمالي معروف | تنتمي المعلمات إلى مجموعة محددة من عدم اليقين، ولا يلزم وجود توزيع |
| معيار الأمثلية | أمثلية القيمة المتوقعة لدالة الهدف | الأمثلية في أسوأ السيناريوهات (minimax) |
| طبيعة الحل | سياسة مثلى «في المتوسط»، قد تكون غير ممكنة التحقيق في السيناريوهات النادرة | حل مضمون التحقق لجميع الاحتمالات؛ قد يكون متحفظًا |
أمثلة
- مسألة بائع الصحف (بالإنجليزية: newsvendor problem): مسألة كلاسيكية في إدارة المخزون، حيث يجب على البائع أن يقرر كمية السلع التي سيشتريها دون معرفة الطلب المستقبلي الدقيق. يوازن الحل بين مخاطر الخسائر الناتجة عن الفائض ومخاطر فوات الربح بسبب النقص.
- مسألة المزارع: يقرر المزارع مساحة الأرض التي سيخصصها للمحاصيل المختلفة ضمن مساحة إجمالية، دون معرفة الطقس المستقبلي الذي يؤثر على المحصول. بعد أن يصبح الطقس معروفًا، يمكن للمزارع اتخاذ إجراءات تصحيحية (مثل بيع الفائض أو شراء النقص من السوق)[5].
انظر أيضًا
- البرمجة الرياضية
- بحوث العمليات
- الأمثلية المتينة
- البرمجة الديناميكية
- نظرية التحكم
مراجع
- ↑ 1.0 1.1 1.2 1.3 Shapiro, A., Dentcheva, D., & Ruszczyński, A. (2009). Lectures on Stochastic Programming: Modeling and Theory. Society for Industrial and Applied Mathematics (SIAM).
- ↑ 2.0 2.1 2.2 2.3 Birge, J. R., & Louveaux, F. (2011). Introduction to Stochastic Programming (2nd ed.). Springer Science+Business Media.
- ↑ "Стохастическое программирование". Википедия. [١]
- ↑ Gorissen, B. L., Yanıkoğlu, İ., & den Hertog, D. (2015). A practical guide to robust optimization. Omega, 53, 124-137.
- ↑ Bricker, D. L. SLPwR: Farmer Problem. University of Iowa. [٢]