نظریه بازی ها

4Duniverse

از نظریه بازی ها ( Game Theory ) چه میدانید ؟

لطفا اگه کسی اطلاعی داره در این تاپیک قرار بده .

سلام خدمت 4Duniverse گرامی

نظریه بازیها از شاخه های نسبتا نوپای ریاضیات کاربردی است.
اساس آن (از لحاظ تئوری) مربوط به برقراری قوانینی بر یک دادد و ستد
است بطوریکه امکان پیشگویی حتمی در آن سیستم آشوبناک حاصل
شود. به چنین داد و ستدی در اصطلاح بازی میگویند.
چنین بازی را یک بازیکن منطقی (rational player ) اساسا شروع نمیکند!
زیرا که برد و باخت آن از پیش مشخص است (البته نه بطور خیلی واضح ).
فیلم ذهن زیبا (beautiful mind ) بر اساس از زندگی پروفسور nash و درباره
همین موضوع بود.پیشتر نمونه هایی از آنها را در تالار مطرح کرده بودم که برای آشنایی دوستان
دوباره قرار میدهم:

http://hupaa.com/forum/viewtopic.php?f=12&t=10695
http://hupaa.com/forum/viewtopic.php?f= ... 940#p88940
http://hupaa.com/forum/viewtopic.php?f=16&t=10667
http://hupaa.com/forum/viewtopic.php?f=12&t=13723
http://hupaa.com/forum/viewtopic.php?f=16&t=16745
یک نمونه نیز در تاپیک سوالات ریاضی با پاسخ تشریحی به
تفصیل توسط retin گرامی بررسی شده است:
http://hupaa.com/forum/viewtopic.php?f= ... a&start=75

از لحاظ کاربردی، این شاخه اهمیت زیادی در علم اقتصاد داراست .
( سرمایه گذاری که منطق بازی را بداند به هیچ وجه ضرر نخواهد کرد هرچند
که تضمینی بر سود هم نیست-چرا؟-).
در زمینه کاربرد این علم در اقتصاد ، در حال حاضر کتابهایی بصورت جامع والبته
مختصر و مفید وجود دارند که همگی بر روی اینترنت نیز قابل دسترس هستند.
از جمله منابع خوب :

در فایل پیوست نیز میتوانید نمونه های خوب و مشهوری برای آشنایی با بازیها را بیابید.
همچنین اخیرا شهریاری در کتابی ،برخی از این بازیها را به فارسی برگردانده است

اگر مشکلی داشتید،در خدمتتان خواهم بود

-پین-

4Duniverse

با تشکر از پین عزیز

4Duniverse

يك فرصت كاملاً بيگانه در نظريه بازى ها

متقلب ها و هالوها

رابرت ساپولسكى*
ترجمه: كاوه فيض اللهى

مدت ها پيش از داستايوفسكى مردم درباره جنايت، مكافات و روابط ميان آنها انديشيده اند. چرا خلاف كارهاى اجتماع را مجازات مى كنيم؟ براى آن كه آنها را اصلاح كنيم، تغيير دهيم يا بازپرورى كنيم؟ تا مجرمان بالقوه را بترسانيم؟ كارى كنيم كه قربانيان و مجازات گران خوشحال شوند و احساس بهترى داشته باشند؟ پژوهشى كه توسط ارنست فهر (Fehr .E) و سيمون گاچر (S.Gachter) انجام و در شماره ۱۰ ژانويه سال ۲۰۰۲ ژورنال علمى صاحب نام «نيچر» منتشر شده است، يك جنبه ناخوشايند از رفتار اجتماعى در عمل و نيز فايده غيرمنتظره اى كه مى تواند از آن حاصل شود را نشان مى دهد.
شما چه يك ديپلمات باشيد چه يك مذاكره گر، اقتصاددان باشيد يا استراتژيست جنگ يا فقط يك شخص عادى كه از ميان زندگى روزمره پيش مى رود، گاهى ناگزير بايد تصميم بگيريد كه آيا با افراد ديگر مى خواهيد شريك باشيد يا رقيب يا حريفى تمام عيار، همكارانه رفتار كنيد يا خير. همين ضرورت در ميان برخى جانوران اجتماعى در طبيعت نيز مطرح مى شود. از آن ميان به عنوان يك مثال اثر كلاسيك جرالد ويلكينسون (G.Wilkinson) از دانشگاه مريلند نشان داده است كه خفاش هاى خون آشام ماده پيوسته با انتخاب هاى استراتژيك روبه رو مى شوند. ماده ها پس از آشاميدن خون گونه هاى طعمه (نظير گاو) به لانه هاى اشتراكى بزرگ خود بازمى گردند و در آنجا با بالا آوردن خون به درون دهان بچه ها آنها را تغذيه مى كنند. ماده ها بايد انتخاب كنند: آيا فقط به بچه هاى خودشان غذا بدهند، به بچه هاى خودشان به علاوه بچه هاى خويشاوندان نزديكشان يا به تمام بچه ها؟ و آيا اين تصميم بايد به آنچه خفاش هاى ديگر مى كنند بستگى داشته باشد؟ اين پرسش ها درباره فداكارى، تقابل و رقابت در نظريه بازى ها مفيد هستند. نظريه بازى ها (game theory) شاخه اى از رياضيات است كه در تحليل رفتار انسان به كار مى رود. شركت كنندگان در آزمايش هاى نظريه بازى ها به بازى چانه زنى مشغول مى شوند با اين تفاوت كه ميزان ارتباط ميان بازيكنان متغير است و براى نتايج مختلف به آنها پاداش هاى متفاوت داده مى شود. بازيكنان بايد تصميم بگيرند كه كى همكارى كنند و كى _ اگر اصطلاحى بسيار فنى در نظريه بازى ها را به كار ببريم - «تقلب» كنند. نظريه بازى ها در تمام انواع برنامه هاى آكادميك تدريس مى شود و معلوم شده كه در جانوران اجتماعى، حتى بدون آن كه فوق ليسانس مديريت بازرگانى داشته باشند، اغلب استراتژى هايى تكامل يافته است كه تصميم بگيرند كى همكارى و كى تقلب كنند. به استناد جوآن استراسمان (J.Strassmann) از دانشگاه رايس حتى در باكترى هاى اجتماعى نيز استراتژى هاى بهينه اى براى از پشت خنجر زدن به يكديگر تكامل يافته است.
فرض كنيد شما در يكى از اين بازى ها حضور يافته ايد، يك تورنمنت دوره اى متشكل از دو شركت كننده كه در هر دور با يكديگر مسابقه مى دهند. قواعد اين بازى طورى است كه اگر هر دو نفر با يكديگر همكارى كنند هر دو پاداش مى گيرند و اگر هر دو تقلب كنند، هر دو خراب مى كنند. از سوى ديگر اگر يكى تقلب و ديگرى همكارى كند، متقلب بزرگترين پاداش ممكن را مى گيرد و همكارى كننده به بدترين شكل مى بازد. حالت ديگر آن است كه بازيكنان در تورنمنت نمى توانند با يكديگر ارتباط داشته باشند و از اين رو نمى توانند نوعى استراتژى جمعى اتخاذ كنند. با اين قيدوبندها تنها راه منطقى آن است كه سعى كنيم ساده لوح نباشيم و هر بار تقلب كنيم. حالا فرض كنيد برخى از بازيكنان با اين همه روش هايى براى همكارى بيابند. چنانچه تعداد كسانى كه اين كار را مى كنند به قدر كافى زياد باشد _ و به ويژه اگر همكارى كنندگان بتوانند همديگر را به طريقى به سرعت پيدا كنند _ چيزى نخواهد گذشت كه همكارى تبديل به استراتژى بهتر خواهد شد. اگر بخواهيم از زبان حرفه اى زيست شناسان تكاملى استفاده كنيم كه درباره اين چيزها فكر مى كنند بايد بگوييم كه اين كار ناهمكارى را به سوى انقراض خواهد راند.
هرگاه همكارى در ميان گروهى از افراد رواج يابد آن گروه سرانجام به بهترين شكل خود درخواهد آمد. اما هر كس اين روند را آغاز كند (يعنى نخستين فردى كه به طور خودانگيخته همكارى را شروع كند) پس از آن از نظر رياضى همواره در وضعيت نامطلوب خواهد بود. اين وضعيت را اصطلاحاً مى توان سناريوى «عجب هالويى» ناميد. در دنياى «هر باكترى براى خودش» هنگامى كه يك روح پريشان ابتدا به ساكن كارى همكارانه انجام دهد، تمام باكترى هاى ديگر در كلنى از ته دل به او مى خندند و مى گويند «عجب هالويى!» و به رقابت بازمى گردند _ و ديگر هيچ كس از آن روياپرداز آرمان پرست يادى نخواهد كرد. در اين شرايط يك عمل فداكارانه تصادفى بى جواب مى ماند.
با اين حال نظام هاى فداكارى متقابل در گونه هاى اجتماعى گوناگون حتى در ميان ما انسان ها پديد آمده است. از اين رو پرسش اصلى در نظريه بازى ها اين است: چه شرايطى يك سيستم را به سمت همكارى سوق مى دهد؟ يكى از عوامل به دقت بررسى شده كه به همكارى مى انجامد خويشاوندى ژنتيكى است. پيوندهاى خانوادگى، نيروى محرك بخش بزرگى از رفتارهاى همكارانه در جانوران است. براى مثال افراد برخى گونه هاى حشرات اجتماعى آنچنان همكارى و فداكارى عجيب و غريبى به نمايش مى گذارند كه بيشترشان خود را از شانس توليد مثل محروم كرده و در عوض به فرد ديگرى (ملكه) كمك مى كنند كه توليدمثل كند. ويليام هميلتون (W.Hamilton) فقيد يكى از غول هاى علم با تبيين اين نوع همكارى در چارچوب ميزان خويشاوندى در ميان اعضاى يك كلنى حشره كه به طور حيرت انگيزى بالاست، در انديشه زيست شناسى تكاملى انقلابى پديد آورد و در مثال هاى بى شمار همكارى ميان خويشاوندان در بسيارى از گونه هاى اجتماعى ديگر نظير دسته سگ هاى وحشى كه همه با هم خواهر و دخترخاله اند و براى توله هاى همديگر غذا بالا مى آورند، گرچه وضعيت به اندازه حشرات اجتماعى افراطى نيست اما عملاً منطق مشابهى حاكم است.
راه ديگر براى راه اندازى همكارى آن است كه كارى كنيم تا بازيكنان «احساس» خويشاوندى كنند. اين نوع ترويج شبه خويشاوندى ويژگى انسان است. بررسى هاى روان شناختى گوناگون نشان داده اند كه هرگاه جمعى از افراد به طور دلبخواهى به دو گروه رقيب تقسيم شوند (چنانكه بچه ها در اردوى تابستانى در يكى از دو تيم آبى و قرمز جاى مى گيرند) حتى وقتى كه اطمينان حاصل كنيد مى دانند كه گروه بندى شان تصادفى است، چيزى نخواهد گذشت كه ميان خودشان ويژگى هاى مشترك و قابل ستايش خواهند يافت كه گروه مقابل از آن بى بهره اند. در ارتش با نگهداشتن سربازهاى جديد در يگان هاى منسجم از دوره آموزشى تا خط مقدم جبهه از اين گرايش انسانى حداكثر بهره بردارى انجام مى شود. اين وضعيت سبب مى شود آنها چنان احساس برادرى كنند كه احتمال انجام اعمال همكارانه در آنها به بالاترين ميزان خود مى رسد. در اين شرايط از روى ديگر سكه يعنى شبه گونه زايى نيز به خوبى بهره بردارى مى شود: اعضاى طرف مقابل را چنان متفاوت، بيگانه و ناانسان ساختن كه كشتن آنها به هيچ شمرده شود.
يك راه ديگر براى تسهيل همكارى در آزمايش هاى نظريه بازى ها آن است كه شركت كنندگان بتوانند در دورهاى پى درپى با همان افراد بازى كنند. با افزايش احتمال وجود فرصتى در آينده امكان انتقام فراهم مى شود تا آن كه در دور قبل سرش كلاه رفته براى متقلب تلافى كند. اين چيزى است كه متقلبان از آن مى ترسند. به همين دليل است كه تقابل به ندرت در گونه هايى فاقد گروه هاى اجتماعى ديده مى شود: هيچ ميگوى آب شورى به ميگوى ديگر پنج دلار قرض نخواهد داد، زيرا تا سه شنبه آينده كه موعد بازپرداخت فرا مى رسد، بدهكار خيلى دور خواهد شد. و به همين دليل است كه براى تقابل در عين حال مقدار زيادى هوش اجتماعى نيز لازم است _ اگر نتوانيد يك ميگوى آب شور را از ديگرى تشخيص دهيد، چنانچه بدهكار سه شنبه آينده هنوز آن دور و بر باشد، باز هم به حال شما فايده اى نخواهد داشت. رابين دانبار (R.Dunbar) جانورشناس يونيورسيتى كالج لندن نشان داده است كه در ميان نخستى هاى اجتماعى هرچه گروه اجتماعى بزرگتر باشد (يعنى هرچه تعداد افرادى كه بايد ردشان را بگيريد بيشتر باشد) اندازه نسبى مغز هم بزرگتر است. در خفاش هاى خون آشام نيز كه با تغذيه بچه هاى همديگر در سيستمى پيچيده كه در آن همواره بايد گوش به زنگ متقلبان هم باشند كلافه هستند، اين يافته از اين نظر جالب توجه است كه مغز اين خفاش ها از تمام گونه هاى ديگر خفاش بزرگتر است.
عامل ديگرى كه در بازى ها به همكارى مى انجامد بازى «روباز» است _ يعنى يك بازيكن وقتى در يك دور از يك بازى با كسى روبه رو مى شود به تاريخچه رفتار بازى كردن آن حريف دسترسى دارد. در اين سناريو لازم نيست كه افراد براى رسيدن به همكارى بارها در برابر هم بازى كرده باشند.
در عوض در آنچه نظريه پردازان بازى ها فداكارى زنجيره اى مى نامند همكارى از مسابقه خوشنامى حاصل مى شود. در اين وضعيت سناريوى پيش پرداخت مطرح مى شود كه در آن «الف» نسبت به «ب» فداكار است كه او هم نسبت به «پ» فداكار است و همين طور الى آخر.
به اين ترتيب نظريه بازى ها نشان مى دهد كه دست كم سه چيز پيدايش همكارى را تسهيل مى كند: بازى با خويشاوندان يا شبه خويشاوندان، دورهاى پياپى با همان افراد و بازى روباز. و در اينجاست كه پژوهش جديد فهر و گاچر «آزمايش كالاى همگانى» مطرح مى شود. نويسندگان مقاله يك بازى طراحى كرده اند كه ظاهراً تمام قواعد آن عليه پيدايش همكارى وضع شده اند. در اين بازى كه به صورت «يك فرصت، كاملاً بيگانه» طراحى شده، در هر دور دو نفر مقابل يكديگر بازى مى كنند و با آن كه بازى در دورهاى بسيار انجام مى شود، هرگز دو شركت كننده براى بار دوم مقابل هم قرار نمى گيرند. علاوه بر اين تمام تعامل ها به طور ناشناس صورت مى گيرد، يعنى هيچ شانسى وجود ندارد كه متقلبان را از طريق سابقه شان بشناسيم.
بازى به اين شكل انجام مى شود. هر كدام از دو بازيكن با مقدار مشخصى پول مثلاً ۵ دلار بازى را آغاز مى كنند. هر كدام از اين دو نفر بخشى يا تمام ۵ دلار را در يك گلدان مشترك مى گذارند بدون آن كه بدانند بازيكن ديگر چه قدر سرمايه گذارى مى كند. سپس يك دلار ديگر به گلدان افزوده مى شود و آنگاه مجموع به تساوى ميان دو نفر تقسيم مى شود. به اين ترتيب اگر هر دو ۵ دلار در گلدان بريزند هر كدام ۵/۵ دلار برداشت مى كنند (۵ دلار + ۵ دلار + ۱ دلار، تقسيم بر دو). اما حالا فرض كنيد بازيكن نخست ۵ دلار بريزد و بازيكن دوم يك دلار نگه دارد و فقط ۴ دلار بريزد. بازيكن نخست در پايان فقط ۵ دلار به دست مى آورد (۵ دلار + ۴ دلار + ۱ دلار، تقسيم بر دو) در حالى كه متقلب ۶ دلار مى گيرد (۵ دلار + ۴ دلار + ۱ دلار، تقسيم بر دو _ به اضافه آن يك دلار كه نگه داشته شده بود). فرض كنيد بازيكن دوم يك پست فطرت تمام عيار باشد و هيچ پولى درون گلدان نريزد. بازيكن نخست خسارت زياد متحمل مى شود و ۳ دلار به دست مى آورد (۵ دلار + ۰ دلار + ۱ دلار، تقسيم بر دو) در حالى كه بازيكن دوم ۸ دلار كاسب مى شود (۵ دلار + ۰ دلار + ۱ دلار، تقسيم بر دو _ به اضافه ۵ دلارى كه نگه داشته شده بود). كار و بار متقلب هميشه سكه است.
اما عنصر كليدى بازى اينجاست كه بازيكنان تصميم هاى سرمايه گذارى شان را به طور ناشناس مى گيرند اما وقتى تصميم ها گرفته شد از نتيجه با خبر مى شوند و مى فهمند كه آيا بازيكن ديگر تقلب كرده است يا خير. در اين لحظه بازيكن مغبون مى تواند متقلب را تنبيه كند. متقلب را مى توان با محروم كردن از مقدارى پول جريمه كرد، البته در صورتى كه بازيكن بپذيرد خود از همان مقدار پول صرف نظر كند. به عبارت ديگر مى توانيد يك متقلب را تنبيه كنيد، به شرطى كه بپذيريد بهاى از دست رفتن فرصت را خودتان بپردازيد.
نخستين يافته جالب آن است كه همكارى _ كه در تعريف محدود اين بازى خاص يعنى صرفاً غيبت دائم تقلب _ حتى با طراحى «يك فرصت، كاملاً بيگانه» نيز پديد مى آيد.
متقلبان وقتى تنبيه شدند دست از تقلب برمى دارند. اكنون به بخش واقعاً جالب آن مى رسيم. نويسندگان مقاله نشان دادند كه همه با كمال ميل از فرصت تنبيه متقلب استقبال مى كنند، حتى هنگامى كه اين كار بدان معناست كه تنبيه كننده خود متحمل هزينه اى خواهد شد و به ياد داشته باشيد كه در طرح «يك فرصت، كاملاً بيگانه» تنبيه هيچ سودى به حال تنبيه كننده ندارد. از آنجا كه دو بازيكن هرگز دوباره با هم بازى نمى كنند، امكان ندارد تنبيه به متقلب بياموزد كه ديگر نبايد سر به سر شما بگذارد و از آنجا كه بازيكنان براى هم ناشناس هستند، فرصت تنبيه كردن متقلب درباره او هشدارى به بازيكنان ديگر نمى دهد. در عوض در موقعيت روباز انگيزه اى براى پرداخت هزينه و به دست آوردن فرصت تنبيه آشكار نهفته است: به اين طريق با گذاشتن داغ قابيل بر پيشانى يك حريف غيرقابل اعتماد در آينده، اميدواريد كه بازيكنان ديگر نيز همين كار را انجام دهند.
جانوران اجتماعى گوناگون در قالب مصرف انرژى و خطر آسيب ديدگى، هزينه زيادى براى تنبيه متقلبان روباز پرداخت مى كنند (يك راه براى تشويق اين كار در يك دنياى روباز استفاده از رويكرد بعضى دانشكده هاى افسرى نظام است كه براساس قوانين و عرف كسانى تنبيه مى شوند كه نتوانند متقلبان را تنبيه كنند.) اما در اين مورد عمل تنبيه همان قدر ناشناس است كه عمل تقلب بود.
در بازى فهر و گاچر، هيچ فايده اى از تنبيه عايد تنبيه كننده نمى شود، اما باز هم افراد با اشتياق اين كار را مى كنند. چرا؟ صرفاً به خاطر ميل به انتقام. نويسندگان مقاله نشان مى دهند كه هرچه متقلبان وقيح تر باشند (بسته به اينكه با چه عدم تناسبى سهم شان را پس بگيرند)، ديگران براى تنبيه آنها هزينه بيشترى پرداخت خواهند كرد. اين مسئله حتى در مورد بازيكنان تازه وارد كه هنوز در باغ نيستند و از ريزه كارى هاى بازى خبر ندارند هم صدق مى كند.
ببينيد چه قدر شگفت انگيز است. اگر قرار بود مردم، حتى اگر برايشان هزينه داشت، خود به خود همكارانه رفتار كنند، همين ما را به سوى يك نظام همكارى پايدار هدايت مى كرد، كه در آن همه سود مى بردند. در فهرست عناوين اين نظام هاى پايدار مى توانيد صلح ، توافق و ترانه «تصور كن» لنون (ترانه اى از آلبوم «غزل ها» با صداى جان لنون خواننده مشهور دهه هاى ۱۹۶۰ و ۱۹۷۰ آمريكا- م) را قرار دهيد. اما مردم نمى خواهند اين كار را انجام دهند. حالا در عوض وضعيتى را درنظر بگيريد كه در آن مردم بتوانند با تنبيه متقلبان متحمل هزينه شوند و در آن تنبيه هيچ سود مستقيمى عايد آنها نسازد يا به هيچ خير همگانى مستقيمى نينجامد- و باز هم آنها از اين فرصت استقبال كنند. و سپس، به طور غيرمستقيم، ناگهان از احساسى كاملاً منفى، جوى از همكارى پايدار سر برمى آورد و آن ميل به انتقام است. و از آنجا كه بسيارى از ناخوشايندى هاى اجتماعى ما- قطع كردن راهتان در ترافيك يك اتوبان شلوغ به وسيله يك ابله يا نابغه ديوانه و خل و چلى كه ويروس كامپيوترى «پانزده دقيقه شهرت» بعدى را مى سازد - تعامل هايى از جنس «يك فرصت، كاملاً بيگانه» هستند، اين يافته فوق العاده جالب است.
مردم حاضرند براى به دست آوردن فرصت تنبيه هزينه كنند، اما نه براى انجام كار خوب، اگر من ولكانى (Vulcan، خداى آتش و فلزكارى در اساطير رومى ـ م) بودم كه درباره رفتار اجتماعى در زمين تحقيق مى كرد، به نظرم مى آمد كه اين يك به هم ريختگى غيرمنطقى است. اما از نظر يك نخستى اجتماعى، اين يافته گرچه طنزآميز اما بى عيب و نقص و همه چيزش كاملاً با هم جور است. خير اجتماعى از برآيند رياضى يك ويژگى اجتماعى نه چندان جذاب حاصل مى شود. به گمانم ناچار بايد به همين كه هست قناعت كرد.
Natural History, Jun. 2002
* Sapolsky.ٍR استاد زيست شناسى و عصب شناسى دانشگاه استانفور د و نويسنده كتاب «زندگى نامه يك نخستى» (۲۰۰۱) است.

بن مایه : وبلاگ پیرامون نظریه بازی ها

4Duniverse

ملاكهاي تصميم در نظريه بازيها

در ادامه بحث مربوط به توانمندي (competence ) در مديريت استراتژيك پيش از پرداختن به به بخش دوم swot 2 يعني نقاط ضعف ( weaknesses ) بايستي به معرفي ملاكهاي تصميم گيري كه دلالت بر اندركنش تصميم هاي استراتژيست با تصميم ها و استراتژي حريف دارد بپردازيم :

1- ملاك مينيماكس:

پيشامدها و پديده هاي متفاوتي مي تواند در آينده با احتمالات مختلفي حادث گردد كه توسط تصميم ساز برآورد مي شود.(محتمل بودن وقوع پيشامدها و تصادفي بودن آن هيچگاه منافاتي با منطقي بودن آنها ندارد ) هر تصميمي به نتايج متفاوتي منتهي مي گردد كه ارزش آماري هر نتيجه عبارت است از حاصلضرب ارزش آن در احتمال چيدمان پيشامدها و پديده هايي كه آن نتيجه را مي سازند.

ماهيت پيشامدها و پديده ها :

پيشامدها و پديده ها نيز به نوبه خود محصول كنش يا واكنش تصميم گيرندگان ديگري (حتي طبيعت ) است كه در بازي حضور دارند. كلاف پيچيده اي شد !!!

تابع مخاطره:

اميد زياني كه بر اثر استراتژيهاي مختلف حريفان ( مثلا طبيعت ) از توابع تصميم استراتژيست حاصل مي شود .

كمي ساده تر :

استراتژيست تصميمي مي گيرد ، حريف نيز تصميم ميگيرد ( حالا اين تصميم ها تابع تحليلها و اطلاعاتي است كاري نداريم ) ، ارزش ( سود يا زيان ) نتيجه شده از اين تركيب تصميم ها در احتمال شكل گيري اين تركيب را تابع مخاطره مي گويند . پس به ازاء هر تركيبي يك تابع مخاطره داريم و اين توابع مخاطره غالبا براي استراتژيست قابل مقايسه و اصطلاحا سبك ، سنگين كردن است و همچنين اين تابع مي تواند با توجه به هريك از چهار حالت برد _ برد ، باخت _ باخت ، برد _ باخت يا باخت _ برد داراي مقادير متنوعي باشد . مثلا زمانيكه صحبت از چند گنج باشد و چند نقشه گنج نيز موجود باشد ، اعتبار هر نقشه ، پارامتر احتمال تصميم جهت جستجو و ارزش هرگنج ارزش هرانتخاب در بازي است . بنابراين با انتخاب هر يك از نقشه ها اگر هم گنجي يافت شود بر حسب اينكه در چه محدوده اي اعتبار نقشه تعريف شود و مقدار گنج چقدر باشد ارزش برد متفاوت خواهدبود .

ملاك مينيماكس

در تصميم سازي زمان تعيين كننده است لذا بايستي از جدول بزرگ ماتريس تصميمها ( استراتژيها ) يك تركيب استخراج شود . اين تركيب حاصل تعامل بازيكن با حريف يا حريفان اوست . ملاك مينيماكس تركيبي را در تصميم گيري ملاك قرار مي دهدكه تابع مخاطره آن به ازاء تصميم بازيكن ماكسيسم ولي به ازاء تصميم حريف مي نيمم گردد. ساده تر اينكه در بازي براي هر بازيكن تصميمي ملاك است كه بهترين نتيجه را برايش در برداشته باشد كه مسلما با توجه به اينكه بازي جنگ محدوديتهاست براي بازيكن حريف حداقل ارزش را خواهد داشت .

مثال جالب : در بازي شطرنج به بن بستي رسيده ايد كه بعد از حركت شما حريف مي تواند يكي از مهره هاي شما را حذف كند . براي انجام حركت ، ملاك مينيماكس به شما توصيه مي كند كم ارزش ترين مهره ممكن را قرباني كنيد ( در نتيجه حريف نيز در مقابل اين تصميم و در صورت بهترين حركتش باز هم كمترين سود ممكن را از حذف مهره شما خواهد برد و شما بيشترين سود را در نتيجه نجات از تنگنا برده ايد).

2- ملاك بيزي :

توجه كنيد در ملاك مينيماكس باز تصميم حريف بر شكل گيري تركيب بهينه مؤثر است. چگونه تابع مخاطره را از تصميم حريف مستقل نماييم ؟

كافي است در تابع مخاطره ضرايب جملاتي كه شامل تصميم هاي حريف است صفر كنيم ( واقعا كه در تحليل هاي رياضي روي كاغذ چه ساده مي توان حريف را كنار زد !!!).

ملاك بيزي بيان مي دارد كه شما تصميمي را گرفته ايد و حريف مي تواند دو ( يا چند ) تصميم در واكنش به تصميم شما با احتمال p و 1-p اتخاذ نمايد كه دو تابع مخاطره با مقادير مختلف خواهد بود. كافي است شما بتوانيد بر اين احتمال ( به عنوان يك ضريب ) تاثير بگذاريد و آن را كه تابع مخاطره بيزي را ماكزيمم ميكند صفر نماييد.

ظاهرا ملاك بيزي كمي زيركانه تر و شايد ناجوانمردانه تر جلوه مي كند.

مثال جالب اول :

وقتي براي كودك خود مي خواهيد اسباب بازي بخريد و ميدانيد كه كودك شما هميشه گزينه دومي كه بيان مي كنيد انتخاب مي نمايد چه مي كنيد ؟ آيا اسباب بازي ارزان قيمت را در گزينه دوم بيان نمي كنيد ؟ اين يعني ملاك بيزي.

مثال جالب دوم :

كارفرمايي به كارگران خود دو پيشنهاد مطرح مي كند : آيا مي خواهيد امروز نيمي از حقوق خود را دريافت كنيد يا هفته آينده تمامي حقوق خود را ؟ به نظر شما كارگران چه پاسخي مي دهند ؟ كمي از ملاك بيزي پيشرفته تر شد نه؟

به نقل از وبلاگ پیرامون نظریه بازی ها

نظریه بازی ها

نظریه بازی ها

Re: نظریه بازی ها

Re: نظریه بازی ها

Re: نظریه بازی ها

Re: نظریه بازی ها