3 στρατηγικές σημαίνει πραγματικό τρίγωνο simplex.
Πάμε με το πιο καθαρό παράδειγμα: Rock–Paper–Scissors (Πέτρα–Ψαλίδι–Χαρτί).
1. Το παιχνίδι (3 στρατηγικές)
Παίκτης 1:
= Πέτρα
= Χαρτί
= Ψαλίδι
Παίκτης 2: ίδια.
Πίνακας αποδόσεων Παίκτη 1 (κλασικό):
(Ο Παίκτης 2 έχει το αντίθετο, μηδενικό άθροισμα.)
2. Μικτή στρατηγική και τρίγωνο simplex
Μικτή στρατηγική Παίκτη 1:
Αυτός ο χώρος:
είναι τρίγωνο (2‑simplex).
Κάθε σημείο μέσα στο τρίγωνο είναι μια μικτή στρατηγική.
3. Αλγεβρική λύση Nash
Έστω ότι ο Παίκτης 2 παίζει:
Απόδοση Παίκτη 1 αν παίξει:
:
:
:
Στην ισορροπία, ο Παίκτης 1 πρέπει να είναι αδιάφορος ανάμεσα σε (για να μπορεί να παίζει και τις 3):
Άρα:
Λύνοντας (και με ) παίρνουμε:
Ανάλογα για τον Παίκτη 2:
👉 Ισορροπία Nash:
4. Γεωμετρικά: πώς φαίνεται στο τρίγωνο
Οι κορυφές του τριγώνου:
→ μόνο Πέτρα
→ μόνο Χαρτί
→ μόνο Ψαλίδι
Το σημείο:
είναι το κέντρο του τριγώνου (barycenter).
Εκεί:
καμία καθαρή στρατηγική δεν είναι καλύτερη από τις άλλες,
ο παίκτης είναι αδιάφορος,
άρα μπορεί να παίζει και τις 3 με ίση πιθανότητα.
5. Τι κερδίζεις από το τρίγωνο simplex
Βλέπεις όλο τον χώρο στρατηγικών σαν γεωμετρικό αντικείμενο.
Το Nash είναι ένα σημείο μέσα στο τρίγωνο.
Οι best‑response περιοχές είναι υποπεριοχές του τριγώνου.
Η τομή τους δίνει το σημείο ισορροπίας.
Το παιχνίδι που θα χρησιμοποιήσουμε είναι το Rock–Paper–Scissors, γιατί είναι το πιο καθαρό 3‑στρατηγικό παιχνίδι με μοναδικό μικτό Nash στο κέντρο του simplex.
🔴 1. ΟΡΙΣΜΟΣ ΤΟΥ ΠΑΙΧΝΙΔΙΟΥ (3 στρατηγικές)
Παίκτης 1:
= Πέτρα
= Χαρτί
= Ψαλίδι
Παίκτης 2: ίδια.
Πίνακας αποδόσεων Παίκτη 1:
Ο Παίκτης 2 έχει το αντίθετο (μηδενικό άθροισμα).
🔵 2. Ο ΧΩΡΟΣ ΜΙΚΤΩΝ ΣΤΡΑΤΗΓΙΚΩΝ = ΤΡΙΓΩΝΟ SIMPLEX
Μικτή στρατηγική Παίκτη 1:
Αυτός ο χώρος:
είναι τρίγωνο.
Κορυφή 1: → μόνο Πέτρα
Κορυφή 2: → μόνο Χαρτί
Κορυφή 3: → μόνο Ψαλίδι
Κάθε σημείο μέσα στο τρίγωνο είναι μια μικτή στρατηγική.
🟣 3. ΑΛΓΕΒΡΙΚΗ ΛΥΣΗ NASH (βήμα‑βήμα)
Έστω ότι ο Παίκτης 2 παίζει:
Απόδοση Παίκτη 1 αν παίξει:
:
:
:
Στην ισορροπία, ο Παίκτης 1 πρέπει να είναι αδιάφορος μεταξύ R, P, S:
Με την κανονικοποίηση , λύση:
Ανάλογα για τον Παίκτη 2:
👉 Ισορροπία Nash:
🟢 4. ΜΗΤΡΩΙΚΗ ΛΥΣΗ
Μικτές στρατηγικές:
Απόδοση Παίκτη 1:
Υπολογίζουμε:
Στην ισορροπία, οι στρατηγικές που παίζονται με θετική πιθανότητα πρέπει να έχουν ίση απόδοση:
Λύση:
🟡 5. ΓΕΩΜΕΤΡΙΚΗ ΛΥΣΗ (best‑response regions)
Στο τρίγωνο:
κάθε σημείο αντιστοιχεί σε μια μικτή στρατηγική
οι best‑response περιοχές είναι 3 καμπύλες που χωρίζουν το τρίγωνο
η τομή τους είναι ένα σημείο: το κέντρο του τριγώνου
Αυτό το σημείο είναι:
🟤 6. LCP (Linear Complementarity Problem) — ιδέα
Το Nash γράφεται ως:
όπου:
= πιθανότητες + dual μεταβλητές
, = κατασκευάζονται από τις μήτρες αποδόσεων
Ο αλγόριθμος Lemke–Howson βρίσκει το Nash ακολουθώντας ένα μονοπάτι σε πολυεδρικό γράφο.
Για το RPS, το μονοπάτι καταλήγει στο:
🟧 7. NASH ΩΣ ΣΤΑΘΕΡΟ ΣΗΜΕΙΟ BROUWER
Ορίζουμε μια συνεχή απεικόνιση:
όπου είναι οι αποδόσεις των καθαρών στρατηγικών.
Το Nash είναι λύση της εξίσωσης:
Το θεώρημα Brouwer εγγυάται ότι υπάρχει πάντα τέτοιο σημείο.
🟩 8. PPAD ΕΡΜΗΝΕΙΑ
Το Nash ανήκει στην κλάση:
που σημαίνει:
υπάρχει πάντα λύση
αλλά δεν ξέρουμε αν βρίσκεται σε πολυωνυμικό χρόνο
η εύρεση Nash ισορροπίας είναι PPAD‑complete
άρα ισοδύναμη με εύρεση σταθερού σημείου Brouwer
🟥 9. ΤΕΛΙΚΗ ΣΥΝΘΕΣΗ — ΟΛΑ ΣΥΓΚΛΙΝΟΥΝ ΣΤΟ ΙΔΙΟ ΣΗΜΕΙΟ
| Αναπαράσταση | Τι δείχνει | Πού οδηγεί |
|---|---|---|
| Αλγεβρική | Ισοτιμία αποδόσεων | |
| Μήτρες | Γραμμική μορφή | |
| Simplex | Γεωμετρία | Κέντρο τριγώνου |
| Best‑responses | Τομές | Κέντρο |
| LCP | Συμπληρωματικότητα | |
| Brouwer | Σταθερό σημείο | |
| PPAD | Πολυπλοκότητα | Ίδιο σημείο |
Όλα καταλήγουν στο:
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου