ΕΠΙΣΤΗΜΗ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑ - ΔΙΑΚΡΙΣΕΙΣ, ΕΡΕΥΝΑ
Παρασκευή 19 Ιουνίου 2026
τρίγωνο simplex.
3 στρατηγικές σημαίνει πραγματικό τρίγωνο simplex.
Πάμε με το πιο καθαρό παράδειγμα: Rock–Paper–Scissors (Πέτρα–Ψαλίδι–Χαρτί).
1. Το παιχνίδι (3 στρατηγικές)
Παίκτης 1:
= Πέτρα
= Χαρτί
= Ψαλίδι
Παίκτης 2: ίδια.
Πίνακας αποδόσεων Παίκτη 1 (κλασικό):
(Ο Παίκτης 2 έχει το αντίθετο, μηδενικό άθροισμα.)
2. Μικτή στρατηγική και τρίγωνο simplex
Μικτή στρατηγική Παίκτη 1:
Αυτός ο χώρος:
είναι τρίγωνο (2‑simplex).
Κάθε σημείο μέσα στο τρίγωνο είναι μια μικτή στρατηγική.
3. Αλγεβρική λύση Nash
Έστω ότι ο Παίκτης 2 παίζει:
Απόδοση Παίκτη 1 αν παίξει:
:
:
:
Στην ισορροπία, ο Παίκτης 1 πρέπει να είναι αδιάφορος ανάμεσα σε (για να μπορεί να παίζει και τις 3):
Άρα:
Λύνοντας (και με ) παίρνουμε:
Ανάλογα για τον Παίκτη 2:
👉 Ισορροπία Nash:
4. Γεωμετρικά: πώς φαίνεται στο τρίγωνο
Οι κορυφές του τριγώνου:
→ μόνο Πέτρα
→ μόνο Χαρτί
→ μόνο Ψαλίδι
Το σημείο:
είναι το κέντρο του τριγώνου (barycenter).
Εκεί:
καμία καθαρή στρατηγική δεν είναι καλύτερη από τις άλλες,
ο παίκτης είναι αδιάφορος,
άρα μπορεί να παίζει και τις 3 με ίση πιθανότητα.
5. Τι κερδίζεις από το τρίγωνο simplex
Βλέπεις όλο τον χώρο στρατηγικών σαν γεωμετρικό αντικείμενο.
Το Nash είναι ένα σημείο μέσα στο τρίγωνο.
Οι best‑response περιοχές είναι υποπεριοχές του τριγώνου.
Η τομή τους δίνει το σημείο ισορροπίας.
Το παιχνίδι που θα χρησιμοποιήσουμε είναι το Rock–Paper–Scissors, γιατί είναι το πιο καθαρό 3‑στρατηγικό παιχνίδι με μοναδικό μικτό Nash στο κέντρο του simplex.
🔴 1. ΟΡΙΣΜΟΣ ΤΟΥ ΠΑΙΧΝΙΔΙΟΥ (3 στρατηγικές)
Παίκτης 1:
= Πέτρα
= Χαρτί
= Ψαλίδι
Παίκτης 2: ίδια.
Πίνακας αποδόσεων Παίκτη 1:
Ο Παίκτης 2 έχει το αντίθετο (μηδενικό άθροισμα).
🔵 2. Ο ΧΩΡΟΣ ΜΙΚΤΩΝ ΣΤΡΑΤΗΓΙΚΩΝ = ΤΡΙΓΩΝΟ SIMPLEX
Μικτή στρατηγική Παίκτη 1:
Αυτός ο χώρος:
είναι τρίγωνο.
Κορυφή 1: → μόνο Πέτρα
Κορυφή 2: → μόνο Χαρτί
Κορυφή 3: → μόνο Ψαλίδι
Κάθε σημείο μέσα στο τρίγωνο είναι μια μικτή στρατηγική.
🟣 3. ΑΛΓΕΒΡΙΚΗ ΛΥΣΗ NASH (βήμα‑βήμα)
Έστω ότι ο Παίκτης 2 παίζει:
Απόδοση Παίκτη 1 αν παίξει:
:
:
:
Στην ισορροπία, ο Παίκτης 1 πρέπει να είναι αδιάφορος μεταξύ R, P, S:
Με την κανονικοποίηση , λύση:
Ανάλογα για τον Παίκτη 2:
👉 Ισορροπία Nash:
🟢 4. ΜΗΤΡΩΙΚΗ ΛΥΣΗ
Μικτές στρατηγικές:
Απόδοση Παίκτη 1:
Υπολογίζουμε:
Στην ισορροπία, οι στρατηγικές που παίζονται με θετική πιθανότητα πρέπει να έχουν ίση απόδοση:
Λύση:
🟡 5. ΓΕΩΜΕΤΡΙΚΗ ΛΥΣΗ (best‑response regions)
Στο τρίγωνο:
κάθε σημείο αντιστοιχεί σε μια μικτή στρατηγική
οι best‑response περιοχές είναι 3 καμπύλες που χωρίζουν το τρίγωνο
η τομή τους είναι ένα σημείο: το κέντρο του τριγώνου
Αυτό το σημείο είναι:
🟤 6. LCP (Linear Complementarity Problem) — ιδέα
Το Nash γράφεται ως:
όπου:
= πιθανότητες + dual μεταβλητές
, = κατασκευάζονται από τις μήτρες αποδόσεων
Ο αλγόριθμος Lemke–Howson βρίσκει το Nash ακολουθώντας ένα μονοπάτι σε πολυεδρικό γράφο.
Για το RPS, το μονοπάτι καταλήγει στο:
🟧 7. NASH ΩΣ ΣΤΑΘΕΡΟ ΣΗΜΕΙΟ BROUWER
Ορίζουμε μια συνεχή απεικόνιση:
όπου είναι οι αποδόσεις των καθαρών στρατηγικών.
Το Nash είναι λύση της εξίσωσης:
Το θεώρημα Brouwer εγγυάται ότι υπάρχει πάντα τέτοιο σημείο.
🟩 8. PPAD ΕΡΜΗΝΕΙΑ
Το Nash ανήκει στην κλάση:
που σημαίνει:
υπάρχει πάντα λύση
αλλά δεν ξέρουμε αν βρίσκεται σε πολυωνυμικό χρόνο
η εύρεση Nash ισορροπίας είναι PPAD‑complete
άρα ισοδύναμη με εύρεση σταθερού σημείου Brouwer
🟥 9. ΤΕΛΙΚΗ ΣΥΝΘΕΣΗ — ΟΛΑ ΣΥΓΚΛΙΝΟΥΝ ΣΤΟ ΙΔΙΟ ΣΗΜΕΙΟ
| Αναπαράσταση | Τι δείχνει | Πού οδηγεί |
|---|---|---|
| Αλγεβρική | Ισοτιμία αποδόσεων | |
| Μήτρες | Γραμμική μορφή | |
| Simplex | Γεωμετρία | Κέντρο τριγώνου |
| Best‑responses | Τομές | Κέντρο |
| LCP | Συμπληρωματικότητα | |
| Brouwer | Σταθερό σημείο | |
| PPAD | Πολυπλοκότητα | Ίδιο σημείο |
Όλα καταλήγουν στο:
Game Theory;
Ποια συνάρτηση θέλεις να βελτιστοποιήσεις στη Game Theory;
Η απάντηση είναι ξεκάθαρη:
👉 Κάθε παίκτης βελτιστοποιεί τη δική του συνάρτηση χρησιμότητας (utility function).
Δεν υπάρχει “μία” κοινή συνάρτηση για όλους. Στη θεωρία παιγνίων, κάθε παίκτης έχει τη δική του συνάρτηση στόχου, και η ισορροπία Nash προκύπτει όταν καμία συνάρτηση δεν μπορεί να βελτιωθεί μονομερώς.
🔍 Τι ακριβώς βελτιστοποιεί ένας παίκτης;
Για έναν παίκτη :
όπου:
= συνάρτηση χρησιμότητας του παίκτη
= στρατηγική του παίκτη
= στρατηγικές όλων των άλλων παικτών
Ο παίκτης επιλέγει ώστε να μεγιστοποιεί το , δεδομένων των επιλογών των άλλων.
🎮 Στο Nash Equilibrium τι συμβαίνει;
Ένα προφίλ στρατηγικών είναι Nash όταν:
Δηλαδή:
Κανένας παίκτης δεν μπορεί να βρει καλύτερη στρατηγική για να αυξήσει τη δική του χρησιμότητα.
Όλοι είναι σε βέλτιστη απάντηση (best response).
🧠 Ποια είναι η “συνάρτηση που βελτιστοποιεί το παιχνίδι συνολικά”;
Στη θεωρία παιγνίων δεν υπάρχει συνολική συνάρτηση που βελτιστοποιείται από όλους (εκτός από ειδικές περιπτώσεις όπως potential games).
Η θεωρία παιγνίων είναι μη συνεργατική: ο καθένας βελτιστοποιεί τη δική του χρησιμότητα.
🧩 Αν μιλάς για αλγοριθμική θεωρία (PPAD, Brouwer → Nash):
Τότε η “συνάρτηση” που βελτιστοποιείς δεν είναι utility αλλά:
👉 μια συνεχής απεικόνιση που ψάχνεις το σταθερό σημείο της:
Από εκεί προκύπτει η Nash ισορροπία.
🎯 Το “τρίγωνο ισορροπίας” (Nash equilibrium simplex) είναι ένα ή πολλά;
✔️ Απάντηση: Είναι ΠΟΛΛΑ. Όχι ένα.
Δεν υπάρχει ένα “τρίγωνο ισορροπίας”. Υπάρχουν πολλά, γιατί:
κάθε παιχνίδι έχει το δικό του σύνολο μικτών στρατηγικών,
κάθε παίκτης έχει το δικό του simplex (τρίγωνο, τετράεδρο, κ.λπ.),
η ισορροπία Nash είναι ένα σημείο μέσα στο καρτεσιανό γινόμενο αυτών των simplex.
🔍 Τι είναι το “τρίγωνο” στη θεωρία παιγνίων;
Για έναν παίκτη με 3 στρατηγικές, το σύνολο των μικτών στρατηγικών του είναι:
Αυτό είναι ένα τρίγωνο (2-simplex).
Αν έχει 4 στρατηγικές → τετράεδρο (3-simplex). Αν έχει 2 → γραμμή (1-simplex).
🧠 Πόσα τέτοια simplex υπάρχουν στο παιχνίδι;
Για ένα παιχνίδι με n παίκτες, όπου ο παίκτης έχει στρατηγικές:
ο παίκτης έχει ένα simplex διαστάσεων ,
το παιχνίδι συνολικά έχει n simplex,
ο χώρος στρατηγικών είναι το καρτεσιανό γινόμενο αυτών.
Άρα:
👉 Υπάρχουν τόσα “τρίγωνα” όσοι είναι οι παίκτες που έχουν 3 στρατηγικές.
🎮 Και η ισορροπία Nash;
Η ισορροπία Nash είναι ένα σημείο μέσα στο προϊόν των simplex:
Δεν είναι τρίγωνο. Δεν είναι περιοχή. Είναι ένα σημείο.
🧩 Άρα τελικά:
Το “τρίγωνο” = ο χώρος μικτών στρατηγικών ενός παίκτη με 3 επιλογές.
Υπάρχουν πολλά, ένα για κάθε παίκτη.
Η ισορροπία Nash είναι ένα σημείο μέσα στο πολυδιάστατο χώρο που σχηματίζουν όλα αυτά τα simplex μαζί.
Μπορούμε να το παραστήσουμε και αλγεβρικά και με μήτρες. Στην πραγματικότητα, η θεωρία παιγνίων έχει δύο πλήρως ισοδύναμες αναπαραστάσεις για το σημείο ισορροπίας Nash:
✅ 1. Αλγεβρική αναπαράσταση (με εξισώσεις)
Αν ο παίκτης έχει μικτή στρατηγική
με και ,
τότε η ισορροπία Nash ικανοποιεί:
Αυτό γράφεται ως σύστημα εξισώσεων και ανισώσεων:
Ισοτιμία αποδόσεων για όλες τις στρατηγικές που παίζονται με θετική πιθανότητα:
Μικρότερη ή ίση απόδοση για στρατηγικές που δεν παίζονται:
Κανονικοποίηση:
Αυτό είναι η αλγεβρική μορφή του Nash.
✅ 2. Αναπαράσταση με ΜΗΤΡΕΣ (matrix form)
Για παιχνίδι 2 παικτών με αποδόσεις:
Παίκτης 1: μήτρα
Παίκτης 2: μήτρα
Αν οι μικτές στρατηγικές είναι:
τότε:
Απόδοση παίκτη 1:
Απόδοση παίκτη 2:
Η ισορροπία Nash ικανοποιεί:
Για τον παίκτη 1:
Για τον παίκτη 2:
Αυτές είναι συνθήκες συμπληρωματικής χαλαρότητας (complementary slackness) και οδηγούν σε γραμμικό συμπλήρωμα (LCP).
🔥 3. Η πιο προχωρημένη μορφή: LCP → PPAD → Brouwer
Το Nash μπορεί να γραφτεί ως:
Αυτό είναι Linear Complementarity Problem (LCP). Και το LCP είναι PPAD-complete, δηλαδή ισοδύναμο με την εύρεση σταθερού σημείου Brouwer.
🎯 Άρα η απάντηση στην ερώτησή σου:
👉 Ναι, το σημείο ισορροπίας Nash μπορεί να παρασταθεί:
Αλγεβρικά με εξισώσεις χρησιμότητας
Με μήτρες (matrix form)
Ως LCP
Ως σταθερό σημείο Brouwer
Όλα αυτά είναι ισοδύναμα.
Ενα μικρό manual της Θεωρίας Παιγνίων για το πώς παριστάνουμε, λύνουμε και κατανοούμε το σημείο ισορροπίας Nash:
Αλγεβρικά
Με μήτρες
Με LCP (Linear Complementarity Problem)
Ως σταθερό σημείο Brouwer
Ως PPAD πρόβλημα
Με γεωμετρία simplex (τρίγωνο)
Και θα τα ενώσω όλα σε ένα ενιαίο πλαίσιο, ώστε να δεις πώς συνδέονται.
🟥 1. ΑΛΓΕΒΡΙΚΗ ΠΑΡΑΣΤΑΣΗ ΤΟΥ NASH
Για έναν παίκτη με μικτή στρατηγική:
Η ισορροπία Nash ικανοποιεί:
(α) Ισοτιμία αποδόσεων στις στρατηγικές που παίζονται
Αν :
(β) Μικρότερη ή ίση απόδοση στις στρατηγικές που δεν παίζονται
Αν :
(γ) Κανονικοποίηση
Αυτό είναι το καθαρό αλγεβρικό σύστημα που ορίζει το Nash.
🟦 2. ΠΑΡΑΣΤΑΣΗ ΜΕ ΜΗΤΡΕΣ (Matrix Form)
Για παιχνίδι 2 παικτών:
Παίκτης 1 → μήτρα αποδόσεων
Παίκτης 2 → μήτρα αποδόσεων
Μικτές στρατηγικές:
Απόδοση παίκτη 1:
Απόδοση παίκτη 2:
Συνθήκες Nash (με συμπληρωματική χαλαρότητα):
Για τον παίκτη 1:
Για τον παίκτη 2:
Αυτό είναι η μητρωική μορφή του Nash.
🟩 3. LCP (Linear Complementarity Problem)
Το Nash μπορεί να γραφτεί ως:
όπου:
= οι πιθανότητες των στρατηγικών
, = κατασκευάζονται από τις μήτρες ,
Αυτό είναι LCP — και είναι PPAD-complete.
🟧 4. ΩΣ ΣΤΑΘΕΡΟ ΣΗΜΕΙΟ BROUWER
Το Nash είναι λύση της εξίσωσης:
όπου είναι μια συνεχής απεικόνιση που “σπρώχνει” κάθε στρατηγική προς τις καλύτερες απαντήσεις.
Το θεώρημα Brouwer εγγυάται ότι υπάρχει πάντα τέτοιο σημείο.
🟪 5. ΩΣ PPAD ΠΡΟΒΛΗΜΑ
Το Nash ανήκει στην κλάση:
που σημαίνει:
δεν ξέρουμε αν λύνεται σε πολυωνυμικό χρόνο
αλλά πάντα υπάρχει λύση
και μπορούμε να τη βρούμε ακολουθώντας ένα “μονοπάτι” (path-following)
Ο πιο γνωστός αλγόριθμος:
Lemke–Howson Algorithm
Ο οποίος βρίσκει Nash σε 2‑player games ακολουθώντας ένα μονοπάτι σε έναν πολυεδρικό γράφο.
🟫 6. ΓΕΩΜΕΤΡΙΑ SIMPLEX (ΤΡΙΓΩΝΟ)
Για παίκτη με 3 στρατηγικές:
Αυτό είναι τρίγωνο.
Για 4 στρατηγικές → τετράεδρο. Για 2 → γραμμή.
Η ισορροπία Nash είναι ένα σημείο μέσα στο προϊόν όλων αυτών των simplex.
🟥 7. ΠΩΣ ΣΥΝΔΕΟΝΤΑΙ ΟΛΑ ΜΑΖΙ
| Αναπαράσταση | Τι δείχνει | Τι λύνει |
|---|---|---|
| Αλγεβρική | Συνθήκες ισορροπίας | Best responses |
| Μήτρες | Αποδόσεις | Γραμμικά συστήματα |
| LCP | Συμπληρωματικότητα | Nash ως πολυεδρικό πρόβλημα |
| Brouwer | Σταθερό σημείο | Ύπαρξη λύσης |
| PPAD | Υπολογιστική πολυπλοκότητα | Δυσκολία εύρεσης |
| Simplex | Γεωμετρία στρατηγικών | Οπτική κατανόηση |
Όλα αυτά είναι ισοδύναμες μορφές του ίδιου πράγματος.
Πάμε, ναι. Θα σου φτιάξω ένα πολύ συγκεκριμένο 2×2 παιχνίδι και θα το λύσουμε:
αλγεβρικά
με μήτρες
σαν LCP (σε ιδέα)
γεωμετρικά (simplex)
Θα χρησιμοποιήσω το κλασικό Matching Pennies γιατί έχει καθαρό μικτό Nash.
1. Το παιχνίδι (2×2)
Δύο παίκτες, δύο στρατηγικές:
Παίκτης 1: H (Κορώνα), T (Γράμματα)
Παίκτης 2: H, T
Πίνακας αποδόσεων Παίκτη 1 (Παίκτης 2 παίρνει το αντίθετο):
Άρα:
Αν ταιριάζουν (H–H ή T–T) → Παίκτης 1 κερδίζει 1
Αν δεν ταιριάζουν → Παίκτης 1 χάνει 1
2. Αλγεβρική λύση (μικτές στρατηγικές)
Έστω:
Παίκτης 1: παίζει H με πιθανότητα , T με
Παίκτης 2: παίζει H με πιθανότητα , T με
Απόδοση Παίκτη 1 αν παίξει H:
Απόδοση αν παίξει T:
Στην ισορροπία, ο Παίκτης 1 είναι αδιάφορος μεταξύ H και T (για να παίζει και τις δύο):
Ανάλογα για τον Παίκτη 2:
Αν ο Παίκτης 1 παίζει H με , T με ,
θα βγει συμμετρικά ότι:
👉 Ισορροπία Nash:
3. Μητρωική μορφή
Μικτές στρατηγικές:
Απόδοση Παίκτη 1:
Στην ισορροπία:
δίνει τις αποδόσεις των καθαρών στρατηγικών του 1, δεδομένου
Θέλουμε οι στρατηγικές που παίζονται με θετική πιθανότητα να έχουν ίση απόδοση και οι άλλες όχι μεγαλύτερη.
Υπολογίζουμε:
Στην ισορροπία, και οι δύο στρατηγικές του Παίκτη 1 παίζονται → πρέπει:
Ανάλογα, για τον Παίκτη 2 με μήτρα βρίσκουμε .
4. LCP (ιδέα, χωρίς να σε πνίξω σε σύμβολα)
Το ίδιο πρόβλημα μπορεί να γραφτεί ως:
όπου το περιέχει:
τις πιθανότητες των στρατηγικών
και κάποιες “dual” μεταβλητές (τιμές αποδόσεων)
Για το συγκεκριμένο παιχνίδι, το LCP κωδικοποιεί:
ότι οι στρατηγικές με θετική πιθανότητα έχουν ίση απόδοση,
ότι οι υπόλοιπες δεν δίνουν μεγαλύτερη,
και ότι όλα είναι ≥ 0.
Ο αλγόριθμος Lemke–Howson παίρνει αυτό το LCP και βρίσκει το σημείο:
5. Γεωμετρία (simplex)
Εδώ κάθε παίκτης έχει 2 στρατηγικές, άρα:
ο χώρος μικτών στρατηγικών του καθενός είναι γραμμή (1‑simplex).
Το συνολικό στρατηγικό προφίλ είναι σημείο στο τετράγωνο .
Το σημείο:
είναι ένα σημείο μέσα στο τετράγωνο όπου:
καμία μονομερής αλλαγή ή δεν βελτιώνει την απόδοση του αντίστοιχου παίκτη.