Share |

Τετάρτη 17 Ιουνίου 2026

ισορροπία Nash

 

1. Πλήρης τυπική διατύπωση (ύφος σύγχρονου βιβλίου)

Ορισμός (Πεπερασμένο μη συνεργατικό παιχνίδι). Ένα πεπερασμένο μη συνεργατικό παιχνίδι σε στρατηγική μορφή αποτελείται από:

  • σύνολο παικτών

N={1,2,,n},
  • για κάθε παίκτη iN, ένα πεπερασμένο σύνολο καθαρών στρατηγικών

Ai={1,2,,ki},
  • για κάθε παίκτη iN, μια συνάρτηση απόδοσης

ui:A1××AnR.

Ο χώρος των μικτών στρατηγικών του παίκτη i είναι το simplex

Δi={xiRki:xi,j0, j=1kixi,j=1}.

Ο συνολικός χώρος μικτών στρατηγικών είναι

Δ=Δ1××Δn.

Κάθε x=(x1,,xn)Δ ονομάζεται προφίλ μικτών στρατηγικών.

Ορισμός (Αναμενόμενη απόδοση). Η αναμενόμενη απόδοση του παίκτη i υπό το προφίλ μικτών στρατηγικών xΔ είναι

ui(x)=aA1××Anui(a)j=1nxj,aj.

Ορισμός (Βέλτιστη απάντηση). Για δεδομένο προφίλ στρατηγικών των άλλων παικτών xiΔi:=jiΔj, μια μικτή στρατηγική yiΔi λέγεται βέλτιστη απάντηση αν

ui(yi,xi)ui(zi,xi)για καˊθε ziΔi.

Το σύνολο όλων των βέλτιστων απαντήσεων του παίκτη i στο xi συμβολίζεται

Bi(xi)Δi.

Ορισμός (Ισορροπία Nash). Ένα προφίλ μικτών στρατηγικών x\*Δ λέγεται ισορροπία Nash αν για κάθε παίκτη iN,

xi\*Bi(xi\*).

Θεώρημα (Nash, 1951 — ύπαρξη ισορροπίας). Κάθε πεπερασμένο μη συνεργατικό παιχνίδι σε στρατηγική μορφή έχει τουλάχιστον μία ισορροπία Nash σε μικτές στρατηγικές.

Απόδειξη (ύφος σύγχρονου βιβλίου, με Kakutani).

  1. Δομή του χώρου. Ο χώρος Δ=Δ1××Δn είναι καρτεσιανό γινόμενο απλώνξων· άρα είναι μη κενό, συμπαγές και κυρτό υποσύνολο της Rm για κατάλληλο m.

  2. Αντιστοιχία βέλτιστων αποκρίσεων. Ορίζουμε την αντιστοιχία

B:ΔΔ,B(x)=B1(x1)××Bn(xn).
  1. Μη κενές, συμπαγείς, κυρτές τιμές. Για κάθε i και κάθε xi, η συνάρτηση

Δiyiui(yi,xi)

είναι γραμμική, άρα συνεχής, πάνω σε συμπαγές, κυρτό σύνολο Δi. Το σύνολο των μεγιστοποιητών Bi(xi) είναι μη κενό, συμπαγές και κυρτό. Επομένως, για κάθε xΔ, το B(x) είναι μη κενό, συμπαγές, κυρτό υποσύνολο της Δ.

  1. Άνω ημισυνέχεια / κλειστό γράφημα. Από τη συνέχεια των ui και τη γραμμικότητα ως προς τις μικτές στρατηγικές, η αντιστοιχία B έχει κλειστό γράφημα, άρα είναι άνω ημισυνεχής.

  2. Εφαρμογή Kakutani. Το θεώρημα σταθερού σημείου του Kakutani λέει: Αν X είναι μη κενό, συμπαγές, κυρτό υποσύνολο της Rm και F:XX είναι άνω ημισυνεχής αντιστοιχία με μη κενές, συμπαγείς, κυρτές τιμές, τότε υπάρχει x\*X τέτοιο ώστε

x\*F(x\*).

Εφαρμόζοντας το θεώρημα στο X=Δ και F=B, παίρνουμε ότι υπάρχει x\*Δ με

x\*B(x\*).
  1. Χαρακτηρισμός ως ισορροπία Nash. Η σχέση x\*B(x\*) σημαίνει ότι για κάθε παίκτη i,

xi\*Bi(xi\*),

δηλαδή η στρατηγική xi\* είναι βέλτιστη απάντηση στο xi\*. Άρα το x\* είναι ισορροπία Nash.

2. Ίδιο περιεχόμενο, σε ύφος «αυστηρού μαθηματικού άρθρου»

Τίτλος: Ύπαρξη ισορροπίας σε πεπερασμένα μη συνεργατικά παιχνίδια (ανακατασκευή Nash–Kakutani).

Πλαίσιο. Θεωρούμε πεπερασμένα παιχνίδια σε στρατηγική μορφή και αποδεικνύουμε την ύπαρξη ισορροπίας Nash σε μικτές στρατηγικές, εφαρμόζοντας το θεώρημα σταθερού σημείου του Kakutani σε κατάλληλα ορισμένη αντιστοιχία βέλτιστων αποκρίσεων.

2.1. Ορισμοί και σημειογραφία

Έστω N={1,,n} το σύνολο των παικτών. Για κάθε iN, έστω Ai={1,,ki} το πεπερασμένο σύνολο καθαρών στρατηγικών του. Θέτουμε

A=A1××An.

Για κάθε iN, η συνάρτηση απόδοσης

ui:AR

επεκτείνεται γραμμικά στον χώρο των μικτών στρατηγικών, όπως παρακάτω.

Ορίζουμε τον χώρο μικτών στρατηγικών του παίκτη i ως

Δi={xiRki:xi,j0, j=1kixi,j=1}.

Ο συνολικός χώρος μικτών στρατηγικών είναι

Δ=Δ1××Δn.

Για x=(x1,,xn)Δ, η αναμενόμενη απόδοση του παίκτη i ορίζεται ως

ui(x)=aAui(a)j=1nxj,aj.

2.2. Βέλτιστες αποκρίσεις και αντιστοιχία

Για κάθε iN και κάθε xiΔi:=jiΔj, ορίζουμε το σύνολο βέλτιστων αποκρίσεων του παίκτη i ως

Bi(xi)={yiΔi:ui(yi,xi)ui(zi,xi) για καˊθε ziΔi}.

Ορίζουμε την αντιστοιχία

B:ΔΔ,B(x)=B1(x1)××Bn(xn).

2.3. Βασικές ιδιότητες της αντιστοιχίας B

Λήμμα 1. Για κάθε xΔ, το B(x) είναι μη κενό, συμπαγές και κυρτό υποσύνολο της Δ.

Απόδειξη. Για κάθε i, η συνάρτηση

Δiyiui(yi,xi)

είναι γραμμική, άρα συνεχής, σε συμπαγές, κυρτό σύνολο Δi. Επομένως, το σύνολο των μεγιστοποιητών Bi(xi) είναι μη κενό, συμπαγές και κυρτό. Το καρτεσιανό γινόμενο

B(x)=i=1nBi(xi)

κληρονομεί αυτές τις ιδιότητες.

Λήμμα 2. Η αντιστοιχία B έχει κλειστό γράφημα, άρα είναι άνω ημισυνεχής.

Σκίτσο απόδειξης. Θεωρούμε ακολουθίες xkx στο Δ και yky στο Δ με ykB(xk) για κάθε k. Για κάθε παίκτη i, ισχύει

ui(yik,xik)ui(zi,xik)για καˊθε ziΔi.

Περνώντας στο όριο και χρησιμοποιώντας τη συνέχεια των ui, παίρνουμε

ui(yi,xi)ui(zi,xi)για καˊθε ziΔi,

άρα yiBi(xi) για κάθε i, δηλαδή yB(x). Έτσι το γράφημα του B είναι κλειστό.

2.4. Εφαρμογή του θεωρήματος Kakutani

Το θεώρημα σταθερού σημείου του Kakutani εφαρμόζεται στο Δ και στην αντιστοιχία B, διότι:

  • Δ είναι μη κενό, συμπαγές, κυρτό υποσύνολο της Rm,

  • η B είναι άνω ημισυνεχής,

  • για κάθε xΔ, το B(x) είναι μη κενό, συμπαγές, κυρτό.

Άρα υπάρχει x\*Δ τέτοιο ώστε

x\*B(x\*).

2.5. Χαρακτηρισμός του σταθερού σημείου ως ισορροπίας Nash

Από τον ορισμό του B, η σχέση x\*B(x\*) σημαίνει ότι για κάθε παίκτη i,

xi\*Bi(xi\*),

δηλαδή η στρατηγική xi\* είναι βέλτιστη απάντηση στο xi\*. Επομένως, το x\* είναι ισορροπία Nash.