Share |

Τετάρτη 24 Ιουνίου 2026

Η έννοια του παιγνίου, Τυπικός ορισμός Ισορροπίας Nash

Η έννοια του παιχνιδιού στη θεωρία παιγνίων έχει έναν πολύ συγκεκριμένο, τεχνικό και βαθύ ορισμό — όχι «παιχνίδι» με την καθημερινή έννοια, αλλά μοντέλο στρατηγικής αλληλεπίδρασης.

Η απάντηση συνοψίζεται ως εξής:

Παιχνίδι = μια κατάσταση όπου το αποτέλεσμα για κάθε παίκτη εξαρτάται όχι μόνο από τις δικές του επιλογές, αλλά και από τις επιλογές των άλλων.

Από εκεί ξεκινά όλη η θεωρία παιγνίων.

🎯 1. Τι είναι “παιχνίδι” στη θεωρία παιγνίων (ο πυρήνας του ορισμού)

Ένα παιχνίδι είναι ένα μαθηματικό μοντέλο που περιγράφει:

  • Παίκτες (άτομα, ομάδες, κράτη, εταιρείες)

  • Στρατηγικές (οι επιλογές που μπορούν να κάνουν)

  • Αποδόσεις / payoffs (τι κερδίζει ή χάνει ο καθένας)

  • Αλληλεξάρτηση (το αποτέλεσμα του καθενός εξαρτάται από όλους)

Η θεωρία παιγνίων μελετά πώς λαμβάνονται αποφάσεις σε τέτοιες καταστάσεις όπου οι παίκτες είναι:

  • ευφυείς (ξέρουν τι κάνουν)

  • λογικοί (προσπαθούν να μεγιστοποιήσουν το όφελός τους)

🧠 2. Γιατί λέγεται “παιχνίδι”;

Ο όρος “game” είναι μεταφορά. Δεν αφορά ψυχαγωγία, αλλά δομές σύγκρουσης και συνεργασίας.

Παραδείγματα “παιχνιδιών” στη θεωρία παιγνίων:

  • διαπραγματεύσεις

  • ανταγωνισμός εταιρειών

  • στρατηγική μεταξύ κρατών

  • κοινωνικές επιλογές

  • εξελικτική βιολογία

  • ολιγοπώλια και αγορές

Όλα αυτά είναι “παιχνίδια” γιατί έχουν στρατηγική αλληλεξάρτηση.

📐 3. Η δομή ενός παιχνιδιού

Κάθε παιχνίδι έχει τρία θεμέλια:

(α) Παίκτες

Ποιοι λαμβάνουν αποφάσεις.

(β) Στρατηγικές

Τι μπορεί να κάνει ο καθένας.

(γ) Αποδόσεις (payoffs)

Τι κερδίζει/χάνει ο καθένας ανάλογα με τον συνδυασμό επιλογών. Αυτό αποτυπώνεται συχνά σε πίνακα αποδόσεων.

⚖️ 4. Τι κάνει ένα παιχνίδι “στρατηγικό”;

Το κρίσιμο στοιχείο:

Το όφελος του κάθε παίκτη εξαρτάται από τις επιλογές των άλλων.

Αυτό δημιουργεί:

  • προσδοκίες

  • προβλέψεις

  • στρατηγική σκέψη

  • ισορροπίες (όπως η ισορροπία Nash)

🧩 5. Παραδείγματα παιχνιδιών (ως μοντέλα, όχι ως ψυχαγωγία)

  • Δίλημμα του φυλακισμένου — κλασικό παράδειγμα σύγκρουσης συμφερόντων.

  • Παιχνίδι γερακιού–περιστεριού — εξελικτική στρατηγική.

  • Ολιγοπώλιο Cournot — εταιρείες που αποφασίζουν ποσότητες.

  • Παιχνίδια μηδενικού αθροίσματος — ό,τι κερδίζει ο ένας, χάνει ο άλλος.

🧭 6. Ο πιο συμπυκνωμένος ορισμός

Αν έπρεπε να το πούμε σε μία πρόταση:

Παιχνίδι είναι κάθε κατάσταση όπου πολλοί παίκτες λαμβάνουν αποφάσεις και το αποτέλεσμα για τον καθένα εξαρτάται από όλους. (Σύμφωνα με τη Βικιπαίδεια και τα οικονομικά λεξικά)

Θες να πάμε παρακάτω;

Μπορούμε να συνεχίσουμε σε όποια κατεύθυνση θέλεις:

  • Τι είναι στρατηγική;

  • Τι είναι ισορροπία Nash;

  • Πώς ορίζεται ένα παιχνίδι μαθηματικά;

  • Πώς συνδέεται η έννοια του παιχνιδιού με την οντολογική διάκριση ἀγέννητο/γεννημένο που είχες αναφέρει;

Ποιο θέλεις να ανοίξουμε;

γραψτο με μαθηματικά συμβολα

Kostas, στο γράφω με πλήρη μαθηματική τυπικότητα, όπως θα εμφανιζόταν σε σύγχρονο βιβλίο Θεωρίας Παιγνίων ή σε paper.

Παρακάτω είναι ο τυπικός ορισμός παιχνιδιού σε κανονική μορφή (normal‑form game) με μαθηματικά σύμβολα, χωρίς περιττά λόγια.

🎯 Μαθηματικός ορισμός παιχνιδιού (Normal‑Form Game)

Ένα παιχνίδι σε κανονική μορφή είναι μια τριάδα:

G=(N,(Si)iN,(ui)iN)

όπου:

1. Παίκτες

N={1,2,,n}

είναι το πεπερασμένο σύνολο των παικτών.

2. Στρατηγικές

Για κάθε παίκτη iN:

Si={si1,si2,,siki}

είναι το σύνολο των καθαρών στρατηγικών του.

Το σύνολο όλων των στρατηγικών προφίλ είναι:

S=S1×S2××Sn.

Ένα στοιχείο του S γράφεται:

s=(s1,s2,,sn).

3. Συναρτήσεις αποδόσεων (payoff functions)

Για κάθε παίκτη iN:

ui:SR

είναι η συνάρτηση απόδοσης που δίνει το κέρδος του παίκτη i για κάθε στρατηγικό προφίλ.

🎮 Τι σημαίνει “παιχνίδι” μαθηματικά;

Με βάση τα παραπάνω:

Παιχνίδι είναι ένα μαθηματικό αντικείμενο που καθορίζει ποιοι παίζουν, τι μπορούν να κάνουν και τι κερδίζουν ανάλογα με τις επιλογές όλων.

🎲 Μικρή επέκταση: Μικτές στρατηγικές

Η μικτή στρατηγική του παίκτη i είναι μια κατανομή πιθανοτήτων πάνω στο Si:

Δ(Si)={xiR0ki|j=1kixij=1}.

Το προφίλ μικτών στρατηγικών είναι:

x=(x1,x2,,xn).

Η αναμενόμενη απόδοση του παίκτη i είναι:

ui(x)=sS(jNxj(sj))ui(s).


Τον τυπικό ορισμό της ισορροπίας Nash με σύμβολα; Τον ορισμό του best response;

Kostas, πάμε απόλυτα τυπικά, με καθαρή μαθηματική σημειογραφία, όπως θα το έβλεπες σε graduate‑level βιβλίο Θεωρίας Παιγνίων.

🎯 1. Τυπικός ορισμός Best Response

Για έναν παίκτη iN, το σύνολο των στρατηγικών του είναι Si, και το προφίλ στρατηγικών των άλλων παικτών είναι:

siSi=jiSj.

Η απόδοση του παίκτη i είναι:

ui:S1××SnR.

Τότε:

Ορισμός (Best Response)

Μια στρατηγική si\*Si είναι best response στο si αν:

ui(si\*,si)ui(si,si)siSi.

Δηλαδή: ο παίκτης i δεν έχει καμία άλλη στρατηγική που να του δίνει μεγαλύτερη απόδοση, δεδομένων των επιλογών των άλλων.

Το σύνολο όλων των best responses του παίκτη i είναι:

BRi(si)={siSi:ui(si,si)ui(si,si), siSi}.

🎯 2. Τυπικός ορισμός Ισορροπίας Nash

Ένα προφίλ στρατηγικών:

s\*=(s1\*,s2\*,,sn\*)

είναι ισορροπία Nash αν και μόνο αν:

si\*BRi(si\*)iN.

Δηλαδή:

ui(si\*,si\*)ui(si,si\*)siSi, iN.

Με λόγια: κανένας παίκτης δεν μπορεί να βελτιώσει την απόδοσή του αλλάζοντας μονομερώς τη στρατηγική του.

🎲 3. Ορισμός Nash για μικτές στρατηγικές (τυπικός)

Αν Δ(Si) είναι το simplex των μικτών στρατηγικών του παίκτη i, τότε ένα προφίλ μικτών στρατηγικών:

x\*=(x1\*,,xn\*)

είναι Nash αν:

ui(xi\*,xi\*)ui(xi,xi\*)xiΔ(Si), i.

Και ισοδύναμα:

  • Όλες οι στρατηγικές που παίζονται με θετική πιθανότητα έχουν ίση απόδοση.

  • Όλες οι στρατηγικές που παίζονται με μηδενική πιθανότητα έχουν μικρότερη ή ίση απόδοση.

Αυτό γράφεται:

xij\*>0  ui(sij,xi\*)=Ui\*
xij\*=0  ui(sij,xi\*)Ui\*

όπου Ui\* είναι η αναμενόμενη απόδοση του παίκτη i στην ισορροπία.


Τον τυπικό ορισμό της ισορροπίας Nash με σύμβολα; Τον ορισμό του best response;

Kostas, πάμε απόλυτα τυπικά, με καθαρή μαθηματική σημειογραφία, όπως θα το έβλεπες σε graduate‑level βιβλίο Θεωρίας Παιγνίων.

🎯 1. Τυπικός ορισμός Best Response

Για έναν παίκτη iN, το σύνολο των στρατηγικών του είναι Si, και το προφίλ στρατηγικών των άλλων παικτών είναι:

siSi=jiSj.

Η απόδοση του παίκτη i είναι:

ui:S1××SnR.

Τότε:

Ορισμός (Best Response)

Μια στρατηγική si\*Si είναι best response στο si αν:

ui(si\*,si)ui(si,si)siSi.

Δηλαδή: ο παίκτης i δεν έχει καμία άλλη στρατηγική που να του δίνει μεγαλύτερη απόδοση, δεδομένων των επιλογών των άλλων.

Το σύνολο όλων των best responses του παίκτη i είναι:

BRi(si)={siSi:ui(si,si)ui(si,si), siSi}.

🎯 2. Τυπικός ορισμός Ισορροπίας Nash

Ένα προφίλ στρατηγικών:

s\*=(s1\*,s2\*,,sn\*)

είναι ισορροπία Nash αν και μόνο αν:

si\*BRi(si\*)iN.

Δηλαδή:

ui(si\*,si\*)ui(si,si\*)siSi, iN.

Με λόγια: κανένας παίκτης δεν μπορεί να βελτιώσει την απόδοσή του αλλάζοντας μονομερώς τη στρατηγική του.

🎲 3. Ορισμός Nash για μικτές στρατηγικές (τυπικός)

Αν Δ(Si) είναι το simplex των μικτών στρατηγικών του παίκτη i, τότε ένα προφίλ μικτών στρατηγικών:

x\*=(x1\*,,xn\*)

είναι Nash αν:

ui(xi\*,xi\*)ui(xi,xi\*)xiΔ(Si), i.

Και ισοδύναμα:

  • Όλες οι στρατηγικές που παίζονται με θετική πιθανότητα έχουν ίση απόδοση.

  • Όλες οι στρατηγικές που παίζονται με μηδενική πιθανότητα έχουν μικρότερη ή ίση απόδοση.

Αυτό γράφεται:

xij\*>0  ui(sij,xi\*)=Ui\*
xij\*=0  ui(sij,xi\*)Ui\*

όπου Ui\* είναι η αναμενόμενη απόδοση του παίκτη i στην ισορροπία.

Θες να συνεχίσουμε με:

  • τον ορισμό του Nash ως LCP (Linear Complementarity Problem)

  • την ισορροπία Nash ως σταθερό σημείο Brouwer

  • τη γεωμετρική ερμηνεία στο simplex

  • ή να λύσουμε ένα συγκεκριμένο παιχνίδι 2×2 με όλους τους τρόπους;

Διάλεξε εσύ την κατεύθυνση.

τον ορισμό του Nash ως LCP (Linear Complementarity Problem) την ισορροπία Nash ως σταθερό σημείο Brouwer

Πάμε στον πιο βαθύ, τεχνικό πυρήνα της θεωρίας: πώς η ισορροπία Nash γράφεται ως LCP και πώς είναι σταθερό σημείο Brouwer. Αυτά είναι τα δύο θεμέλια πάνω στα οποία χτίζεται όλη η PPAD θεωρία.

Σου τα δίνω με καθαρή μαθηματική σημειογραφία, όπως σε graduate‑level notes.

🔵 1. Ισορροπία Nash ως LCP (Linear Complementarity Problem)

Για παιχνίδι δύο παικτών με μικτές στρατηγικές:

  • Ο παίκτης 1 έχει payoff matrix A

  • Ο παίκτης 2 έχει payoff matrix B

Οι μικτές στρατηγικές είναι:

xΔ(S1),yΔ(S2)

Οι αναμενόμενες αποδόσεις:

u1=xAy,u2=xBy

🎯 Το Nash γράφεται ως LCP με μεταβλητές τις “υπερβάσεις” (slacks)

Ορίζουμε:

  • u1: αναμενόμενη απόδοση του παίκτη 1

  • u2: αναμενόμενη απόδοση του παίκτη 2

  • v1=Ayu11

  • v2=Bxu21

Τα v1,v2 είναι τα slack variables: πόσο χειρότερη είναι κάθε καθαρή στρατηγική από την αναμενόμενη απόδοση.

📌 Οι συνθήκες Nash είναι ακριβώς οι συνθήκες LCP

x0,v10,xv1=0
y0,v20,yv2=0

και

1x=1,1y=1.

🧩 Τι σημαίνουν οι συμπληρωματικότητες;

xi>0(v1)i=0
yj>0(v2)j=0

Δηλαδή:

  • κάθε στρατηγική που παίζεται με θετική πιθανότητα έχει ίση απόδοση με την αναμενόμενη

  • κάθε στρατηγική που δεν παίζεται έχει μικρότερη ή ίση απόδοση

Αυτό είναι ακριβώς το Nash.

🔵 2. Ισορροπία Nash ως σταθερό σημείο Brouwer

Αυτός είναι ο βαθύτερος ορισμός — και ο λόγος που το Nash ανήκει στην PPAD.

🎯 Ορισμός

Ένα προφίλ μικτών στρατηγικών x\*=(x1\*,,xn\*) είναι ισορροπία Nash αν:

x\*=F(x\*)

όπου F είναι μια συνεχής συνάρτηση από το προϊόν των simplexes στον εαυτό του:

F:Δ(S1)××Δ(Sn)Δ(S1)××Δ(Sn)

📌 Ποια είναι η συνάρτηση F;

Η κλασική κατασκευή του Nash είναι:

Fi(x)=max{0,ui(si1,xi),,ui(siki,xi)}j=1kimax{0,ui(sij,xi)}

Δηλαδή:

  • για κάθε παίκτη i

  • παίρνεις τις αποδόσεις όλων των καθαρών στρατηγικών του

  • κόβεις τις αρνητικές στο 0

  • κανονικοποιείς ώστε να γίνει κατανομή πιθανοτήτων

Σταθερό σημείο = Ισορροπία Nash

Αν:

x\*=F(x\*)

τότε:

  • όλες οι στρατηγικές που παίζονται έχουν ίση απόδοση

  • καμία στρατηγική δεν έχει μεγαλύτερη απόδοση

  • άρα κανένας παίκτης δεν έχει κίνητρο να αποκλίνει

Αυτό είναι ακριβώς η ισορροπία Nash.

🔵 3. Γιατί αυτό είναι θεμελιώδες για την PPAD;

Γιατί το Brouwer Fixed Point Theorem λέει:

Κάθε συνεχής συνάρτηση από ένα συμπαγές, κυρτό σύνολο στον εαυτό του έχει σταθερό σημείο.

Το simplex είναι:

  • συμπαγές

  • κυρτό

  • κλειστό

Άρα:

x\*:x\*=F(x\*)

δηλαδή υπάρχει Nash.

Και επειδή το πρόβλημα Brouwer είναι PPAD‑complete, και επειδή το Nash είναι σταθερό σημείο Brouwer, το Nash είναι PPAD‑complete.

τον ορισμό του Nash ως LCP (Linear Complementarity Problem) την ισορροπία Nash ως σταθερό σημείο Brouwer

Kostas, πάμε στον πιο βαθύ, τεχνικό πυρήνα της θεωρίας: πώς η ισορροπία Nash γράφεται ως LCP και πώς είναι σταθερό σημείο Brouwer. Αυτά είναι τα δύο θεμέλια πάνω στα οποία χτίζεται όλη η PPAD θεωρία.

Σου τα δίνω με καθαρή μαθηματική σημειογραφία, όπως σε graduate‑level notes.

🔵 1. Ισορροπία Nash ως LCP (Linear Complementarity Problem)

Για παιχνίδι δύο παικτών με μικτές στρατηγικές:

  • Ο παίκτης 1 έχει payoff matrix A

  • Ο παίκτης 2 έχει payoff matrix B

Οι μικτές στρατηγικές είναι:

xΔ(S1),yΔ(S2)

Οι αναμενόμενες αποδόσεις:

u1=xAy,u2=xBy

🎯 Το Nash γράφεται ως LCP με μεταβλητές τις “υπερβάσεις” (slacks)

Ορίζουμε:

  • u1: αναμενόμενη απόδοση του παίκτη 1

  • u2: αναμενόμενη απόδοση του παίκτη 2

  • v1=Ayu11

  • v2=Bxu21

Τα v1,v2 είναι τα slack variables: πόσο χειρότερη είναι κάθε καθαρή στρατηγική από την αναμενόμενη απόδοση.

📌 Οι συνθήκες Nash είναι ακριβώς οι συνθήκες LCP

x0,v10,xv1=0
y0,v20,yv2=0

και

1x=1,1y=1.

🧩 Τι σημαίνουν οι συμπληρωματικότητες;

xi>0(v1)i=0
yj>0(v2)j=0

Δηλαδή:

  • κάθε στρατηγική που παίζεται με θετική πιθανότητα έχει ίση απόδοση με την αναμενόμενη

  • κάθε στρατηγική που δεν παίζεται έχει μικρότερη ή ίση απόδοση

Αυτό είναι ακριβώς το Nash.

🔵 2. Ισορροπία Nash ως σταθερό σημείο Brouwer

Αυτός είναι ο βαθύτερος ορισμός — και ο λόγος που το Nash ανήκει στην PPAD.

🎯 Ορισμός

Ένα προφίλ μικτών στρατηγικών x\*=(x1\*,,xn\*) είναι ισορροπία Nash αν:

x\*=F(x\*)

όπου F είναι μια συνεχής συνάρτηση από το προϊόν των simplexes στον εαυτό του:

F:Δ(S1)××Δ(Sn)Δ(S1)××Δ(Sn)

📌 Ποια είναι η συνάρτηση F;

Η κλασική κατασκευή του Nash είναι:

Fi(x)=max{0,ui(si1,xi),,ui(siki,xi)}j=1kimax{0,ui(sij,xi)}

Δηλαδή:

  • για κάθε παίκτη i

  • παίρνεις τις αποδόσεις όλων των καθαρών στρατηγικών του

  • κόβεις τις αρνητικές στο 0

  • κανονικοποιείς ώστε να γίνει κατανομή πιθανοτήτων

Σταθερό σημείο = Ισορροπία Nash

Αν:

x\*=F(x\*)

τότε:

  • όλες οι στρατηγικές που παίζονται έχουν ίση απόδοση

  • καμία στρατηγική δεν έχει μεγαλύτερη απόδοση

  • άρα κανένας παίκτης δεν έχει κίνητρο να αποκλίνει

Αυτό είναι ακριβώς η ισορροπία Nash.

🔵 3. Γιατί αυτό είναι θεμελιώδες για την PPAD;

Γιατί το Brouwer Fixed Point Theorem λέει:

Κάθε συνεχής συνάρτηση από ένα συμπαγές, κυρτό σύνολο στον εαυτό του έχει σταθερό σημείο.

Το simplex είναι:

  • συμπαγές

  • κυρτό

  • κλειστό

Άρα:

x\*:x\*=F(x\*)

δηλαδή υπάρχει Nash.

Και επειδή το πρόβλημα Brouwer είναι PPAD‑complete, και επειδή το Nash είναι σταθερό σημείο Brouwer, το Nash είναι PPAD‑complete.


...Θα στα δώσω όλα, πλήρως, καθαρά, μαθηματικά, και με τη σωστή λογική σειρά — σαν advanced graduate lecture σε Game Theory & Computational Complexity.

Θα καλύψουμε:

  1. Nash ως LCP (με πλήρη ανάπτυξη)

  2. Nash ως Brouwer fixed point (με κατασκευή της συνάρτησης)

  3. Πώς το Brouwer → Nash γίνεται με gadgets (το reduction των Παπαδημητρίου–Δασκαλάκη–Goldberg)

  4. Πώς γράφεται το Nash ως VI (Variational Inequality)

  5. Πώς λύνεται ένα πραγματικό παιχνίδι ως LCP

  6. Πώς συνδέονται όλα αυτά με PPAD

Και θα το κάνω χωρίς να επαναλαμβάνω όσα ήδη είπα — θα χτίσω πάνω τους.

🔵 1. Nash ως LCP — πλήρης ανάπτυξη

Για παιχνίδι δύο παικτών:

  • payoff matrix του παίκτη 1: ARm×n

  • payoff matrix του παίκτη 2: BRm×n

Μικτές στρατηγικές:

xΔm,yΔn.

Αναμενόμενες αποδόσεις:

u1=xAy,u2=xBy.

Ορίζουμε τα slack vectors:

v1=Ayu11m,
v2=Bxu21n.

Τότε το Nash equilibrium είναι η λύση του LCP:

x0,v10,xv1=0,
y0,v20,yv2=0,
1x=1,1y=1.

Αυτό είναι ακριβώς το LCP(M, q) με:

M=(0AB0),q=(11).

🔵 2. Nash ως Brouwer fixed point — πλήρης κατασκευή

Ορίζουμε για κάθε παίκτη i τη συνάρτηση:

Fi(x)=max{0,ui(si1,xi),,ui(siki,xi)}j=1kimax{0,ui(sij,xi)}.

Η συνολική συνάρτηση:

F:Δ(S1)××Δ(Sn)Δ(S1)××Δ(Sn)

είναι συνεχής και χαρτογραφεί το simplex στον εαυτό του.

Τότε:

x\*=F(x\*)

x\* ειˊναι ισορροπιˊα Nash.

Αυτό είναι η κατασκευή του Nash στο proof του 1950.

🔵 3. Πώς το Brouwer → Nash γίνεται με gadgets

(Παπαδημητρίου–Δασκαλάκης–Goldberg)

Αυτό είναι το ιερό δισκοπότηρο της PPAD.

Η μείωση έχει τρία στάδια:

(1) Έχουμε ένα Brouwer circuit

Ένα κύκλωμα με gates:

  • addition

  • subtraction

  • comparator

  • max/min

  • scaling

  • constant

που υπολογίζει μια συνεχή συνάρτηση:

f:[0,1]k[0,1]k.

(2) Κάθε gate υλοποιείται από ένα game gadget

Για κάθε gate φτιάχνουμε ένα μικρό παιχνίδι (3–6 παίκτες) με payoffs έτσι ώστε:

  • οι μικτές στρατηγικές των παικτών

  • να ικανοποιούν ακριβώς την εξίσωση του gate.

Παράδειγμα:

Comparator gate

Υλοποιεί:

y={1x1>x20x1<x2

Το gadget είναι ένα παιχνίδι όπου:

  • δύο παίκτες παίζουν στρατηγικές που αντιστοιχούν σε x1,x2

  • ένας τρίτος παίκτης παίζει στρατηγική που αντιστοιχεί σε y

  • τα payoffs ρυθμίζονται ώστε η ισορροπία να επιβάλλει τη σχέση.

(3) Όλα τα gadgets ενώνονται σε ένα μεγάλο παιχνίδι

Το τελικό παιχνίδι G έχει την ιδιότητα:

Nash equilibria of GBrouwer fixed points of f.

Άρα:

  • επειδή το Brouwer είναι PPAD‑complete

  • και επειδή το Nash μπορεί να προσομοιώσει Brouwer

  • το Nash είναι PPAD‑complete

Αυτό είναι το θεμέλιο της computational game theory.

🔵 4. Nash ως Variational Inequality (VI)

Το Nash equilibrium είναι λύση της VI:

F(x\*),xx\*0xX

όπου:

  • X=Δ(S1)××Δ(Sn)

  • F είναι ο pseudo-gradient των payoffs:

F(x)=(x1u1(x)xnun(x)).

Η VI μορφή είναι η βάση για:

  • αλγορίθμους τύπου extragradient

  • θεωρία μονοτονίας

  • equilibrium programming

🔵 5. Λύση πραγματικού παιχνιδιού ως LCP (παράδειγμα)

Παιχνίδι 2×2:

A=(2001),B=(1002).

Μικτές στρατηγικές:

x=(p,1p),y=(q,1q).

Αναμενόμενες αποδόσεις:

u1=2pq+(1p)(1q),
u2=pq+2(1p)(1q).

Slacks:

v1=Ayu11,v2=Bxu21.

Λύνουμε:

x0, v10, xv1=0,
y0, v20, yv2=0.

Η λύση είναι:

p\*=23,q\*=13.

🔵 6. Πώς όλα αυτά συνδέονται με PPAD

Η PPAD είναι η κλάση προβλημάτων που εγγυώνται λύση από:

  • Brouwer fixed point

  • Sperner’s lemma

  • parity arguments

Το Nash είναι:

  • LCP → ανήκει στη PPAD

  • Brouwer fixed point → PPAD‑complete

  • VI → γενίκευση των fixed points

  • gadget reduction → δείχνει πληρότητα

Άρα:

Nash equilibriumPPAD-complete.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου