Dynamic programming·Διάλεξη 14·~44 min

L14 · Δυναμικός Προγραμματισμός I — Memoization & Σταθμισμένος Χρονοπρογραμματισμός

Χρειάζεσαι:L11 · Άπληστοι I — interval scheduling, exchange argument

Τι θα δούμε

Ξεκινά το τελευταίο μεγάλο κεφάλαιο: ο δυναμικός προγραμματισμός (dynamic programming, DP). Είναι το πιο εξεταζόμενο κομμάτι της ύλης — και αυτό που οι φοιτητές βρίσκουν πιο «μαγικό». Στόχος αυτής της διάλεξης: να πάψει να είναι μαγικό.

Θα δούμε την ιδέα μέσα από το απλούστερο παράδειγμα (Fibonacci), μετά το πρώτο «πραγματικό» πρόβλημα (σταθμισμένος χρονοπρογραμματισμός διαστημάτων), και θα κωδικοποιήσουμε μια συνταγή 4 βημάτων που εφαρμόζεται σε κάθε DP πρόβλημα.

Τα τρία αλγοριθμικά μοντέλα

Το παράδειγμα-εκκίνηση: Fibonacci

Η ακολουθία Fibonacci ορίζεται αναδρομικά:

$F (n) = F (n - 1) + F (n - 2), F (0) = 0, F (1) = 1.$

Η απευθείας μεταφορά σε κώδικα είναι κομψή — και καταστροφική:

fib(n):

αν n ≤ 1: επίστρεψε n

επίστρεψε fib(n−1) + fib(n−2)

Σωστό, αλλά η πολυπλοκότητα είναι ≈ O(2ⁿ) — εκθετική.

Γιατί είναι τόσο αργό; Επικάλυψη υποπροβλημάτων

Ο κώδικας είναι σωστός — γιατί όμως είναι τόσο αργός; Αντί να το συμπεράνουμε, ας παρακολουθήσουμε τι κάνει στ' αλήθεια η fib. Κάθε κλήση fib(k) γεννά δύο νέες, τις fib(k−1) και fib(k−2)· αυτές γεννούν άλλες δύο η καθεμιά, και ούτω καθεξής. Όλες μαζί σχηματίζουν ένα δέντρο αναδρομής — κι εκεί κρύβεται το πρόβλημα.

Το δέντρο αναδρομής του Fibonacci

Σύρε το n και δες το δέντρο κλήσεων. Πάτησε έναν κόμβο για να φωτιστεί κάθε άλλη κλήση του ίδιου fib(k).

fib(5)n = 5

νέος υπολογισμόςεπιλεγμένο fib(k)

Αφελής αναδρομή

κλήσεις της fib()

Με memoization

κλήσεις της fib()

Για fib(5) το memoization κάνει 1.7× λιγότερες κλήσεις.

Πέρα από το δέντρο — πόσες κλήσεις χρειάζονται

fib(n)	Αφελής	Memoization
fib(10)	177	19
fib(20)	21.891	39
fib(30)	2.692.537	59

Αφελής: εκθετική, ≈ 2ⁿ. Memoization: γραμμική, 2n−1. Στο fib(30) η διαφορά είναι ήδη εκατομμύρια προς δεκάδες.

Κάθε κύκλος είναι μία κλήση της fib(). Το δέντρο σχεδόν διπλασιάζεται σε κάθε επίπεδο, γιατί το ίδιο fib(k) ξαναϋπολογίζεται απ’ την αρχή ξανά και ξανά. Πάτησε έναν κόμβο για να το δεις — ή γύρνα στο «Memoized».

Σύρε το n (κράτησέ το για τώρα στο «Αφελής») και πρόσεξε δύο πράγματα:

Το δέντρο σχεδόν διπλασιάζεται σε κάθε επιπλέον επίπεδο. Ο μετρητής κλήσεων δεν ανεβαίνει γραμμικά — εκτοξεύεται, περίπου σαν $2^{n}$ . Ο πίνακας στο τέλος δείχνει πού φτάνει αυτό: το fib(30) θέλει πάνω από δύο εκατομμύρια κλήσεις.
Πάτησε σε έναν κόμβο — π.χ. σε ένα fib(2). Φωτίζονται όλες οι άλλες κλήσεις του ίδιου fib(2) στο δέντρο. Είναι πολλές· και η καθεμιά ξαναϋπολογίζει από την αρχή ακριβώς την ίδια τιμή.

Αυτό το δεύτερο είναι η ρίζα του κακού, και έχει όνομα: επικάλυψη υποπροβλημάτων (overlapping subproblems). Το ίδιο υποπρόβλημα — «πόσο κάνει το fib(2);» — ξαναεμφανίζεται αμέτρητες φορές μέσα στην αναδρομή. Ο αφελής αλγόριθμος δεν είναι αργός επειδή έχει δύσκολη δουλειά· είναι αργός επειδή κάνει την ίδια εύκολη δουλειά ξανά και ξανά.

Η λύση: memoization

Αφού το πρόβλημα είναι ότι υπολογίζουμε το ίδιο πράγμα πολλές φορές, η λύση γράφεται σχεδόν μόνη της: υπολόγισέ το μία φορά, και κράτησέ το.

Γύρνα τώρα στο interactive παραπάνω και πάτα το κουμπί «Memoized». Ίδιο n, ίδιο πρόβλημα — αλλά το δέντρο καταρρέει: κάθε fib(k) υπολογίζεται μία μόνο φορά, και κάθε επόμενη φορά που ζητείται επιστρέφεται έτοιμο από τον πίνακα (ο πράσινος κόμβος «cache hit», χωρίς υποδέντρο από κάτω). Ο μετρητής κλήσεων πέφτει από εκθετικός σε γραμμικό.

Στην πράξη το ίδιο αποτέλεσμα το πετυχαίνουμε ακόμα πιο καθαρά — χωρίς καθόλου αναδρομή. Γεμίζουμε έναν πίνακα από κάτω προς τα πάνω (bottom-up): πρώτα τις βασικές περιπτώσεις, και μετά κάθε επόμενο όρο από τους δύο προηγούμενους.

fib2(n):

αν n ≤ 1: επίστρεψε n

A[0] ← 0 ; A[1] ← 1

για i = 2 έως n:

A[i] ← A[i−1] + A[i−2]

επίστρεψε A[n]

Κάθε F(k) υπολογίζεται ακριβώς μία φορά → O(n) αντί για O(2ⁿ).

Κάθε $F (k)$ υπολογίζεται ακριβώς μία φορά. Η πολυπλοκότητα πέφτει από εκθετική $O (2^{n})$ σε γραμμική $O (n)$ — αλλάζοντας μόνο πού αποθηκεύεις τα ενδιάμεσα αποτελέσματα.

Σταθμισμένος χρονοπρογραμματισμός διαστημάτων

Τώρα το πρώτο πραγματικό πρόβλημα. Είναι το πρόβλημα του L11 — με μία προσθήκη.

Είσοδος: $n$ αιτήματα. Το αίτημα $j$ ξεκινά τη στιγμή $s_{j}$ , τελειώνει τη στιγμή $f_{j}$ , και έχει βαρύτητα $v_{j}$ . Δύο αιτήματα είναι συμβατά αν δεν επικαλύπτονται.

Στόχος: υποσύνολο $S$ ανά δύο συμβατών αιτημάτων με μέγιστο άθροισμα βαρυτήτων $\sum_{i \in S} v_{i}$ .

Γιατί δεν αρκεί ο άπληστος

Στο L11, όταν όλες οι βαρύτητες ήταν ίσες με $1$ , το άπληστο κριτήριο «μικρότερος χρόνος λήξης» έδινε αποδεδειγμένα βέλτιστη λύση. Το ένστικτο λέει πως κάποιο άπληστο κριτήριο θα δουλεύει και τώρα που οι εργασίες έχουν βαρύτητες. Δοκίμασε τα δύο πιο φυσικά — και δες τα να αποτυγχάνουν:

Γιατί ο άπληστος αποτυγχάνει με βάρη

Ο άπληστος εξετάζει τα διαστήματα κατά αύξοντα χρόνο λήξης. Κάθε ράβδος δείχνει την αξία της — δες ποια διαλέγει.

Άπληστος

Βέλτιστο

Κανόνας «μικρότερος χρόνος λήξης» — ο νικητής του L11, όταν όλα τα βάρη ήταν 1. Εδώ τα βάρη διαφέρουν. Πάτα «Επόμενο».

Βήμα 0 / 5

Στο πρώτο στιγμιότυπο, μια φθηνή εργασία που τυχαίνει να τελειώνει πρώτη μπλοκάρει μια εργασία που αξίζει $100$ . Στο δεύτερο, μια ακριβή εργασία μπλοκάρει δύο φθηνότερες που μαζί την ξεπερνούν. Το πρόβλημα είναι βαθύ: η σωστή απόφαση για μια εργασία εξαρτάται από όλες τις υπόλοιπες, ενώ ο άπληστος κοιτάζει μόνο μία τη φορά.

Η προετοιμασία: ταξινόμηση και $p (j)$

Πριν στήσουμε την αναδρομή, χρειαζόμαστε δύο προετοιμασίες.

Πρώτη: ταξινόμηση. Διατάσσουμε τα αιτήματα κατά χρόνο λήξης, ώστε $f_{1} \leq f_{2} \leq \dots \leq f_{n}$ . Από εδώ και πέρα, «αίτημα $j$ » σημαίνει «το $j$ -οστό αίτημα που τελειώνει».

Δεύτερη: η ποσότητα $p (j)$ . Φαντάσου ότι αποφασίζεις να βάλεις το αίτημα $j$ στη λύση σου. Αμέσως αποκλείεις κάθε προηγούμενο αίτημα που επικαλύπτεται μαζί του. Το ερώτημα είναι: ποιο είναι το τελευταίο προηγούμενο αίτημα που σου μένει ακόμα διαθέσιμο; Αυτό ακριβώς ονομάζουμε $p (j)$ .

Ένα χρήσιμο γεγονός: επειδή τα αιτήματα είναι ταξινομημένα κατά λήξη, τα συμβατά με το $j$ είναι πάντα ένα αρχικό κομμάτι $1, \dots, p (j)$ — κι όλα τα ενδιάμεσα $p (j) + 1, \dots, j - 1$ το επικαλύπτουν. Διάλεξε ένα αίτημα παρακάτω και δες ποιο είναι το $p (j)$ του και ποια αιτήματα αποκλείει:

Τι είναι το p(j) — διάλεξε ένα αίτημα

p(8) = 5

Πάτησε σε ένα αίτημα. Κίτρινο = το j · μπλε = το p(j) · κόκκινο = ασύμβατα που αποκλείονται.

p(8) = 5το αίτημα 5 λήγει στο 12 ≤ 12 = s(8)

Διάλεξες το αίτημα 8. Ξεκινά τη στιγμή s = 12. Τα αιτήματα 1, 2, 3, 4, 5 τελειώνουν ώς τότε — είναι συμβατά μαζί του, και το τελευταίο τους είναι το p(8) = 5. Τα αιτήματα 6, 7 τελειώνουν μετά το 12 → ασύμβατα: αν πάρεις το 8, αυτά αποκλείονται.

Όλα τα p(j):

Η αναδρομή — μια δυαδική επιλογή

Ορίζουμε $OPT (j)$ = η τιμή της βέλτιστης λύσης για τα αιτήματα ${1, 2, \dots, j}$ . Κοιτάμε το αίτημα $j$ και ρωτάμε: μέσα ή έξω;

Το $j$ είναι ΜΕΣΑ. Τότε αποκλείονται όλα τα ασύμβατα με το $j$ — τα ${p (j) + 1, \dots, j - 1}$ . Ό,τι μένει είναι η βέλτιστη λύση για τα ${1, \dots, p (j)}$ . Συνεισφορά: $v_{j} + OPT (p (j))$ .
Το $j$ είναι ΕΞΩ. Τότε η βέλτιστη λύση είναι ακριβώς η βέλτιστη για τα ${1, \dots, j - 1}$ . Συνεισφορά: $OPT (j - 1)$ .

Δεν ξέρουμε ποια περίπτωση ισχύει — οπότε παίρνουμε τη μεγαλύτερη:

Δες την αναδρομή να γεμίζει τον πίνακα. Σε κάθε βήμα φαίνονται οι δύο υποψήφιες τιμές — «το $j$ μέσα» και «το $j$ έξω» — και ποια κερδίζει:

Σταθμισμένος χρονοπρογραμματισμός — γέμισμα του πίνακα M

Αρχή

Κίτρινο = το αίτημα j · μπλε = ο συμβατός προκάτοχος p(j) · πράσινο = στη λύση.

Πίνακας M

M[0]

M[1]

M[2]

M[3]

M[4]

M[5]

M[6]

M[7]

M[8]

Τα 8 αιτήματα του παραδείγματος, ταξινομημένα κατά χρόνο λήξης. M[0] = 0. Γεμίζουμε αριστερά → δεξιά.

Βήμα 0 / 9

Ο αλγόριθμος

Η απευθείας αναδρομή είναι εκθετική — ακριβώς όπως ο αφελής Fibonacci, το πλήθος κλήσεων μεγαλώνει σαν $T (n) = T (n - 1) + T (n - 2)$ . Η θεραπεία είναι η ίδια: απομνημόνευση.

ΑλγόριθμοςΣταθμισμένος χρονοπρογραμματισμός (DP)

O(n log n)

Ταξινόμησε κατά λήξη, υπολόγισε τα p(j), και γέμισε τον πίνακα M με την αναδρομή «το j μέσα ή έξω».

Είσοδος:: n αιτήματα με χρόνους έναρξης/λήξης και βαρύτητες
Έξοδος:: η μέγιστη συνολική βαρύτητα ενός συνόλου συμβατών αιτημάτων

Με λόγια. Ταξινόμησε τα αιτήματα κατά χρόνο λήξης και υπολόγισε όλα τα $p (j)$ . Μετά γέμισε έναν πίνακα $M$ με αύξουσα σειρά: το $M [j]$ είναι το μεγαλύτερο ανάμεσα στο «πάρε το $j$ » ( $v_{j} + M [p (j)]$ ) και στο «παράτα το $j$ » ( $M [j - 1]$ ). Το $M [n]$ είναι η απάντηση.

Ισοδύναμα, top-down με memoization — η αναδρομή λύνει κάθε υποπρόβλημα, αλλά το αποθηκεύει:

Υπολογισμός των $p (j)$ σε $O (n)$

Είπαμε πως όλα τα $p (j)$ βγαίνουν σε $O (n)$ . Δεν είναι προφανές: ο απλός τρόπος — για κάθε $j$ , ψάξε προς τα πίσω για το τελευταίο συμβατό αίτημα — κάνει $O (n^{2})$ δουλειά. Πώς πέφτουμε στο $O (n)$ ;

Το κόλπο: έχουμε δύο ταξινομημένες ακολουθίες — τους χρόνους λήξης και τους χρόνους έναρξης — και τις συγχωνεύουμε, ακριβώς όπως το merge της συγχωνευτικής ταξινόμησης (L03). Δύο δείκτες, ο $i$ πάνω στις λήξεις και ο $j$ πάνω στις ενάρξεις, σαρώνουν τις ακολουθίες από μία φορά:

Αν η τρέχουσα λήξη $f_{i}$ είναι $\leq$ από την τρέχουσα έναρξη $s_{j}$ , τότε το αίτημα $i$ προλαβαίνει να τελειώσει — είναι έγκυρος προκάτοχος. Προχωράμε τον $i$ .
Αλλιώς, η λήξη $f_{i}$ έρχεται πολύ αργά. Άρα ο τελευταίος που πρόλαβε ήταν ο $i - 1$ : θέτουμε $p (j) = i - 1$ και προχωράμε τον $j$ .

Κάθε βήμα προχωρά έναν από τους δύο δείκτες κατά ένα, και κανένας δεν ξεπερνά το $n$ — άρα το πολύ $2 n$ βήματα συνολικά. Δες τη σάρωση να τρέχει βήμα-βήμα — στο interactive κάθε έναρξη δείχνει σε ποιο αίτημα ανήκει, ώστε το $p$ να καταγράφεται στο σωστό:

Υπολογισμός όλων των p(j) σε O(n)

Βήμα 0 / 13

Συγχώνευση δύο ταξινομημένων πινάκων με δύο δείκτες — όπως το merge της συγχωνευτικής ταξινόμησης.

Χρόνοι λήξης fᵢ — ταξινομημένοι

5αίτ. 1

▲ i

7αίτ. 2

8αίτ. 3

10αίτ. 4

12αίτ. 5

13αίτ. 6

14αίτ. 7

16αίτ. 8

Χρόνοι έναρξης sⱼ — ταξινομημένοι

1αίτ. 1

▲ j

2αίτ. 2

3αίτ. 4

4αίτ. 3

6αίτ. 5

8αίτ. 7

9αίτ. 6

12αίτ. 8

i = 1, j = 1 — έτοιμοι για την πρώτη σύγκριση

Αποτέλεσμα — p(j)

p(1)

p(2)

p(3)

p(4)

p(5)

p(6)

p(7)

p(8)

Δύο ταξινομημένοι πίνακες — οι χρόνοι λήξης και οι χρόνοι έναρξης — και δύο δείκτες i, j που ξεκινούν στο 1. Σε κάθε βήμα συγκρίνουμε τη λήξη fᵢ με την έναρξη sⱼ. Πάτα «Επόμενο».

Εύρεση της λύσης

Ο αλγόριθμος υπολογίζει τη μέγιστη τιμή. Για να βρούμε ποια αιτήματα την πετυχαίνουν, κάνουμε ένα πέρασμα προς τα πίσω — σε κάθε $j$ ρωτάμε «ποια από τις δύο περιπτώσεις κέρδισε;»

Η συνταγή του δυναμικού προγραμματισμού

Κάθε πρόβλημα DP — όσα θα δούμε στα L15–L17 — λύνεται με τα ίδια 4 βήματα:

Κάρτα μνήμης — Σταθμισμένος χρονοπρογραμματισμός (DP)

Λέξεις-κλειδιά

επικαλυπτόμενα υποπροβλήματαταξινόμηση κατά λήξηp(j) = τελευταίο συμβατόOPT(j) = max{μέσα, έξω}memoizationp(j) σε O(n) με δύο δείκτες

Τα βήματα στο μυαλό σου

1Ταξινόμησε τα αιτήματα κατά χρόνο λήξης· υπολόγισε p(j) για καθένα.

2Όρισε OPT(j) = βέλτιστη τιμή για τα πρώτα j αιτήματα.

3Αναδρομή: OPT(j) = max{ vⱼ + OPT(p(j)), OPT(j−1) } — το j μέσα ή έξω.

4Γέμισε τον πίνακα M· πέρασμα προς τα πίσω για τα ίδια τα αιτήματα.

Πολυπλοκότητα

O(n log n)

Κλασική παγίδα

Ο άπληστος «μικρότερος χρόνος λήξης» (L11) ΑΠΟΤΥΓΧΑΝΕΙ με βαρύτητες — μια φθηνή πρώιμη εργασία μπλοκάρει μια ακριβή. Η αφελής αναδρομή χωρίς memoization είναι εκθετική· ο πίνακας M την κάνει γραμμική.

Κλείδωσε τη γνώση

Βάλε στη σειρά τα βήματα του DP για τον σταθμισμένο χρονοπρογραμματισμό:

Βάλε τα βήματα στη σειρά

Ο αλγόριθμος DP για τον σταθμισμένο χρονοπρογραμματισμό, από την πρώτη ενέργεια στην τελευταία.

Σύρε τις γραμμές για αναδιάταξη — ή χρησιμοποίησε τα βελάκια.

1.Για j = 1 έως n, θέσε M[j] = max{ vⱼ + M[p(j)], M[j−1] }.

2.Υπολόγισε για κάθε j το p(j) — το τελευταίο συμβατό προηγούμενο αίτημα.

3.Κάνε πέρασμα προς τα πίσω για να βρεις ποια αιτήματα την πετυχαίνουν.

4.Θέσε M[0] = 0.

5.Ταξινόμησε τα αιτήματα κατά αύξοντα χρόνο λήξης.

6.Η βέλτιστη τιμή είναι το M[n].

Και συμπλήρωσε τα κενά:

Συμπλήρωσε τα κενά

Η ιδέα του δυναμικού προγραμματισμού σε τέσσερις λέξεις-κλειδιά.

Ο δυναμικός προγραμματισμός διασπά ένα πρόβλημα σε υποπροβλήματα. Με την τεχνική της λύνουμε κάθε υποπρόβλημα μία μόνο φορά. Στον σταθμισμένο χρονοπρογραμματισμό, η αναδρομή εκφράζει τη δυαδική επιλογή «το αίτημα j ή έξω;», και η βέλτιστη τιμή βρίσκεται τελικά στη θέση M[].

Μοτίβο σκέψης

Η συνταγή του δυναμικού προγραμματισμού

Σινιάλα στην εκφώνηση«βρες τη βέλτιστη (μέγιστη / ελάχιστη) …»«ο άπληστος αποτυγχάνει εδώ»«κάθε στοιχείο: μέσα ή έξω;»

Όταν ένα πρόβλημα βελτιστοποίησης δεν λύνεται άπληστα, σκέψου DP — με τα ίδια 4 βήματα κάθε φορά:

Δομή / παραμετροποίηση. Όρισε τι είναι ένα υποπρόβλημα — συνήθως «τα πρώτα $j$ στοιχεία» ή «τα στοιχεία $i .. j$ ». Είναι το δυσκολότερο βήμα· μόλις το βρεις, τα υπόλοιπα γράφονται σχεδόν μόνα τους.
Αναδρομικός ορισμός. Γράψε το $OPT (\cdot)$ ως max/min πάνω στις επιλογές της «τελευταίας απόφασης» (εδώ: το $j$ μέσα ή έξω).
Υπολογισμός. Γέμισε τον πίνακα — memoization (top-down) ή bottom-up. Ίδιο αποτέλεσμα.
Κατασκευή λύσης. Πέρασμα προς τα πίσω: σε κάθε θέση, ρώτα ποια επιλογή κέρδισε.

Σήμα ότι θέλεις DP κι όχι divide-and-conquer: τα υποπροβλήματα επικαλύπτονται — το ίδιο εμφανίζεται ξανά και ξανά.

Ραντάρ εξετάσεων

Σχεδίασε αλγόριθμο DP για νέο πρόβλημα — όρισε υποπρόβλημα, αναδρομή, πολυπλοκότητασυχνό

Το κυρίαρχο θέμα DP — η εκφώνηση ζητάει «σχεδίασε αποδοτικό αλγόριθμο».

Δες το στις ασκήσειςpt1-th3 front-set-8-ask3 front-set-8-ask4

Σταθμισμένος χρονοπρογραμματισμός — γέμισε τον πίνακα M και βρες τη λύσησυχνό

Δες το στις ασκήσειςpt6-th2

Γιατί ο άπληστος αποτυγχάνει σε πρόβλημα με βάρη — αντιπαράδειγμαπιθανό

Δες το στις ασκήσειςpt5-th4 pt6-th2

Memoization vs bottom-up — και γιατί ο χρόνος πέφτει από εκθετικός σε γραμμικόπιθανό

Δες το στις ασκήσειςpt7-th2

Διάκριση: πότε DP, πότε divide-and-conquer (επικαλυπτόμενα vs ανεξάρτητα υποπροβλήματα)πιθανό

Κάτω φράγμα από το μέγεθος του πίνακα — ποια πολυπλοκότητα ΔΕΝ μπορεί να ισχύεισυχνό

Σταθερή ερώτηση πολλαπλής επιλογής: 1D ⇒ Ω(n), 2D ⇒ Ω(nm). Αποκλείεται ό,τι ασυμπτωτικά μικρότερο.

Δες το στις ασκήσειςpt1-th1-q7 pt1-th1-q8 pt2-th1-q6 pt2-th1-q7

Μέγιστο ανεξάρτητο σύνολο σε μονοπάτι — με ή χωρίς γεωμετρικό περιορισμόσυχνό

OPT(i) = max(OPT(i−1), v_i + OPT(prev(i))). Από κολώνες φωτισμού ως εστιατόρια κατά μήκος δρόμου.

Δες το στις ασκήσειςpt5-th4 front-set-8-ask4

Δοκίμασε όλα τα «πρώτα κομμάτια» — τεμαχισμός ράβδου / Θ(n²) DPπιθανό

C(i) = max_k(V_k + C(i−k)). Όταν το αντικείμενο σπάει σε δύο ανεξάρτητα τμήματα, η αναδρομή δοκιμάζει όλες τις πρώτες κοπές.

Δες το στις ασκήσειςfront-set-8-ask3

Εκθετικό κάτω φράγμα αφελούς αναδρομής με k κλάδουςπιθανό

Δέντρο k παιδιών, βάθος ≥ n / max d_i ⇒ Ω(k^(n / max d_i)).

Δες το στις ασκήσειςpt7-th2

Τι μάθαμε

Τι κρατάμε από αυτή τη διάλεξη

Δυναμικός προγραμματισμός — διάσπαση σε επικαλυπτόμενα υποπροβλήματα· λύσε καθένα μία φορά, αποθήκευσέ το.
Fibonacci — αφελής αναδρομή $O (2^{n})$ λόγω επικάλυψης· memoization → $O (n)$ .
Σταθμισμένος χρονοπρογραμματισμός — μέγιστη βαρύτητα συμβατών αιτημάτων. Ο άπληστος αποτυγχάνει.
$p (j)$ = το τελευταίο συμβατό προηγούμενο αίτημα. Αναδρομή: $OPT (j) = max {v_{j} + OPT (p (j)), OPT (j - 1)}$ .
Χρόνος $O (n lo g n)$ — η ταξινόμηση κυριαρχεί· τα $p (j)$ βγαίνουν σε $O (n)$ με σάρωση δύο δεικτών, και η εύρεση της λύσης σε $O (n)$ με πέρασμα προς τα πίσω.
Η συνταγή DP (4 βήματα): δομή → αναδρομικός ορισμός → υπολογισμός τιμής → κατασκευή λύσης.

Επόμενο

L15 · DP II — knapsack family

Ασκήσεις από εξετάσεις

Από τη θεωρία στην εξεταστική

14 άσκησεις που χρησιμοποιούν ως τελευταίο εργαλείο αυτή τη διάλεξη. Οι πρόσφατες εξεταστικές (2024/2025) φέρουν badge προτεραιότητας.

Παλαιό θέμαΙούνιος 2025Θέμα Εξετάσεων 2025Θέμα 1.73%Δυναμικός προγραμματισμόςΜέτριο

Ιούνιος 2025 · Θέμα 1.7 — Πολυπλοκότητα δισδιάστατου πίνακα DP

Λύνουμε ένα πρόβλημα με δυναμικό προγραμματισμό συμπληρώνοντας έναν πίνακα με τιμές $OPT (i, j)$ , για $i = 1 \dots n$ και $j = 1 \dots m$ . Ποια από τα παρακάτω μπορούμε να πούμε με βεβαιότητα ότι δεν αντικατοπτρίζει τη χρονική πολυπλοκότητα;

(i) $O (n)$ · (ii) $O (mn)$ · (iii) $o (m^{2} n^{2})$ · (iv) $O (m n^{2})$ .

Απαιτεί:L14 · DP I

Παλαιό θέμαΙούνιος 2025Θέμα Εξετάσεων 2025Θέμα 1.83%Δυναμικός προγραμματισμόςΜέτριο

Ιούνιος 2025 · Θέμα 1.8 — Πολυπλοκότητα μονοδιάστατου πίνακα DP

Όμοια, λύνουμε ένα πρόβλημα με DP συμπληρώνοντας έναν πίνακα τιμών $OPT (i)$ για $i = 1 \dots n$ . Ποια μπορούμε να πούμε με βεβαιότητα ότι δεν αντικατοπτρίζει τη χρονική πολυπλοκότητα;

(i) $O (n)$ · (ii) $O (n^{2})$ · (iii) $O (1)$ · (iv) $O (lo g_{2} n)$ .

Απαιτεί:L14 · DP I

Παλαιό θέμαΙούνιος 2025Θέμα Εξετάσεων 2025Θέμα 320%Δυναμικός προγραμματισμόςΜέτριο

Ιούνιος 2025 · Θέμα 3 — Επίσκεψη αξιοθέατων (DP)

Θέλουμε να επισκεφτούμε μία ακολουθία από $n$ αξιοθέατα $α_{1}, α_{2}, \dots, α_{n}$ σε μία πόλη. Οι μόνες επιλογές μετακίνησης είναι ταξί ή ηλεκτρικό πατίνι, του οποίου η μίσθωση ισχύει για 4 διαδρομές. Με ταξί, η μετάβαση από το $α_{i - 1}$ στο $α_{i}$ κοστίζει $c_{i}$ (η μετάβαση στο πρώτο αξιοθέατο είναι δωρεάν). Η ενοικίαση πατινιού κοστίζει σταθερά $S$ . Ορίζουμε $OPT (i)$ = το ελάχιστο κόστος για να επισκεφθούμε τα $α_{1}, \dots, α_{i}$ .

(i) Ποια τιμή δίνει το ελάχιστο συνολικό κόστος; (ii) Όρισε αναδρομικά το $OPT (i)$ . (iii) Ποια είναι η χρονική πολυπλοκότητα και γιατί;

Απαιτεί:L14 · DP I

Παλαιό θέμαΣεπτέμβριος 2025Θέμα Εξετάσεων 2025Θέμα 1.63%Δυναμικός προγραμματισμόςΜέτριο

Σεπτέμβριος 2025 · Θέμα 1.6 — Πολυπλοκότητα δισδιάστατου πίνακα DP

Λύνουμε ένα πρόβλημα με DP συμπληρώνοντας έναν πίνακα τιμών $OPT (i, j)$ , για $i = 1 \dots n$ , $j = 1 \dots m$ . Ποιες επιλογές μπορούμε να πούμε με βεβαιότητα ότι δεν αντικατοπτρίζουν τη χρονική πολυπλοκότητα;

(i) $O (n^{3})$ · (ii) $O (m)$ · (iii) $O (n)$ · (iv) $O (m^{2} n^{2})$ .

Απαιτεί:L14 · DP I

Παλαιό θέμαΣεπτέμβριος 2025Θέμα Εξετάσεων 2025Θέμα 1.73%Δυναμικός προγραμματισμόςΕύκολο

Σεπτέμβριος 2025 · Θέμα 1.7 — Πολυπλοκότητα μονοδιάστατου πίνακα DP

Λύνουμε ένα πρόβλημα με DP συμπληρώνοντας έναν πίνακα τιμών $OPT (i)$ για $i = 1 \dots n$ . Ποιες μπορούμε να πούμε με βεβαιότητα ότι δεν αντικατοπτρίζουν τη χρονική πολυπλοκότητα; (i) $O (n)$ · (ii) $O (n^{2})$ · (iii) $O (1)$ · (iv) $O (lo g_{2} n)$ .

Απαιτεί:L14 · DP I

Από φροντιστήριοΦροντιστήριο 2023–24Άσκηση 11Δυναμικός προγραμματισμόςΜέτριο

Φροντιστηριακό Σετ #10 · Άσκηση 11 — Αναδρομή vs ΔΠ (πολυωνυμική αναδρομή)

Θέλουμε να υπολογίσουμε με αναδρομικό αλγόριθμο την ακολουθία $a_{1}, a_{2}, \dots, a_{n}$ από τον τύπο

a_{n} = 2 max {a_{⌊ n /2 ⌋}, a_{⌊ n /2 ⌋ + 1}} + a_{⌊ n /2 ⌋ - 1}

με τους 3 αρχικούς όρους ίσους με 1. Δίνεται $lo g_{2} 3 = 1.585$ . Έστω $R A (n)$ ο αναδρομικός αλγόριθμος.

i. Γράψτε σύντομα τον $R A (n)$ . ii. Δείξτε ότι είναι πολυωνυμικός με πολυπλοκότητα $O (n^{1.585})$ . iii. Με ΔΠ ( $D A (n)$ ), πόσα υποπροβλήματα ορίζονται; iv. Δικαιολογήστε ότι ο $D A (n)$ είναι γραμμικός. v. Ποιος είναι ταχύτερος;

Απαιτεί:L14 · DP I

Από φροντιστήριοΦροντιστήριο 2023–24Άσκηση 12Δυναμικός προγραμματισμόςΜέτριο

Φροντιστηριακό Σετ #10 · Άσκηση 12 — Αναδρομή vs ΔΠ (εκθετική αναδρομή)

Θέλουμε να υπολογίσουμε με αναδρομικό αλγόριθμο την ακολουθία $b_{1}, b_{2}, \dots, b_{n}$ από τον τύπο

b_{n} = 2 max {b_{n - 1}, b_{n - 2}} + b_{n - 3}

με τους 3 αρχικούς όρους ίσους με 1. Έστω $R B (n)$ ο αναδρομικός αλγόριθμος· δίνεται $3^{1/3} = 1.44$ .

i. Γράψτε σύντομα τον $R B (n)$ . ii. Δείξτε ότι είναι εκθετικός, με πολυπλοκότητα $Ω (1.4 4^{n})$ . iii. Με ΔΠ ( $D B (n)$ ), πόσα υποπροβλήματα; iv. Δικαιολογήστε ότι ο $D B (n)$ είναι γραμμικός. v. Ποιος είναι ταχύτερος;

Απαιτεί:L14 · DP I

Από φροντιστήριοΦροντιστήριο 2023–24Άσκηση 3Δυναμικός προγραμματισμόςΜέτριο

Φροντιστηριακό Σετ #8 · Άσκηση 3 — Τεμαχισμός ράβδου (rod cutting)

Το πρόβλημα τεμαχισμού μιας ράβδου: δίνεται μια ράβδος μήκους $n$ cm, και το κέρδος πώλησης για κάθε δυνατό μήκος τμήματος ( $V_{k}$ για τμήμα μήκους $k$ ). Δώσε αλγόριθμο που βρίσκει τον πιο επικερδή τρόπο τεμαχισμού.

Απαιτεί:L14 · DP I

Από φροντιστήριοΦροντιστήριο 2023–24Άσκηση 4Δυναμικός προγραμματισμόςΜέτριο

Φροντιστηριακό Σετ #8 · Άσκηση 4 — Άνοιγμα εστιατορίων κατά μήκος δρόμου

Σκέφτεστε να ανοίξετε μια σειρά εστιατορίων κατά μήκος ενός αυτοκινητόδρομου. Οι $n$ πιθανές τοποθεσίες σχηματίζουν ευθεία γραμμή, με αποστάσεις από την αρχή (σε χιλιόμετρα, κατά αύξουσα σειρά) $m_{1} < m_{2} < \dots < m_{n}$ . Σε κάθε τοποθεσία μπορείτε να ανοίξετε το πολύ ένα εστιατόριο· το προσδοκώμενο κέρδος από το άνοιγμα στην τοποθεσία $i$ είναι $p_{i} > 0$ . Δύο οποιαδήποτε εστιατόρια πρέπει να απέχουν τουλάχιστον $k$ χιλιόμετρα. Δώστε αποδοτικό αλγόριθμο για τον υπολογισμό του μέγιστου συνολικού κέρδους.

Απαιτεί:L14 · DP I

Από φροντιστήριοΦροντιστήριο 2023–24Άσκηση 3Δυναμικός προγραμματισμόςΔύσκολο

Φροντιστηριακό Σετ #9 · Άσκηση 3 — Αλυσίδα εστιατορίων στην εθνική οδό (DP)

Ως υπεύθυνος δικτύου μιας αλυσίδας εστιατορίων πρέπει να επιλέξετε πού θα ανοίξουν καταστήματα κατά μήκος μιας νέας εθνικής οδού. Έχουν προεπιλεγεί $n$ υποψήφιες θέσεις. Το αναμενόμενο κέρδος από το κατάστημα στη θέση $i$ εξαρτάται από το αν ανοίγουν καταστήματα στις γειτονικές θέσεις $i - 1$ και $i + 1$ :

σε καμία γειτονική → κέρδος $a_{i}$ ·
σε μία από τις δύο → κέρδος $b_{i}$ ·
και στις δύο → κέρδος $c_{i}$ .

Τα $c_{1}$ και $c_{n}$ δεν ορίζονται, και για κάθε θέση ισχύει $a_{i} \geq b_{i} \geq c_{i} \geq 0$ . Με είσοδο τις τριάδες $(a_{i}, b_{i}, c_{i})$ διατυπώστε αποδοτικό αλγόριθμο που επιλέγει τις θέσεις ώστε να μεγιστοποιηθεί το κέρδος.

Απαιτεί:L14 · DP I

Από φροντιστήριοΦροντιστήριο 2023–24Άσκηση 530%Δυναμικός προγραμματισμόςΔύσκολο

Φροντιστηριακό Σετ #9 · Άσκηση 5 — Μαγνητικός τομογράφος (weighted interval scheduling)

Ένα νοσοκομείο έχει έναν μαγνητικό τομογράφο και λαμβάνει $n$ αιτήματα εξέτασης. Κάθε αίτημα $i$ έχει χρόνο έναρξης $ϵ_{i}$ , χρόνο λήξης $λ_{i}$ και βαρύτητα (βαθμό επείγοντος) $β_{i} \in [1, 10]$ . Δύο αιτήματα με επικαλυπτόμενα διαστήματα είναι ασύμβατα. Ζητείται υποσύνολο $Σ$ ανά δύο συμβατών αιτημάτων που μεγιστοποιεί το άθροισμα $\sum_{i \in Σ} β_{i}$ .

1. Είναι βέλτιστος ο άπληστος αλγόριθμος «ταξινόμησε κατά φθίνουσα βαρύτητα, διάλεξε το πρώτο, μετά το επόμενο συμβατό, κ.ο.κ.»;

2. Βρείτε τη βέλτιστη τιμή με δυναμικό προγραμματισμό (δώστε την αναδρομική σχέση).

3. Δώστε τον χρόνο εκτέλεσης και εκτελέστε στο παράδειγμα 8 αιτημάτων: $[0, 20] β = 3$ , $[10, 25] β = 7$ , $[25, 50] β = 7$ , $[15, 60] β = 8$ , $[40, 70] β = 5$ , $[50, 70] β = 5$ , $[70, 80] β = 9$ , $[75, 90] β = 9$ .

Απαιτεί:L14 · DP I

Παλαιό θέμαΙούνιος 2023Θέμα 440%Δυναμικός προγραμματισμόςΔύσκολο

Ιούνιος 2023 · Θέμα 4 — Κολώνες φωτισμού (μέγιστο ανεξάρτητο σύνολο σε μονοπάτι)

Ο δήμος θέλει να εγκαταστήσει κολώνες φωτισμού σε $n$ πιθανές θέσεις κατά μήκος ενός δρόμου. Για εξοικονόμηση κόστους δεν τοποθετεί κολώνες σε δύο διαδοχικές θέσεις. Κάθε θέση $x_{i}$ έχει φωτεινότητα $φ_{i}$ · στόχος είναι ένα υποσύνολο μη-διαδοχικών θέσεων με τη μέγιστη συνολική φωτεινότητα («μέγιστο ανεξάρτητο υποσύνολο»).

Παράδειγμα 7 θέσεων με φωτεινότητες $[8, 40, 20, 16, 32, 36, 24]$ (για $x_{1}, \dots, x_{7}$ ). Π.χ. τα ανεξάρτητα ${x_{1}, x_{3}, x_{5}, x_{7}}, {x_{2}, x_{4}, x_{6}}, {x_{2}, x_{5}, x_{7}}, {x_{1}, x_{4}, x_{7}}$ έχουν φωτεινότητες $84, 92, 96, 48$ .

1. Ο εξής άπληστος αλγόριθμος επιλέγει το καλύτερο ανάμεσα στο σύνολο των κορυφών με περιττούς δείκτες και σε αυτό με άρτιους δείκτες. Είναι βέλτιστος; Αν όχι, δώσε αντιπαράδειγμα. 2. Σχεδίασε αλγόριθμο δυναμικού προγραμματισμού που βρίσκει τη μέγιστη συνολική φωτεινότητα (δώσε την αναδρομική σχέση). 3. Δώσε τον χρόνο εκτέλεσης — πρέπει να είναι πολυωνυμικός ως προς το $n$ και ανεξάρτητος των τιμών φωτεινότητας. 4. Εκτέλεσε τον αλγόριθμο στο παραπάνω παράδειγμα.

Απαιτεί:L14 · DP I

Παλαιό θέμαΣεπτέμβριος 2023Θέμα 235%Δυναμικός προγραμματισμόςΔύσκολο

Σεπτέμβριος 2023 · Θέμα 2 — Χρονοπρογραμματισμός με βάρη (πλατφόρμα δόνησης)

Το γυμναστήριο της γειτονιάς σας απέκτησε πρόσφατα μια υπερσύγχρονη πλατφόρμα δόνησης, ένα πολύ ακριβό όργανο που υπόσχεται μυϊκή ενδυνάμωση. Πολλοί αθλούμενοι θέλουν να τη χρησιμοποιήσουν: κάθε αίτημα $i$ χαρακτηρίζεται από έναν χρόνο έναρξης $s_{i}$ , έναν χρόνο λήξης $e_{i}$ και μια συνδρομή $p_{i}$ που είναι διατεθειμένος να πληρώσει. Υπάρχει μόνο μία πλατφόρμα, οπότε δεν μπορούν να εξυπηρετηθούν δύο αιτήματα που επικαλύπτονται χρονικά. Το γυμναστήριο θέλει να επιλέξει ένα υποσύνολο $S \subseteq {1, 2, \dots, n}$ μη επικαλυπτόμενων αιτημάτων ώστε να μεγιστοποιηθεί το συνολικό άθροισμα των συνδρομών.

(Α) Θεωρήστε τον εξής άπληστο αλγόριθμο: ταξινόμησε τα αιτήματα κατά φθίνουσα συνδρομή, διάλεξε το πρώτο, και κατόπιν, σαρώνοντας τη λίστα, διάλεξε κάθε επόμενο αίτημα που είναι συμβατό (δεν επικαλύπτεται) με όσα έχεις ήδη επιλέξει. Επιλύει ο αλγόριθμος αυτός το παραπάνω πρόβλημα; Αν όχι, δώστε αντιπαράδειγμα.

(Β) Βρείτε την τιμή $P [n]$ (συνολικό άθροισμα των συνδρομών) της βέλτιστης λύσης.

Σημείωση μεταγραφής: το πρωτότυπο είναι αχνό σκαναρισμένο φύλλο με $n = 7$ αιτήματα. Παρακάτω διδάσκουμε πλήρως τη μέθοδο και τη δουλεύουμε σε ένα καθαρό, αντιπροσωπευτικό στιγμιότυπο.

Απαιτεί:L14 · DP I

Παλαιό θέμαΙούνιος 2022Θέμα 235%Δυναμικός προγραμματισμόςΜέτριο

Ιούνιος 2022 · Θέμα 2 — Αναδρομή vs δυναμικός προγραμματισμός

Θέλουμε να υπολογιστεί η ακολουθία $b_{1}, b_{2}, b_{3}, \dots, b_{n}$ που προκύπτει από τον αναδρομικό τύπο

b_{n} = 2 max {b_{n - 1}, b_{n - 2}} + b_{n - 3}

με τους 3 αρχικούς όρους $b_{1} = b_{2} = b_{3} = 1$ . Έστω $R B (n)$ ο αλγόριθμος που στηρίζεται απευθείας στην αναδρομική σχέση. (Δίνεται ότι $3^{1/3} = 1, 44$ .)

i. Γράψτε σε φυσική γλώσσα τον αλγόριθμο $R B (n)$ . ii. Δείξτε ότι ο $R B (n)$ είναι εκθετικός, με πολυπλοκότητα $Ω (1, 4 4^{n})$ . iii. Αν χρησιμοποιήσουμε δυναμικό προγραμματισμό (αλγόριθμος $D B (n)$ ), πόσα υποπροβλήματα θα οριστούν; iv. Δικαιολογήστε ότι η πολυπλοκότητα του $D B (n)$ είναι γραμμική. v. Ποιος αλγόριθμος είναι ταχύτερος;

Απαιτεί:L14 · DP I

Φόρτωση σχολίων…

L14 · Δυναμικός Προγραμματισμός I — Memoization & Σταθμισμένος Χρονοπρογραμματισμός

Τι θα δούμε

Τα τρία αλγοριθμικά μοντέλα

Το παράδειγμα-εκκίνηση: Fibonacci

Γιατί είναι τόσο αργό; Επικάλυψη υποπροβλημάτων

Η λύση: memoization

Σταθμισμένος χρονοπρογραμματισμός διαστημάτων

Γιατί δεν αρκεί ο άπληστος

Η προετοιμασία: ταξινόμηση και p(j)

Η αναδρομή — μια δυαδική επιλογή

Ο αλγόριθμος

Υπολογισμός των p(j) σε O(n)

Εύρεση της λύσης

Η συνταγή του δυναμικού προγραμματισμού

Κλείδωσε τη γνώση

Μοτίβο σκέψης

Τι μάθαμε

Ιούνιος 2025 · Θέμα 1.7 — Πολυπλοκότητα δισδιάστατου πίνακα DP

Ιούνιος 2025 · Θέμα 1.8 — Πολυπλοκότητα μονοδιάστατου πίνακα DP

Ιούνιος 2025 · Θέμα 3 — Επίσκεψη αξιοθέατων (DP)

Σεπτέμβριος 2025 · Θέμα 1.6 — Πολυπλοκότητα δισδιάστατου πίνακα DP

Σεπτέμβριος 2025 · Θέμα 1.7 — Πολυπλοκότητα μονοδιάστατου πίνακα DP

Φροντιστηριακό Σετ #10 · Άσκηση 11 — Αναδρομή vs ΔΠ (πολυωνυμική αναδρομή)

Φροντιστηριακό Σετ #10 · Άσκηση 12 — Αναδρομή vs ΔΠ (εκθετική αναδρομή)

Φροντιστηριακό Σετ #8 · Άσκηση 3 — Τεμαχισμός ράβδου (rod cutting)

Φροντιστηριακό Σετ #8 · Άσκηση 4 — Άνοιγμα εστιατορίων κατά μήκος δρόμου

Φροντιστηριακό Σετ #9 · Άσκηση 3 — Αλυσίδα εστιατορίων στην εθνική οδό (DP)

Φροντιστηριακό Σετ #9 · Άσκηση 5 — Μαγνητικός τομογράφος (weighted interval scheduling)

Ιούνιος 2023 · Θέμα 4 — Κολώνες φωτισμού (μέγιστο ανεξάρτητο σύνολο σε μονοπάτι)

Σεπτέμβριος 2023 · Θέμα 2 — Χρονοπρογραμματισμός με βάρη (πλατφόρμα δόνησης)

Ιούνιος 2022 · Θέμα 2 — Αναδρομή vs δυναμικός προγραμματισμός

Η προετοιμασία: ταξινόμηση και $p (j)$

Υπολογισμός των $p (j)$ σε $O (n)$