ΗΥ-225: Οργάνωση Υπολογιστών
Άνοιξη 2009 |
Τμ. Επ. Υπολογιστών © Πανεπιστήμιο Κρήτης |
[Up - Table of Contents] [Prev - 13. Exceptions] |
[printer version - PDF] [15. Cache Memories - Next] |
Εάν ο υπολογιστής A εκτελεί ένα δοθέν πρόγραμμα σε χρόνο tA, ο δε υπολογιστής B το εκτελεί σε χρόνο tB, όπου tB > tA και (tB / tA) = 1.xy, τότε λέμε ότι "ο υπολογιστής A είναι ταχύτερος του B κατά xy % γιά το δοθέν πρόγραμμα". Παραδείγματος χάριν, αν tA = 4s και tB = 5s, τότε (tB/tA) = 1.25, και ο A είναι ταχύτερος του Β κατά 25 % γιά το δοθέν πρόγραμμα. Ο χρόνος texec εκτέλεσης ενός προγράμματος σ' έναν υπολογιστή μπορεί συχνά να εκφραστεί σαν:
texec = Ninstructions * CPIaverage * Tclock
όπου Ninstructions είναι το πλήθος (ο αριθμός) των εντολών που ο υπολογιστής εκτελεί προκειμένου να ολοκληρωθεί η εκτέλεση του δοθέντος προγράμματος, CPIaverage είναι το μέσο πλήθος (μέσος αριθμός) των κύκλων ρολογιού που απαιτούνται γιά την εκτέλεση μιάς εντολής (Cycles Per Instruction --CPI), και Tclock είναι ο χρόνος που διαρκεί ένας κύκλος ρολογιού, δηλαδή η περίοδος του ρολογιού, δηλαδή το αντίστροφο της συχνότητας ρολογιού.
Ερώτηση: Θεωρήστε έναν υπολογιστή A (τύπου RISC), που γιά να τελειώσει ένα δοθέν πρόγραμμα πρέπει να εκτελέσει 2,400,000 εντολές, με μέσο CPI = 3.5 κύκλους ρολογιού ανά εντολή, και με ρολόϊ 600 MHz. Ενας άλλος υπολογιστής B (τύπου CISC --complex instruction set computer) έχει πιό "πλούσιο" ρεπερτόριο εντολών, κι έτσι του αρκεί να εκτελέσει μόνο 1,800,000 εντολές γιά να τελειώσει το ίδιο πρόγραμμα. Ομως, λόγω της αυξημένης πολυπλοκότητάς του, έχει μέσο CPI = 5.2 κύκλους ρολογιού ανά εντολή, και ρολόϊ 500 MHz. Πόσους κύκλους ρολογιού και πόσα δευτερόλεπτα χρειάζεται ο κάθε υπολογιστής γιά να εκτελέσει το δοθέν πρόγραμμα; Ποιός από τους δύο υπολογιστές είναι ταχύτερος από τον άλλον γιά το δοθέν πρόγραμμα, και πόσο ταχύτερος;
(α)
Στην υλοποίησή σας της
άσκησης 12.1
(δηλαδή χωρίς τις βελτιστοποιήσεις της
άσκησης 12.2),
πόσους κύκλους ρολογιού παίρνει η εκτέλεση μιάς εντολής του κάθε τύπου;
Βασει της διάρκειας αυτής εκτέλεσης του κάθε τύπου εντολής,
και βάσει των παραπάνω ποσοστών εκτέλεσης των διαφόρων τύπων εντολών,
πόσο θα είναι το μέσο CPI αυτού του επεξεργαστή γιά αυτά τα προγράμματα;
(Προφανώς, το μέσο CPI είναι ο σταθμισμένος μέσος όρος
των κύκλων ρολογιού ανά εντολή,
όπου οι συντελεστές στάθμισης είναι τα ποσοστά (συχνότητα) εκτέλεσης
του κάθε τύπου εντολών).
(β)
Έστω τώρα ότι κάνουμε βελτιστοποιήσεις ανάλογες με αυτές της
άσκησης 12.2
αλλά περισσότερες:
έστω ότι κάνουμε όλες τις εντολές άλματος (j, jr, jal, κλπ)
καθώς και την εντολή load upper immediate (lui)
να εκτελούνται σε δύο αντί τριών ή περισσοτέρων κύκλων ρολογιού καθεμία.
Πόσο θα είναι τότε το νέο μέσο CPI του επεξεργαστή
γιά αυτά τα προγράμματα;
(γ)
Αν η βελτιστοποίηση (β) έχει σαν αρνητική παρενέργεια
να αυξήσει τον κύκλο ρολογιού από 2.4 ns σε 2.6 ns,
ποιός από τους δύο επεξεργαστές (α) και (β) θα είναι ταχύτερος,
και κατά πόσο;
(Υπόδειξη:
προφανώς, το πλήθος των εκτελούμενων εντολών Ninstructions
δεν αλλάζει από τον (α) στον (β)).
Ομως, όπως είπαμε, δυστυχώς, υπάρχουν και αλληλεξαρτήσεις εντολών, οι οποίες προκαλούν απώλεια κύκλου ή κύκλων ρολογιού επιπλέον του παραπάνω ενός "βασικού" κύκλου ανά εντολή. Χωρίς να μπούμε σε πολλές λεπτομέρειες του πώς και γιατί, ας θεωρήσουμε, σε σχέση και με τα ποσοστά εντολών που αναφέρθηκαν στην παραπάνω άσκηση 14.2, ότι:
Θεωρήστε ότι κάνουμε τον επεξεργαστή της άσκησης 14.3 superscalar, και ας πούμε γιά απλότητα ότι αυτό γίνεται χωρίς να αλλάξουμε την δομή της pipeline του και χωρίς να αλλάξει το ρολόϊ (στην πράξη δεν είναι έτσι). Εάν το μέσο πλήθος ταυτόχρονα εκτελούμενων ανεξάρτητων εντολών είναι μιάμιση (1.5) εντολή, τότε ποιό θα είναι το μέσο CPI του νέου επεξεργαστή; Πόσο γρηγορότερος θα είναι αυτός από εκείνον της άσκησης 14.2(α), και πόσο από εκείνον της άσκησης 14.3;
Τρόπος Παράδοσης: Δώστε όλες τις απαντήσεις σας σε χαρτί, στο μάθημα, πριν αυτό αρχίσει. (Εάν γράψετε την απάντηση σε υπολογιστή, παρακαλείστε να την τυπώσετε και να παραδώσετε μόνο χαρτί, γιά ομοιομορφία και διευκόλυνση διόρθωσης).
[Up - Table of Contents] [Prev - 13. Exceptions] |
[printer version - PDF] [15. Cache Memories - Next] |
Up to the Home Page of CS-225
|
© copyright
University of Crete, Greece.
last updated: 5 Apr. 2009, by M. Katevenis. |