ΗΥ-225: Οργάνωση Υπολογιστών
Άνοιξη 2021 |
Τμ. Επ. Υπολογιστών © Πανεπιστήμιο Κρήτης |
[Up: Table of Contents] [Prev: 2. Loops, I/O] |
[Next: 4. Instruction Formats] |
Βιβλίο: Υπόλοιπη §2.3: pp. 68-73 (Αγγλικό), ή σελίδες 121-127 (Ελληνικό).
Αντιγραφή μιας 32-μπιτης λέξης από τη μνήμη σ' ένα καταχωρητή ("φόρτωμα στον καταχωρητή") γίνεται με την εντολή "lw rd, offset(rs1)" (load word), όπου rd είναι ο καταχωρητής προορισμού (destination register), και rs1 είναι ένας καταχωρητής πηγής (source/index/base register) που περιέχει μια διεύθυνση μνήμης (pointer) στην οποία προστίθεται ο σταθερός αριθμός offset (απόσταση/απόκλιση), και το αποτέλεσμα της πρόσθεσης είναι η τελική διεύθυνση μνήμης απ' όπου γίνεται η ανάγνωση και αντιγραφή στον rd. Συχνά, συμβολίζουμε τη μνήμη σαν έναν πίνακα (array) M[ ], και γράφουμε M[A] γιά να συμβολίσουμε το περιεχόμενο της θέσης μνήμης με διεύθυνση A. Έτσι, η παραπάνω εντολή lw rd, offset(rs1) προκαλεί ανάγνωση από τη διεύθυνση μνήμης (offset + rs1), δηλαδή διαβάζει το M[offset + rs1], και το γράφει στον καταχωρητή rd. Ο σταθερός αριθμός offset χρησιμοποιείται σαν προσημασμένος από το υλικό του RISC-V, επομένως η "κίνηση" που αυτός επιβάλει σε σχέση με το πού "δείχνει" ο καταχωρητής rs1 μπορεί να είναι προς τα "εμπρός" ή προς τα "πίσω".
Αντίστροφα, αντιγραφή μιας 32-μπιτης λέξης από έναν καταχωρητή στη μνήμη ("αποθήκευση του καταχωρητή") γίνεται με την εντολή "sw rs2, offset(rs1)" (store word), η οποία γράφει στη θέση μνήμης με διεύθυνση (offset + rs1), δηλαδή προκαλεί την αντιγραφή M[offset + rs1] ← rs2. Εδώ, ο rs2 είναι καταχωρητής πηγής (source register)· προσέξτε ότι σε αυτή την περίπτωση, ο τελεστέος πηγής (source operand) γράφεται αριστερά και ο τελεστέος προορισμού δεξιά μέσα στην εντολή Assembly, αντίθετα δηλαδή από τις εντολές αριθμητικών πράξεων και από την εντολή load.
Υπάρχουν και οι παρόμοιες εντολές lb" (load byte) και lh" (load half) που διαβάζουν αντίστοιχα 1 ή 2 Bytes από τη μνήμη, τα μετατρέπουν σε 32 bits θεωρώντας τα προσημασμένα (signed), και τα γράφουν στον καταχωρητή rd. Επίσης οι εντολές lbu" (load byte unsigned) και lhu" (load half unsigned) κάνουν την ίδια δουλειά εκτός ότι στη μετατροπή σε 32 bits θεωρούν τα 8 ή 16 bits που διάβασαν από τη μνήμη σαν μη προσημασμένα. Αντίστοιχα οι εντολές sb" (store byte) και sh" (store half) γράφουν στη μνήμη τα 8 ή 16 δεξιά (λιγότερο σημαντικά - least significant) bits του καταχωρητή rs2.
Στον 64-μπιτο RISC-V (όπως στο Αγγλικό βιβλίο, αλλά όχι όπως στον RARS), οι καταχωρητές είναι 64-μπιτοι, οπότε η lw διαβάζει πάλι 32 bits από τη μνήμη, όπως και πριν, αλλά τα μετατρέπει σε 64 bits θεωρώντας τα προσημασμένα (signed) γιά να τα γράψει στο 64-μπιτο καταχωρητή rd, ενώ η lwu (load word unsigned) κάνει το ίδιο αλλά στη μετατροπή θεωρεί τα 32 bits που διάβασε σαν unsigned. Αντίστοιχα, η εντολή sw γράφει τα 32 δεξιά (least significant) bits του καταχωρητή rs2 στη μνήμη. Επίσης στον 64-μπιτο RISC-V υπάρχει η ld (load double) που διαβάζει 64 bits (8 bytes) από τη μνήμη, και η sd (store double) που γράφει 64 bits (8 bytes) στη μνήμη. Στους σημερινούς 64-μπιτους υπολογιστές, οι compilers της C θεωρούν τις μεταβλητές τύπου pointer πάντα σαν 64-μπιτες ποσότητες (προφανώς), ενώ τις μεταβλητές τύπου int σαν 32-μπιτους ακεραίους και τις μεταβλητές τύπου long long int σαν 64-μπιτους ακεραίους· τον τύπο long int, τα μεν Windows τον θεωρούν 32 bits, το δε Linux τον θεωρεί 64 bits.
Οι συνήθεις τρόποι χρήσης του παραπάνω τρόπου "διευθυνσιοδότησης" (addressing mode), δηλαδή "καταχωρητής + σταθερά", θα γίνουν κατανοητοί καθώς το μάθημα θα προχωρά. Ας σημειώσουμε όμως εδώ, γιά μελλοντική αναφορά, ότι η πιό συνηθισμένη χρήση είναι με τον καταχωρητή να περιέχει έναν pointer, και τη σταθερή ποσότητα να είναι μιά "απόκλιση" (offset) από εκεί που δείχνει ο pointer. Αυτό χρησιμοποιείται εξαιρετικά συχνά: (α) όταν ο pointer δείχνει σε μιά δομή δεδομένων και η απόκλιση ορίζει ποιό από τα πεδία αυτής της δομής θέλουμε να προσπελάσουμε (π.χ. p->next)· (β) όταν ο καταχωρητής είναι ο stack pointer (sp = x2) και η απόκλιση ορίζει ποιάν από τις τοπικές μεταβλητές της διαδικασίας ζητάμε· και (γ) όταν ο καταχωρητής είναι ο global pointer (gp = x3) και η απόκλιση ορίζει μία από τις καθολικές βαθμωτές μεταβλητές. Μιά άλλη χρήση του τρόπου διευθυνσιοδότησης "σταθερά + καταχωρητής" θα μπορούσε να ήταν με τη σταθερά να είναι η διεύθυνση βάσης ενός (στατικά allocated) πίνακα (array) και ο καταχωρητής να είναι το index του στοιχείου του πίνακα πολλαπλασιασμένο (ήδη) επί το μέγεθος του στοιχείου του πίνακα, οπότε προσπελάζουμε το στοιχείο με εκείνο το index. Όμως στην πράξη, στον RISC-V, αυτό είναι σχεδόν αδύνατο διότι θα έπρεπε ο πίνακας να ξεκινά στα πρώτα 2 KBytes του χώρου διευθύνσεων, ώστε η διεύθυνση βάση του να χωρά στα μόλις 12 bits που έχει η (προσημασμένη) σταθερά. Ευτυχώς, η χρήση αυτή δεν είναι απαραίτητη, διότι συνήθως οι compilers αλλάζουν την αριθμητική με array indexes σε αριθμητική με array element pointers μέσα στους βρόχους που επεξεργάζονται στοιχεία πινάκων.
Ας ξεκινήσουμε με μια σύμβαση που αφορά τον τρόπο σχεδιασμού στο χαρτί των ποσοτήτων που αποτελούνται από πολλαπλά bytes: Μέσα σ' έναν ακέραιο αριθμό, τα bits εκείνα που πολλαπλασιάζονται επί τις μεγαλύτερες δυνάμεις του 2 για να μας δώσουν την αριθμητική τιμή του ακεραίου λέγονται "περισσότερο σημαντικά" (MS - most significant) bits, και αυτά που πολλαπλασιάζονται επί τις μικρότερες δυνάμεις του 2 λέγονται "λιγότερο σημαντικά" (LS - least significant) bits. Το Byte που περιέχει τα MS bits λέγεται MS Byte, και εκείνο που περιέχει τα LS bits λέγεται LS Byte. Όποτε σχεδιάζουμε έναν ακέραιο στο χαρτί, οριζόντια, θα βάζουμε πάντα τα MS bits και Byte αριστερά, και τα LS bits και Byte δεξιά, δηλαδή όπως και στους δεκαδικούς αριθμούς (φυσικά, η σύμβαση αυτή αφορά μόνο τους ανθρώπους –μέσα στον υπολογιστή δεν έχει νόημα να μιλάμε για "αριστερά transistors" και "δεξιά transistors"...). Ακολουθώντας τη σύμβαση αυτή, το σχήμα δείχνει ένα παράδειγμα τεσσάρων (4) λέξεων μνήμης (16 Bytes) ενός 32-μπιτου υπολογιστή σε μία μηχανή "Big-Endian" και σε μία μηχανή "little-Endian". Η πρώτη λέξη περιέχει τον ακέραιο αριθμό 2003 (δεκαδικό) = 7D3 (δεκαεξαδικό), ενώ στις επόμενες 3 λέξεις υπάρχει ένας πίνακας χαρακτήρων (array of char) μεγέθους 10 στοιχείων, και περισσεύουν και δύο ελεύθερα bytes· ο πίνακας χαρακτήρων περιέχει το (null-terminated) string "katevenis" (κάθε Byte θα περιέχει το δυαδικό κώδικα ASCII ενός χαρακτήρα –π.χ. το πρώτο byte θα περιέχει 01101011, που είναι ο κώδικας του 'k'– αλλά εμείς, για ευκολία, δείχνουμε το συμβολιζόμενο χαρακτήρα).
Το "endian-ness" του υπολογιστή, δηλαδή το αν είναι little-endian ή big-endian, δεν μας επηρεάζει όταν εργαζόμαστε σε ένα και μόνο μηχάνημα, και πάντα γράφουμε και διαβάζουμε την κάθε ποσότητα με τον ίδιο τύπο –πράγμα που είναι και το σωστό να κάνει κανείς– δηλαδή όπου στη μνήμη γράφουμε string διαβάζουμε πάντα string, και όπου γράφουμε integer διαβάζουμε πάντα integer. Το "endian-ness" μας επηρεάζει όταν αλλάζουμε τύπο μεταξύ εγγραφής και ανάγνωσης –πράγμα ανορθόδοξο– π.χ. γράφουμε κάπου ένα string και μετά το διαβάζουμε σαν integer, ή γράφουμε integer και διαβάζουμε string. Το σημαντικότερο όλων όμως είναι ότι το endian-ness του υπολογιστή πρέπει να λαμβάνεται υπ' όψη όταν μεταφέρονται δεδομένα μέσω δικτύου μεταξύ υπολογιστών. Συνήθως, τα προγράμματα μεταφοράς δεδομένων (π.χ. ftp) θεωρούν ότι μεταφέρουμε κείμενο (ASCII strings), και τοποθετούν τα bytes με την αντίστοιχη σειρά. Αν όμως μεταφέρουμε άλλες μορφές δεδομένων (π.χ. 32-μπιτους ακεραίους) μεταξύ υπολογιστών με διαφορετικό endian-ness, η σειρά αυτή θα ήταν λάθος: όπως οι χαρακτήρες k, a, t, e μεταφέρονται σαν e, t, a, k στο παραπάνω σχήμα από big-endian σε little-endian, έτσι και ο ακέραιος 2003 θα ερμηνεύονταν σαν 00, 00, 07, D3 (δεκαεξαδικό), και θα μεταφέρονταν σαν D3, 07, 00, 00, δηλαδή 11010011.00000111.00000000.00000000 (δυαδικό), που είναι ο αριθμός -754,515,968 (δεκαδικό, συμπλήρωμα ως προς 2). Για να γίνει σωστά η μεταφορά, πρέπει να δηλωθεί στο πρόγραμμα μεταφοράς ο τύπος των δεδομένων που μεταφέρονται (π.χ. εντολή "type" στο ftp).
Τα 4 bytes που αποτελούν έναν ακέραιο έχουν διευθύνσεις που είναι συνεχόμενοι αριθμοί. Διεύθυνση του ακεραίου είναι πάντα η διεύθυνση εκείνου από τα 4 Bytes του που έχει τη μικρότερη ("πρώτη") από τις 4 διευθύνσεις.
Γιά λόγους ταχύτητας προσπέλασης της μνήμης είναι προτιμότερο οι ποσότητες που προσπελάζουν οι εντολές load και store να είναι ευθυγραμμισμένες (aligned) στα φυσικά του όρια, δηλαδή μια ποσότητα μεγέθους N Bytes να έχει διεύθυνση που να είναι ακέραιο πολλαπλάσιο του N. Αυτό αντιστοιχεί στις διευθύνσεις που θα είχαν τέτοιες ποσότητες εάν γεμίζαμε τη μνήμη, από την αρχή (διεύθυνση 0), με τέτοιες ποσότητες. Έτσι, όταν το N είναι δύναμη του 2, η διεύθυνση κάθε τέτοιας ποσότητας τελειώνει σ' ένα αντίστοιχο πλήθος μηδενικών, και η διεύθυνση των υπολοίπων Bytes της ποσότητας διαφέρει μόνο σε αυτά τα λιγότερο σημαντικά (least significant) bits. Όταν ικανοποιείται αυτός ο περιορισμός, τότε όταν η φυσική μνήμη έχει πλάτος N Bytes, αρκεί μία μόνο προσπέλαση σε αυτήν για κάθε πρόσβαση σε ποσότητα μεγέθους N Bytes. Παρατηρήστε ότι π.χ. 64-μπιτες ποσότητες (8 Bytes) αποθηκευμένες σε 32-μπιτη μνήμη (πλάτος μνήμης = 4 Bytes) απαιτούν πάντα 2 προσπελάσεις μνήμης γιά να τις διαβάσουμε ή γράψουμε, είτε αυτές είναι ευθυγραμμισμένες σε διευθύνσεις πολλαπλάσια του 8 είτε σε πολλαπλάσια του 4. Όταν όμως ένα επόμενο μοντέλο υπολογιστή έχει 64-μπιτη μνήμη, τότε με την μεν ευθυγράμμιση πολλαπλασίων του 8 θα έχουμε εξασφαλισμένη τη μία μόνο προσπέλαση πάντα, ενώ με ευθυγράμμιση πολλαπλασίων του 4 αυτό δεν εξασφαλίζεται. Στον RISC-V μιά τέτοια ευθυγράμμιση είναι έντονα επιθυμητή γιά λόγους ταχύτητας, αλλά πάντως προαιρετική (γιά να εξυπηρετούνται παλαιά προγράμματα) (ενώ στον MIPS η ευθυγράμμιση αυτή είναι υποχρεωτική).
Τρόπος Παράδοσης:
Παραδώστε μέσω turnin ex03@hy225 [directoryName] τα εξής:
(1)
τον πηγαίο κώδικά σας της άσκησης 3.4, "ex03_4.asm"
(2)
τον πηγαίο κώδικά σας της άσκησης 3.5, "ex03_5.asm"
(3)
ένα στιγμιότυπο (screen-dump) του τρεξίματος της άσκησης 3.4, "ex03_4.jpg"
(4)
ένα στιγμιότυπο (screen-dump) του τρεξίματος της άσκησης 3.5,
"ex03_5.jpg"
Θα εξεταστείτε και προφορικά για την Άσκηση 3,
από βοηθούς του μαθήματος,
με διαδικασία γιά την οποία θα ενημερωθείτε
μέσω ηλτά (email) στη λίστα του μαθήματος.