Μηχανική Μάθηση — Επιβλεπόμενη, Μη Επιβλεπόμενη & Βασικοί Αλγόριθμοι

Η μηχανική μάθηση είναι ένας τρόπος να χρησιμοποιούμε δεδομένα για να κάνουμε προβλέψεις ή να εντοπίζουμε μοτίβα χωρίς να γράφουμε κάθε κανόνα με το χέρι. Στην επιβλεπόμενη μάθηση, τα δεδομένα εκπαίδευσης περιλαμβάνουν τη σωστή απάντηση. Στη μη επιβλεπόμενη μάθηση, αυτό δεν συμβαίνει, οπότε ο στόχος είναι να βρεθεί δομή, όπως ομάδες ή κύριες κατευθύνσεις μεταβολής.

Αυτή είναι η βασική ιδέα πίσω από τις περισσότερες εισαγωγικές έννοιες της μηχανικής μάθησης. Ξεκινάς με δεδομένα, επιλέγεις ένα μοντέλο, το εκπαιδεύεις σε παραδείγματα και μετά ελέγχεις αν λειτουργεί σε νέα δεδομένα, όχι μόνο σε αυτά που έχει ήδη δει.

Τι Κάνει Η Μηχανική Μάθηση

Ένα μοντέλο μηχανικής μάθησης αντιστοιχίζει εισόδους σε εξόδους ή μοτίβα. Η είσοδος μπορεί να είναι το μέγεθος ενός σπιτιού, οι βαθμοί σε εξετάσεις, η δραστηριότητα πελατών ή οι τιμές pixel σε μια εικόνα. Η έξοδος εξαρτάται από την εργασία:

πρόβλεψη ενός αριθμού, όπως η τιμή
πρόβλεψη μιας ετικέτας, όπως spam ή όχι spam
ομαδοποίηση παρόμοιων αντικειμένων χωρίς ετικέτες
κατάταξη ή σύσταση πιθανών επιλογών

Αυτό που το κάνει «μάθηση» είναι ότι οι παράμετροι του μοντέλου προσαρμόζονται από τα δεδομένα αντί να είναι πλήρως καθορισμένες από έναν προγραμματιστή.

Επιβλεπόμενη Μάθηση vs Μη Επιβλεπόμενη Μάθηση

Επιβλεπόμενη Μάθηση: Πρόβλεψη Γνωστού Στόχου

Η επιβλεπόμενη μάθηση χρησιμοποιεί παραδείγματα της μορφής $(x, y)$ , όπου το $x$ είναι η είσοδος και το $y$ είναι ο γνωστός στόχος.

Αν το $y$ είναι αριθμητικό, η εργασία συχνά ονομάζεται παλινδρόμηση. Αν το $y$ είναι κατηγορία, η εργασία συνήθως ονομάζεται ταξινόμηση.

Συνηθισμένοι αλγόριθμοι επιβλεπόμενης μάθησης είναι η γραμμική παλινδρόμηση, η λογιστική παλινδρόμηση, τα δέντρα αποφάσεων, τα τυχαία δάση, οι μηχανές διανυσμάτων υποστήριξης και τα νευρωνικά δίκτυα. Καμία μέθοδος δεν είναι η καλύτερη σε κάθε περίπτωση. Η σωστή επιλογή εξαρτάται από το μέγεθος των δεδομένων, το επίπεδο θορύβου, τον τύπο χαρακτηριστικών και το πόση ερμηνευσιμότητα χρειάζεσαι.

Μη Επιβλεπόμενη Μάθηση: Εύρεση Δομής Χωρίς Ετικέτες

Η μη επιβλεπόμενη μάθηση χρησιμοποιεί εισόδους $x$ χωρίς ετικέτες-στόχους.

Εδώ ο στόχος είναι συνήθως να ανακαλυφθεί δομή που υπάρχει ήδη στα δεδομένα. Μια μέθοδος συσταδοποίησης όπως το k-means προσπαθεί να ομαδοποιήσει παρόμοιες παρατηρήσεις. Μια μέθοδος μείωσης διαστάσεων όπως η ανάλυση κύριων συνιστωσών προσπαθεί να συνοψίσει τη μεταβολή με λιγότερες κατευθύνσεις.

Η μη επιβλεπόμενη μάθηση μπορεί να είναι χρήσιμη για διερεύνηση, συμπίεση, ανίχνευση ανωμαλιών ή προεπεξεργασία. Τα αποτελέσματά της εξαρτώνται έντονα από το πώς αναπαρίστανται τα δεδομένα και από το ποια έννοια ομοιότητας είναι ενσωματωμένη στη μέθοδο.

Ένα Απλό Νοητικό Μοντέλο

Σκέψου τη μηχανική μάθηση ως προσαρμογή καμπύλης ή προσαρμογή μοτίβου υπό αβεβαιότητα.

Επιλέγεις μια οικογένεια μοντέλων, όπως ευθείες γραμμές, δέντρα αποφάσεων ή πολυεπίπεδα νευρωνικά δίκτυα. Στη συνέχεια, η εκπαίδευση προσαρμόζει το μοντέλο ώστε οι προβλέψεις του να ταιριάζουν όσο γίνεται καλύτερα στα δεδομένα εκπαίδευσης σύμφωνα με μια συνάρτηση απώλειας. Αν το μοντέλο γενικεύει καλά, τότε αποδίδει καλά και σε νέα δεδομένα που δεν έχει δει ξανά.

Αυτή η τελευταία συνθήκη είναι σημαντική. Ένα μοντέλο που απλώς απομνημονεύει το σύνολο εκπαίδευσης συνήθως δεν είναι χρήσιμο.

Παράδειγμα: Πρόβλεψη Ενοικίου Με Γραμμική Παλινδρόμηση

Ας υποθέσουμε ότι θέλεις να προβλέψεις το ενοίκιο ενός διαμερίσματος από το εμβαδόν του. Ένα απλό επιβλεπόμενο μοντέλο είναι

\hat{y} = b_0 + b_1x

όπου το $x$ είναι το εμβαδόν, το $\hat{y}$ είναι το προβλεπόμενο ενοίκιο, το $b_0$ είναι η σταθερά τομής και το $b_1$ είναι η κλίση.

Υπόθεσε ότι ένα προσαρμοσμένο μοντέλο δίνει

\hat{y} = 500 + 2x

με το ενοίκιο να μετριέται σε δολάρια και το εμβαδόν σε τετραγωνικά πόδια.

Αν ένα διαμέρισμα έχει $x = 700$ , η πρόβλεψη είναι

\hat{y} = 500 + 2(700) = 1900

Άρα το μοντέλο προβλέπει ενοίκιο $1900$ .

Τρεις λεπτομέρειες έχουν σημασία εδώ. Το μοντέλο έμαθε από επισημασμένα παραδείγματα εμβαδού και ενοικίου. Η πρόβλεψη είναι εκτίμηση, όχι εγγύηση. Ο τύπος έχει νόημα μόνο αν μια περίπου γραμμική σχέση είναι λογική προσέγγιση στο εύρος τιμών που σε ενδιαφέρει.

Αυτό το παράδειγμα είναι σκόπιμα απλό, αλλά αποτυπώνει τον βασικό κύκλο της επιβλεπόμενης μάθησης: χρήση επισημασμένων δεδομένων, προσαρμογή παραμέτρων και πρόβλεψη ενός στόχου για μια νέα είσοδο.

Βασικοί Αλγόριθμοι Μηχανικής Μάθησης Και Πότε Να Τους Χρησιμοποιείς

Γραμμική Παλινδρόμηση

Χρησιμοποίησέ τη όταν ο στόχος είναι να προβλέψεις μια αριθμητική τιμή και μια προσέγγιση με ευθεία γραμμή είναι ένα λογικό πρώτο μοντέλο.

Λογιστική Παλινδρόμηση

Χρησιμοποίησέ τη για ταξινόμηση όταν θέλεις μια σχετικά απλή και ερμηνεύσιμη βασική μέθοδο για την πρόβλεψη κατηγοριών όπως ναι ή όχι.

Δέντρα Αποφάσεων Και Τυχαία Δάση

Χρησιμοποίησέ τα όταν οι σχέσεις είναι μη γραμμικές ή περιλαμβάνουν αλληλεπιδράσεις, ειδικά σε πινακοποιημένα δεδομένα. Τα τυχαία δάση συνήθως θυσιάζουν λίγη ερμηνευσιμότητα για πιο σταθερή προγνωστική απόδοση.

Συσταδοποίηση K-Means

Χρησιμοποίησέ τη στη μη επιβλεπόμενη μάθηση για να ομαδοποιήσεις παρατηρήσεις σε $k$ συστάδες. Λειτουργεί καλύτερα όταν η έννοια του κέντρου συστάδας έχει νόημα για τα χαρακτηριστικά που χρησιμοποιείς.

Νευρωνικά Δίκτυα

Χρησιμοποίησέ τα όταν η σχέση ανάμεσα στις εισόδους και τις εξόδους είναι πολύ σύνθετη, ιδιαίτερα σε εργασίες εικόνας, ομιλίας και γλώσσας. Συχνά χρειάζονται περισσότερα δεδομένα και περισσότερη ρύθμιση από τα απλούστερα μοντέλα.

Συνηθισμένα Λάθη Στις Βασικές Έννοιες Της Μηχανικής Μάθησης

Σύγχυση Πρόβλεψης Με Εξήγηση

Ένα μοντέλο μπορεί να προβλέπει καλά και παρ' όλα αυτά να μην εξηγεί την πραγματική αιτία του μοτίβου.

Παράβλεψη Της Διαφοράς Μεταξύ Εκπαίδευσης Και Ελέγχου

Η υψηλή ακρίβεια στην εκπαίδευση δεν σημαίνει ότι το μοντέλο θα αποδώσει καλά σε νέα δεδομένα. Η γενίκευση πρέπει να ελέγχεται σε ξεχωριστά δεδομένα.

Χρήση Λάθος Μετρικής

Η ακρίβεια μπορεί να είναι παραπλανητική σε προβλήματα ταξινόμησης με ανισόρροπες κλάσεις. Σε ορισμένες εργασίες, η precision, η recall, το μέσο απόλυτο σφάλμα ή κάποια άλλη μετρική μπορεί να έχουν μεγαλύτερη σημασία.

Αντιμετώπιση Των Ονομάτων Αλγορίθμων Ως Εγγυήσεις

Το «νευρωνικό δίκτυο» ή το «τυχαίο δάσος» δεν είναι υπόσχεση ποιότητας. Η ποιότητα των δεδομένων, ο σχεδιασμός χαρακτηριστικών, η αξιολόγηση και η σωστή διατύπωση του προβλήματος έχουν τουλάχιστον την ίδια σημασία με την ετικέτα του αλγορίθμου.

Πότε Είναι Χρήσιμη Η Μηχανική Μάθηση

Η μηχανική μάθηση είναι χρήσιμη όταν το μοτίβο είναι υπερβολικά σύνθετο για ένα μικρό σταθερό σύνολο κανόνων, αλλά υπάρχουν αρκετά δεδομένα ώστε να μάθεις από παραδείγματα. Συνηθισμένες χρήσεις περιλαμβάνουν συστήματα συστάσεων, ανίχνευση απάτης, εργαλεία υποστήριξης για ιατρικές εικόνες, κατάταξη, πρόβλεψη και ταξινόμηση εγγράφων.

Δεν είναι πάντα το σωστό εργαλείο. Αν ο κανόνας είναι απλός, σταθερός και πλήρως γνωστός, ένας συνηθισμένος τύπος ή ένα ντετερμινιστικό πρόγραμμα μπορεί να είναι καλύτερη επιλογή.

Δοκίμασε Ένα Παρόμοιο Πρόβλημα

Πάρε ένα μικρό σύνολο δεδομένων και κάνε δύο ερωτήσεις: «Ποια είναι η είσοδος;» και «Ποιος είναι ο στόχος;». Αν μπορείς να απαντήσεις και στις δύο, δοκίμασε ένα επιβλεπόμενο μοντέλο όπως γραμμική παλινδρόμηση ή ταξινόμηση. Αν δεν μπορείς, διερεύνησε αν τα δεδομένα σχηματίζουν φυσικά ομάδες με μια μη επιβλεπόμενη μέθοδο.

Αν θέλεις να προχωρήσεις ένα βήμα παραπέρα, λύσε πρώτα ένα παρόμοιο πρόβλημα με ένα απλό μοντέλο και μετά σύγκρινέ το με ένα πιο ευέλικτο. Αυτός είναι συνήθως καλύτερος τρόπος μάθησης από το να πας κατευθείαν στον πιο προχωρημένο αλγόριθμο.

Συχνές ερωτήσεις

Είναι η μηχανική μάθηση το ίδιο με την τεχνητή νοημοσύνη;: Όχι ακριβώς. Η μηχανική μάθηση είναι ένα βασικό μέρος της σύγχρονης τεχνητής νοημοσύνης, αλλά η ΤΝ είναι ευρύτερη και περιλαμβάνει επίσης συστήματα βασισμένα σε κανόνες, αναζήτηση, σχεδιασμό και άλλες προσεγγίσεις.
Χρειάζεται η μηχανική μάθηση πάντα τεράστιες ποσότητες δεδομένων;: Όχι. Ορισμένα μοντέλα λειτουργούν καλά και με σχετικά μικρά σύνολα δεδομένων, αλλά η ποσότητα δεδομένων που χρειάζεσαι εξαρτάται από το πρόβλημα, το επίπεδο θορύβου και την πολυπλοκότητα του μοντέλου.
Εξηγεί ένα μοντέλο μηχανικής μάθησης γιατί συμβαίνει κάτι;: Όχι από μόνο του. Ένα μοντέλο μπορεί να εντοπίζει μοτίβα που βοηθούν στην πρόβλεψη, αλλά η πρόβλεψη είναι διαφορετική από την απόδειξη αιτιότητας.

Χρειάζεσαι βοήθεια με μια άσκηση;

Ανέβασε την ερώτησή σου και πάρε επαληθευμένη λύση βήμα-βήμα σε δευτερόλεπτα.

Άνοιξε το GPAI Solver →