Πώς λειτουργεί η Τεχνητή Νοημοσύνη;

Η τεχνητή νοημοσύνη μπορεί να μοιάζει με ένα μαγικό κόλπο που όλοι κάνουν καταφατικά ενώ σκέφτονται ήσυχα... περιμένετε, πώς λειτουργεί αυτό στην πραγματικότητα ; Καλά νέα. Θα το απομυθοποιήσουμε χωρίς περιττά στοιχεία, θα παραμείνουμε πρακτικοί και θα προσθέσουμε μερικές ατελείς αναλογίες που θα το κάνουν να φαίνεται πειστικό. Αν θέλετε απλώς την ουσία, προχωρήστε στην απάντηση ενός λεπτού παρακάτω. Αλλά ειλικρινά, οι λεπτομέρειες είναι εκεί που ανάβει η λάμπα 💡.

Άρθρα που ίσως σας ενδιαφέρουν μετά από αυτό:

🔗 Τι σημαίνει το GPT
Μια γρήγορη επεξήγηση του ακρωνυμίου GPT και της σημασίας του.

🔗 Από πού αντλεί τις πληροφορίες της η Τεχνητή Νοημοσύνη
Πηγές που χρησιμοποιεί η Τεχνητή Νοημοσύνη για να μαθαίνει, να εκπαιδεύεται και να απαντά σε ερωτήσεις.

🔗 Πώς να ενσωματώσετε την Τεχνητή Νοημοσύνη στην επιχείρησή σας
Πρακτικά βήματα, εργαλεία και ροές εργασίας για την αποτελεσματική ενσωμάτωση της Τεχνητής Νοημοσύνης.

🔗 Πώς να ξεκινήσετε μια εταιρεία τεχνητής νοημοσύνης
Από την ιδέα έως την έναρξη: επικύρωση, χρηματοδότηση, ομάδα και εκτέλεση.

Πώς λειτουργεί η Τεχνητή Νοημοσύνη; Η απάντηση σε ένα λεπτό ⏱️

Η Τεχνητή Νοημοσύνη μαθαίνει μοτίβα από δεδομένα για να κάνει προβλέψεις ή να δημιουργήσει περιεχόμενο - δεν απαιτούνται χειρόγραφοι κανόνες. Ένα σύστημα λαμβάνει παραδείγματα, μετρά πόσο λάθος κάνει μέσω μιας συνάρτησης απώλειας και ωθεί τα εσωτερικά του κουμπιά - παραμέτρους - να είναι λίγο λιγότερο λάθος κάθε φορά. Ξεπλύνετε, επαναλάβετε, βελτιώστε. Με αρκετούς κύκλους, γίνεται χρήσιμο. Η ίδια ιστορία ισχύει είτε ταξινομείτε email, είτε εντοπίζετε όγκους, είτε παίζετε επιτραπέζια παιχνίδια είτε γράφετε χαϊκού. Για μια απλή γλώσσα στη «μηχανική μάθηση», η γενική εικόνα της IBM είναι αξιόπιστη [1].

Το μεγαλύτερο μέρος της σύγχρονης Τεχνητής Νοημοσύνης είναι μηχανική μάθηση. Η απλή εκδοχή: τροφοδοτήστε δεδομένα, μάθετε μια αντιστοίχιση από εισόδους σε εξόδους και, στη συνέχεια, γενικεύστε σε νέα πράγματα. Όχι μαγικά μαθηματικά, υπολογισμούς και, για να είμαστε ειλικρινείς, μια πρέζα τέχνης.

«Πώς λειτουργεί η Τεχνητή Νοημοσύνη;» ✅

Όταν οι άνθρωποι ψάχνουν στο Google για το πώς λειτουργεί η τεχνητή νοημοσύνη , συνήθως θέλουν:

ένα επαναχρησιμοποιήσιμο νοητικό μοντέλο που μπορούν να εμπιστευτούν
έναν χάρτη των κύριων τύπων μάθησης, ώστε η ορολογία να μην είναι τρομακτική
μια ματιά στο εσωτερικό των νευρωνικών δικτύων χωρίς να χαθείτε
γιατί οι μετασχηματιστές φαίνεται να κυβερνούν τον κόσμο τώρα
η πρακτική διαδικασία από τα δεδομένα στην ανάπτυξη
ένας γρήγορος συγκριτικός πίνακας που μπορείτε να αποθηκεύσετε σε στιγμιότυπο οθόνης και να τον κρατήσετε
προστατευτικά κιγκλιδώματα σχετικά με την ηθική, την προκατάληψη και την αξιοπιστία που δεν είναι κυματιστά

Αυτό θα βρεις εδώ. Αν περιπλανηθώ, είναι επίτηδες - σαν να ακολουθώ τη γραφική διαδρομή και με κάποιο τρόπο να θυμάμαι καλύτερα τους δρόμους την επόμενη φορά. 🗺️

Τα βασικά συστατικά των περισσότερων συστημάτων Τεχνητής Νοημοσύνης 🧪

Σκεφτείτε ένα σύστημα τεχνητής νοημοσύνης σαν μια κουζίνα. Τέσσερα συστατικά εμφανίζονται ξανά και ξανά:

Δεδομένα — παραδείγματα με ή χωρίς ετικέτες.
Μοντέλο — μια μαθηματική συνάρτηση με ρυθμιζόμενες παραμέτρους.
Στόχος — μια συνάρτηση απώλειας που μετρά πόσο κακές είναι οι εικασίες.
Βελτιστοποίηση — ένας αλγόριθμος που ωθεί παραμέτρους για να μειώσει τις απώλειες.

Στη βαθιά μάθηση, αυτή η ώθηση είναι συνήθως η κλίση κατάβασης με οπισθοδιάδοση - ένας αποτελεσματικός τρόπος για να καταλάβετε ποιο κουμπί σε ένα γιγάντιο ηχείο τσίριξε και στη συνέχεια να το χαμηλώσετε λίγο [2].

Μικρή περίπτωση: Αντικαταστήσαμε ένα εύθραυστο φίλτρο ανεπιθύμητης αλληλογραφίας που βασίζεται σε κανόνες με ένα μικρό εποπτευόμενο μοντέλο. Μετά από μια εβδομάδα βρόχων ετικέτας → μέτρησης → ενημέρωσης, τα ψευδώς θετικά αποτελέσματα μειώθηκαν και τα αιτήματα υποστήριξης μειώθηκαν. Τίποτα το φανταχτερό - απλώς πιο καθαροί στόχοι (ακρίβεια στα "ερωτικά" email) και καλύτερη βελτιστοποίηση.

Παραδείγματα μάθησης με μια ματιά 🎓

Επιβλεπόμενη μάθηση
Παρέχετε ζεύγη εισόδου-εξόδου (φωτογραφίες με ετικέτες, email που επισημαίνονται ως ανεπιθύμητα/όχι ανεπιθύμητα). Το μοντέλο μαθαίνει είσοδο → έξοδο. Βασική βάση πολλών πρακτικών συστημάτων [1].
Μη επιβλεπόμενη μάθηση
Χωρίς ετικέτες. Βρείτε συστάδες δομής, συμπιέσεις, λανθάνοντες παράγοντες. Ιδανικό για εξερεύνηση ή προεκπαίδευση.
Αυτοεποπτευόμενη μάθηση
Το μοντέλο δημιουργεί τις δικές του ετικέτες (προβλέπει την επόμενη λέξη, το κομμάτι εικόνας που λείπει). Μετατρέπει τα ακατέργαστα δεδομένα σε σήμα εκπαίδευσης σε μεγάλη κλίμακα· στηρίζει τα σύγχρονα μοντέλα γλώσσας και όρασης.
Ενισχυτική μάθηση
Ένας πράκτορας ενεργεί, συλλέγει ανταμοιβές και μαθαίνει μια πολιτική που μεγιστοποιεί τη σωρευτική ανταμοιβή. Αν οι «συναρτήσεις αξίας», οι «πολιτικές» και η «μάθηση χρονικών διαφορών» χτυπούν το καμπανάκι - αυτό είναι το σπίτι του [5].

Ναι, οι κατηγορίες θολώνουν στην πράξη. Οι υβριδικές μέθοδοι είναι φυσιολογικές. Η πραγματική ζωή είναι ακατάστατη. Η καλή μηχανική την συναντά εκεί που είναι.

Μέσα σε ένα νευρωνικό δίκτυο χωρίς πονοκέφαλο 🧠

Ένα νευρωνικό δίκτυο στοιβάζει επίπεδα από μικροσκοπικές μαθηματικές μονάδες (νευρώνες). Κάθε επίπεδο μετασχηματίζει τις εισόδους με βάρη, προκαταλήψεις και μια απαλή μη γραμμικότητα όπως το ReLU ή το GELU. Τα πρώτα επίπεδα μαθαίνουν απλά χαρακτηριστικά. Τα βαθύτερα κωδικοποιούν αφαιρέσεις. Η «μαγεία» -αν μπορούμε να την ονομάσουμε έτσι- είναι η σύνθεση : συνδέστε αλυσιδωτά μικρές συναρτήσεις και μπορείτε να μοντελοποιήσετε εξαιρετικά πολύπλοκα φαινόμενα.

Βρόχος εκπαίδευσης, μόνο με δονήσεις:

εικασία → σφάλμα μέτρησης → ευθύνη χαρακτηριστικού μέσω backprop → βάρη ώθησης → επανάληψη.

Κάντε το αυτό σε παρτίδες και, σαν ένας αδέξιος χορευτής που βελτιώνει κάθε τραγούδι, το μοντέλο σταματά να σας πατάει στα πόδια. Για ένα φιλικό, αυστηρό κεφάλαιο για το backprop, δείτε [2].

Γιατί οι Transformers κατέκτησαν την κορυφή - και τι σημαίνει στην πραγματικότητα η «προσοχή» 🧲

Οι μετασχηματιστές χρησιμοποιούν την αυτοσυγκέντρωση για να ζυγίσουν ποια μέρη της εισόδου έχουν σημασία μεταξύ τους, όλα ταυτόχρονα. Αντί να διαβάζουν μια πρόταση αυστηρά από αριστερά προς τα δεξιά όπως τα παλαιότερα μοντέλα, ένας μετασχηματιστής μπορεί να κοιτάξει παντού και να αξιολογήσει δυναμικά τις σχέσεις - όπως σαρώνοντας ένα γεμάτο δωμάτιο για να δει ποιος μιλάει σε ποιον.

Αυτός ο σχεδιασμός απέρριψε την επανάληψη και τις συνελίξεις για τη μοντελοποίηση ακολουθιών, επιτρέποντας μαζική παραλληλία και εξαιρετική κλιμάκωση. Η εργασία που το ξεκίνησε - Attention Is All You Need - παρουσιάζει την αρχιτεκτονική και τα αποτελέσματα [3].

Αυτοπροσοχή σε μία γραμμή: δημιουργήστε ερωτήματος , κλειδιού και τιμής για κάθε διακριτικό. Υπολογίστε ομοιότητες για να λάβετε βάρη προσοχής. Ανακατέψτε τιμές ανάλογα. Προσεγμένο στις λεπτομέρειες, κομψό στο πνεύμα.

Προσοχή: Οι μετασχηματιστές κυριαρχούν, δεν μονοπωλούν. Τα CNN, τα RNN και τα σύνολα δέντρων εξακολουθούν να κερδίζουν σε ορισμένους τύπους δεδομένων και περιορισμούς καθυστέρησης/κόστους. Επιλέξτε την αρχιτεκτονική για τη δουλειά, όχι τη διαφημιστική εκστρατεία.

Πώς λειτουργεί η Τεχνητή Νοημοσύνη; Ο πρακτικός αγωγός που θα χρησιμοποιήσετε πραγματικά 🛠️

Διαμόρφωση προβλήματος
Τι προβλέπετε ή δημιουργείτε και πώς θα μετρηθεί η επιτυχία;
δεδομένων
, επισήμανση εάν χρειάζεται, καθαρισμός και διαχωρισμός. Αναμένεται ελλιπείς τιμές και περιπτώσεις ακμής.
Μοντελοποίηση
Ξεκινήστε απλά. Οι γραμμές βάσης (λογιστική παλινδρόμηση, ενίσχυση κλίσης ή ένας μικρός μετασχηματιστής) συχνά υπερτερούν της ηρωικής πολυπλοκότητας.
Εκπαίδευση
Επιλέξτε έναν στόχο, επιλέξτε έναν βελτιστοποιητή, ορίστε υπερπαραμέτρους. Επαναλάβετε.
Αξιολόγηση
Χρησιμοποιήστε παρακράτηση, διασταυρούμενη επικύρωση και μετρήσεις που συνδέονται με τον πραγματικό σας στόχο (ακρίβεια, F1, AUROC, BLEU, αμηχανία, καθυστέρηση).
Ανάπτυξη:
Εξυπηρετήστε πίσω από ένα API ή ενσωματώστε το σε μια εφαρμογή. Παρακολουθήστε την καθυστέρηση, το κόστος, την απόδοση.
Παρακολούθηση & διακυβέρνηση
Παρακολουθήστε την απόκλιση, τη δικαιοσύνη, την ευρωστία και την ασφάλεια. Το Πλαίσιο Διαχείρισης Κινδύνων Τεχνητής Νοημοσύνης του NIST (GOVERN, MAP, MEASURE, MANAGE) είναι μια πρακτική λίστα ελέγχου για αξιόπιστα συστήματα από άκρο σε άκρο [4].

Μικρή περίπτωση: Ένα μοντέλο όρασης ολοκλήρωσε με επιτυχία το εργαστήριο και στη συνέχεια υπέστη σφάλμα στο πεδίο όταν άλλαξε ο φωτισμός. Παρακολούθηση της επισημασμένης απόκλισης στα ιστογράμματα εισόδου. Μια γρήγορη αύξηση + βελτιστοποίηση της απόδοσης αποκατέστησε την τιμή. Βαρετό; Ναι. Αποτελεσματικό; Επίσης, ναι.

Συγκριτικός πίνακας - προσεγγίσεις, για ποιον προορίζονται, πρόχειρο κόστος, γιατί λειτουργούν 📊

Ατελές επίτηδες: μια μικρή άνιση διατύπωση το κάνει να δίνει ανθρώπινη αίσθηση.

Προσέγγιση	Ιδανικό κοινό	Ακριβό	Γιατί λειτουργεί / σημειώσεις
Εποπτευόμενη μάθηση	Αναλυτές, ομάδες προϊόντων	χαμηλό-μεσαίο	Άμεση αντιστοίχιση εισόδου → ετικέτα. Ιδανικό όταν υπάρχουν ετικέτες· αποτελεί τη ραχοκοκαλιά πολλών αναπτυγμένων συστημάτων [1].
Χωρίς επίβλεψη	Εξερευνητές δεδομένων, Έρευνα και Ανάπτυξη	χαμηλός	Βρίσκει συστάδες/συμπιέσεις/λανθάνοντες παράγοντες - καλό για ανακάλυψη και προεκπαίδευση.
Αυτοεπιβλεπόμενο	Ομάδες πλατφόρμας	μέσον	Δημιουργεί τις δικές του ετικέτες από ακατέργαστα δεδομένα-κλίμακες με υπολογισμό και δεδομένα.
Ενισχυτική μάθηση	Ρομποτική, έρευνα επιχειρήσεων	μέτρια–υψηλή	Μαθαίνει πολιτικές από σήματα ανταμοιβής· διαβάστε τους Sutton & Barto για τον κανόνα [5].
Μετασχηματιστές	NLP, όραμα, πολυτροπική	μέτρια–υψηλή	Η αυτοπροσοχή αποτυπώνει τις μακροπρόθεσμες αποστάσεις και παραλληλίζεται καλά· βλέπε την αρχική δημοσίευση [3].
Κλασική Μηχανική Μάθηση (δέντρα)	Εφαρμογές επιχειρήσεων σε μορφή πίνακα	χαμηλός	Φθηνές, γρήγορες, συχνά σοκαριστικά ισχυρές βασικές γραμμές σε δομημένα δεδομένα.
Βασισμένο σε κανόνες/συμβολικό	Συμμόρφωση, ντετερμινιστική	πολύ χαμηλό	Διαφανής λογική· χρήσιμη σε υβριδικά συστήματα όταν χρειάζεστε δυνατότητα ελέγχου.
Αξιολόγηση & κίνδυνος	Καθένας	ποικίλλει	Χρησιμοποιήστε το GOVERN-MAP-MEASURE-MANAGE του NIST για να το διατηρήσετε ασφαλές και χρήσιμο [4].

Τιμολογιακά = επισήμανση δεδομένων + υπολογισμός + άνθρωποι + εξυπηρέτηση.

Βαθιά βουτιά 1 - συναρτήσεις απώλειας, κλίσεις και τα μικροσκοπικά βήματα που αλλάζουν τα πάντα 📉

Φανταστείτε να προσαρμόζετε μια γραμμή για να προβλέψετε την τιμή ενός σπιτιού από το μέγεθος. Επιλέγετε τις παραμέτρους (w) και (b), προβλέπετε (\hat{y} = wx + b) και μετράτε το σφάλμα με τη μέση τετραγωνική απώλεια. Η κλίση σας λέει προς ποια κατεύθυνση να κινηθείτε (w) και (b) για να μειώσετε την απώλεια ταχύτερα - όπως όταν περπατάτε προς τα κάτω στην ομίχλη, νιώθοντας την κλίση του εδάφους. Ενημερώστε μετά από κάθε παρτίδα και η γραμμή σας πλησιάζει περισσότερο στην πραγματικότητα.

Σε deep net είναι το ίδιο τραγούδι με μεγαλύτερη μπάντα. Το Backprop υπολογίζει πώς οι παράμετροι κάθε επιπέδου επηρέασαν το τελικό σφάλμα - αποτελεσματικά - ώστε να μπορείτε να ωθήσετε εκατομμύρια (ή δισεκατομμύρια) κουμπιά προς τη σωστή κατεύθυνση [2].

Βασικές διαισθήσεις:

Η απώλεια διαμορφώνει το τοπίο.
Οι κλίσεις είναι η πυξίδα σας.
Ο ρυθμός μάθησης είναι το μέγεθος του βήματος - πολύ μεγάλος και ταλαντεύεσαι, πολύ μικρός και κοιμάσαι.
Η κανονικοποίηση σας εμποδίζει να απομνημονεύσετε το εκπαιδευτικό σετ σαν παπαγάλος με τέλεια ανάκληση αλλά χωρίς κατανόηση.

Βαθιά κατάδυση 2 - ενσωματώσεις, προτροπή και ανάκτηση 🧭

Οι ενσωματώσεις αντιστοιχίζουν λέξεις, εικόνες ή αντικείμενα σε διανυσματικούς χώρους όπου παρόμοια αντικείμενα προσγειώνονται το ένα κοντά στο άλλο. Αυτό σας επιτρέπει:

βρείτε σημασιολογικά παρόμοια αποσπάσματα
δυναμική αναζήτηση που κατανοεί το νόημα
συνδέστε την επαυξημένη παραγωγή ανάκτησης (RAG) έτσι ώστε ένα γλωσσικό μοντέλο να μπορεί να αναζητήσει δεδομένα πριν γράψει

Η προτροπή είναι ο τρόπος με τον οποίο κατευθύνετε τα γενετικά μοντέλα - περιγράψτε την εργασία, δώστε παραδείγματα, θέστε περιορισμούς. Σκεφτείτε το σαν να γράφετε μια πολύ λεπτομερή περιγραφή για έναν πολύ γρήγορο ασκούμενο: πρόθυμο, περιστασιακά υπερβολικά σίγουρο.

Πρακτική συμβουλή: εάν το μοντέλο σας έχει παραισθήσεις, προσθέστε ανάκτηση, αυστηροποιήστε την προτροπή ή αξιολογήστε με γειωμένες μετρήσεις αντί για «δονήσεις».

Βαθιά βουτιά 3 - αξιολόγηση χωρίς ψευδαισθήσεις 🧪

Η καλή αξιολόγηση είναι βαρετή - αυτό ακριβώς είναι το νόημα.

Χρησιμοποιήστε ένα κλειδωμένο σετ δοκιμών.
Επιλέξτε μια μέτρηση που αντικατοπτρίζει τον πόνο του χρήστη.
Κάνε καταστολές για να ξέρεις τι πραγματικά βοήθησε.
Καταγράψτε τις αποτυχίες με πραγματικά, ακατάστατα παραδείγματα.

Στην παραγωγή, η παρακολούθηση είναι αξιολόγηση που δεν σταματά ποτέ. Συμβαίνει απόκλιση. Εμφανίζεται νέα αργκό, οι αισθητήρες επαναβαθμονομούνται και το χθεσινό μοντέλο παρουσιάζει μικρή απόκλιση. Το πλαίσιο NIST αποτελεί πρακτική αναφορά για τη συνεχή διαχείριση κινδύνου και διακυβέρνηση - όχι ένα έγγραφο πολιτικής που πρέπει να αφήνεται στην άκρη [4].

Μια σημείωση σχετικά με την ηθική, την προκατάληψη και την αξιοπιστία ⚖️

Τα συστήματα Τεχνητής Νοημοσύνης αντικατοπτρίζουν τα δεδομένα και το πλαίσιο ανάπτυξής τους. Αυτό συνεπάγεται κινδύνους: μεροληψία, άνισα σφάλματα μεταξύ ομάδων, ευθραυστότητα υπό την αλλαγή κατανομής. Η ηθική χρήση δεν είναι προαιρετική - είναι διακυβεύματα. Το NIST επισημαίνει συγκεκριμένες πρακτικές: καταγραφή κινδύνων και επιπτώσεων, μέτρηση επιβλαβών μεροληψιών, δημιουργία εφεδρικών λύσεων και ενημέρωση των ανθρώπων όταν τα διακυβεύματα είναι υψηλά [4].

Συγκεκριμένες κινήσεις που βοηθούν:

συλλέγουν ποικίλα, αντιπροσωπευτικά δεδομένα
μετρήστε την απόδοση σε όλους τους υποπληθυσμούς
κάρτες μοντέλων εγγράφων και φύλλα δεδομένων
προσθήκη ανθρώπινης εποπτείας όπου τα διακυβεύματα είναι υψηλά
Σχεδιάστε ασφαλείς λύσεις όταν το σύστημα είναι αβέβαιο

Πώς λειτουργεί η Τεχνητή Νοημοσύνη; Ως νοητικό μοντέλο μπορείτε να το επαναχρησιμοποιήσετε 🧩

Μια συνοπτική λίστα ελέγχου που μπορείτε να εφαρμόσετε σε σχεδόν οποιοδήποτε σύστημα τεχνητής νοημοσύνης:

Ποιος είναι ο στόχος; Πρόβλεψη, κατάταξη, δημιουργία, έλεγχος;
Από πού προέρχεται το μαθησιακό σήμα; Ετικέτες, αυτοεπιβλεπόμενες εργασίες, ανταμοιβές;
Ποια αρχιτεκτονική χρησιμοποιείται; Γραμμικό μοντέλο, δενδροειδές σύνολο, CNN, RNN, μετασχηματιστής [3];
Πώς βελτιστοποιείται; Παραλλαγές κλίσης καθόδου/backprop [2];
Ποιο καθεστώς δεδομένων; Μικρό σύνολο με ετικέτες, ωκεανός κειμένου χωρίς ετικέτες, προσομοιωμένο περιβάλλον;
Ποιες είναι οι τρόποι αστοχίας και οι διασφαλίσεις; Προκατάληψη, απόκλιση, παραίσθηση, καθυστέρηση, χαρτογράφηση κόστους σύμφωνα με το GOVERN-MAP-MEASURE-MANAGE του NIST [4].

Αν μπορείτε να απαντήσετε σε αυτά, ουσιαστικά καταλαβαίνετε το σύστημα - τα υπόλοιπα είναι λεπτομέρειες υλοποίησης και γνώση του τομέα.

Γρήγορες πηγές που αξίζει να προσθέσετε στους σελιδοδείκτες σας 🔖

Εισαγωγή σε απλή γλώσσα στις έννοιες μηχανικής μάθησης (IBM) [1]
Οπισθοδιάδοση με διαγράμματα και ήπια μαθηματικά [2]
Το έγγραφο μετασχηματιστή που άλλαξε τη μοντελοποίηση ακολουθίας [3]
Πλαίσιο Διαχείρισης Κινδύνων Τεχνητής Νοημοσύνης του NIST (πρακτική διακυβέρνηση) [4]
Το εγχειρίδιο κανονικής ενισχυτικής μάθησης (δωρεάν) [5]

Συχνές ερωτήσεις για τον αστραπή ⚡

Είναι η Τεχνητή Νοημοσύνη απλώς στατιστικά στοιχεία;
Είναι στατιστικά στοιχεία συν βελτιστοποίηση, υπολογιστική, μηχανική δεδομένων και σχεδιασμός προϊόντων. Τα στατιστικά στοιχεία είναι ο σκελετός. Τα υπόλοιπα είναι ο μυς.

Κερδίζουν πάντα τα μεγαλύτερα μοντέλα;
Η κλιμάκωση βοηθάει, αλλά η ποιότητα των δεδομένων, η αξιολόγηση και οι περιορισμοί ανάπτυξης συχνά έχουν μεγαλύτερη σημασία. Το μικρότερο μοντέλο που επιτυγχάνει τον στόχο σας είναι συνήθως το καλύτερο για τους χρήστες και τα πορτοφόλια.

Μπορεί η Τεχνητή Νοημοσύνη να καταλάβει;
Ορίστε την έννοια της κατανόησης . Τα μοντέλα αποτυπώνουν τη δομή των δεδομένων και γενικεύουν με εντυπωσιακό τρόπο, αλλά έχουν τυφλά σημεία και μπορεί να κάνουν σίγουρα λάθος. Αντιμετωπίστε τα σαν ισχυρά εργαλεία - όχι σαν σοφούς.

Είναι η εποχή των μετασχηματιστών για πάντα;
Πιθανώς όχι για πάντα. Είναι κυρίαρχη τώρα επειδή η προσοχή παραλληλίζεται και κλιμακώνεται καλά, όπως έδειξε η αρχική δημοσίευση [3]. Αλλά η έρευνα συνεχίζεται.

Πώς λειτουργεί η Τεχνητή Νοημοσύνη; Πολύ καιρό, δεν διάβασα 🧵

Η Τεχνητή Νοημοσύνη μαθαίνει μοτίβα από δεδομένα, ελαχιστοποιεί την απώλεια και γενικεύει σε νέες εισόδους [1,2].
Η επιβλεπόμενη, η μη επιβλεπόμενη, η αυτοεπιβλεπόμενη και η ενισχυτική μάθηση είναι οι κύριες μορφές εκπαίδευσης. Η RL μαθαίνει από τις ανταμοιβές [5].
Τα νευρωνικά δίκτυα χρησιμοποιούν οπισθοδιάδοση και καθοδική κλίση για να προσαρμόσουν αποτελεσματικά εκατομμύρια παραμέτρους [2].
Οι μετασχηματιστές κυριαρχούν σε πολλές εργασίες ακολουθίας επειδή η αυτοπροσοχή καταγράφει τις σχέσεις παράλληλα σε κλίμακα [3].
Η Τεχνητή Νοημοσύνη στον πραγματικό κόσμο είναι ένας αγωγός - από τη διαμόρφωση προβλημάτων έως την ανάπτυξη και τη διακυβέρνηση - και το πλαίσιο του NIST σας κρατάει ειλικρινείς σχετικά με τον κίνδυνο [4].

Αν κάποιος σας ρωτήσει ξανά « Πώς λειτουργεί η Τεχνητή Νοημοσύνη;» , μπορείτε να χαμογελάσετε, να πιείτε έναν καφέ και να πείτε: μαθαίνει από δεδομένα, βελτιστοποιεί μια απώλεια και χρησιμοποιεί αρχιτεκτονικές όπως μετασχηματιστές ή σύνολα δέντρων ανάλογα με το πρόβλημα. Στη συνέχεια, προσθέστε ένα κλείσιμο του ματιού, γιατί αυτό είναι απλό και ύπουλα ολοκληρωμένο. 😉

Αναφορές

[1] IBM - Τι είναι η Μηχανική Μάθηση;
διαβάστε περισσότερα

[2] Michael Nielsen - Πώς λειτουργεί ο αλγόριθμος οπισθοδιάδοσης
διαβάστε περισσότερα

[3] Vaswani et al. - Η προσοχή είναι το μόνο που χρειάζεσαι (arXiv)
διαβάστε περισσότερα

[4] NIST - Πλαίσιο Διαχείρισης Κινδύνων Τεχνητής Νοημοσύνης (AI RMF 1.0)
διαβάστε περισσότερα

[5] Sutton & Barto - Ενισχυτική Μάθηση: Εισαγωγή (2η έκδοση)
διαβάστε περισσότερα

Βρείτε την τελευταία λέξη της Τεχνητής Νοημοσύνης στο επίσημο κατάστημα βοηθών τεχνητής νοημοσύνης

Σχετικά με εμάς

Επιστροφή στο ιστολόγιο

Χώρα/περιοχή