Από πού αντλεί πληροφορίες η Τεχνητή Νοημοσύνη

Από πού αντλεί τις πληροφορίες της η Τεχνητή Νοημοσύνη;

Έχετε ποτέ καθίσει εκεί και ξύνετε το κεφάλι σας, ρωτώντας... από πού προέρχονται στην πραγματικότητα όλα αυτά ; Θέλω να πω, η Τεχνητή Νοημοσύνη δεν ψάχνει σε σκονισμένες βιβλιοθήκες ούτε βλέπει κρυφά σύντομα βίντεο στο YouTube. Κι όμως, με κάποιο τρόπο, βγάζει απαντήσεις για τα πάντα - από κόλπα για λαζάνια μέχρι φυσική μαύρης τρύπας - σαν να έχει μέσα κάποιο απύθμενο ντουλάπι αρχειοθέτησης. Η πραγματικότητα είναι πιο περίεργη και ίσως πιο ενδιαφέρουσα από ό,τι θα μαντεύατε. Ας το αναλύσουμε λίγο (και ναι, ίσως να καταρρίψουμε μερικούς μύθους στην πορεία).


Είναι Μαγεία; 🌐

Δεν είναι μαγεία, αν και μερικές φορές έτσι φαίνεται. Αυτό που συμβαίνει κάτω από την κουκούλα είναι βασικά η πρόβλεψη μοτίβων . Τα μεγάλα γλωσσικά μοντέλα (LLM) δεν αποθηκεύουν δεδομένα με τον τρόπο που ο εγκέφαλός σας κρατάει τη συνταγή για μπισκότα της γιαγιάς σας. Αντίθετα, είναι εκπαιδευμένα να μαντεύουν την επόμενη λέξη (συμβολική ένδειξη) με βάση την προηγούμενη [2]. Στην πράξη, αυτό σημαίνει ότι προσκολλώνται στις σχέσεις: ποιες λέξεις κρέμονται μεταξύ τους, πώς σχηματίζονται συνήθως οι προτάσεις, πώς ολόκληρες ιδέες δομούνται σαν σκαλωσιά. Γι' αυτό το αποτέλεσμα ακούγεται σωστό, παρόλο που -με πλήρη ειλικρίνεια- είναι στατιστική μίμηση, όχι κατανόηση [4].

Τι κάνει, λοιπόν, στην πραγματικότητα χρήσιμες ; Μερικά πράγματα:

  • Ποικιλομορφία δεδομένων - άντληση από αμέτρητες πηγές, όχι από ένα στενό ρεύμα.

  • Ενημερώσεις - χωρίς κύκλους ανανέωσης, φθαρεί γρήγορα.

  • Φιλτράρισμα - ιδανικά, πιάνουμε τα σκουπίδια πριν εισχωρήσουν (αν και, ας είμαστε ειλικρινείς, αυτό το δίχτυ έχει τρύπες).

  • Διασταύρωση δεδομένων - βασιζόμενοι σε πηγές κύρους (π.χ. NASA, ΠΟΥ, μεγάλα πανεπιστήμια), κάτι που είναι απαραίτητο στα περισσότερα εγχειρίδια διακυβέρνησης της Τεχνητής Νοημοσύνης [3].

Παρόλα αυτά, μερικές φορές κατασκευάζεται - με σιγουριά. Αυτές οι λεγόμενες παραισθήσεις ; Ουσιαστικά γυαλισμένες ανοησίες που παραδίδονται με σοβαρό ύφος [2][3].

Άρθρα που ίσως σας ενδιαφέρουν μετά από αυτό:

🔗 Μπορεί η Τεχνητή Νοημοσύνη να προβλέψει τους αριθμούς της λαχειοφόρου αγοράς;
Εξερευνώντας μύθους και γεγονότα σχετικά με τις προβλέψεις λαχειοφόρων αγορών με τεχνητή νοημοσύνη.

🔗 Τι σημαίνει μια ολιστική προσέγγιση στην Τεχνητή Νοημοσύνη
Κατανόηση της Τεχνητής Νοημοσύνης με ισορροπημένες προοπτικές σχετικά με την ηθική και τον αντίκτυπο.

🔗 Τι λέει η Βίβλος για την τεχνητή νοημοσύνη
Εξέταση βιβλικών προοπτικών σχετικά με την τεχνολογία και την ανθρώπινη δημιουργία.


Γρήγορη Σύγκριση: Από πού αντλεί η Τεχνητή Νοημοσύνη 📊

Δεν είναι όλες οι πηγές ίδιες, αλλά η καθεμία παίζει τον ρόλο της. Ακολουθεί μια συνοπτική προβολή.

Τύπος πηγής Ποιος το χρησιμοποιεί (Τεχνητή Νοημοσύνη) Κόστος/Αξία Γιατί λειτουργεί (ή δεν λειτουργεί...)
Βιβλία & Άρθρα Μεγάλα γλωσσικά μοντέλα Ανεκτίμητο (σχεδόν) Πυκνή, δομημένη γνώση - απλώς γερνάει γρήγορα.
Ιστότοποι & Ιστολόγια Σχεδόν όλες οι Τεχνητές Νοημοσύνης Δωρεάν (με θόρυβο) Άγρια ποικιλία· μείγμα λαμπρότητας και απόλυτης σκουπιδιών.
Ακαδημαϊκές Εργασίες Τεχνητές Νοημοσύνης με έντονη ερευνητική δραστηριότητα Μερικές φορές με paywall Αυστηρότητα + αξιοπιστία, αλλά διατυπωμένα με βαριά ορολογία.
Δεδομένα χρήστη Εξατομικευμένες Τεχνητές Νοημοσύνης Εξαιρετικά ευαίσθητο ⚠️ Κομψή ραπτική, αλλά και πολλοί πονοκέφαλοι που αφορούν την ιδιωτικότητα.
Ιστός σε πραγματικό χρόνο Τεχνητές νοημοσύνης που συνδέονται με την αναζήτηση Δωρεάν (αν είναι online) Διατηρεί τις πληροφορίες ενημερωμένες. Το μειονέκτημα είναι ο κίνδυνος διεύρυνσης των φημών.

Το Σύμπαν των Δεδομένων Εκπαίδευσης 🌌

Αυτή είναι η φάση της «παιδικής μάθησης». Φανταστείτε να δίνετε σε ένα παιδί εκατομμύρια βιβλία με παραμύθια, αποκόμματα ειδήσεων και αστεία άρθρα της Wikipedia ταυτόχρονα. Έτσι μοιάζει η προεκπαίδευση. Στον πραγματικό κόσμο, οι πάροχοι συνδυάζουν δημόσια διαθέσιμα δεδομένα, αδειοδοτημένες πηγές και κείμενο που δημιουργείται από εκπαιδευτές [2].

Σε στρώσεις από πάνω: επιμελημένα ανθρώπινα παραδείγματα - καλές απαντήσεις, κακές απαντήσεις, ωθήσεις προς τη σωστή κατεύθυνση - πριν καν ξεκινήσει η ενίσχυση [1].

Προειδοποίηση διαφάνειας: οι εταιρείες δεν αποκαλύπτουν κάθε λεπτομέρεια. Ορισμένα προστατευτικά κιγκλιδώματα είναι εμπιστευτικά (διανοητική κυριότητα, ζητήματα ασφάλειας), επομένως έχετε μόνο μια μερική εικόνα για το πραγματικό μείγμα [2].


Αναζήτηση σε πραγματικό χρόνο: Το επιπλέον υλικό 🍒

Ορισμένα μοντέλα μπορούν πλέον να ξεφύγουν από τη φούσκα εκπαίδευσής τους. Αυτή είναι η γενιά με επαυξημένη ανάκτηση (RAG) - ουσιαστικά η εξαγωγή τμημάτων από ένα ενεργό ευρετήριο ή ένα κατάστημα εγγράφων και η ένταξή τους στην απάντηση [5]. Ιδανικό για γρήγορα μεταβαλλόμενα θέματα, όπως τίτλους ειδήσεων ή τιμές μετοχών.

Το πρόβλημα; Το διαδίκτυο είναι εξίσου ιδιοφυΐα και φωτιά σκουπιδιών. Εάν τα φίλτρα ή οι έλεγχοι προέλευσης είναι αδύναμοι, υπάρχει κίνδυνος να επιστρέψουν άχρηστα δεδομένα - ακριβώς για αυτό που προειδοποιούν τα πλαίσια κινδύνου [3].

Μια συνηθισμένη λύση: οι εταιρείες συνδέουν τα μοντέλα με τις δικές τους εσωτερικές βάσεις δεδομένων, έτσι ώστε οι απαντήσεις να αναφέρουν μια τρέχουσα πολιτική HR ή ένα ενημερωμένο έγγραφο προϊόντος αντί να το υπερβάλλουν. Σκεφτείτε: λιγότερες στιγμές «ωχ», περισσότερες αξιόπιστες απαντήσεις.


Βελτιστοποίηση: Βήμα βελτίωσης της Τεχνητής Νοημοσύνης 🧪

Τα ακατέργαστα προ-εκπαιδευμένα μοντέλα είναι αδέξια. Έτσι, βελτιστοποιούνται :

  • Διδάσκοντάς τους να είναι χρήσιμοι, ακίνδυνοι, ειλικρινείς (μέσω ενισχυτικής μάθησης από ανθρώπινη ανατροφοδότηση, RLHF) [1].

  • Τρίψιμο σε μη ασφαλείς ή τοξικές ακμές (ευθυγράμμιση) [1].

  • Προσαρμογή στον τόνο - είτε αυτός είναι φιλικός, επίσημος είτε παιχνιδιάρικα σαρκαστικός.

Δεν είναι τόσο το γυάλισμα ενός διαμαντιού, όσο το να οδηγήσεις μια στατιστική χιονοστιβάδα να συμπεριφέρεται περισσότερο σαν συνομιλητής.


Τα χτυπήματα και οι αποτυχίες 🚧

Ας μην προσποιούμαστε ότι είναι άψογο:

  • Παραισθήσεις - σαφείς απαντήσεις που είναι εντελώς λανθασμένες [2][3].

  • Προκατάληψη - αντικατοπτρίζει μοτίβα που έχουν ενσωματωθεί στα δεδομένα· μπορεί ακόμη και να τα ενισχύσει εάν δεν ελεγχθεί [3][4].

  • Δεν έχει εμπειρία από πρώτο χέρι - μπορεί να μιλάει για συνταγές σούπας αλλά ποτέ δεν έχει δοκιμάσει [4].

  • Υπερβολική αυτοπεποίθηση - η πρόζα ρέει σαν να ξέρει, ακόμα και όταν δεν ξέρει. Τα πλαίσια κινδύνου δίνουν έμφαση στις υποτιθέμενες υποθέσεις [3].


Γιατί είναι σαν να ξέρεις 🧠

Δεν έχει πεποιθήσεις, δεν έχει μνήμη με την ανθρώπινη έννοια και σίγουρα δεν έχει εαυτό. Ωστόσο, επειδή συνδέει ομαλά τις προτάσεις, ο εγκέφαλός σας το διαβάζει σαν να καταλαβαίνει . Αυτό που συμβαίνει είναι απλώς μια μαζική πρόβλεψη του επόμενου συμβολισμού : η επεξεργασία τρισεκατομμυρίων πιθανοτήτων σε κλάσματα δευτερολέπτου [2].

Η ατμόσφαιρα της «νοημοσύνης» είναι η αναδυόμενη συμπεριφορά - οι ερευνητές την αποκαλούν, λίγο ειρωνικά, το του «στοχαστικού παπαγάλου» [4].


Αναλογία κατάλληλη για παιδιά 🎨

Φανταστείτε έναν παπαγάλο που έχει διαβάσει όλα τα βιβλία της βιβλιοθήκης. Δεν καταλαβαίνει τις ιστορίες, αλλά μπορεί να αναμειχθεί με τις λέξεις σε κάτι που του δίνει μια σοφή αίσθηση. Μερικές φορές είναι άψογο, μερικές φορές είναι ανοησίες - αλλά με αρκετή φινέτσα, δεν μπορείς πάντα να καταλάβεις τη διαφορά.


Συνοψίζοντας: Από πού προέρχονται οι πληροφορίες της τεχνητής νοημοσύνης 📌

Με απλά λόγια:

  • Μαζικά δεδομένα εκπαίδευσης (δημόσια + αδειοδοτημένα + δημιουργημένα από εκπαιδευτές) [2].

  • Βελτιστοποίηση με ανθρώπινη ανατροφοδότηση για τη διαμόρφωση του τόνου/συμπεριφοράς [1].

  • Συστήματα ανάκτησης όταν συνδέονται με ζωντανές ροές δεδομένων [5].

Η τεχνητή νοημοσύνη δεν «γνωρίζει» πράγματα - προβλέπει κείμενο . Αυτή είναι ταυτόχρονα η υπερδύναμή της και η αχίλλειος πτέρνα της. Συμπέρασμα; Να διασταυρώνετε πάντα τα σημαντικά στοιχεία με μια αξιόπιστη πηγή [3].


Αναφορές

  1. Ouyang, L. et al. (2022). Εκπαίδευση γλωσσικών μοντέλων για την τήρηση οδηγιών με ανθρώπινη ανατροφοδότηση (InstructGPT) . arXiv .

  2. OpenAI (2023). Τεχνική Έκθεση GPT-4 - μείγμα αδειοδοτημένων, δημόσιων και δεδομένων που δημιουργήθηκαν από τον άνθρωπο· στόχος και περιορισμοί πρόβλεψης επόμενου διακριτικού. arXiv .

  3. NIST (2023). Πλαίσιο Διαχείρισης Κινδύνων Τεχνητής Νοημοσύνης (AI RMF 1.0) - προέλευση, αξιοπιστία και έλεγχοι κινδύνου. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Σχετικά με τους κινδύνους των στοχαστικών παπαγάλων: Μπορούν τα γλωσσικά μοντέλα να είναι πολύ μεγάλα; PDF .

  5. Lewis, P. et al. (2020). Επαυξημένη Ανάκτηση για NLP Εντατικής Γνώσης . arXiv .


Βρείτε την τελευταία λέξη της Τεχνητής Νοημοσύνης στο επίσημο κατάστημα βοηθών τεχνητής νοημοσύνης

Σχετικά με εμάς

Επιστροφή στο ιστολόγιο