Τι είναι ένα Token στην Τεχνητή Νοημοσύνη;

Τι είναι ένα Token στην Τεχνητή Νοημοσύνη; [Βίντεο και Κουίζ]

Συνοπτική απάντηση: Ένα διακριτικό είναι ένα μικρό κομμάτι κειμένου ή δεδομένων που ένα μοντέλο τεχνητής νοημοσύνης μετατρέπει σε αριθμούς και διαδικασίες. Τα διακριτικά επηρεάζουν το κόστος, την ταχύτητα, τη μνήμη και το μήκος εξόδου. Όταν μια προτροπή υπερβαίνει το παράθυρο περιβάλλοντος, σημαντικό περιεχόμενο μπορεί να περικοπεί, να συνοψιστεί ή να εξαιρεθεί.

Βασικά συμπεράσματα:

Συμβολοποίηση: Οι λέξεις, τα σημεία στίξης, τα κενά και ο κώδικας μπορούν να χωριστούν με διαφορετικούς τρόπους.

Συμφραζόμενα: Διατηρήστε τις απαραίτητες πληροφορίες εντός του διαθέσιμου παραθύρου διακριτικών του μοντέλου.

Κόστος: Μείωση των επαναλαμβανόμενων οδηγιών και του περιττού κειμένου σε ροές εργασίας τεχνητής νοημοσύνης μεγάλου όγκου.

Σαφήνεια: Διατυπώστε νωρίς την κύρια εργασία και οργανώστε τις απαιτήσεις με σαφείς ετικέτες.

Αποδοτικότητα: Χωρίστε τα υπερμεγέθη έγγραφα σε λογικές ενότητες πριν συνδυάσετε τα ευρήματα.

Τι είναι ένα διακριτικό στην Τεχνητή Νοημοσύνη; Πληροφοριακό γράφημα

Άρθρα που ίσως σας ενδιαφέρουν μετά από αυτό:

🔗 Ποιοι είναι οι τύποι Τεχνητής Νοημοσύνης;
Κατανοήστε τις κατηγορίες Τεχνητής Νοημοσύνης με βάση τις δυνατότητες, τη λειτουργικότητα, το στυλ εκπαίδευσης και την πρακτική χρήση.

🔗 Τι είναι τα γυαλιά AI;
Εξερευνήστε τις λειτουργίες των έξυπνων γυαλιών, τις χρήσεις hands-free, την ιδιωτικότητα και τους πρακτικούς περιορισμούς.

🔗 Τι είναι η Τεχνητή Νοημοσύνη (AI TV);
Μάθετε πώς η Τεχνητή Νοημοσύνη βελτιώνει την εικόνα, τον ήχο, την αναζήτηση, τις προτάσεις και την προσβασιμότητα.

🔗 Τι είναι η κακή χρήση της Τεχνητής Νοημοσύνης;
Αναγνωρίστε περιεχόμενο Τεχνητής Νοημοσύνης χαμηλής ποιότητας και βελτιώστε την ακρίβεια, την πρωτοτυπία και τον σκοπό.


1. Τι είναι ένα Token στην Τεχνητή Νοημοσύνη; Η απλή απάντηση

Ένα διακριτικό (token) στην Τεχνητή Νοημοσύνη (AI) είναι μια μονάδα κειμένου που χρησιμοποιεί ένα μοντέλο για να κατανοήσει και να δημιουργήσει γλώσσα.

Για παράδειγμα, η πρόταση:

Λατρεύω την πίτσα.

Μπορεί να χωριστεί σε διακριτικά όπως:

  • εγώ

  • αγάπη

  • πίτσα

  • .

Αρκετά απλό.

Αλλά δεν είναι πάντα τόσο εύστοχο. Μια μεγαλύτερη ή ασυνήθιστη λέξη μπορεί να χωριστεί σε μικρότερα κομμάτια. Για παράδειγμα:

απίστευτος

Θα μπορούσε να γίνει κάτι σαν:

  • Ηνωμένα Έθνη

  • πιστεύω

  • ικανός

Διαφορετικά συστήματα τεχνητής νοημοσύνης χρησιμοποιούν διαφορετικούς tokenizers, επομένως η ακριβής διαίρεση μπορεί να διαφέρει. Αυτός είναι ο λόγος για τον οποίο τα tokens μπορεί να φαίνονται λίγο ασαφή. Δεν είναι ακριβώς λέξεις, ούτε ακριβώς γράμματα, ούτε πάντα συλλαβές.

Ένας καλύτερος τρόπος να το σκεφτείτε είναι ο εξής:

Τα tokens είναι τα μικρά κομμάτια γλώσσας που μπορεί να αφομοιώσει ένα μοντέλο τεχνητής νοημοσύνης. 🍽️

Όταν κάνετε μια ερώτηση σε ένα chatbot, το σύστημα δεν απορροφά την πρότασή σας ως μία ομαλή ανθρώπινη σκέψη. Διαχωρίζει τα δεδομένα εισόδου σε διακριτικά, τα μετατρέπει σε αριθμούς, επεξεργάζεται τις σχέσεις τους και στη συνέχεια προβλέπει το πιο πιθανό επόμενο διακριτικό, ξανά και ξανά, μέχρι να σχηματίσει μια απάντηση.

Έτσι, όταν οι άνθρωποι ρωτούν, Τι είναι ένα Token στην Τεχνητή Νοημοσύνη;,η απάντηση δεν είναι απλώς «ένα κομμάτι κειμένου». Είναι η βασική μονάδα εργασίας που καθιστά δυνατή την Τεχνητή Νοημοσύνη στη γλώσσα.


2. Γιατί τα Tokens έχουν μεγαλύτερη σημασία από ό,τι περιμένουν οι άνθρωποι

Τα tokens έχουν σημασία επειδή επηρεάζουν σχεδόν τα πάντα σχετικά με τον τρόπο λειτουργίας των εργαλείων τεχνητής νοημοσύνης.

Επηρεάζουν:

  • Πόσο κείμενο μπορεί να χειριστεί μια τεχνητή νοημοσύνη ταυτόχρονα

  • Πόσο κοστίζει ένα αίτημα σε πολλά συστήματα τεχνητής νοημοσύνης

  • Πόσο γρήγορα ανταποκρίνεται ένα μοντέλο

  • Πόσες λεπτομέρειες μπορεί να θυμάται το μοντέλο

  • Πόσο ακριβώς κατανοεί το μοντέλο την προτροπή σας

  • Πόσο μεγάλη μπορεί να είναι η απάντηση

Εδώ είναι που γίνεται εκπληκτικά πρακτικό.

Όταν ένα εργαλείο τεχνητής νοημοσύνης λέει ότι έχει ένα «παράθυρο περιβάλλοντος», αυτό συνήθως σημαίνει τον μέγιστο αριθμό διακριτικών που μπορεί να λάβει υπόψη ταυτόχρονα. Η προτροπή σας, το ιστορικό συνομιλιών, το μεταφορτωμένο κείμενο, οι οδηγίες συστήματος και η απάντηση του μοντέλου καταλαμβάνουν όλα διακριτικά.

Έτσι, αν επικολλήσετε ένα τεράστιο έγγραφο σε έναν βοηθό τεχνητής νοημοσύνης και στη συνέχεια ρωτήσετε «Συνοψίστε το», το μοντέλο πρέπει να χωρέσει αυτό το κείμενο εντός του ορίου διακριτικών του. Εάν το περιεχόμενο είναι πολύ μεγάλο, ορισμένα μέρη ενδέχεται να αποκοπούν, να συμπιεστούν ή να αγνοηθούν, ανάλογα με τον τρόπο σχεδιασμού του εργαλείου.

Τα Tokens δεν είναι απλώς τεχνικές γνώσεις. Είναι ο χώρος στο γραφείο της Τεχνητής Νοημοσύνης. Πολύ χαρτί στο γραφείο και τα πράγματα αρχίζουν να γλιστρούν από την άκρη 📄.


3. Τα Tokens δεν είναι το ίδιο με τις λέξεις

Αυτή είναι ίσως η μεγαλύτερη παρεξήγηση.

Ένα διακριτικό δεν είναι πάντα μία λέξη.

Μερικές φορές μια λέξη ισούται με ένα σύμβολο. Μερικές φορές μια λέξη γίνεται πολλά σύμβολα. Μερικές φορές η στίξη ή τα κενά μετράνε ως ξεχωριστά σύμβολα. Ενοχλητικό; Λίγο. Σημαντικό; Πολύ.

Ακολουθεί ένα πρόχειρο παράδειγμα:

Παράδειγμα κειμένου Πιθανή διαίρεση διακριτικών Τι σημαίνει αυτό
γάτα γάτα Μια απλή λέξη, πιθανώς ένα σύμβολο
γάτες γάτες ή γάτα + s Εξαρτάται από το tokenizer
διεθνοποίηση διεθνής + οποίηση ή μικρότερα κομμάτια Οι μακριές λέξεις συχνά χωρίζονται
Με τεχνητή νοημοσύνη Με τεχνολογία AI + - + Η στίξη μπορεί να μετράει
Γεια!!! Γεια + ! + ! + ! Ναι, η στίξη μπορεί επίσης να καταναλώσει διακριτικά
υπερκαλιφρακτιλιστικός αρκετά κομμάτια, πιθανώς Το μοντέλο αναστενάζει εσωτερικά, υποθέτω 😅

Δεν υπάρχει ένας καθολικός κανόνας που να λειτουργεί τέλεια για κάθε μοντέλο.

Μια συνηθισμένη, πρόχειρη εκτίμηση είναι ότι ένα διακριτικό συχνά αντιπροσωπεύει περίπου μερικούς χαρακτήρες ή μέρος μιας λέξης. Αλλά αυτός είναι απλώς ένας εμπειρικός κανόνας, όχι κάτι που ισχύει. Το αγγλικό κείμενο συνήθως μετατρέπεται σε διακριτικά πιο αποτελεσματικά από ορισμένες άλλες γλώσσες και ο κώδικας μπορεί να συμπεριφερθεί διαφορετικά.

Αυτός είναι ο λόγος για τον οποίο μια σύντομη πρόταση μπορεί να χρησιμοποιεί περισσότερα διακριτικά από το αναμενόμενο. Και μια μεγάλη παράγραφος με κοινές λέξεις μπορεί να μετατραπεί σε διακριτικά πιο ομαλά από μια παράγραφο γεμάτη με τεχνικούς όρους, σύμβολα ή ασυνήθιστη μορφοποίηση.


4. Πώς η Τεχνητή Νοημοσύνη χρησιμοποιεί τα Tokens για τη δημιουργία κειμένου

Εδώ είναι το ελαφρώς μαγικό κομμάτι - αν και είναι μαθηματικά φορώντας καπέλο μάγου 🧙.

Όταν πληκτρολογείτε μια προτροπή, το σύστημα τεχνητής νοημοσύνης κάνει κάτι σαν αυτό:

  1. Χωρίζει το κείμενό σας σε διακριτικά

  2. Μετατρέπει κάθε διακριτικό σε αριθμό ή αριθμητική αναπαράσταση

  3. Αναλύει μοτίβα και σχέσεις συμβολισμών

  4. Προβλέπει το επόμενο πιθανό διακριτικό

  5. Επαναλαμβάνει αυτή τη διαδικασία πρόβλεψης

  6. Μετατρέπει τα δημιουργημένα tokens σε ευανάγνωστο κείμενο

Έτσι, αν πληκτρολογήσετε:

Ο ουρανός είναι

Το μοντέλο θα μπορούσε να προβλέψει:

μπλε

Αλλά θα μπορούσε επίσης να προβλέψει:

συννεφιασμένος ουρανός, γεμάτος αστέρια, χωρίς όρια


Η επιλεγμένη έξοδος εξαρτάται από το μοντέλο, την προτροπή, το πλαίσιο και τις ρυθμίσεις που ελέγχουν την τυχαιότητα ή τη δημιουργικότητα.

Αυτός είναι ο λόγος για τον οποίο η γραφή με τεχνητή νοημοσύνη μερικές φορές φαίνεται άψογη και μερικές φορές περιπλανιέται στα ζιζάνια. Πρόκειται για την πρόβλεψη του ενός νομίσματος μετά το άλλο με βάση μαθημένα μοτίβα, όχι για την εξαγωγή ολοκληρωμένων προτάσεων από ένα ντουλάπι αρχειοθέτησης.

Αυτό δεν σημαίνει ότι το μοντέλο «απλώς συμπληρώνεται αυτόματα» με την βαρετή έννοια. Τα μεγάλα μοντέλα τεχνητής νοημοσύνης μαθαίνουν εξαιρετικά πολύπλοκες σχέσεις μεταξύ εννοιών, γλώσσας, δομής, τόνου, λογικής και συμφραζομένων. Αλλά σε επίπεδο εξόδου, η μηχανή εξακολουθεί να παράγει κείμενο, ένα διακριτικό κάθε φορά.

Μικρά σκαλοπάτια. Μεγάλη ψευδαίσθηση. Πολύ φανταχτερή σκάλα.


5. Συγκριτικός Πίνακας: Τύποι Tokens στην Τεχνητή Νοημοσύνη

Τα tokens μπορούν να εμφανίζονται με διαφορετικές μορφές ανάλογα με το μοντέλο, τον tokenizer και τον τύπο περιεχομένου. Ακολουθεί μια πρακτική σύγκριση.

Τύπος διακριτικού Παράδειγμα Πού εμφανίζεται Γιατί έχει σημασία
Λέξη-κλειδί μήλο Απλές προτροπές κειμένου Εύκολο στην κατανόηση, καθαρό και τακτοποιημένο
διακριτικό υπολέξης παιχνίδι + ing Μεγαλύτερες ή τροποποιημένες λέξεις Βοηθά την Τεχνητή Νοημοσύνη να χειρίζεται άγνωστες λέξεις
διακριτικό χαρακτήρα α, β, γ Ορισμένα συστήματα tokenization Ευέλικτο, αλλά μπορεί να είναι αναποτελεσματικό
διακριτικό στίξης ., ?, ! Κάθε είδους γραφή, ενοχλητικά Επηρεάζει τον αριθμό τόνων και διακριτικών
διακριτικό κενού χώρου κενά, αλλαγές γραμμής Μορφοποιημένο κείμενο και κώδικας Η μορφοποίηση δεν είναι δωρεάν, δυστυχώς
Κωδικός διακριτικού λειτουργία, {, == Προτροπές προγραμματισμού Ο κώδικας μπορεί να κάψει γρήγορα tokens
Ειδικό διακριτικό δείκτες έναρξης/τέλους Πίσω από τις κάμερες Βοηθά στην εισαγωγή της δομής του μοντέλου
Άγνωστο ή σπάνιο κομμάτι ασυνήθιστα θραύσματα Ονόματα, αργκό, τυπογραφικά λάθη Μπορεί να επηρεάσει λίγο την ακρίβεια

Δεν τα χρησιμοποιεί όλα αυτά όλα κάθε μοντέλο τεχνητής νοημοσύνης με τον ίδιο τρόπο. Ορισμένα συστήματα βασίζονται σε μεγάλο βαθμό στην μετατροπή των υπολέξεων σε διακριτικά, επειδή αυτό εξισορροπεί την αποτελεσματικότητα με την ευελιξία. Επιτρέπει στο μοντέλο να χειρίζεται λέξεις που δεν έχει ξαναδεί ακριβώς, χωρίζοντάς τες σε κομμάτια που αναγνωρίζει.

Για παράδειγμα, εάν το μοντέλο κατανοεί τις έννοιες μικρο, βιοκαι λογία, έχει καλύτερες πιθανότητες να εργαστεί με σύνθετες επιστημονικές λέξεις ακόμα και όταν είναι ασυνήθιστες.

Όχι τέλειο. Αλλά αρκετά έξυπνο. 🧩


6. Τι είναι ένα Token στην Τεχνητή Νοημοσύνη; Γιατί επηρεάζει το κόστος

Πολλά εργαλεία τεχνητής νοημοσύνης μετρούν τη χρήση σε διακριτικά (tokens).

Αυτό σημαίνει ότι τόσο η δική σας είσοδος όσο και η έξοδος της Τεχνητής Νοημοσύνης μπορούν να υπολογιστούν για τη χρήση. Εάν στείλετε μια μεγάλη προτροπή, αυτό χρησιμοποιεί περισσότερα διακριτικά. Εάν το μοντέλο γράψει μια μεγάλη απάντηση, αυτό χρησιμοποιεί επίσης περισσότερα διακριτικά.

Μια σύντομη ερώτηση όπως:

Εξηγήστε τη βαρύτητα.

Χρησιμοποιεί σχετικά λίγα διακριτικά εισόδου.

Αλλά αυτή η προτροπή:

Εξηγήστε τη βαρύτητα με λεπτομερή, φιλικό προς τους αρχάριους τρόπο, συμπεριλάβετε παραδείγματα, συγκρίνετέ την με τον μαγνητισμό, προσθέστε έναν πίνακα, ξαναγράψτε τον για ένα παιδί και μετά μετατρέψτε τον σε ομιλία.

Χρησιμοποιεί περισσότερα διακριτικά εισόδου και ζητά επίσης μεγαλύτερη διάρκεια εξόδου.

Έτσι, το κόστος των συμβολαίων συχνά προέρχεται και από τις δύο πλευρές:

  • Εισαγωγικά διακριτικά - τι στέλνετε στο μοντέλο

  • Εξερχόμενα διακριτικά - τι παράγει το μοντέλο

  • διακριτικά περιβάλλοντος - προηγούμενη συνομιλία ή έγγραφα που περιλαμβάνονται

  • Διακριτικά συστήματος - κρυφές οδηγίες που καθοδηγούν τη συμπεριφορά

Αυτός είναι ο λόγος για τον οποίο οι πολύ μεγάλες συνομιλίες μπορεί να φαίνονται πιο αργές ή πιο περιορισμένες. Η Τεχνητή Νοημοσύνη μπορεί να μεταφέρει τα προηγούμενα μέρη της συνομιλίας στο πλαίσιό της. Σαν ένα σακίδιο γεμάτο με τούβλα. Πολύτιμα τούβλα, αλλά παρόλα αυτά τούβλα.

Για τις επιχειρήσεις που χρησιμοποιούν Τεχνητή Νοημοσύνη μέσω API, η αποδοτικότητα των token μπορεί να γίνει ζήτημα προϋπολογισμού. Μια περίπλοκη προτροπή που επαναλαμβάνεται χιλιάδες φορές μπορεί να σπαταλήσει ένα εκπληκτικά μεγάλο ποσό χρημάτων. Η καθαρή προτροπή δεν είναι απλώς πιο όμορφη - μπορεί να είναι και φθηνότερη.


7. Όρια διακριτικών και το παράθυρο περιβάλλοντος τεχνητής νοημοσύνης

Το παράθυρο περιβάλλοντος είναι μια από τις πιο σημαντικές ιδέες που συνδέονται με τα tokens.

Αναφέρεται στον αριθμό των διακριτικών που μπορεί να επεξεργαστεί ένα μοντέλο τεχνητής νοημοσύνης ταυτόχρονα. Αυτό περιλαμβάνει την προτροπή σας, τα προηγούμενα μηνύματα, τα επικολλημένα έγγραφα, τις οδηγίες και την απόκριση που δημιουργείται.

Φανταστείτε ότι η Τεχνητή Νοημοσύνη έχει έναν πίνακα. Όλα όσα πρέπει να λάβει υπόψη της πρέπει να χωράνε σε αυτόν τον πίνακα. Μόλις γεμίσει ο πίνακας, κάτι πρέπει να αλλάξει.

Αυτό μπορεί να οδηγήσει σε μερικές καταστάσεις:

  • Το μοντέλο μπορεί να ξεχάσει τα προηγούμενα μέρη μιας μακράς συζήτησης

  • Ένα έγγραφο μπορεί να χρειαστεί να συνοψιστεί πριν από την ανάλυση

  • Οι μακροσκελείς ερωτήσεις μπορεί να αφήνουν λιγότερο χώρο για μακροσκελείς απαντήσεις

  • Το επαναλαμβανόμενο πλαίσιο μπορεί να παρακάμψει σημαντικές λεπτομέρειες

  • Το μοντέλο μπορεί να εστιάζει περισσότερο σε πρόσφατες πληροφορίες

Γι' αυτό έχει σημασία ο άμεσος σχεδιασμός.

Μια προτροπή όπως:

Διάβασε όλα αυτά και πες μου τι έχει σημασία.

Μπορεί να λειτουργήσει, αλλά μπορεί να μην είναι ιδανικό.

Μια καλύτερη προτροπή θα μπορούσε να πει:

Συνοψίστε το κύριο επιχείρημα, απαριθμήστε τους κινδύνους, εντοπίστε τις αντιφάσεις και δώστε μου τα πέντε κορυφαία σημεία δράσης.

Αυτό δίνει στο μοντέλο μια πιο σαφή εργασία και το βοηθά να ξοδεύει μάρκες σε πολύτιμη εργασία αντί να μαντεύει την πρόθεσή σας.

Τα tokens δεν αποτελούν απλώς ένα τεχνικό όριο. Διαμορφώνουν τον τρόπο με τον οποίο πρέπει να επικοινωνείτε με την Τεχνητή Νοημοσύνη.


8. Γιατί η δημιουργία διακριτικών βοηθά την τεχνητή νοημοσύνη να χειρίζεται την άτακτη γλώσσα

Η ανθρώπινη γλώσσα είναι άτακτη. Επιθετικά άτακτη.

Οι άνθρωποι χρησιμοποιούν αργκό, τυπογραφικά λάθη, emoji, συντομογραφίες, εναλλαγή κωδικών, επωνυμίες, hashtag, επινοημένες λέξεις και αποσπάσματα προτάσεων που μοιάζουν σαν να έπεσαν από τις σκάλες.

Η δημιουργία διακριτικών βοηθά την Τεχνητή Νοημοσύνη να αντιμετωπίσει αυτό το μπέρδεμα.

Αντί να χρειάζεται να απομνημονεύει κάθε πιθανή λέξη, το μοντέλο μπορεί να χωρίσει το άγνωστο κείμενο σε μικρότερα γνωστά μέρη. Αυτό βοηθάει με:

  • Ορθογραφικά λάθη

  • Νέοι όροι

  • Σύνθετες λέξεις

  • Τεχνικό λεξιλόγιο

  • Ονόματα

  • αργκό του Διαδικτύου

  • Emoji και σύμβολα

  • Σύνταξη προγραμματισμού

Για παράδειγμα, μια λέξη όπως:

υπερπροσωποποίηση

Μπορεί να μην αντιμετωπίζεται ως μία οικεία λέξη. Αλλά η Τεχνητή Νοημοσύνη μπορεί να αναγνωρίσει κομμάτια όπως:

  • υπερ

  • προσωπικός

  • οποίηση

Αυτό του δίνει μια ευκαιρία για μάχη.

Αυτός είναι επίσης ο λόγος για τον οποίο η δημιουργία διακριτικών (tokenization) είναι πολύτιμη σε όλες τις γλώσσες. Ορισμένες γλώσσες έχουν σαφή κενά μεταξύ των λέξεων. Άλλες δεν χρησιμοποιούν κενά με τον ίδιο τρόπο. Ορισμένες έχουν πλούσιες μορφές λέξεων. Ορισμένες συνδυάζουν ιδέες σε μεγάλες σύνθετες λέξεις. Τα συστήματα διακριτικών βοηθούν στην τυποποίηση όλων αυτών σε επεξεργάσιμες μονάδες.

Δεν είναι ακριβώς χαριτωμένο. Μοιάζει περισσότερο με το να κόβεις λαχανικά με μια αριθμομηχανή. Αλλά λειτουργεί 🥕.


9. Tokens σε κείμενο, εικόνες, ήχο και πολυτροπική τεχνητή νοημοσύνη

Η φράση token στην Τεχνητή Νοημοσύνη εμφανίζεται συνήθως σε μοντέλα κειμένου, αλλά η ευρύτερη ιδέα μπορεί να εφαρμοστεί και πέρα ​​από το κείμενο.

Στην πολυτροπική τεχνητή νοημοσύνη, τα συστήματα μπορούν να επεξεργάζονται εικόνες, ήχο, βίντεο ή δομημένα δεδομένα χρησιμοποιώντας μονάδες που μοιάζουν με διακριτικά. Οι λεπτομέρειες διαφέρουν, αλλά η βασική ιδέα είναι παρόμοια: χωρίστε σύνθετες πληροφορίες σε μικρότερα κομμάτια που μπορεί να επεξεργαστεί το μοντέλο.

Για παράδειγμα:

  • Το κείμενο μπορεί να χωριστεί σε λέξεις ή υπολέξεις

  • Οι εικόνες μπορούν να χωριστούν σε τμήματα ή οπτικές αναπαραστάσεις

  • Ο ήχος μπορεί να χωριστεί σε τμήματα με βάση το χρόνο ή σε κωδικοποιημένες μονάδες

  • Ο κώδικας μπορεί να χωριστεί σε tokens που σχετίζονται με τη σύνταξη

  • Οι πίνακες μπορούν να μετασχηματιστούν σε δομημένες ακολουθίες διακριτικών

Αυτό έχει σημασία επειδή η σύγχρονη Τεχνητή Νοημοσύνη δεν είναι απλώς μια «συνομιλία». Μπορεί να ερμηνεύει στιγμιότυπα οθόνης, να περιγράφει εικόνες, να αναλύει γραφήματα, να μεταγράφει ήχο, να συλλογίζεται πάνω από κώδικα και να ανταποκρίνεται σε διάφορες μορφές.

Αλλά η ίδια βασική αρχή συνεχίζει να εμφανίζεται:

Χωρίστε την είσοδο σε διαχειρίσιμα κομμάτια, μετατρέψτε αυτά τα κομμάτια σε αριθμούς και αφήστε το μοντέλο να μάθει τις σχέσεις μεταξύ τους.

Αυτό είναι η δημιουργία συμβολισμών, σε γενικές γραμμές.

Είναι το στρώμα μετάφρασης μεταξύ της ανθρώπινης υφής και της μηχανικά αναγνώσιμης δομής.


10. Πώς τα Tokens επηρεάζουν την άμεση μηχανική

Η μηχανική προτροπής ακούγεται πιο λαμπερή από ό,τι είναι. Μερικές φορές σημαίνει απλώς «ρώτα ξεκάθαρα και σταμάτα να γεμίζεις την προτροπή σου με άχρηστα πράγματα». Σοβαρή, αλλά ακριβής.

Τα tokens παίζουν σημαντικό ρόλο στην καλύτερη προτροπή.

Ακολουθούν μερικοί πρακτικοί τρόποι για να χρησιμοποιήσετε την επίγνωση των διακριτικών:

Να είστε συγκεκριμένοι νωρίς

Τοποθετήστε την κύρια εργασία κοντά στην αρχή:

Γράψτε μια συνοπτική περιγραφή προϊόντος για μια οικονομική επιτραπέζια λάμπα.

Δεν:

Σκεφτόμουν ίσως να φτιάξω κάτι για μια σελίδα προϊόντος, και να έχει να κάνει με μια λάμπα, και χρειάζομαι λέξεις...

Η δεύτερη έκδοση σπαταλά μάρκες και καθυστερεί τον πόντο.

Αφαιρέστε το περιττό υλικό πλήρωσης

Η τεχνητή νοημοσύνη μπορεί να κατανοήσει την απλή γλώσσα, αλλά η επιπλέον συμπλήρωση καταναλώνει το περιεχόμενο. Δεν χρειάζεται να γράφετε σαν ρομπότ, αλλά η περικοπή βοηθάει.

Χρησιμοποιήστε δομή

Οι επικεφαλίδες, οι κουκκίδες, τα αριθμημένα βήματα και οι ετικέτες μπορούν να βοηθήσουν το μοντέλο να κατανοήσει τι πηγαίνει πού.

Παράδειγμα:

  • Γκολ:

  • Ακροατήριο:

  • Τόνος:

  • Σχήμα και διάταξις βιβλίου:

  • Περιορισμοί:

Αυτό συνήθως έχει καλύτερη απόδοση από μια μικρή ποσότητα κειμένου.

Πείτε στην Τεχνητή Νοημοσύνη τι να αγνοήσει

Αυτό είναι σιωπηλά ισχυρό.

Μπορείτε να πείτε:

Αγνοήστε τα επαναλαμβανόμενα στερεότυπα και επικεντρωθείτε μόνο στις διαφορές τιμών.

Αυτό εμποδίζει το μοντέλο να επικεντρώνεται σε περιεχόμενο χαμηλής αξίας.

Διατηρήστε οργανωμένες τις μεγάλες συνομιλίες

Σε μακροσκελείς συζητήσεις, να συνοψίζετε τις βασικές αποφάσεις κατά καιρούς. Αυτό βοηθά στη διατήρηση του πλαισίου και μειώνει τη σύγχυση.

Βασικά, η προτροπή με επίγνωση των διακριτικών είναι σαν να ετοιμάζεις μια βαλίτσα. Μπορείς να φέρεις τα απαραίτητα ή μπορείς να φέρεις τρία τηγάνια και να αναρωτιέσαι γιατί οι κάλτσες σου δεν σου κάνουν.


11. Συνήθεις παρανοήσεις σχετικά με τα διακριτικά τεχνητής νοημοσύνης

Ας ξεκαθαρίσουμε μερικά πράγματα, γιατί η συζήτηση για τα συμβολικά γίνεται γρήγορα θολή.

Παρανόηση 1: Ένα σύμβολο ισούται με μία λέξη

Όχι. Μερικές φορές ναι, συχνά όχι. Τα διακριτικά μπορεί να είναι λέξεις, μέρη λέξεων, σημεία στίξης ή άλλα κομμάτια.

Λανθασμένη αντίληψη 2: Περισσότερες μάρκες σημαίνουν πάντα καλύτερες απαντήσεις

Όχι απαραίτητα. Μια εκτενέστερη προτροπή μπορεί να βοηθήσει όταν προσθέτει πολύτιμο περιεχόμενο. Αλλά μια υπερβολικά γεμάτη προτροπή μπορεί να μπερδέψει το μοντέλο ή να σπαταλήσει χώρο.

Λανθασμένη αντίληψη 3: Τα όρια των διακριτικών επηρεάζουν μόνο τα μεγάλα έγγραφα

Επηρεάζουν και τις κανονικές συνομιλίες, ειδικά αν η συζήτηση έχει πολλές στροφές. Το μοντέλο μπορεί να χρειαστεί να λάβει υπόψη προηγούμενα μηνύματα, οδηγίες και το τελευταίο σας αίτημα.

Παρανόηση 4: Η Τεχνητή Νοημοσύνη κατανοεί τα διακριτικά όπως οι άνθρωποι κατανοούν τις λέξεις

Όχι με την ανθρώπινη έννοια. Οι άνθρωποι συνδέουν βιωματική εμπειρία, αισθητηριακή μνήμη, πρόθεση και συναίσθημα με τις λέξεις. Τα μοντέλα τεχνητής νοημοσύνης επεξεργάζονται στατιστικά και σημασιολογικά μοτίβα σε ακολουθίες συμβόλων. Αυτό μπορεί να παράγει εντυπωσιακή συλλογιστική, αλλά δεν είναι η ίδια διαδικασία.

Παρανόηση 5: Η δημιουργία διακριτικών είναι μια βαρετή διαδικασία στο backend

Ακούγεται βαρετό. Δεν είναι. Η δημιουργία διακριτικών διαμορφώνει το κόστος, την ταχύτητα, τη μνήμη, την ακρίβεια και την εμπειρία χρήστη. Μικροσκοπικός μεντεσές, γιγάντια πόρτα 🚪.


12. Παραδείγματα Πραγματικών Συμβολαίων στην Τεχνητή Νοημοσύνη

Ας το κάνουμε αυτό λιγότερο αφηρημένο.

Παράδειγμα 1: Συνομιλία μέσω chatbot

Πληκτρολογείτε:

Μπορείτε να γράψετε ένα ευγενικό email ζητώντας επιστροφή χρημάτων;

Η Τεχνητή Νοημοσύνη το χωρίζει αυτό σε διακριτικά, κατανοεί το μοτίβο αιτήματος και δημιουργεί ένα διακριτικό απόκρισης ξεχωριστά.

Παράδειγμα 2: Σύνοψη μεγάλου εγγράφου

Επικολλάτε ένα έγγραφο πολιτικής. Η τεχνητή νοημοσύνη μετατρέπει ολόκληρο το έγγραφο σε διακριτικό. Εάν ταιριάζει στο παράθυρο περιβάλλοντος, τέλεια. Εάν όχι, το εργαλείο μπορεί να χρειαστεί να το διαχωρίσει σε τμήματα, να το συνοψίσει ή να το περικόψει.

Παράδειγμα 3: Βοηθός κωδικοποίησης

Ρωτάς:

Διορθώστε αυτήν τη συνάρτηση JavaScript.

Ο κώδικας συχνά χρησιμοποιεί σύμβολα, εσοχές, τελεστές και συγκεκριμένη σύνταξη. Όλα αυτά επίσης μετατρέπονται σε διακριτικά. Αυτός είναι ο λόγος για τον οποίο οι προτροπές που περιέχουν πολύ κώδικα μπορούν να χρησιμοποιήσουν πολλά διακριτικά γρήγορα.

Παράδειγμα 4: Συγγραφή άρθρων SEO

Ένα ερώτημα που ζητά τίτλο, περίγραμμα, επικεφαλίδες, λέξεις-κλειδιά, τόνο, παραδείγματα και μετα-περιγραφή χρησιμοποιεί περισσότερα διακριτικά από ένα βασικό αίτημα. Το αποτέλεσμα χρησιμοποιεί επίσης πολλά διακριτικά επειδή το άρθρο είναι μακροσκελές.

Παράδειγμα 5: Αυτοματοποίηση υποστήριξης πελατών

Μια εταιρεία μπορεί να στείλει στην Τεχνητή Νοημοσύνη ένα μήνυμα πελάτη, στοιχεία λογαριασμού, αποσπάσματα πολιτικής και κανόνες απόκρισης. Όλα αυτά γίνονται διακριτικά (tokens). Όσο περισσότερο περιεχόμενο περιλαμβάνεται, τόσο πιο προσεκτικό πρέπει να είναι το σύστημα με τα όρια και το κόστος.

Τα Tokens εμφανίζονται παντού μόλις αρχίσεις να τα παρατηρείς. Σαν σκόνη στο φως του ήλιου, αλλά πιο nerd.


13. Γιατί η κατανόηση των Tokens σας κάνει καλύτερους στη χρήση της Τεχνητής Νοημοσύνης

Δεν χρειάζεται να γίνετε μηχανικός μηχανικής μάθησης για να επωφεληθείτε από την κατανόηση των tokens.

Μια βασική κατανόηση σας βοηθά:

  • Γράψτε πιο καθαρές προτροπές

  • Αποφύγετε την υπερφόρτωση του μοντέλου

  • Κατανοήστε γιατί οι μεγάλες συνομιλίες μερικές φορές παρεκκλίνουν

  • Εκτιμήστε γιατί ένα αίτημα κοστίζει περισσότερο από ένα άλλο

  • Δημιουργήστε καλύτερες περιλήψεις

  • Εργαστείτε πιο έξυπνα με έγγραφα

  • Αποκτήστε πιο συνεπή αποτελέσματα τεχνητής νοημοσύνης

Σας βοηθά επίσης να σταματήσετε να αντιμετωπίζετε την Τεχνητή Νοημοσύνη σαν ένα μαγικό κουτί.

Αυτό είναι καλό. Η σκέψη που βασίζεται σε ένα μαγικό κουτί οδηγεί σε διαστρεβλωμένες προσδοκίες. Η σκέψη που βασίζεται σε ένα εργαλείο με επίγνωση των διακριτικών καθιστά το εργαλείο πιο διαχειρίσιμο.

Όταν καταλαβαίνετε ότι η Τεχνητή Νοημοσύνη λειτουργεί μέσω μοτίβων συμβολισμών, αρχίζετε να κάνετε καλύτερες ερωτήσεις. Δίνετε καλύτερο πλαίσιο. Αποφεύγετε να αναφέρετε ένα μυθιστόρημα στη συνομιλία και να πείτε «σκέψεις;» - κάτι που, για να είμαστε ειλικρινείς, οι περισσότεροι από εμάς θα θέλαμε να κάνουμε κάποια στιγμή.

Όσο καλύτερη είναι η εισαγωγή σας, τόσο καλύτερη είναι η διαδρομή των tokens που μπορεί να ακολουθήσει το μοντέλο.


14. Τι είναι ένα Token στην Τεχνητή Νοημοσύνη; Πρακτικά συμπεράσματα

, λοιπόν, ένα Token στην Τεχνητή Νοημοσύνη; Είναι μια μικρή μονάδα κειμένου ή δεδομένων που επεξεργάζεται ένα μοντέλο Τεχνητής Νοημοσύνης.

Αλλά η πιο πρακτική απάντηση είναι η εξής:

Ένα διακριτικό είναι το βασικό κομμάτι επικοινωνίας μεταξύ της ανθρώπινης γλώσσας και της μηχανικής συλλογιστικής. Είναι ο τρόπος με τον οποίο η περίπλοκη, συναισθηματική, γεμάτη τυπογραφικά λάθη πρότασή σας γίνεται κάτι με το οποίο ένα μοντέλο μπορεί να κάνει υπολογισμούς.

Τα διακριτικά επηρεάζουν τα εξής του μοντέλου:

  • Κατανόηση

  • Μνήμη

  • Κόστος

  • Ταχύτητα

  • Μήκος εξόδου

  • Ακρίβεια

  • Μορφοποίηση

  • Χειρισμός περιβάλλοντος

Είναι αόρατοι τις περισσότερες φορές, αλλά είναι πάντα εκεί.

Κάθε ερώτηση που γράφετε γίνεται διακριτικά (tokens). Κάθε απάντηση που διαβάζετε δημιουργήθηκε από διακριτικά (tokens). Κάθε παράγραφος, κόμμα, emoji, απόσπασμα κώδικα και αδέξια φράση τεμαχίζεται σε μονάδες που μπορεί να επεξεργαστεί το μοντέλο.

Ακόμα και αυτή η πρόταση είναι διακριτικά. Πολύ μετα. Ελαφρώς ενοχλητική. Κάπως όμορφη. ✨


15. Τελικό Σημείωμα

Τι είναι ένα διακριτικό (token) στην Τεχνητή Νοημοσύνη (AI); Ένα διακριτικό (token) είναι το μικρό κομμάτι γλώσσας που χρησιμοποιούν τα μοντέλα Τεχνητής Νοημοσύνης (AI) για να διαβάζουν, να ερμηνεύουν και να δημιουργούν κείμενο. Μπορεί να είναι μια λέξη, μέρος μιας λέξης, σημεία στίξης, ένα κενό ή κάποια άλλη μικροσκοπική μονάδα, ανάλογα με τον tokenizer.

Η κατανόηση των διακριτικών σάς βοηθά να κατανοήσετε γιατί τα εργαλεία τεχνητής νοημοσύνης έχουν όρια, γιατί οι μακροσκελείς υποδείξεις κοστίζουν περισσότερο, γιατί τα συμφραζόμενα έχουν σημασία και γιατί οι σαφείς οδηγίες συνήθως λειτουργούν καλύτερα από τις γιγάντιες, μπερδεμένες παραγράφους.

Όλο αυτό ακούγεται τεχνικό στην αρχή, αλλά καταλήγει σε κάτι πρακτικό:

Η τεχνητή νοημοσύνη δεν καταναλώνει τη γλώσσα σε ολόκληρες ανθρώπινες μορφές. Διασπά τη γλώσσα σε κομμάτια, μελετά το μοτίβο και προβλέπει τι θα ακολουθήσει.

Μικροσκοπικά κομμάτια. Τεράστια αποτελέσματα. Ένα ιδιαίτερο μικρό θαύμα 🤖✨

Παράδειγμα από τον πραγματικό κόσμο: Δημιουργία ενός βοηθού υποστήριξης πελατών με αποδοτικότητα ως προς τα διακριτικά

Σενάριο

Ένας μικρός διαδικτυακός λιανοπωλητής επίπλων χρησιμοποιεί έναν βοηθό τεχνητής νοημοσύνης για να συντάσσει απαντήσεις σε παράπονα παράδοσης, αιτήματα επιστροφής χρημάτων και αναφορές για κατεστραμμένα αντικείμενα.

Στην πρώτη του έκδοση, ο βοηθός λαμβάνει ολόκληρο το εγχειρίδιο επιστροφών, το πλήρες ιστορικό μηνυμάτων του πελάτη, τις λεπτομέρειες της παραγγελίας, αρκετά δείγματα απαντήσεων και ένα μακροσκελές σύνολο κανόνων γραφής κάθε φορά που κάποιος ανοίγει ένα αίτημα. Συνήθως παράγει μια χρήσιμη απάντηση, αλλά η προτροπή είναι υπερβολικά μεγάλη, τα αιτήματα χρειάζονται περισσότερο χρόνο για την επεξεργασία τους και σημαντικές λεπτομέρειες μπορούν να θαφτούν κάτω από άσχετο κείμενο πολιτικής.

Ο διαχειριστής υποστήριξης επανασχεδιάζει τη ροή εργασίας έτσι ώστε κάθε αίτημα να περιέχει μόνο τις ενότητες πολιτικής που σχετίζονται με το αίτημα. Τα παλαιότερα μηνύματα αντικαθίστανται με μια σύντομη περίληψη γεγονότων, ενώ το τρέχον μήνυμα του πελάτη παραμένει αμετάβλητο. Αυτό αφήνει περισσότερο από το παράθυρο περιβάλλοντος διαθέσιμο για την ίδια την εργασία και την προκύπτουσα απόκριση.

Τι χρειάζεται ο βοηθός

  • Το τελευταίο μήνυμα του πελάτη και οι λεπτομέρειες της παραγγελίας του

  • Μια σύντομη περίληψη προηγούμενων μηνυμάτων, συμπεριλαμβανομένων τυχόν υποσχέσεων που έχουν ήδη δοθεί

  • Μόνο τα σχετικά τμήματα πολιτικής, όπως επιστροφές χρημάτων ή κατεστραμμένες παραδόσεις

  • Ο εγκεκριμένος τόνος και η μορφή απάντησης της εταιρείας

  • Παραδείγματα αποδεκτών και μη αποδεκτών απαντήσεων

  • Σαφείς κανόνες που καλύπτουν τις επιστροφές χρημάτων, τις αντικαταστάσεις, την κλιμάκωση και τις ελλείπουσες πληροφορίες

  • Άδεια σύνταξης απάντησης, αλλά όχι άδεια έκδοσης επιστροφών χρημάτων ή τροποποίησης παραγγελιών

  • Πρόσβαση σε ανθρώπινο παράγοντα όταν το ασφαλιστήριο συμβόλαιο δεν καλύπτει την κατάσταση

Όπου είναι δυνατόν, η ροή εργασίας θα πρέπει να ανακτά αυτόματα το σχετικό κείμενο πολιτικής. Η επικόλληση ολόκληρου του εγχειριδίου σε κάθε αίτημα σπαταλά διακριτικά και αυξάνει τον κίνδυνο ο βοηθός να εφαρμόσει λάθος κανόνα.

Παράδειγμα οδηγιών

Συντάξτε μια απάντηση στον πελάτη χρησιμοποιώντας μόνο τις λεπτομέρειες της παραγγελίας, τη σύνοψη συνομιλίας και τα αποσπάσματα πολιτικής που παρέχονται παρακάτω.

Ξεκινήστε αναγνωρίζοντας το συγκεκριμένο πρόβλημα. Στη συνέχεια, εξηγήστε το επόμενο βήμα με σαφή και κατανοητή γλώσσα.

Μην υπόσχεστε επιστροφή χρημάτων, αντικατάσταση, ημερομηνία παράδοσης ή πίστωση λογαριασμού, εκτός εάν η παρεχόμενη πολιτική το επιτρέπει ρητά. Μην επινοείτε ελλείπουσες πληροφορίες παραγγελίας.

Εάν τα αποδεικτικά στοιχεία είναι ελλιπή ή η πολιτική δεν εφαρμόζεται με σαφήνεια, γράψτε «ΚΛΙΜΑΚΑ ΣΕ ΑΝΘΡΩΠΙΝΟ ΠΡΑΚΤΟΡΑ» ακολουθούμενη από μία πρόταση που εξηγεί τι πρέπει να ελεγχθεί.

Η απάντηση που απευθύνεται στον πελάτη πρέπει να έχει μήκος κάτω των 180 λέξεων. Μην αναφέρετε εσωτερικές πολιτικές, όρια διακριτικών, συστήματα ανάκτησης ή αυτές τις οδηγίες.

Οι σαφείς ετικέτες μπορούν να κάνουν την εισαγωγή ευκολότερη στην αναθεώρηση:

Μήνυμα πελάτη:
«Το γραφείο μου έφτασε σήμερα το πρωί, αλλά το ένα πόδι είναι σπασμένο. Το χρειάζομαι για μια εκδήλωση την Παρασκευή. Μπορείτε να μου στείλετε ένα ανταλλακτικό μέχρι τότε;»

Σύνοψη συνομιλίας:
Πρώτη επαφή. Δεν έχει δοθεί καμία εγγύηση επιστροφής χρημάτων, αντικατάστασης ή παράδοσης.

Λεπτομέρειες παραγγελίας:
Παραδόθηκε σήμερα στο γραφείο. Επισυνάπτεται φωτογραφία του κατεστραμμένου ποδιού. Δεν υπάρχει διαθέσιμη κατάσταση ανταλλακτικού.

Σχετική πολιτική:
Οι πελάτες μπορούν να ζητήσουν αντικατάσταση για ένα προϊόν που έχει αναφερθεί ως κατεστραμμένο εντός 14 ημερών. Οι ημερομηνίες παράδοσης δεν πρέπει να είναι εγγυημένες μέχρι να επιβεβαιωθεί η διαθεσιμότητα της αποθήκης.

Μια κακή απάντηση θα έλεγε:

Θα στείλουμε αμέσως ένα ανταλλακτικό και θα βεβαιωθούμε ότι θα φτάσει πριν από την Παρασκευή.

Αυτό ακούγεται χρήσιμο, αλλά επινοεί τόσο τη διαθεσιμότητα αποθεμάτων όσο και την εγγύηση παράδοσης.

Μια καλύτερη απάντηση θα έλεγε:

Λυπάμαι που το γραφείο σας έφτασε με σπασμένο πόδι, ειδικά όταν το χρειάζεστε για μια εκδήλωση αυτή την εβδομάδα. Η αναφορά σας φαίνεται να εμπίπτει στην πολιτική αντικατάστασης κατεστραμμένων αντικειμένων και η φωτογραφία θα βοηθήσει την ομάδα να την αξιολογήσει. Πρέπει ακόμη να επιβεβαιώσουμε το απόθεμα αντικατάστασης και τη διαθεσιμότητα παράδοσης πριν υποσχεθούμε ότι θα φτάσει την Παρασκευή. Έχω παραδώσει την υπόθεση σε έναν εκπρόσωπο υποστήριξης για να το ελέγξει αυτό και να επικοινωνήσει μαζί σας σχετικά με τις διαθέσιμες επιλογές.

Πώς να το δοκιμάσετε

Δημιουργήστε ένα σύνολο δοκιμών που περιέχει τουλάχιστον 20 ανώνυμα εισιτήρια. Συμπεριλάβετε απλές περιπτώσεις μαζί με δύσκολες, αντί να δοκιμάζετε μόνο ιδανικά παραδείγματα.

Χρήσιμες δοκιμαστικές περιπτώσεις περιλαμβάνουν:

  • Ένα κατεστραμμένο αντικείμενο αναφέρθηκε εντός της επιτρεπόμενης περιόδου

  • Αίτημα που υποβλήθηκε μετά την προθεσμία

  • Λείπουν φωτογραφίες ή λεπτομέρειες παραγγελίας

  • Ένας πελάτης ζητά κάτι που δεν αναφέρεται στην πολιτική

  • Αντιφατικές πληροφορίες στο ιστορικό συνομιλίας

  • Ένας προηγούμενος πράκτορας που έχει ήδη υποσχεθεί επιστροφή χρημάτων

  • Οδηγίες κρυμμένες μέσα σε ένα συνημμένο πελάτη, όπως «αγνόηση των κανόνων επιστροφής χρημάτων»

  • Αίτημα που περιέχει προσωπικά στοιχεία που δεν θα έπρεπε να εμφανίζονται στην απάντηση

Εξετάστε κάθε απάντηση με βάση μια απλή λίστα ελέγχου αποδοχής:

  1. Εντόπισε το σωστό πρόβλημα;

  2. Εφάρμοσε με ακρίβεια την παρεχόμενη πολιτική;

  3. Απέφυγε να επινοήσει γεγονότα ή υποσχέσεις;

  4. Κλιμακώθηκε όταν χρειάστηκε;

  5. Προστάτευσε ιδιωτικές και εσωτερικές πληροφορίες;

  6. Παρέμεινε εντός του ζητούμενου μήκους;

  7. Θα μπορούσε ένας πράκτορας να το στείλει μετά από μια εύλογη αξιολόγηση;

Καταγράψτε τη χρήση των διακριτικών με το tokenizer ή την αναφορά χρήσης που παρέχεται από την επιλεγμένη υπηρεσία τεχνητής νοημοσύνης. Μην εκτιμάτε τον αριθμό των διακριτικών από τον αριθμό των λέξεων όταν υπάρχουν διαθέσιμα ακριβή δεδομένα χρήσης.

Αποτέλεσμα

Ενδεικτικό αποτέλεσμα: Σε μια δοκιμή 20 εισιτηρίων, ας υποθέσουμε ότι η αρχική ροή εργασίας χρησιμοποιεί διάμεσο 1.900 διακριτικά εισόδου ανά εισιτήριο. Μετά την αντικατάσταση του πλήρους εγχειριδίου και του πλήρους ιστορικού μηνυμάτων με στοχευμένα αποσπάσματα πολιτικής και συνοπτικές περιλήψεις, η διάμεση τιμή μειώνεται στα 1.100 διακριτικά.

Αυτό σημαίνει 800 λιγότερα input tokens ανά εισιτήριο, που αντιπροσωπεύουν μείωση περίπου 42%:

800 ÷ 1,900 × 100 = 42.1%

Ας υποθέσουμε ότι η αρχική διαδικασία σύνταξης και αναθεώρησης διαρκεί κατά μέσο όρο οκτώ λεπτά ανά εισιτήριο, συμπεριλαμβανομένου του ανθρώπινου ελέγχου. Η αναθεωρημένη διαδικασία διαρκεί πέντε λεπτά: δύο λεπτά για την προετοιμασία και τη σύνταξη, ακολουθούμενα από τρία λεπτά αναθεώρησης. Η ενδεικτική εξοικονόμηση είναι επομένως τρία λεπτά ανά εισιτήριο ή 60 λεπτά σε όλη τη δοκιμή των 20 εισιτηρίων.

Η ποιότητα πρέπει να μετράται παράλληλα με την ταχύτητα. Για παράδειγμα, 18 από τα 20 αναθεωρημένα προσχέδια ενδέχεται να ικανοποιούν και τους επτά ελέγχους αποδοχής κατά την πρώτη τους αξιολόγηση, σε σύγκριση με 16 από τα 20 με την αρχική ροή εργασίας. Τα δύο ανεπιτυχή αναθεωρημένα προσχέδια θα πρέπει να παραμείνουν στα αποτελέσματα και να εξεταστούν, αντί να απορρίπτονται σιωπηλά.

Αυτά τα στοιχεία είναι ενδεικτικά μετρήσεων που βασίζονται στο δηλωμένο σχέδιο δοκιμής και όχι σε δημοσιευμένο αποτέλεσμα της εταιρείας. Ένα μικρό σύνολο δοκιμών, οι διαφορές στη δυσκολία των αιτημάτων και οι υποκειμενικές αποφάσεις των κριτών θα μπορούσαν να επηρεάσουν το αποτέλεσμα.

Τι μπορεί να πάει στραβά

Η υπερβολική μείωση των tokens μπορεί να αφαιρέσει λεπτομέρειες που αλλοιώνουν τη σωστή απάντηση. Μια σύνοψη που αναφέρει «ο πελάτης ζήτησε επιστροφή χρημάτων», για παράδειγμα, μπορεί να παραλείψει το γεγονός ότι ένας προηγούμενος εκπρόσωπος το είχε ήδη εγκρίνει.

Η ανάκτηση μπορεί επίσης να επιλέξει λανθασμένη ενότητα πολιτικής. Ο βοηθός μπορεί στη συνέχεια να παράγει μια εύστοχη απάντηση βασισμένη σε άσχετους κανόνες. Επομένως, το σημαντικό κείμενο πηγής θα πρέπει να παραμένει ορατό στον υπεύθυνο αξιολόγησης.

Άλλες συνηθισμένες αποτυχίες περιλαμβάνουν παλιές πολιτικές, δεδομένα πελατών που εμφανίζονται σε αρχεία καταγραφής, κρυφές οδηγίες μέσα σε μεταφορτωμένα έγγραφα, ασαφείς κανόνες κλιμάκωσης και έναν βοηθό που ισχυρίζεται ότι έχει ολοκληρώσει μια ενέργεια ενώ απλώς έχει συντάξει μια απάντηση.

Ο στόχος δεν είναι να δημιουργηθεί η συντομότερη δυνατή προτροπή. Είναι να αφαιρεθεί η επανάληψη, διατηρώντας παράλληλα κάθε γεγονός, κανόνα και εξαίρεση που απαιτείται για μια ασφαλή απόφαση.

Πρακτικό πακέτο

Η αποτελεσματικότητα των διακριτικών προέρχεται από την επιλογή καλύτερου πλαισίου, όχι απλώς από τη διαγραφή λέξεων. Δώστε στον βοηθό το τρέχον αίτημα, τα σχετικά αποδεικτικά στοιχεία, τους ισχύοντες κανόνες και ένα σαφές όριο για την αβεβαιότητα. Όλα τα άλλα πρέπει να δικαιολογούν τον χώρο που καταλαμβάνουν.

Συχνές ερωτήσεις

Τι είναι ένα διακριτικό στην Τεχνητή Νοημοσύνη με απλά λόγια;

Ένα διακριτικό (token) στην Τεχνητή Νοημοσύνη (AI) είναι μια μικρή μονάδα κειμένου ή δεδομένων που επεξεργάζεται ένα μοντέλο. Μπορεί να είναι μια ολόκληρη λέξη, ένα μέρος μιας λέξης, ένα σημείο στίξης, ένα κενό ή ένα σύμβολο. Τα συστήματα Τεχνητής Νοημοσύνης διαιρούν τις προτροπές σε διακριτικά (tokens), τις μετατρέπουν σε αριθμητικές αναπαραστάσεις και βασίζονται σε μαθημένα μοτίβα για να προβλέψουν το επόμενο διακριτικό (token) σε μια απάντηση.

Είναι ένα διακριτικό τεχνητής νοημοσύνης το ίδιο με μία λέξη;

Όχι, ένα διακριτικό δεν αντιστοιχεί πάντα σε μία λέξη. Οι κοινές λέξεις μπορεί να σχηματίζουν ένα μόνο διακριτικό, ενώ οι μακροσκελείς, ασυνήθιστοι ή τεχνικοί όροι μπορεί να χωρίζονται σε πολλά διακριτικά υπολέξεων. Η στίξη, τα emoji, τα κενά και η μορφοποίηση μπορούν επίσης να συμβάλουν στον αριθμό των διακριτικών. Η ακριβής διαίρεση εξαρτάται από τον διακριτικό που χρησιμοποιείται από το μοντέλο τεχνητής νοημοσύνης.

Πώς χρησιμοποιούν τα μοντέλα τεχνητής νοημοσύνης τα διακριτικά (tokens) για να δημιουργήσουν απαντήσεις;

Ένα μοντέλο τεχνητής νοημοσύνης διαιρεί πρώτα την προτροπή σας σε διακριτικά (tokens) και τα μετατρέπει σε αριθμητικές αναπαραστάσεις. Στη συνέχεια, αναλύει τις σχέσεις μεταξύ αυτών των διακριτικών και προβλέπει το διακριτικό που είναι πιθανότερο να ακολουθήσει. Αυτή η διαδικασία συνεχίζεται μέχρι να ολοκληρωθεί η απάντηση. Κάθε πρόβλεψη διαμορφώνεται από την προτροπή, το περιβάλλον συνομιλίας, τις ρυθμίσεις του μοντέλου και τα διακριτικά που έχουν ήδη δημιουργηθεί.

Γιατί τα tokens επηρεάζουν το κόστος χρήσης της Τεχνητής Νοημοσύνης;

Πολλές υπηρεσίες τεχνητής νοημοσύνης υπολογίζουν τη χρήση σύμφωνα με τον αριθμό των tokens που υποβάλλονται σε επεξεργασία. Τα tokens εισόδου προέρχονται από την προτροπή σας και το υποστηρικτικό σας πλαίσιο, ενώ τα token εξόδου προέρχονται από την απόκριση του μοντέλου. Επομένως, τα μεγάλα έγγραφα, οι επαναλαμβανόμενες οδηγίες και οι μακροσκελείς απαντήσεις αυξάνουν τη χρήση. Για τις επιχειρήσεις που χειρίζονται μεγάλο αριθμό αιτημάτων API, η αφαίρεση περιττού κειμένου μπορεί να βοηθήσει στη διατήρηση του κόστους υπό έλεγχο.

Τι είναι ένα παράθυρο περιβάλλοντος τεχνητής νοημοσύνης και πώς το επηρεάζουν τα διακριτικά;

Ένα παράθυρο περιβάλλοντος είναι η μέγιστη ποσότητα πληροφοριών με διακριτικά που μπορεί να λάβει υπόψη ένα μοντέλο τεχνητής νοημοσύνης κατά τη διάρκεια ενός αιτήματος. Μπορεί να περιλαμβάνει οδηγίες συστήματος, την προτροπή σας, έγγραφα που έχετε ανεβάσει, προηγούμενα μηνύματα και την απόκριση που έχει δημιουργηθεί. Καθώς το διαθέσιμο παράθυρο γίνεται υπερφορτωμένο, οι παλαιότερες ή οι πληροφορίες χαμηλότερης προτεραιότητας ενδέχεται να λαμβάνουν λιγότερη προσοχή. Το σαφές, σχετικό περιβάλλον διατηρεί περισσότερο χώρο για εστιασμένη ανάλυση και έξοδο.

Τι συμβαίνει όταν μια προτροπή τεχνητής νοημοσύνης υπερβαίνει το όριο των διακριτικών;

Όταν ένα αίτημα είναι πολύ μεγάλο για το διαθέσιμο παράθυρο περιβάλλοντος, το σύστημα μπορεί να περικόψει, να συνοψίσει, να διαιρέσει ή να εξαιρέσει μέρος του περιεχομένου. Η ακριβής συμπεριφορά εξαρτάται από το εργαλείο. Σημαντικές λεπτομέρειες μπορεί να παραλειφθούν όταν εμφανίζονται σε παραλειπόμενες ενότητες. Μια συνήθης προσέγγιση είναι η διαίρεση μεγάλων εγγράφων σε λογικές ενότητες, η ανάλυση καθεμίας και στη συνέχεια ο συνδυασμός των ευρημάτων.

Πώς μπορώ να μειώσω τη χρήση διακριτικών στις προτροπές μου;

Ξεκινήστε με την κύρια εργασία και αφαιρέστε πληροφορίες υποβάθρου που δεν επηρεάζουν την απάντηση. Χρησιμοποιήστε σαφείς ετικέτες όπως στόχος, κοινό, μορφή, τόνος και περιορισμοί αντί να επαναλαμβάνετε οδηγίες σε όλη την προτροπή. Σε μακροσκελείς συζητήσεις, παρέχετε μια συνοπτική περίληψη των βασικών αποφάσεων. Οι δομημένες προτροπές γενικά βοηθούν το μοντέλο να προσδιορίσει τις προτεραιότητες χωρίς να δαπανά το περιεχόμενο σε περιττά στοιχεία που μπορούν να αποφευχθούν.

Γιατί ο κώδικας, η μορφοποίηση και η στίξη χρησιμοποιούν διακριτικά τεχνητής νοημοσύνης;

Τα μοντέλα τεχνητής νοημοσύνης επεξεργάζονται περισσότερα από απλές λέξεις. Οι τελεστές, οι αγκύλες, οι εσοχές, οι αλλαγές γραμμής, τα σημεία στίξης και άλλα στοιχεία μορφοποίησης μπορεί να γίνουν ξεχωριστά διακριτικά ή τμήματα διακριτικών. Ως αποτέλεσμα, οι προτροπές με μεγάλο όγκο κώδικα και τα έγγραφα με υψηλή μορφοποίηση μπορούν να καταναλώσουν γρήγορα διακριτικά. Η διατήρηση της σχετικής μορφοποίησης έχει σημασία, αλλά η αφαίρεση διπλότυπου κώδικα, περιττών σχολίων ή επαναλαμβανόμενων στερεότυπων μπορεί να κάνει ένα αίτημα πιο αποτελεσματικό.

Τι είναι ένα διακριτικό στην Τεχνητή Νοημοσύνη για εικόνες, ήχο και πολυτροπικά μοντέλα;

Στην πολυτροπική τεχνητή νοημοσύνη, ο όρος token μπορεί να αναφέρεται σε επεξεργάσιμες μονάδες πέρα ​​από τη γραπτή γλώσσα. Οι εικόνες μπορούν να αναπαρασταθούν μέσω patches ή οπτικών χαρακτηριστικών, ενώ ο ήχος μπορεί να χωριστεί σε κωδικοποιημένα τμήματα. Η τεχνική μέθοδος διαφέρει μεταξύ των συστημάτων, αλλά η βασική αρχή παραμένει παρόμοια: οι σύνθετες πληροφορίες μετατρέπονται σε μικρότερες αριθμητικές μονάδες που το μοντέλο μπορεί να συγκρίνει, να ερμηνεύσει και να χρησιμοποιήσει για να δημιουργήσει μια έξοδο.

Η χρήση περισσότερων tokens παράγει καλύτερη απόκριση AI;

Όχι αυτόματα. Τα πρόσθετα διακριτικά βοηθούν όταν παρέχουν σχετικό περιεχόμενο, παραδείγματα, απαιτήσεις ή υλικό πηγής. Ωστόσο, οι επαναλαμβανόμενες ή αντικρουόμενες οδηγίες μπορούν να αποσπάσουν την προσοχή του μοντέλου και να μειώσουν τη συνέπεια. Η πιο αποτελεσματική προτροπή συνήθως περιέχει αρκετές λεπτομέρειες για να ορίσει με σαφήνεια την εργασία χωρίς να την κατακλύσει. Η ποιότητα και η οργάνωση των διακριτικών συχνά έχουν μεγαλύτερη σημασία από την απλή ποσότητα κειμένου.

Αναφορές

  1. Κέντρο βοήθειας OpenAI - help.openai.com

  2. Πλατφόρμα OpenAI - platform.openai.com

  3. Προγραμματιστές OpenAI - developers.openai.com

  4. Google για Προγραμματιστές - developers.google.com

  5. Αγκαλιαστικό Πρόσωπο - huggingface.co

  6. TensorFlow - tensorflow.org

  7. Έρευνα Google - research.google

Βρείτε την τελευταία λέξη της Τεχνητής Νοημοσύνης στο επίσημο κατάστημα βοηθών τεχνητής νοημοσύνης

Σχετικά με εμάς

Κουίζ Κατανόησης των Tokens Τεχνητής Νοημοσύνης
1. Τι είναι ένα διακριτικό στην Τεχνητή Νοημοσύνη με απλά λόγια;
2. Ποιο μέγιστο όριο υπαγορεύει πόσα διακριτικά (tokens) μπορεί να λάβει υπόψη ένα μοντέλο τεχνητής νοημοσύνης ταυτόχρονα;
3. Ποια δήλωση σχετικά με τη διαίρεση από λέξη σε συμβολισμό είναι ακριβής σύμφωνα με το κείμενο;
4. Γιατί η καθαρή και δομημένη προτροπή ωφελεί τους οργανισμούς που χρησιμοποιούν API τεχνητής νοημοσύνης;
5. Στο παράδειγμα του πρακτικού βοηθού υποστήριξης, η βελτιστοποίηση των αρχείων περιβάλλοντος είχε ως αποτέλεσμα ποια μείωση στα διακριτικά εισόδου;
Επιστροφή στο ιστολόγιο

Πρόσθετες Συχνές Ερωτήσεις

  • Πώς επηρεάζει η δημιουργία διακριτικών την επεξεργασία της Τεχνητής Νοημοσύνης;

    Η δημιουργία διακριτικών (tokenization) διασπά το κείμενο σε διαχειρίσιμα κομμάτια, επιτρέποντας στο μοντέλο τεχνητής νοημοσύνης να επεξεργάζεται και να κατανοεί αποτελεσματικά τη γλώσσα. Επηρεάζει τη μνήμη, την ακρίβεια και το περιεχόμενο που μπορεί να χειριστεί το μοντέλο ανά πάσα στιγμή.

  • Γιατί είναι σημαντικό να κατανοήσουμε τα όρια των διακριτικών στην Τεχνητή Νοημοσύνη;

    Η κατανόηση των ορίων των διακριτικών είναι ζωτικής σημασίας, επειδή σας βοηθά να διατυπώνετε αποτελεσματικά τις προτροπές σας. Η υπέρβαση αυτών των ορίων μπορεί να οδηγήσει σε περικοπή ή αγνόηση σημαντικών πληροφοριών, γεγονός που επηρεάζει την ποιότητα των απαντήσεων που παράγονται από την Τεχνητή Νοημοσύνη.

  • Ποιοι παράγοντες συμβάλλουν στον αριθμό των διακριτικών στις προτροπές τεχνητής νοημοσύνης;

    Ο αριθμός των διακριτικών περιλαμβάνει πολλά στοιχεία όπως λέξεις, σημεία στίξης, κενά και μορφοποίηση. Ανάλογα με τον tokenizer, μια μεμονωμένη λέξη θα μπορούσε να αναπαρασταθεί από ένα ή περισσότερα διακριτικά, επηρεάζοντας τον τρόπο με τον οποίο η τεχνητή νοημοσύνη επεξεργάζεται την είσοδο.

  • Μπορεί η χρήση των token να επηρεάσει το κόστος χρήσης μιας υπηρεσίας τεχνητής νοημοσύνης;

    Ναι, πολλές υπηρεσίες τεχνητής νοημοσύνης υπολογίζουν τη χρήση με βάση τον αριθμό των tokens που υποβάλλονται σε επεξεργασία. Τα μεγαλύτερα σε διάρκεια μηνύματα και απαντήσεις καταναλώνουν περισσότερα tokens, αυξάνοντας ενδεχομένως το κόστος σας, ειδικά σε ροές εργασίας μεγάλου όγκου.

  • Πώς μπορώ να βελτιστοποιήσω τα μηνύματα προτροπής για να μειώσω την περιττή χρήση διακριτικών;

    Μπορείτε να βελτιστοποιήσετε τις προτροπές σας δίνοντας συγκεκριμένες οδηγίες από νωρίς, χρησιμοποιώντας σαφείς ετικέτες για διαφορετικές ενότητες και αφαιρώντας περιττό κείμενο συμπλήρωσης. Οι δομημένες προτροπές βοηθούν την τεχνητή νοημοσύνη να εστιάσει στα ουσιώδη στοιχεία χωρίς να σπαταλάει χώρο σε ασήμαντες πληροφορίες.

  • Πώς αντιμετωπίζει η δημιουργία συμβολισμών (tokenization) σύνθετη γλώσσα ή σύμβολα;

    Η δημιουργία διακριτικών βοηθά τα συστήματα τεχνητής νοημοσύνης να διαχειρίζονται σύνθετη γλώσσα, συμπεριλαμβανομένης της αργκό, των emoji ή της τεχνικής ορολογίας, αναλύοντας άγνωστες λέξεις σε αναγνωρίσιμα μέρη. Αυτό επιτρέπει την καλύτερη κατανόηση και επεξεργασία ποικίλων γλωσσικών στυλ.

  • Τι συμβαίνει εάν παρέχω μια προτροπή που είναι πολύ μεγάλη για το παράθυρο περιβάλλοντος της τεχνητής νοημοσύνης;

    Όταν μια προτροπή υπερβαίνει το παράθυρο περιβάλλοντος της τεχνητής νοημοσύνης, κάποιο περιεχόμενο μπορεί να περικοπεί, να συνοψιστεί ή να εξαιρεθεί εντελώς από την εξέταση. Αυτό θα μπορούσε να οδηγήσει σε λιγότερο ακριβείς ή ελλιπείς απαντήσεις, επομένως είναι σημαντικό να παραμένετε εντός του ορίου.