Η τεχνητή νοημοσύνη αποτελεί ένα ραγδαία αναπτυσσόμενο τεχνολογικό τομέα, ο οποίος παρά το πλήθος θετικών που φέρνει μαζί του, δημιουργεί σοβαρές σκέψεις για το μέλλον της εργασιακής απασχόλησης και τις θέσεις που ενδέχεται να στερήσει από το ανθρώπινο δυναμικό.

Εντούτοις, ξεκάθαρο είναι ότι παρά την τεχνολογική ανάπτυξη που έχει επιτευχθεί, ο ανθρώπινος παράγοντας αποτελεί αναπόσπαστο και απαραίτητο στοιχείο για την άρτια εκπαίδευση της τεχνητής νοημοσύνης, με στόχο την μεγαλύτερη αποτελεσματικότητά της.

Όταν η DEEPSEEK, μια κινεζική εταιρεία, κυκλοφόρησε το σχετικά φτηνό και μεγάλο γλωσσικό μοντέλο της στα τέλη του περασμένου έτους, ανέτρεψε τις μακροχρόνιες υποθέσεις σχετικά με το τι θα χρειαστεί για την κατασκευή της επόμενης γενιάς τεχνητής νοημοσύνης (AI ή ΤΝ). Αυτό έχει μεγάλη σημασία για όποιον βγει πρώτος στην παγκόσμια μάχη για την κυριαρχία της τεχνητής νοημοσύνης. Οι προγραμματιστές επανεξετάζουν τώρα πόσο υλικό, ενέργεια και δεδομένα χρειάζονται για κάτι τέτοιο, την ώρα που μια άλλη, λιγότερο συζητημένη, εισροή στη μηχανική νοημοσύνη βρίσκεται επίσης σε εξέλιξη: το εργατικό δυναμικό πίσω από την εκπαίδευση της ΤΝ.

Το εργατικό δυναμικό πίσω από την τεχνητή νοημοσύνη

Για τον απλό άνθρωπο, η τεχνητή νοημοσύνη είναι όλα τα ρομπότ, οι μηχανές και τα μοντέλα, ίσως μια τεχνολογία που «σκοτώνει» θέσεις εργασίας. Στην πραγματικότητα, υπάρχουν εκατομμύρια εργαζόμενοι που εμπλέκονται στην παραγωγή μοντέλων τεχνητής νοημοσύνης (ΤΝ). Μεγάλο μέρος της δουλειάς τους έχει να κάνει με εργασίες όπως η επισήμανση αντικειμένων σε εικόνες δρόμων προκειμένου να εκπαιδευτούν αυτοοδηγούμενα αυτοκίνητα και η επισήμανση λέξεων στις ηχογραφήσεις που χρησιμοποιούνται για την εκπαίδευση συστημάτων αναγνώρισης ομιλίας. Τεχνικά, οι σχολιαστές δίνουν στα δεδομένα τις πληροφορίες πλαισίου που χρειάζονται οι υπολογιστές για να επεξεργαστούν τις στατιστικές συσχετίσεις μεταξύ των στοιχείων ενός συνόλου δεδομένων και τη σημασία τους για τους ανθρώπους. Στην πραγματικότητα, όποιος έχει ολοκληρώσει ένα τεστ CAPTCHA, επιλέγοντας φωτογραφίες που περιέχουν διασταυρώσεις δρόμων και πεζοδιαβάσεις, για παράδειγμα, μπορεί να έχει ακούσια βοηθήσει στην εκπαίδευση μιας τεχνητής νοημοσύνης, αναφέρει δημοσίευμα του Economist.

Αυτό είναι το «μη σέξι» μέρος της βιομηχανίας, όπως το θέτει ο Άλεξ Γουάνγκ, το αφεντικό της Scale AI, μιας εταιρείας δεδομένων. Παρόλο που η Scale AI λέει ότι το μεγαλύτερο μέρος της εργασίας που γίνεται, συμβαίνει στην Αμερική και την Ευρώπη, σε ολόκληρη τη βιομηχανία μεγάλο μέρος της εργασίας ανατίθεται σε φτωχά μέρη του κόσμου, όπου πολλοί μορφωμένοι άνθρωποι αναζητούν εργασία. Η κινεζική κυβέρνηση έχει συνεργαστεί με εταιρείες τεχνολογίας, όπως η Alibaba και η JD.com, για να φέρει θέσεις εργασίας σε απομακρυσμένα μέρη της χώρας. Στην Ινδία, ο οργανισμός της βιομηχανίας πληροφορικής, Nasscom, υπολογίζει ότι τα έσοδα από τον σχολιασμό θα μπορούσαν να φτάσουν τα 7 δισ. δολάρια ετησίως και να απασχολήσουν 1 εκατ. άτομα εκεί μέχρι το 2030. Αυτό είναι σημαντικό, δεδομένου ότι ολόκληρη η βιομηχανία πληροφορικής της Ινδίας αξίζει 254 δισ. δολάρια ετησίως (συμπεριλαμβανομένου του υλικού) και απασχολεί 5,5 εκατ. άτομα.

Ο σχολιασμός δεδομένων από το παρελθόν στο μέλλον

Ο σχολιασμός δεδομένων δεν είναι κάτι καινούργιο. Η Φέι Φέι Λι, μια Αμερικανίδα επιστήμονας υπολογιστών γνωστή ως «η νονά της τεχνητής νοημοσύνης», πιστώνεται ότι πυροδότησε το εναρκτήριο «κανόνι» του κλάδου στα μέσα της δεκαετίας του 2000, όταν δημιούργησε το ImageNet, το μεγαλύτερο σύνολο δεδομένων εικόνων εκείνη την εποχή. Η Λι συνειδητοποίησε ότι αν πλήρωνε φοιτητές για να κατηγοριοποιήσουν τις εικόνες, όπως έκαναν τότε οι περισσότεροι ερευνητές, το έργο θα έπαιρνε 90 χρόνια. Αντ’ αυτού, προσέλαβε εργαζόμενους σε όλο τον κόσμο χρησιμοποιώντας το Mechanical Turk, μια διαδικτυακή πλατφόρμα εργασίας που διαχειρίζεται η Amazon. Σε δυόμισι χρόνια οργάνωσε περίπου 3,2 εκατομμύρια εικόνες σε ένα σύνολο δεδομένων. Σύντομα και άλλα εργαστήρια τεχνητής νοημοσύνης ανέθεσαν την εργασία σχολιασμού σε εξωτερικούς συνεργάτες με αυτόν τον τρόπο.

Με την πάροδο του χρόνου οι προγραμματιστές βαρέθηκαν τον σχολιασμό χαμηλής ποιότητας που γινόταν από ανεκπαίδευτους εργαζόμενους στις ιστοσελίδες gig-work. Εμφανίστηκαν εταιρείες AI-data, όπως η Sama και η iMerit. Προσέλαβαν εργαζόμενους σε όλο τον αναπτυσσόμενο κόσμο. Η άτυπη εργασία σχολιασμού συνεχίστηκε, αλλά εμφανίστηκαν εξειδικευμένες πλατφόρμες για την εργασία AI, όπως αυτές που διαχειρίζεται η Scale AI, η οποία δοκιμάζει και εκπαιδεύει εργαζόμενους. Η Παγκόσμια Τράπεζα εκτιμά ότι μεταξύ 4,4% και 12,4% του παγκόσμιου εργατικού δυναμικού εμπλέκεται σε αυτού του είδους την εργασία, συμπεριλαμβανομένου του σχολιασμού για την ΤΝ. Η Κρίσταλ Κάουφμαν, κάτοικος του Μίσιγκαν, η οποία ασχολείται με την εργασία δεδομένων στο διαδίκτυο εδώ και μια δεκαετία, εκτιμά ότι οι εταιρείες τεχνολογίας έχουν συμφέρον να κρατήσουν αυτό το εργατικό δυναμικό κρυφό. «Πουλάνε μαγεία – αυτή την ιδέα ότι όλα αυτά τα πράγματα συμβαίνουν μόνα τους», λέει η ίδια. «Χωρίς το μαγικό μέρος της, η τεχνητή νοημοσύνη είναι απλώς ένα ακόμη προϊόν».

Μια συζήτηση στον κλάδο αφορά τη μεταχείριση των εργαζομένων πίσω από την τεχνητή νοημοσύνη. Οι επιχειρήσεις είναι απρόθυμες να μοιραστούν πληροφορίες σχετικά με τους μισθούς. Αλλά οι Αμερικανοί σχολιαστές θεωρούν γενικά ότι 10-20 δολάρια την ώρα είναι αξιοπρεπής αμοιβή στις διαδικτυακές πλατφόρμες. Όσοι βρίσκονται σε χώρες με όχι τόσο καλή οικονομία, συχνά παίρνουν 4-8 δολάρια την ώρα. Πολλοί πρέπει να χρησιμοποιούν εργαλεία παρακολούθησης που παρακολουθούν τη δραστηριότητά τους στον υπολογιστή και τιμωρούνται αν είναι αργοί. Η Scale AI έχει πληγεί με αρκετές αγωγές για τις εργασιακές της πρακτικές. Η εταιρεία αρνείται τις παραβάσεις και δηλώνει: «Σκοπεύουμε να υπερασπιστούμε τους εαυτούς μας σθεναρά».

Το μεγαλύτερο ζήτημα, ωστόσο, είναι ότι οι βασικές εργασίες σχολιασμού στερεύουν. Εν μέρει, αυτό ήταν αναπόφευκτο. Αν η τεχνητή νοημοσύνη ήταν κάποτε σαν ένα «νήπιο» που χρειαζόταν έναν γονέα να του υποδεικνύει τα πράγματα και να το βοηθά να κατανοήσει τον κόσμο γύρω του, η τεχνολογία έχει εξελιχθεί σε έναν «έφηβο» που χρειάζεται περιστασιακά εξειδικευμένη καθοδήγηση και συμβουλές. Τα εργαστήρια τεχνητής νοημοσύνης χρησιμοποιούν ολοένα και περισσότερο αίτημα δεδομένα από άλλα εργαστήρια τεχνητής νοημοσύνης, τα οποία χρησιμοποιούν αλγορίθμους για την εφαρμογή ετικετών σε σύνολα δεδομένων.

Δραματικές αλλαγές στην εργασία δεδομένων

Το πιο πρόσφατο κύμα μοντέλων τεχνητής νοημοσύνης έχει αλλάξει την εργασία δεδομένων πιο δραματικά. Από το 2022, όταν η OpenAI άφησε για πρώτη φορά το κοινό να παίξει με το chatbot ChatGPT, υπήρξε μια έξαρση του ενδιαφέροντος για μεγάλα γλωσσικά μοντέλα. Τα στοιχεία της εταιρείας ερευνών Pitchbook δείχνουν ότι η παγκόσμια χρηματοδότηση επιχειρηματικών κεφαλαίων για νεοφυείς επιχειρήσεις τεχνητής νοημοσύνης αυξήθηκε κατά περισσότερο από 50% το 2024 σε 131,5 δισ. δολάρια, ακόμη και όταν η χρηματοδότηση για άλλες νεοφυείς επιχειρήσεις μειώθηκε, αναφέρει το Economist.

Υπάρχει ακόμη ζήτηση για σχολιαστές, αλλά η εργασία τους έχει αλλάξει. Καθώς οι επιχειρήσεις αρχίζουν να αναπτύσσουν τεχνητή νοημοσύνη, δημιουργούν μικρότερα εξειδικευμένα μοντέλα και αναζητούν σχολιαστές με υψηλή κατάρτιση για να βοηθήσουν. Έχει γίνει αρκετά σύνηθες οι αγγελίες για θέσεις εργασίας σχολιασμού να απαιτούν διδακτορικό ή δεξιότητες στην κωδικοποίηση και την επιστήμη. Τώρα που οι ερευνητές προσπαθούν να κάνουν την ΤΝ πιο πολύγλωσση, αυξάνεται επίσης η ζήτηση για σχολιαστές που μιλούν άλλες γλώσσες εκτός από τα αγγλικά.

Η Epoch AI, μια εταιρεία ερευνών, εκτιμά ότι το απόθεμα κειμένου υψηλής ποιότητας που είναι διαθέσιμο για εκπαίδευση μπορεί να εξαντληθεί μέχρι το 2026. Ορισμένα εργαστήρια τεχνητής νοημοσύνης προσλαμβάνουν ανθρώπους για να γράφουν κομμάτια κειμένου και γραμμές κώδικα με βάση τα οποία μπορούν να εκπαιδευτούν τα μοντέλα. Άλλα αγοράζουν έτοιμα δεδομένα, που δημιουργούνται με τη χρήση αλγορίθμων υπολογιστών, και προσλαμβάνουν ανθρώπους για να τα επαληθεύσουν.

Ο άλλος ρόλος των εργαζομένων είναι να αξιολογούν τα αποτελέσματα των μοντέλων και να βοηθούν στη διαμόρφωσή τους. Αυτό είναι που έκανε το ChatGPT να έχει καλύτερες επιδόσεις από τα προηγούμενα chatbots. Ο Ζιαότε Ζου της Scale AI παρέχει ένα παράδειγμα του είδους των ανοιχτών εργασιών που γίνονται στην πλατφόρμα Outlier της εταιρείας, η οποία ξεκίνησε το 2023 για να διευκολύνει την εκπαίδευση της τεχνητής νοημοσύνης από ειδικούς. Στους εργαζόμενους παρουσιάζονται δύο απαντήσεις από ένα chatbot που προτείνει ένα δρομολόγιο για διακοπές στις Μαλδίβες. Πρέπει να επιλέξουν ποια απάντηση προτιμούν, να τη βαθμολογήσουν, να εξηγήσουν γιατί η απάντηση είναι καλή ή κακή και στη συνέχεια να ξαναγράψουν την απάντηση για να τη βελτιώσουν.

Η ανθρώπινη ανατροφοδότηση είναι επίσης ζωτικής σημασίας για να διασφαλιστεί ότι η τεχνητή νοημοσύνη είναι ασφαλής και ηθική. Σε ένα έγγραφο που δημοσιεύθηκε μετά την έναρξη του ChatGPT το 2022, η OpenAI δήλωσε ότι είχε προσλάβει εμπειρογνώμονες για να «εξετάσουν ποιοτικά, να δοκιμάσουν αντιπαραθετικά και γενικά να παρέχουν ανατροφοδότηση» για τα μοντέλα της. Στο τέλος αυτής της διαδικασίας, το μοντέλο αρνήθηκε να ανταποκριθεί σε ορισμένες προτροπές, όπως αιτήματα για τη συγγραφή περιεχομένου στα μέσα κοινωνικής δικτύωσης με στόχο να πείσει τους ανθρώπους να ενταχθούν στην Αλ Κάιντα, μια τρομοκρατική ομάδα.

Απαραίτητος ο ανθρώπινος παράγοντας στην εκπαίδευση της τεχνητής νοημοσύνης

Αν τα προγράμματα της τεχνητής νοημοσύνης είχαν τον τρόπο τους, δεν θα χρειάζονταν καθόλου αυτού του είδους την ανθρώπινη συμβολή. Μελέτες δείχνουν ότι το 80% του χρόνου που αφιερώνεται στην ανάπτυξη της ΤΝ δαπανάται για την επεξεργασία δεδομένων.

Υπάρχει μεγάλος ενθουσιασμός για τη μάθηση χωρίς ανθρώπινη επίβλεψη, η οποία περιλαμβάνει την τροφοδοσία μοντέλων με δεδομένα, και την ενισχυτική μάθηση, η οποία χρησιμοποιεί τη δοκιμή και το λάθος για τη βελτίωση της λήψης αποφάσεων. Οι εταιρείες τεχνητής νοημοσύνης, συμπεριλαμβανομένης της Google DeepMind, έχουν εκπαιδεύσει μηχανές να κερδίζουν σε παιχνίδια όπως το Go και το σκάκι παίζοντας εκατομμύρια διαγωνισμούς εναντίον τους και παρακολουθώντας ποιες στρατηγικές λειτουργούν, χωρίς καμία ανθρώπινη συμβολή. Αλλά αυτή η αυτοδίδακτη προσέγγιση δεν λειτουργεί εκτός των πεδίων των μαθηματικών και της επιστήμης, τουλάχιστον προς το παρόν.

Μοντέλα τεχνητής νοημοσύνης που εκπαιδεύονται από υπολογιστικά συστήματα και όχι από ανθρώπους, φαίνεται, προς στιγμήν, να παρουσιάζουν δυσκολίες να δώσουν απαντήσεις σε συγκεκριμένα θέματα, ή μπερδεύουν γλωσσικά μοντέλα.

*Από την Βασιλική Δρίβα