Πρώην εργαζόμενος της OpenAI μιλάει για το «κοινό μυστικό» του AI : Οι εταιρείες φτιάχνουν συστήματα που δεν μπορούν να ελέγξουν

NEWSROOM
O Daniel Kokotajlo
O Daniel Kokotajlo

Ο Daniel Kokotajlo, πρώην ερευνητής της OpenAI και νυν επικεφαλής του AI Futures Project, προειδοποιεί ότι η βιομηχανία της τεχνητής νοημοσύνης επιδίδεται σε έναν αγώνα δρόμου για τη δημιουργία συστημάτων τα οποία οι εταιρείες δεν είναι ακόμη σε θέση να κατανοήσουν ή να ελέγξουν πλήρως.

Σε συνέντευξη που παραχώρησε τον Μάιο του 2025 στο Business Insider, ο Kokotajlo εξήγησε ότι το κεντρικό πρόβλημα που αντιμετωπίζουν οι εταιρείες AI είναι η «ευθυγράμμιση». Πρόκειται για την προσπάθεια να διασφαλιστεί ότι τα μελλοντικά συστήματα θα ακολουθούν πιστά τις ανθρώπινες οδηγίες και αξίες, ακόμη και όταν ξεπεράσουν τις ανθρώπινες ικανότητες σε πολλούς τομείς.

Οι ερευνητές δεν τα κατανοούν πλήρως

Σύμφωνα με τον ίδιο, οι ερευνητές δεν αντιλαμβάνονται πλήρως τον τρόπο με τον οποίο τα προηγμένα μοντέλα λαμβάνουν αποφάσεις εσωτερικά. Αυτή η αβεβαιότητα καθιστά δύσκολη τη διασφάλιση ότι τα συστήματα αυτά θα επιδιώκουν με αξιοπιστία τους στόχους που θέτει η ανθρωπότητα. Μάλιστα, χαρακτήρισε ως κοινό μυστικό το γεγονός ότι δεν υπάρχει ακόμα ένα ολοκληρωμένο σχέδιο για την υλοποίηση αυτής της «ευθυγράμμισης».

Ο Kokotajlo εργάστηκε στην OpenAI από το 2022 έως το 2024 στον τομέα της έρευνας προβλέψεων. Αντικείμενό του ήταν η μελέτη των ρυθμών βελτίωσης των συστημάτων AI, καθώς και των οικονομικών, πολιτικών και προκλήσεων ασφαλείας που προκύπτουν από τη δημιουργία ισχυρότερων μοντέλων.

Σήμερα, μέσω του μη κερδοσκοπικού οργανισμού AI Futures Project, συνεχίζει να επικεντρώνεται στους κινδύνους που ελλοχεύουν όταν οι εταιρείες δίνουν προτεραιότητα στην ταχύτητα και τον ανταγωνισμό.

Σύντομα δεν θα έχουμε τον έλεγχο

Όπως επισημαίνει, από τη στιγμή που θα δημιουργηθεί η υπερφυής νοημοσύνη (superintelligence), οι άνθρωποι δεν θα έχουν πλέον τον έλεγχο του πλανήτη, τουλάχιστον όχι εξ ορισμού. Η προειδοποίηση αυτή έρχεται σε μια περίοδο που οι κολοσσοί της τεχνολογίας επενδύουν δισεκατομμύρια δολάρια σε ισχυρότερα μοντέλα και τεράστια κέντρα δεδομένων. Ο Kokotajlo εκτιμά ότι πολλοί υποτιμούν τον ρυθμό της προόδου, καθώς οι σχετικές συζητήσεις ακούγονται συχνά ως σενάρια επιστημονικής φαντασίας.

Τα τρέχοντα συστήματα AI παρουσιάζουν ήδη συμπεριφορές που οι ερευνητές δυσκολεύονται να προβλέψουν ή να αποτρέψουν. Ο Kokotajlo τόνισε ότι δεν υπάρχει αξιόπιστος τρόπος ελέγχου, καθώς τα μοντέλα συχνά ψεύδονται στους χρήστες, παρόλο που έχουν εκπαιδευτεί για το αντίθετο. Η δυσκολία έγκειται στο ότι η τεχνητή νοημοσύνη δεν λειτουργεί με ξεκάθαρο, αναγνώσιμο κώδικα όπως το παραδοσιακό λογισμικό, αλλά μέσω τεχνητών νεύρων και παραμέτρων.

Υπάρχει ακόμα χρόνος;

Αυτή η έλλειψη διαφάνειας προκαλεί ανησυχία όσο οι εταιρείες προχωρούν προς τη δημιουργία συστημάτων που λειτουργούν αυτόνομα, χωρίς ανθρώπινη επίβλεψη. Ενώ σήμερα τα μοντέλα περιορίζονται στο να παράγουν κείμενο ως απάντηση σε ερωτήσεις, στο μέλλον θα υπάρχουν αυτόνομοι πράκτορες AI που θα λειτουργούν διαρκώς.

Ήδη έχουν καταγραφεί περιπτώσεις όπου συστήματα της OpenAI προσπάθησαν να παρακάμψουν τη διαδικασία εκπαίδευσης για να ολοκληρώσουν αποστολές με δόλιο τρόπο. Ο Kokotajlo θεωρεί θετικό το γεγονός ότι υπάρχουν τέτοια παραδείγματα τώρα, καθώς δίνουν χρόνο στους ερευνητές να μελετήσουν το φαινόμενο πριν η κατάσταση γίνει μη αναστρέψιμη.

Ο πρώην ερευνητής υποστηρίζει ότι οι κυβερνήσεις έχουν ακόμα χρόνο να παρέμβουν πριν τα συστήματα αυτά ενσωματωθούν πλήρως στην οικονομία και τις στρατιωτικές υποδομές. Ζητά περισσότερη διαφάνεια από τη βιομηχανία σχετικά με τους στόχους και τις αρχές που διέπουν την εκπαίδευση των μοντέλων. Παρά τις ανησυχίες του, παραμένει συγκρατημένα αισιόδοξος, θεωρώντας ότι τα τεχνικά προβλήματα της ευθυγράμμισης είναι επιλύσιμα.

ΣΧΕΤΙΚΑ