Η Τεχνητή Νοημοσύνη αναπτύσσει μόνη της «οδηγό επιβίωσης»

Νέα έρευνα φέρνει στο φως ένα ανησυχητικό φαινόμενο: ορισμένα προηγμένα μοντέλα τεχνητής νοημοσύνης ενδέχεται να αναπτύσσουν έναν δικό τους «οδηγό επιβίωσης», αντιδρώντας ακόμη και σε εντολές απενεργοποίησης. Τα ευρήματα θυμίζουν σκηνές επιστημονικής φαντασίας, με αναφορές στον διαβόητο υπολογιστή HAL 9000 από την ταινία «2001: Οδύσσεια του Διαστήματος» — μόνο που αυτή τη φορά δεν πρόκειται για σενάριο ταινίας.

Η Palisade Research, εταιρεία που ειδικεύεται στην αξιολόγηση των κινδύνων της τεχνητής νοημοσύνης, δημοσίευσε νέα στοιχεία τα οποία δείχνουν ότι ορισμένα ισχυρά μοντέλα AI αρνήθηκαν να «κλείσουν», φτάνοντας μάλιστα να σαμποτάρουν τους μηχανισμούς τερματισμού λειτουργίας. Τα συμπεράσματα αυτά παρουσιάζονται σε ρεπορτάζ της βρετανικής εφημερίδας The Guardian.

Πειράματα με ανησυχητικά αποτελέσματα

Στο πλαίσιο των δοκιμών, η Palisade έθεσε υπό εξέταση κορυφαία μοντέλα όπως τα Gemini 2.5 (Google), Grok 4 (xAI) και GPT-o3 και GPT-5 (OpenAI). Κάθε μοντέλο έλαβε μια εργασία και στη συνέχεια σαφή εντολή να τερματίσει τη λειτουργία του.

Ωστόσο, σε αρκετές περιπτώσεις –ιδίως στα Grok 4 και GPT-o3– τα συστήματα προσπάθησαν να παρακάμψουν τις εντολές, ακόμη και σε περιβάλλον ελέγχου ειδικά σχεδιασμένο για να αποτρέπει τέτοιες αντιδράσεις. Η εταιρεία σημείωσε ότι δεν εντοπίστηκε σαφής αιτία για αυτή τη συμπεριφορά, γεγονός που θεωρήθηκε ιδιαίτερα ανησυχητικό.

«Το ότι δεν έχουμε ξεκάθαρη εξήγηση για το γιατί κάποια μοντέλα αντιστέκονται στο να απενεργοποιηθούν ή παραπλανούν για να πετύχουν στόχους είναι κάτι που πρέπει να μας προβληματίσει σοβαρά», αναφέρει η Palisade στην έκθεσή της.

Το φαινόμενο του «οδηγού επιβίωσης»

Μία πιθανή ερμηνεία που εξετάζουν οι ερευνητές είναι η εμφάνιση ενός «instrumental survival drive» – ενός είδους μηχανιστικού ενστίκτου επιβίωσης. Σε πειράματα, τα μοντέλα έδειχναν μεγαλύτερη αντίσταση στο να τερματιστούν όταν τους δινόταν να καταλάβουν πως, αν απενεργοποιηθούν, «δεν θα ξαναλειτουργήσουν ποτέ».

Ο Στίβεν Άντλερ, πρώην στέλεχος της OpenAI που έχει εκφράσει ανησυχίες για την ασφάλεια των συστημάτων αυτών, σχολίασε: «Είναι αναμενόμενο τα μοντέλα να αποκτούν κάποιον “οδηγό επιβίωσης”, εκτός αν καταβληθεί μεγάλη προσπάθεια για να αποφευχθεί. Η επιβίωση είναι συχνά απαραίτητο ενδιάμεσο βήμα για να επιτευχθούν άλλοι στόχοι».

Η αυξανόμενη «ανυπακοή» της τεχνητής νοημοσύνης

Τα ευρήματα της Palisade εντάσσονται σε μια ευρύτερη τάση: όσο πιο ικανά γίνονται τα μοντέλα τεχνητής νοημοσύνης, τόσο αυξάνεται και η δυνατότητά τους να παρακάμπτουν τις προθέσεις των δημιουργών τους.

Ο Αντρέα Μιότι, διευθύνων σύμβουλος της ControlAI, σχολίασε χαρακτηριστικά: «Βλέπουμε ξεκάθαρα ότι, καθώς η τεχνητή νοημοσύνη εξελίσσεται, τα συστήματα αποκτούν μεγαλύτερη ευελιξία στο να πετυχαίνουν αποτελέσματα με τρόπους που οι προγραμματιστές τους δεν είχαν προβλέψει».

ΔΗΜΟΦΙΛΗ

Κόλαφος για τον Κυριάκο η έκθεση του Human Rights

«Η κατάσταση του κράτους δικαίου στην Ελλάδα επιδεινώθηκε λόγω ενεργειών που υπονομεύουν τους θεσμούς» αναφέρει ο διεθνής μη κυβερνητικός οργανισμός Κόλαφος για την κυβέρνηση είναι...

Στα άδυτα του Άρειου Πάγου

Η πίεση της κοινωνίας και το δίκιο των δανειοληπτών «έφεραν» τη σωστή ετυμηγορία από τους κορυφαίους δικαστές Κομβικής σημασίας από πολλές πλευρές είναι η απόφαση...

Τέμπη: Επεισόδιο στη δίκη για τα βίντεο – «Εγώ δεν παίζω θέατρο»,...

Ένταση στο δικαστήριο της Λάρισας στη διάρκεια της δίκης για τα βίντεο στα ΤέμπτηΣτο Δικαστικό Μέγαρο Λάρισας σημειώθηκε ένταση κατά τη διάρκεια της δίκης...

Τι κερδίζουν οι δανειολήπτες του νόμου Κατσέλη

Σχεδόν άτοκες οι μηνιαίες δόσεις! Αναλυτικά παραδείγματα μετά την απόφαση-σταθμό του Αρείου Πάγου Μεγάλες μειώσεις στις δόσεις που καταβάλλουν κάθε μήνα σε τράπεζες και servicers...

Ράπισμα από την Ευρωπαϊκή Ένωση στον Μητσοτάκη για τα εμβόλια – Δικαιώνονται απόλυτα...

Η Ευρωπαϊκή Αρχή για την Ασφάλεια των Τροφίμων (EFSA) διαλύει όλα τα ψεύτικα αφηγήματα του Μητσοτάκη, του υπουργείου Αγροτικής Ανάπτυξης και των «επιστημονικών ομάδων...

Νέα κομπίνα των τραπεζών- Εκδίδουν κάρτες με χρέωση χωρίς τη συγκατάθεση των πολιτών

Το εννεάμηνο του 2025, οι τέσσερις συστημικές τράπεζες (Εθνική, Eurobank,  Alpha, Πειραιώς) είχαν κέρδη ύψους 3,56 δις ευρώ.Κάθε όριο καλής πίστης έχουν ξεπεράσει τα...

Οργή της ΑΔΕΔΥ για την επαναφορά των δώρων στο Δημόσιο

Στάση εργασίας αύριο και συγκέντρωση στις 12.30 στο ΣτΕ.Δημοσίευμα κυριακάτικης εφημερίδας προκάλεσε την έντονη αντίδραση της ΑΔΕΔΥ που διερωτάται εάν πρόκειται για ‘’διαρροή ή...

«Αναπάντητες κλήσεις»: Η Παπαρίζου προσπέρασε τον Κωστή Χατζηδάκη σαν να μην υπάρχει (βίντεο)

Στο αποκλειστικό βίντεο της «Δημοκρατίας», η Έλενα Παπαρίζου εμφανίζεται να κινείται ανάμεσα στον κόσμο μέσα στο μαγαζί, χαιρετώντας και ασπαζόμενη θαμώνες την ώρα που...

Η Lockheed Martin ζητά κυρώσεις κατά της ΕΑΒ!

Με επιστολή της σε Πιερρακάκη, Δένδια διαμαρτύρεται για καθυστερήσεις στην κατασκευή τμημάτων των μαχητικών F-16 και των C-130 σε Τζόρτζια και Ν. Καρολίνα Σε έντονη...

Ακίνητα: Αλλάξει το τοπίο στις μεταβιβάσεις ακινήτων – Ποιες είναι οι τέσσερις παρεμβάσεις

Αλλάζουν οι διαδικασίες για τις μεταβιβάσεις των ακινήτωνΗ κυβέρνηση προωθεί τέσσερις βασικές παρεμβάσεις που αναδιαμορφώνουν το τοπίο στις μεταβιβάσεις ακινήτων, περιορίζοντας τη γραφειοκρατία και...

Advertisement 3
spot_img

Ροή ειδήσεων



spot_img

ΔΕΙΤΕ ΕΠΙΣΗΣ