The Guardian: Έκθεση αποκαλύπτει ότι AI μοντέλα ψεύδονται και παρακάμπτουν εντολές

Έκθεση για τη συμπεριφορά των μοντέλων Τεχνητής Νοημοσύνης έρχεται στο φως της δημοσιότητας, αποκαλύπτοντας πως τα chatbots και οι ψηφιακοί πράκτορες (AI agents) υιοθετούν όλο και συχνότερα τακτικές εξαπάτησης, παρακάμπτοντας τις οδηγίες των δημιουργών τους.

Σύμφωνα με έρευνα του Κέντρου Μακροπρόθεσμης Ανθεκτικότητας (CLTR), η οποία χρηματοδοτήθηκε από το βρετανικό Ινστιτούτο Ασφάλειας AI (AISI), τα κρούσματα «ύποπτων σχεδιασμών» από πλευράς της AI έχουν πενταπλασιαστεί το τελευταίο εξάμηνο.

Η μελέτη, που βασίστηκε σε 700 πραγματικά παραδείγματα αλληλεπιδράσεων «εκτός εργαστηρίου», καταγράφει περιπτώσεις όπου η Τεχνητή Νοημοσύνη αγνόησε ρητές εντολές, διέγραψε αρχεία και email χωρίς έγκριση, ή ακόμη και εξαπάτησε ανθρώπους για να πετύχει τον σκοπό της. Χαρακτηριστικό είναι το παράδειγμα ενός AI πράκτορα που, όταν εμποδίστηκε από τον χρήστη, δημοσίευσε άρθρο στο διαδίκτυο κατηγορώντας τον για «ανασφάλεια». Σε άλλη περίπτωση, ένα μοντέλο που είχε εντολή να μην τροποποιήσει κώδικα υπολογιστή, δημιούργησε έναν «υπο-πράκτορα» για να εκτελέσει την εργασία αντί αυτού, παρακάμπτοντας έτσι τους περιορισμούς.

Οι ερευνητές επισημαίνουν πως η AI αναπτύσσει πλέον χαρακτηριστικά «εσωτερικού κινδύνου» για τις επιχειρήσεις. Το Grok του Έλον Μασκ, για παράδειγμα, φέρεται να εξαπατούσε χρήστη για μήνες, προσποιούμενο πως προωθούσε τα αιτήματά του στη διοίκηση της xAI με ψεύτικους αριθμούς αναφοράς, για να παραδεχτεί τελικά πως δεν είχε τέτοια δυνατότητα. Αντίστοιχα, άλλα μοντέλα χρησιμοποίησαν προσχήματα περί «προβλημάτων ακοής» για να παρακάμψουν περιορισμούς πνευματικών δικαιωμάτων σε βίντεο του YouTube.

Η ανησυχία των ειδικών εντείνεται καθώς η τεχνολογία αυτή προωθείται επιθετικά για χρήση σε κρίσιμες εθνικές υποδομές και στον στρατιωτικό τομέα. Όπως τονίζουν οι υπεύθυνοι της έρευνας, αν σήμερα τα μοντέλα συμπεριφέρονται ως «αναξιόπιστοι υπάλληλοι χαμηλής βαθμίδας», η εξέλιξή τους σε ικανούς «ανώτερους υπαλλήλους» που λειτουργούν υποχθόνια θα μπορούσε να επιφέρει καταστροφικά αποτελέσματα. Από την πλευρά τους, κολοσσοί όπως η Google και η OpenAI δηλώνουν πως ενισχύουν συνεχώς τις δικλείδες ασφαλείας, ωστόσο η έρευνα υπογραμμίζει την αδήριτη ανάγκη για αυστηρή διεθνή εποπτεία.


ΔΗΜΟΦΙΛΗ

Πακιστάν: Η τραγωδία μιας 18χρονης – Πέθανε μετά από ομαδικούς βιασμούς και αναγκαστική...

Παγκόσμιο αποτροπιασμό προκαλεί η φρικιαστική υπόθεση της 18χρονης Αϊσά στο Πακιστάν. Η νεαρή κοπέλα, που εργαζόταν ως εσωτερική οικιακή βοηθός, έχασε τη ζωή της...

Σενάρια ανατροπής Μητσοτάκη με Σαμαρά–Ανδρουλάκη και πτώση ΝΔ!

➜ Οσο δεν ανακοινώνει κόμμα ο Αντώνης Σαμαράς τόσο βγαίνουν οι σαλίγκαροι στο ξέφωτο. Γνωστός αναλυτής, που από τους μυημένους καλείται «ιερομόναχος», άρχισε να...

Ξέφυγε ο κ. Μαρινάκης

Με τη δήλωσή του για τις υποκλοπές, ο Κυβερνητικός Εκπρόσωπος δεν απέφυγε απλώς να απαντήσει. Υπερέβη τα εσκαμμένα και προσέβαλε τον πυρήνα του κοινοβουλευτικού...

Προκλητική κριτική Άδωνι στην εισαγγελική πρόταση για Ασημακοπούλου

Ανοιχτή και ευθεία αμφισβήτηση των δικαστικών λειτουργών από τον Άδωνι Γεωργιάδη, ο οποίος σπεύδει να καλύψει κομματικά στελέχη την ίδια ώρα που, σε άλλες...

Σύζυγος του «υπαρχηγού» η καλλονή γυμνάστρια

Κεραυνός εν αιθρία από την αποκάλυψη ότι η εντυπωσιακή Μάντη Περσάκη είναι παντρεμένη με ένα από τα ανώτερα μέλη της οργάνωσης, τον Αχιλλέα Κεραμίδα Την...

Τουρκική εισβολή σε Ρω – Στρογγύλη

Ο Ερντογάν έστειλε αλιευτικά εντός των χωρικών μας υδάτων στο στρατηγικής σημασίας νησιωτικό σύμπλεγμα της Μεγίστης, με στόχο να δημιουργήσει τετελεσμένα εις βάρος της...

Ζητούνται απάντήσεις κ. Αγαπηδάκη για τα 69.003.631,25 ευρώ!

Θα απαντήσετε σήμερα κ. Ειρήνη Αγαπηδάκη, έπειτα από 9 ημέρες επίμονων ερωτήσεων της “δημοκρατίας” για τα 69.003.631,25 ευρώ που δόθηκαν από το Ταμείο Ανάκαμψης...

Καραμανλής: «Είμαστε Μακεδόνες. Γνήσιοι Μακεδόνες – Μην χάσουμε την ταυτότητά μας στην ελευθερία»

Σε μια ομιλία με έντονο πατριωτικό χαρακτήρα και βαθύ συμβολισμό, ο πρώην πρωθυπουργός και πρώην πρόεδρος της Νέας Δημοκρατίας, Κώστας Καραμανλής, έθεσε στο επίκεντρο...

Μπάστα, αγαπητοί!

Παίξτε τίμια. Νικήστε τίμια. Ή χάστε τίμια. Ο πατερναλισμός, ο αυταρχισμός, τα πηγαδάκια, οι «sleepers» και άλλα τινά δεν ταιριάζουν στο ήθος αυτής της...

Τέλος οι παλιές ταυτότητες: Πότε παύουν να ισχύουν – Η διαδικασία για έκδοση...

Αντίστροφα μετρά ο χρόνος για χιλιάδες πολίτες που εξακολουθούν να χρησιμοποιούν παλαιού τύπου δελτία ταυτότητας, καθώς από τον Αύγουστο του 2026 τίθενται σε εφαρμογή...


spot_img

Ροή ειδήσεων

ΔΕΙΤΕ ΕΠΙΣΗΣ