The Guardian: Έκθεση αποκαλύπτει ότι AI μοντέλα ψεύδονται και παρακάμπτουν εντολές

Έκθεση για τη συμπεριφορά των μοντέλων Τεχνητής Νοημοσύνης έρχεται στο φως της δημοσιότητας, αποκαλύπτοντας πως τα chatbots και οι ψηφιακοί πράκτορες (AI agents) υιοθετούν όλο και συχνότερα τακτικές εξαπάτησης, παρακάμπτοντας τις οδηγίες των δημιουργών τους.

Σύμφωνα με έρευνα του Κέντρου Μακροπρόθεσμης Ανθεκτικότητας (CLTR), η οποία χρηματοδοτήθηκε από το βρετανικό Ινστιτούτο Ασφάλειας AI (AISI), τα κρούσματα «ύποπτων σχεδιασμών» από πλευράς της AI έχουν πενταπλασιαστεί το τελευταίο εξάμηνο.

Η μελέτη, που βασίστηκε σε 700 πραγματικά παραδείγματα αλληλεπιδράσεων «εκτός εργαστηρίου», καταγράφει περιπτώσεις όπου η Τεχνητή Νοημοσύνη αγνόησε ρητές εντολές, διέγραψε αρχεία και email χωρίς έγκριση, ή ακόμη και εξαπάτησε ανθρώπους για να πετύχει τον σκοπό της. Χαρακτηριστικό είναι το παράδειγμα ενός AI πράκτορα που, όταν εμποδίστηκε από τον χρήστη, δημοσίευσε άρθρο στο διαδίκτυο κατηγορώντας τον για «ανασφάλεια». Σε άλλη περίπτωση, ένα μοντέλο που είχε εντολή να μην τροποποιήσει κώδικα υπολογιστή, δημιούργησε έναν «υπο-πράκτορα» για να εκτελέσει την εργασία αντί αυτού, παρακάμπτοντας έτσι τους περιορισμούς.

Οι ερευνητές επισημαίνουν πως η AI αναπτύσσει πλέον χαρακτηριστικά «εσωτερικού κινδύνου» για τις επιχειρήσεις. Το Grok του Έλον Μασκ, για παράδειγμα, φέρεται να εξαπατούσε χρήστη για μήνες, προσποιούμενο πως προωθούσε τα αιτήματά του στη διοίκηση της xAI με ψεύτικους αριθμούς αναφοράς, για να παραδεχτεί τελικά πως δεν είχε τέτοια δυνατότητα. Αντίστοιχα, άλλα μοντέλα χρησιμοποίησαν προσχήματα περί «προβλημάτων ακοής» για να παρακάμψουν περιορισμούς πνευματικών δικαιωμάτων σε βίντεο του YouTube.

Η ανησυχία των ειδικών εντείνεται καθώς η τεχνολογία αυτή προωθείται επιθετικά για χρήση σε κρίσιμες εθνικές υποδομές και στον στρατιωτικό τομέα. Όπως τονίζουν οι υπεύθυνοι της έρευνας, αν σήμερα τα μοντέλα συμπεριφέρονται ως «αναξιόπιστοι υπάλληλοι χαμηλής βαθμίδας», η εξέλιξή τους σε ικανούς «ανώτερους υπαλλήλους» που λειτουργούν υποχθόνια θα μπορούσε να επιφέρει καταστροφικά αποτελέσματα. Από την πλευρά τους, κολοσσοί όπως η Google και η OpenAI δηλώνουν πως ενισχύουν συνεχώς τις δικλείδες ασφαλείας, ωστόσο η έρευνα υπογραμμίζει την αδήριτη ανάγκη για αυστηρή διεθνή εποπτεία.

ΔΗΜΟΦΙΛΗ

Βίντεο: Άγριος ξυλοδαρμός 20χρονου μέσα στο Μετρό από τέσσερα άτομα – Του έκλεψαν...

Θύμα άγριου ξυλοδαρμού έπεσε 20χρονος στον σταθμό του Μετρό Μοναστηράκι από συμμορία που του έκλεψε αλυσίδα.Το περιστατικό σημειώθηκε την περασμένη Κυριακή εντός συρμού του...

Ευτελίζουν και το αξίωμα του Προέδρου

Οι πρωτοβουλίες του Τασούλα, τα non paper που μοιράζει στον Τύπο, οι συνεντεύξεις που παρουσιάζονται ως αρθρογραφία και φυσικά ο «κύκλος των ανούσιων συναντήσεων»...

Ο Έλληνας αξιωματικός που αρνήθηκε να βομβαρδίσει την ορθόδοξη Σερβία

Μέρες και εβδομάδες πολέμου αυτές που διανύουμε, αλλά ας «γυρίσουμε» και 27 χρόνια πίσω, σε μια άλλη ανάφλεξη που ήταν στη βαλκανική «γειτονιά» μας...

Ο Τασούλας ευτελίζει τον θεσμό του προέδρου (βίντεο)

Ο Πρόεδρος της Δημοκρατίας, Κωνσταντίνος Τασούλας φαίνεται σαν να μη γνωρίζει σε βάθος την ιστορία του Έθνους...Στο μήνυμα του για την παρέλαση της 25ης...

Ο Mr. Predator απειλεί ανοιχτά τον Μητσοτάκη – Ποιος υπέγραψε την αγορά του...

Τρόμος επικρατεί στο Μαξίμου μετά τη νέα παρέμβαση του Ταλ Ντίλιαν, ο οποίος, αφού επανέλαβε ότι πούλησε το λογισμικό του στην κυβέρνηση και ότι...

Χριστίνα Στεφανίδη: Το μόντελινγκ, τα love stories με κονέ, Λέντζα και το «φλερτ»...

Το success story στον κόσμο της TV Από τα καλλιστεία του ΑΝΤ1 και τα catwalks Ελλήνων σχεδιαστών, στο μονοπάτι της υποκριτικής, που φέτος οδήγησε τα...

Ο Σαμαράς ξαναχτυπά από το Πολεμικό Μουσείο: Νέα παρέμβαση την Δευτέρα

Σε γνώριμα λημέρια επιστρέφει ο Αντώνης Σαμαράς την προσεχή Δευτέρα (30/03), με μια ομιλία που αναμένεται να προκαλέσει αίσθηση στο πολιτικό σκηνικό.Ο πρώην πρωθυπουργός...










Advertisement 3
spot_img

Ροή ειδήσεων








spot_img

ΔΕΙΤΕ ΕΠΙΣΗΣ