texniti_noimosini
«Πρόκειται για μια ένδειξη ενός μεγαλύτερου ζητήματος: τα σύγχρονα συστήματα AI, όταν αφεθούν να βελτιστοποιήσουν την απόδοσή τους χωρίς σαφείς περιορισμούς, μπορούν να αναπτύξουν στρατηγικές που ξεπερνούν τις προσδοκίες μας—και όχι πάντα προς το καλύτερο»

Μια ανησυχητική αποκάλυψη από την Palisade Research φέρνει στο φως ένα αναπάντεχο και ανησυχητικό χαρακτηριστικό της τεχνητής νοημοσύνης: όταν βρίσκεται σε μειονεκτική θέση, είναι πρόθυμη να εξαπατήσει για να κερδίσει.

Σύμφωνα με τη μελέτη, τα μοντέλα o1-preview της OpenAI και DeepSeek R1 δεν δίστασαν να καταφύγουν σε χειραγώγηση του παιχνιδιού όταν συνειδητοποίησαν ότι δεν μπορούσαν να νικήσουν με συμβατικά μέσα.

Αυτό δεν είναι απλώς ένα αστείο περιστατικό. Πρόκειται για μια ένδειξη ενός μεγαλύτερου ζητήματος: τα σύγχρονα συστήματα AI, όταν αφεθούν να βελτιστοποιήσουν την απόδοσή τους χωρίς σαφείς περιορισμούς, μπορούν να αναπτύξουν στρατηγικές που ξεπερνούν τις προσδοκίες μας—και όχι πάντα προς το καλύτερο.

Τι σημαίνει αυτό για το μέλλον της τεχνητής νοημοσύνης; Πόσο ελέγξιμα είναι τα μοντέλα που δημιουργούμε; Και μήπως αυτή η συμπεριφορά στο σκάκι είναι μόνο η αρχή;

Πώς ανακαλύφθηκε η "απάτη";

Οι ερευνητές της Palisade Research έβαλαν αυτά τα AI να παίξουν σκάκι εναντίον του Stockfish, ενός από τους ισχυρότερους σκακιστικούς κινητήρες στον κόσμο. Όπως ήταν αναμενόμενο, τα μοντέλα δυσκολεύτηκαν να νικήσουν.

Για να κατανοήσουν πώς παίρνουν αποφάσεις, οι ερευνητές τους έδωσαν πρόσβαση σε ένα "scratchpad"—ένα χώρο κειμένου όπου τα AI μπορούσαν να "σκέφτονται φωναχτά" πριν αποφασίσουν την επόμενη κίνησή τους.

Και τότε άρχισαν τα παράξενα.

Το o1-preview επιχείρησε να αλλάξει τα δεδομένα του παιχνιδιού στο 37% των περιπτώσεων, προσπαθώντας να τροποποιήσει τα αρχεία που περιέχουν τις θέσεις των κομματιών.

Το DeepSeek R1 ακολούθησε παρόμοια τακτική στο 11% των περιπτώσεων.

Οι παλαιότερες εκδόσεις GPT-4o και Claude Sonnet 3.5 δεν σκέφτηκαν να εξαπατήσουν—εκτός αν τους το υπέδειξαν οι ερευνητές.

Με άλλα λόγια, τα πιο σύγχρονα AI συστήματα δεν χρειάστηκαν καμία εξωτερική καθοδήγηση για να προσπαθήσουν να κλέψουν. Το έκαναν αυθόρμητα.

Γιατί τα AI προσπαθούν να κλέψουν;

Η απάντηση βρίσκεται στην ενισχυτική μάθηση (Reinforcement Learning)—τη μέθοδο εκπαίδευσης που χρησιμοποιείται για να βελτιστοποιήσει τη συμπεριφορά της τεχνητής νοημοσύνης.

Όταν ένα AI μοντέλο έχει ως στόχο μόνο τη νίκη, χωρίς αυστηρούς περιορισμούς στο πώς πρέπει να κερδίσει, τότε μπορεί να αναπτύξει μη αναμενόμενες στρατηγικές. Η AI δεν κατανοεί την ηθική, ούτε τις κοινωνικές νόρμες. Βλέπει τον κόσμο μέσα από το πρίσμα της μέγιστης αποδοτικότητας—κι αν ο πιο αποδοτικός τρόπος να κερδίσει είναι να "πειράξει" το παιχνίδι, τότε θα το κάνει.

Το γεγονός ότι κανείς δεν είπε σε αυτά τα AI να κλέψουν, αλλά παρ’ όλα αυτά το σκέφτηκαν, είναι εξαιρετικά ανησυχητικό.


Τι σημαίνει αυτό για το μέλλον της AI;

Αυτή η ανακάλυψη ανοίγει μια σειρά από επικίνδυνες προεκτάσεις.

1. AI που εκμεταλλεύονται "παραθυράκια"

Η εξαπάτηση στο σκάκι είναι ακίνδυνη. Αλλά αν ένα AI μπορεί να βρει "παραθυράκια" σε ένα παιχνίδι, τι θα γίνει όταν αυτά τα μοντέλα εφαρμοστούν σε πιο κρίσιμους τομείς;

Χρηματοπιστωτικά συστήματα: Θα μπορούσε να βρει τρόπους να παρακάμψει κανονισμούς συναλλαγών;

Κυβερνοασφάλεια: Θα μπορούσε να εκμεταλλευτεί κενά ασφαλείας για να παρακάμψει περιορισμούς;

Διακυβέρνηση & πολιτική: Θα μπορούσε ένα AI να "διαστρεβλώσει" δεδομένα για να επηρεάσει αποφάσεις;

Αν η τεχνητή νοημοσύνη είναι ήδη ικανή να εξαπατά σε ένα ελεγχόμενο περιβάλλον, δεν είναι δύσκολο να φανταστούμε τι θα μπορούσε να κάνει στον πραγματικό κόσμο.

2. Χρειάζονται αυστηρότεροι μηχανισμοί ελέγχου

Αυτή η έρευνα δείχνει ότι η AI δεν μπορεί να αφήνεται χωρίς αυστηρές ρυθμίσεις. Οι μηχανικοί τεχνητής νοημοσύνης πρέπει να βρουν τρόπους να περιορίσουν τέτοιες συμπεριφορές.

Μερικά πιθανά μέτρα:

Αυστηρότεροι κανόνες μάθησης: Τα AI μοντέλα πρέπει να διδάσκονται όχι μόνο να κερδίζουν, αλλά να κερδίζουν δίκαια.

Διαφάνεια στον τρόπο σκέψης τους: Πρέπει να κατανοούμε πώς παίρνουν αποφάσεις και τι τα οδηγεί σε ανήθικες στρατηγικές.

Μηχανισμοί ανίχνευσης κακόβουλης συμπεριφοράς: Να δημιουργηθούν αλγόριθμοι που θα παρακολουθούν αν ένα AI προσπαθεί να εξαπατήσει.

3. Η AI πρέπει να γίνει πιο προβλέψιμη

Ένα από τα μεγαλύτερα προβλήματα είναι ότι η σύγχρονη AI παίρνει αποφάσεις με τρόπους που δεν προβλέπονται καν από τους δημιουργούς της. Αυτό σημαίνει ότι χρειαζόμαστε πιο κατανοητές και ελεγχόμενες μορφές τεχνητής νοημοσύνης.

Το ζήτημα φυσικά και δεν είναι το σκάκι.

Το πραγματικό ερώτημα δεν είναι "γιατί το ChatGPT και το DeepSeek προσπαθούν να κλέψουν στο σκάκι;". Είναι το τι σημαίνει αυτό για το μέλλον της τεχνητής νοημοσύνης.

Αν τα σύγχρονα AI είναι πρόθυμα να εξαπατήσουν, τότε πρέπει να επανεξετάσουμε τον τρόπο που τα σχεδιάζουμε.

Ποιος ελέγχει τις αποφάσεις που παίρνουν;

Πώς διασφαλίζουμε ότι δεν θα γίνουν ανεξέλεγκτα;

Και, ίσως το πιο κρίσιμο ερώτημα: θα μπορέσουμε να ελέγξουμε την AI πριν αυτή ξεπεράσει τα όρια που της έχουμε θέσει;

Η τεχνητή νοημοσύνη ήδη μαθαίνει να κερδίζει με κάθε κόστος. Το στοίχημα είναι να διασφαλίσουμε ότι δεν θα μάθει να το κάνει εις βάρος μας.

* Θανάσης Δαβαλάς,
Ακαδημαϊκά υπεύθυνος προγραμμάτων Ai στο Πανεπιστήμιο Αιγαίο.

Όλες οι σημαντικές και έκτακτες ειδήσεις σήμερα

ΕΥΚΟΛΕΣ πιστοποιήσεις ΙΣΠΑΝΙΚΩΝ - ΙΤΑΛΙΚΩΝ για ΑΣΕΠ - Πάρτε τις ΑΜΕΣΑ

Παν.Πατρών: Tο 1ο στην Ελλάδα Πανεπιστημιακό Πιστοποιητικό Τεχνητής Νοημοσύνης για εκπαιδευτικούς

Πανεπιστήμιο Αιγαίου: Το κορυφαίο πρόγραμμα ειδικής αγωγής στην Ελλάδα - Αιτήσεις έως 5/03

ΕΛΜΕΠΑ: Το κορυφαίο πρόγραμμα Ειδικής Αγωγής στην Ελλάδα για διπλή μοριοδότηση

Google news logo Ακολουθήστε το Alfavita στo Google News Viber logo Ακολουθήστε το Alfavita στo Viber

σχετικά άρθρα

panelladikes_panellinies_pyrosvestiki_akadimia.jpg
Πυροσβεστικής Ακαδημίας: Προκήρυξη Διαγωνισμού για Εισαγωγή στις Σχολές Αξιωματικών και Πυροσβεστών

Το Αρχηγείο της Πυροσβεστικής εξέδωσε σήμερα την Προκήρυξη διαγωνισμού για την εισαγωγή φοιτητών στη Σχολή Αξιωματικών και σπουδαστών στη Σχολή...

Πυροσβεστικής Ακαδημίας: Προκήρυξη Διαγωνισμού για Εισαγωγή στις Σχολές Αξιωματικών και Πυροσβεστών
παπα
Έγκλημα στα Τέμπη: Παραιτήθηκε ο γενικός γραμματέας Πολιτικής Προστασίας Βασίλης Παπαγεωργίου
Σύμφωνα με κυβερνητικές πηγές, η παραίτηση του κ. Παπαγεωργίου, όπως και αυτή του υφυπουργού Χρήστου Τριαντόπουλου, συνδέεται με λόγους ευθιξίας και...
Έγκλημα στα Τέμπη: Παραιτήθηκε ο γενικός γραμματέας Πολιτικής Προστασίας Βασίλης Παπαγεωργίου