Ο Ίλον Μασκ δήλωσε ότι οι εταιρείες που ασχολούνται με την τεχνητή νοημοσύνη έχουν φτάσει σε αδιέξοδο όσον αφορά τα δεδομένα για την εκπαίδευση των μοντέλων τους και έχουν εξαντλήσει το σύνολο της ανθρώπινης γνώσης.
Ο πλουσιότερος άνθρωπος στον κόσμο πρότεινε ότι οι εταιρείες τεχνολογίας θα πρέπει να στραφούν σε «συνθετικά» δεδομένα – ή υλικό που δημιουργείται από μοντέλα τεχνητής νοημοσύνης – για να κατασκευάσουν και να τελειοποιήσουν νέα συστήματα, μια διαδικασία που ήδη λαμβάνει χώρα με την ταχέως αναπτυσσόμενη τεχνολογία.
Ο Μασκ προειδοποίησε επίσης ότι η συνήθεια των μοντέλων τεχνητής νοημοσύνης να παράγουν «ψευδαισθήσεις» – όρος για ανακριβές ή παράλογο αποτέλεσμα – αποτελεί κίνδυνο για τη διαδικασία συνθετικών δεδομένων.
«Το σωρευτικό άθροισμα της ανθρώπινης γνώσης έχει εξαντληθεί στην εκπαίδευση AI. Αυτό συνέβη βασικά πέρυσι», είπε ο Μασκ σε μια συνέντευξη που μεταδόθηκε ζωντανά στην πλατφόρμα κοινωνικής δικτύωσης X.
Μοντέλα τεχνητής νοημοσύνης όπως το μοντέλο GPT-4o που τροφοδοτεί το chatbot ChatGPT «εκπαιδεύονται» σε μια τεράστια γκάμα δεδομένων που λαμβάνονται από το διαδίκτυο, όπου στην πραγματικότητα μαθαίνουν να εντοπίζουν μοτίβα σε αυτές τις πληροφορίες – επιτρέποντάς τους να προβλέψουν, για παράδειγμα, την επόμενη λέξη σε μια πρόταση.
Συνθετικά δεδομένα για την τεχνητή νοημοσύνη
Ο Μασκ είπε ότι ο «μόνος τρόπος» για να αντιμετωπιστεί η έλλειψη υλικού από πηγές για την εκπαίδευση νέων μοντέλων ήταν να προχωρήσουμε σε συνθετικά δεδομένα που δημιουργούνται από την τεχνητή νοημοσύνη.
Αναφερόμενος στην εξάντληση των πηγών δεδομένων, είπε: «Ο μόνος τρόπος για να το συμπληρώσεις είναι με συνθετικά δεδομένα όπου… θα γράψει ένα δοκίμιο ή θα καταλήξει σε μια διατριβή και μετά θα βαθμολογήσει τον εαυτό του και… θα περάσει από αυτή τη διαδικασία αυτομάθησης».
Η Meta, η ιδιοκτήτρια του Facebook και του Instagram, έχει χρησιμοποιήσει συνθετικά δεδομένα για να τελειοποιήσει το μεγαλύτερο μοντέλο τεχνητής νοημοσύνης Llama, ενώ η Microsoft χρησιμοποίησε επίσης περιεχόμενο κατασκευασμένο από AI για το μοντέλο Phi-4. Η Google και η OpenAI, η εταιρεία πίσω από το ChatGPT, έχουν επίσης χρησιμοποιήσει συνθετικά δεδομένα στην εργασία τους με τεχνητή νοημοσύνη.
Ωστόσο, ο Μασκ προειδοποίησε επίσης ότι η συνήθεια των μοντέλων τεχνητής νοημοσύνης να παράγουν «ψευδαισθήσεις» – όρος για ανακριβές ή παράλογο αποτέλεσμα – αποτελεί κίνδυνο για τη διαδικασία συνθετικών δεδομένων.
Τα δεδομένα υψηλής ποιότητας και ο έλεγχός τους είναι ένα από τα νομικά πεδία μάχης στην έκρηξη της τεχνητής νοημοσύνης. Η OpenAI παραδέχτηκε πέρυσι ότι θα ήταν αδύνατο να δημιουργηθούν εργαλεία όπως το ChatGPT χωρίς πρόσβαση σε υλικό που προστατεύεται από πνευματικά δικαιώματα, ενώ οι βιομηχανίες περιεχομένου και οι εκδότες απαιτούν αποζημίωση για τη χρήση του προϊόντος τους στη διαδικασία εκπαίδευσης των μοντέλων.
Όλες οι σημαντικές και έκτακτες ειδήσεις σήμερα
Σχολικός εκφοβισμός: Το νέο μοριοδοτούμενο σεμινάριο του Παν.Αιγαίου
Παν.Πατρών: Tο 1ο στην Ελλάδα Πανεπιστημιακό Πιστοποιητικό Τεχνητής Νοημοσύνης για εκπαιδευτικούς
Πανεπιστήμιο Αιγαίου: Το κορυφαίο πρόγραμμα ειδικής αγωγής στην Ελλάδα - Αιτήσεις έως 13/01
ΕΥΚΟΛΕΣ πιστοποιήσεις ΙΣΠΑΝΙΚΩΝ - ΙΤΑΛΙΚΩΝ - ΓΑΛΛΙΚΩΝ - ΓΕΡΜΑΝΙΚΩΝ για ΑΣΕΠ - Πάρτε τις ΑΜΕΣΑ
ΕΛΜΕΠΑ: Το κορυφαίο πρόγραμμα Ειδικής Αγωγής στην Ελλάδα για διπλή μοριοδότηση