icon zoom-in

Μεγέθυνση κειμένου

Α Α Α

Η νέα έκδοση μπορεί να διαβάζει και να συζητά για εικόνες, να μεταφράζει γλώσσες και να αναγνωρίζει συναισθήματα από οπτικές εκφράσεις

Η OpenAI παρουσίασε την τελευταία έκδοση της τεχνολογίας που υποστηρίζει το chatbot Τεχνητής Νοημοσύνης ChatGPT. Ονομάζεται GPT-4o και θα διατεθεί σε όλους τους χρήστες του ChatGPT, συμπεριλαμβανομένων των μη συνδρομητών.

Είναι ταχύτερο από τα προηγούμενα μοντέλα και έχει προγραμματιστεί να ακούγεται φλύαρο και μερικές φορές ακόμη και να φλερτάρει στις απαντήσεις του.

Η νέα έκδοση μπορεί να διαβάζει και να συζητά για εικόνες, να μεταφράζει γλώσσες και να αναγνωρίζει συναισθήματα από οπτικές εκφράσεις. Υπάρχει επίσης μνήμη, ώστε να μπορεί να ανακαλεί προηγούμενες προτροπές.

Μπορείς να το διακόψεις και έχει ευκολότερο ρυθμό συνομιλίας – δεν διαπιστώνεται καθυστέρηση μεταξύ της υποβολής μιας ερώτησης και της λήψης μιας απάντησης.

Δυσλειτουργίες

Κατά τη διάρκεια μιας ζωντανής επίδειξης με τη χρήση της φωνητικής έκδοσης το GPT-4o παρείχε χρήσιμες προτάσεις για το πώς να λύσετε μια απλή εξίσωση γραμμένη σε ένα κομμάτι χαρτί – αντί απλά να την λύσετε. Ανέλυσε έναν κώδικα υπολογιστή, μετέφρασε από ιταλικά σε αγγλικά και ερμήνευσε τα συναισθήματα σε μια selfie ενός χαμογελαστού άνδρα.

Χρησιμοποιώντας μια ζεστή αμερικανική γυναικεία φωνή, χαιρέτησε τους χρήστες ρωτώντας τους αν είναι καλά. Όταν κάποιος τού έκανε ένα κομπλιμέντο, απάντησε: «Σταμάτα, με κάνεις να κοκκινίζω!».

Δεν ήταν τέλειο – σε ένα σημείο μπέρδεψε τον χαμογελαστό άνδρα με μια ξύλινη επιφάνεια και άρχισε να λύνει μια εξίσωση που δεν του είχε ακόμη παρουσιαστεί. Αυτό έδειξε άθελά του, ότι υπάρχει ακόμη δρόμος μέχρι να εξαλειφθούν οι δυσλειτουργίες που καθιστούν τα chatbots αναξιόπιστα και δυνητικά επικίνδυνα.

Αλλά αυτό που μας δείχνει είναι η κατεύθυνση του ταξιδιού για το OpenAI, το οποίο σκοπεύει το GPT-4o να γίνει η επόμενη γενιά ψηφιακών βοηθών AI, ένα είδος υπερτροφοδοτούμενης Siri ή Hey, Google που θυμάται τι του έχουν πει στο παρελθόν και μπορεί να αλληλεπιδράσει πέρα από τη φωνή ή το κείμενο.

Ωστόσο, αν δεν θέλουμε να αγνοήσουμε τον ελέφαντα στο δωμάτιο, θα πρέπει να τεθεί και το ζήτημα του περιβαλλοντικού τιμήματος αυτής της τεχνολογίας.

Ήδη ξέρουμε ότι η Τεχνητή Νοημοσύνη είναι πιο ενεργοβόρα από τις παραδοσιακές υπολογιστικές εργασίες και ότι όσο πιο εξελιγμένη γίνεται, τόσο περισσότερη υπολογιστική ισχύ απαιτεί. Κατά τη διάρκεια της παρουσίασης της νέας έκδοσης πάντως δεν έγινε καμία αναφορά στη βιωσιμότητα.

Απομυθοποίηση

Έχουμε δει chatbots όπως το Grok του Elon Musk και το Pi, από τον συνιδρυτή της DeepMind Mustafa Suleyman, να δίνουν προτεραιότητα στην «προσωπικότητα» των προϊόντων τους, αλλά ο τρόπος με τον οποίο το GPT-4o χειρίστηκε απρόσκοπτα τον συνδυασμό κειμένου, ήχου και εικόνων με άμεση ανταπόκριση φαίνεται να βάζει το OpenAI μπροστά από τον ανταγωνισμό.

Φυσικά, προς το παρόν μπορούμε να έχουμε μόνο τα όσα υποστηρίζει η εταιρεία – ήταν το δικό τους demo, προσεκτικά επιμελημένο και διαχειριζόμενο από τους ίδιους. Θα είναι ενδιαφέρον να δούμε πώς το GPT-4o θα ανταπεξέλθει σε κλίμακα με τα εκατομμύρια των ανθρώπων που ήδη χρησιμοποιούν το ChatGPT, καθώς θα αναπτύσσεται.

Η Mira Murati, επικεφαλής τεχνολογίας της OpenAI, περιέγραψε το GPT-4o ως «μαγικό», αλλά πρόσθεσε ότι η εταιρεία θα «αφαιρέσει αυτόν τον μυστικισμό» με την εξάπλωση του προϊόντος.

Μια ενδιαφέρουσα και συναισθηματική επιλογή λέξεων: Ενώ αυτή η τεχνολογία γίνεται ταχύτατα πιο εξελιγμένη και όλο και πιο πειστική ως σύντροφος – δεν είναι αισθαντική ή μαγική, είναι σύνθετος προγραμματισμός και μηχανική μάθηση.

Υπήρχαν φήμες για μια συνεργασία μεταξύ της OpenAI και της Apple και ενώ αυτό δεν έχει ακόμη επιβεβαιωθεί, ήταν χαρακτηριστικό ότι κατά τη διάρκεια της παρουσίασης χρησιμοποιήθηκαν προϊόντα της Apple.

Ενδιαφέρουσα όμως ήταν και η χρονική συγκυρία της παρουσίασης, που έγινε 24 ώρες πριν η αντίπαλός της Google παρουσιάσει τις τελευταίες της εξελίξεις στον τομέα της Τεχνητής Νοημοσύνης στο ετήσιο συνέδριό της, το Google IO.

Με πληροφορίες από BBC