icon zoom-in

Μεγέθυνση κειμένου

Α Α Α

Το πρόγραμμα μπορεί να δημιουργήσει βίντεο μέγιστης διάρκειας ενός λεπτού διατηρώντας ικανοποιητική οπτική ποιότητα

Ένα νέο εργαλείο με την ονομασία Sora παρουσίασε η OpenAI, δημιουργός του ChatGPT και του δημιουργού εικόνων DALL-E. Με την απλή εισαγωγή ενός κειμένου, το πρόγραμμα δημιουργεί ρεαλιστικά βίντεο διάρκειας έως ένα λεπτού – μία τεράστια καινοτομία στον τομέα της Τεχνητής Νοημοσύνης.

Βασισμένη στις προηγούμενες έρευνες για τα προγράμματα DALL-E και GPT, αυτή η νέα πλατφόρμα είναι προς το παρόν υπό δοκιμή, διευκρίνισε η εταιρεία, η οποία παρουσίασε μερικά βίντεο καθώς και τον τρόπο που δημιουργήθηκαν.

Το Sora μπορεί «να δημιουργεί πολύπλοκες σκηνές με πολλά πρόσωπα, συγκεκριμένους τύπους κινήσεων και ακριβείς λεπτομέρειες», αναφέρει στον ιστότοπό της η start-up. Επιτρέπει επίσης τη δημιουργία βίντεο από μια σταθερή εικόνα.

Ο Σαμ Άλτμαν, επικεφαλής της OpenAI, δήλωσε στο X (πρώην Twitter) πως η εταιρεία «θα προσφέρει σε περιορισμένο αριθμό δημιουργών την πρόσβαση» σ’ αυτό το νέο εργαλείο, στο πλαίσιο μίας πειραματικής φάσης.

Ο ίδιος κάλεσε επίσης τους χρήστες να κάνουν προτάσεις για τη δημιουργία βίντεο και μερικά λεπτά αργότερα ανέβασε στην πλατφόρμα τα πιο επιτυχημένα απ’ αυτά.

Ανάμεσα σ’ αυτά τα βίντεο βλέπει κανείς δύο σκύλους να παίζουν στο χιόνι σε βουνό. Ένα άλλο δείχνει την πτήση ενός φανταστικού ζώου που είναι μισό πάπια μισό δράκος, μπροστά σε ένα υπέροχο ηλιοβασίλεμα, έχοντας στην πλάτη του ένα χάμστερ με εκδρομική περιβολή.

Βίντεο με προσομοιώσεις του πραγματικού κόσμου

Το Sora χρησιμεύει ως βάση για «προγράμματα ικανά να καταλάβουν και να προσομοιώσουν τον πραγματικό κόσμο», εξηγεί η εταιρεία, η οποία ελπίζει ότι «θα αποτελέσει ένα σημαντικό σταθμό στην πραγματοποίηση της AGI», της Γενικής Τεχνητής Νοημοσύνης – ενός πολύ-αυτόνομου συστήματος που φέρεται ότι θα ξεπεράσει τους ανθρώπους στις περισσότερες από τις οικονομικά αποδοτικές δουλειές.

Η OpenAI προειδοποίησε ότι το «σημερινό μοντέλο» της πλατφόρμας παρουσιάζει «ελαττώματα», καθώς συγχέει το αριστερά με το δεξιά και εμφανίζει αδυναμία να διατηρήσει μία οπτική συνέχεια σε ολόκληρο το βίντεο. «Για παράδειγμα, ένα πρόσωπο μπορεί να δαγκώσει ένα μπισκότο, όμως μετά το μπισκότο μπορεί να μην έχει ίχνη από το δάγκωμα», εξηγεί η εταιρεία.

Παρουσιάζοντας αυτό το νέο εργαλείο, η OpenAI ανέφερε πως το ζήτημα της ασφάλειας αποτελεί ουσιώδες διακύβευμα και ότι θα οργανωθούν προσομοιώσεις με χρήστες από τους οποίους θα ζητηθεί να παραγάγουν δυσλειτουργίες ή να δημιουργήσουν ανάρμοστα περιεχόμενα, ώστε να καθορισθούν καλύτερα τα όρια της πλατφόρμας.

«Θα καλέσουμε πρόσωπα που λαμβάνουν πολιτικές αποφάσεις, εκπαιδευτικούς και καλλιτέχνες απ’ όλο τον κόσμο για να κατανοήσουμε τις ανησυχίες τους και να εντοπίσουμε τις θετικές περιπτώσεις χρήσης αυτής της νέας τεχνολογίας», ανέφερε η OpenAI.

Οι Meta, Google και Runway AI, οι οποίες εργάζονται σε παρόμοιες εφαρμογές μετατροπής κειμένου σε βίντεο, τις λεγόμενες text-to-video (από κείμενο σε βίντεο), έχουν ήδη παρουσιάσει δείγματα.

Με πληροφορίες από ΑΠΕ-ΜΠΕ