Μεγέθυνση κειμένου
Η τεχνολογία μπορεί να είναι πρακτική για πιο «πρόχειρες» εργασίες ή για τη συγγραφή προσχεδίων και σημειώσεων, αλλά για τη δημιουργία πιο απαιτητικών κειμένων, η παραδοσιακή πληκτρολόγηση έχει σαφές πλεονέκτημα
Με την τεχνολογία μετατροπής ομιλίας σε κείμενο να έχει κάνει τεράστια πρόοδο τα τελευταία χρόνια, η μετάβαση από το πληκτρολόγιο στην απλή υπαγόρευση για τη δημιουργία κειμένων φαίνεται πως είναι προ των πυλών. Ωστόσο, ορισμένοι υποστηρίζουν πως η συγκεκριμένη τεχνολογία απέχει πολύ ακόμη από τα να καταστήσει περιττά τα πληκτρολόγια…
Για τη γραφίστρια Miriam Inza οι προκλήσεις είναι ακόμα πολλές και υπαρκτές: Ένα κείμενο θα πρέπει να το ξαναδιαβάσεις για να κάνεις την επεξεργασία, να βάλεις τα σημεία στίξης, να αλλάξεις λέξεις, να διορθώσεις ορθογραφικά λάθη σε ομόηχες λέξεις… και τελικά να μετατρέψεις το κείμενο σε κάτι εντελώς διαφορετικό, αφού η προφορική με τη γραπτή γλώσσα απέχουν παρασάγγας.
(Ημι)αυτόματη στίξη
Ίσως ένα από τα σημεία στα οποία η τεχνολογία ομιλίας σε κείμενο πρέπει να βελτιωθεί σημαντικά είναι η αυτόματη στίξη. «Προς το παρόν, για να γράψεις με φωνή, πρέπει να υπαγορεύσεις τα σημεία στίξης ή, στην περίπτωση της απομαγνητοφώνησης μιας συνέντευξης, για παράδειγμα, να τα εισάγεις χειροκίνητα», λέει η Inza.
Τα τελευταία χρόνια, με την άφιξη του Whisper, του μοντέλου αυτόματης αναγνώρισης ομιλίας (Automatic Speech Recognition – ASR) που κυκλοφόρησε η OpenAI στα τέλη του 2022, πολλά άτομα των οποίων η δουλειά απαιτεί ώρες μπροστά στο πληκτρολόγιο αναθάρρησαν πως το «μαρτύριό» τους τελειώνει.
Το εργαλείο, ωστόσο, θεωρήθηκε από πολλούς αμφιλεγόμενο: Σύμφωνα με έρευνα των New York Times, η OpenAI δημιούργησε το Whisper όταν ξέμεινε από κείμενα στο διαδίκτυο με τα οποία μπορούσε να τροφοδοτήσει την Τεχνητή Νοημοσύνη της. Με το Whisper, η εταιρεία άνοιξε την πόρτα σε ολόκληρο το YouTube, δίνοντάς της περισσότερο υλικό με το οποίο θα μπορούσε να εκπαιδεύσει το ChatGPT-4, το πιο προηγμένο γλωσσικό μοντέλο της.
Αυτή η χρήση, όμως, ενδεχομένως παραβιάζει τους κανόνες του YouTube – για να μην αναφέρουμε την ιδιωτικότητα των χρηστών που εμφανίζονται στα βίντεο. Εδώ να πούμε πως και η Google, ιδιοκτήτρια της διαδικτυακής υπηρεσίας βίντεο, χρησιμοποιεί το ίδιο υλικό για να εκπαιδεύσει τη δική της AI.
Διάλεκτοι, ξένες λέξεις και εξωτερικοί θόρυβοι
Εκτός από τα παραπάνω ζητήματα, «το Whisper έχει αλλάξει τα πάντα», λέει η José María Fernández Gil, επικεφαλής της Μονάδας Ψηφιακής Προσβασιμότητας στο Πανεπιστήμιο του Αλικάντε στην Ισπανία, η οποία ωστόσο υποστηρίζει πως εξακολουθεί να υπάρχει σημαντική έλλειψη λεξιλογίου και ότι το μοντέλο κάνει λάθη με ορισμένα ακρωνύμια.
Ένα άλλο ζήτημα που δεν έχει ακόμη επιλυθεί είναι η επεξεργασία των διαφορετικών προφορών και διαλέκτων, λέει η Dayana Ribas, επιστημονική διευθύντρια της Business Telecommunication Services (BTS), μιας εταιρείας τηλεπικοινωνιών που χρησιμοποιεί επίσης την τεχνολογία.
Η Ribas αναφέρει ότι το μοντέλο αποτυγχάνει επίσης όταν χρησιμοποιούνται ξένες λέξεις σε διαφορετικές γλώσσες, μια κατάσταση που συναντάται συχνά σε δίγλωσσες χώρες, όπως το Πουέρτο Ρίκο.
Ένα άλλο ζήτημα που προκύπτει είναι η μεταφορά σε κείμενο όταν αυτό υπαγορεύεται σε ρεαλιστικά, καθημερινά περιβάλλοντα με εξωτερικούς θορύβους και διάφορες παραμορφώσεις.
Πάρε τον χρόνο σου…
Με την τεχνολογία να βρίσκεται ήδη στα σκαριά, τίθεται το ερώτημα: Θα έρθει επιτέλους η στιγμή που η πρώτη επιλογή όταν θες να παράγεις ένα γραπτό κείμενο θα είναι να το υπαγορεύσεις σε μια μηχανή;
Οι ειδικοί δεν είναι και τόσο σίγουροι αφού συμφωνούν ότι μιλάμε και γράφουμε διαφορετικά, οπότε αυτό είναι κάτι που θα πρέπει πάντα να λαμβάνεται υπόψη.
Η Ribas πιστεύει ότι η υπαγόρευση μπορεί να είναι πρακτική για πιο «πρόχειρες» εργασίες ή για τη συγγραφή προσχεδίων, καθώς «διευκολύνει την ταχύτητα και τη φυσικότητα στην παραγωγή και την αποθήκευση ιδεών». Επιπλέον, είναι ιδανική όταν κάποιος τη χρησιμοποιεί ενώ κάνει άλλα πράγματα, όπως να μαγειρεύει.
Ωστόσο, για τη δημιουργία πιο απαιτητικών κειμένων, όπως η συγγραφή μιας τεχνικής έκθεσης ή ενός μυθιστορήματος, η παραδοσιακή πληκτρολόγηση έχει το εξής πλεονέκτημα: Δίνει στον συγγραφέα επαρκή χρόνο για να σκεφτεί τι θέλει να γράψει.
Τεχνολογικό χάσμα γενεών
«Υπάρχει μεγάλη απόσταση μεταξύ του κεφαλιού και του χεριού μου και την εκμεταλλεύομαι για να αποφύγω να πω το πρώτο πράγμα που μου έρχεται στο μυαλό», συνήθισε να λέει ο Γάλλος δοκιμιογράφος Roland Barthes.
Με τη νέα τεχνολογία, είναι επίσης πολύ πιθανό να παρατηρηθεί «τεχνολογικό χάσμα γενεών». Σε σύγκριση με τους ανθρώπους που έχουν συνηθίσει να πληκτρολογούν γρήγορα στον υπολογιστή τους, «οι νέες γενιές έχουν δει το εικονίδιο του μικροφώνου για υπαγόρευση από μικρή ηλικία και το χρησιμοποιούν πιο συχνά», λέει η Fernández Gil.
Από την άλλη πλευρά, μια αλλαγή στο μέσο γραφής θα παράγει κείμενα με διαφορετικά χαρακτηριστικά. Η Βιρτζίνια Γουλφ, για παράδειγμα, παραπονέθηκε όταν έγραψε ένα γράμμα στη γραφομηχανή – κάτι που προσπαθούσε να αποφύγει – ότι η συσκευή έκοβε και έσπαγε προτάσεις που ήταν «πεντακάθαρες και πολύτιμες στο μυαλό της».
Επιπλέον, η χρήση εργαλείων Τεχνητής Νοημοσύνης για το γραπτό κείμενο έχει και άλλο αντίκτυπο: Πρόσφατη έρευνα από το Πανεπιστήμιο του Χάρβαρντ κατέληξε στο συμπέρασμα ότι τα κείμενα που γράφονται με τη βοήθεια της προγνωστικής γραφής είναι «πιο περιεκτικά, πιο προβλέψιμα και λιγότερο πολύχρωμα».
Ανοίγοντας νέες προοπτικές
Όπως και να έχει, η ανάπτυξη της τεχνολογίας ομιλίας σε κείμενο δεν αποτελεί μόνο ένα βήμα προς τα εμπρός όσον αφορά στην ευκολία και την ταχύτητα αλλά θα βοηθήσει επίσης σημαντικά τα άτομα με προβλήματα ακοής, τα οποία, χάρη στη γενίκευση των αυτόματων υποτίτλων, θα μπορούν να «διαβάζουν όσα δεν μπορούν να ακούσουν».
Επιπλέον, βοηθά στην ενσωμάτωση ανθρώπων από άλλες χώρες και πολιτισμούς συνδυάζοντας την αναγνώριση προφορικού λόγου με τη μετάφραση, ενώ θα διευκολύνει ακόμη και τους ανθρώπους που, λόγω κινητικών προβλημάτων, δεν μπορούν ή δυσκολεύονται να γράψουν με τα χέρια τους.
Από την πλευρά της, η Ribas υπογραμμίζει και τις εκπαιδευτικές δυνατότητες της τεχνολογίας, καθώς «ενισχύεται το εκπαιδευτικό σύστημα με εργαλεία που διευκολύνουν την τήρηση σημειώσεων και τη μελέτη».
Με πληροφορίες από El Pais
Ακολουθήστε το pride.gr στο Google News και ενημερωθείτε πρώτοι