Οτιδήποτε έχετε δημοσιεύσει ποτέ στο Διαδίκτυο – ένα κακόγουστο tweet, μια αρχαία ανάρτηση σε ιστολόγιο, μια ενθουσιώδη κριτική εστιατορίου ή μια θολή selfie στο Instagram – είναι σχεδόν βέβαιο ότι έχει καταβροχθιστεί και χρησιμοποιηθεί ως μέρος του εκπαιδευτικού υλικού της Τεχνητής Νοημοσύνης.

Μεγάλα εργαλεία γλωσσικών μοντέλων, όπως το ChatGPT, και δημιουργοί εικόνων τροφοδοτούνται από τεράστιους όγκους δεδομένων μας. Aκόμα και αν δεν τροφοδοτούν ένα chatbot ή κάποιο άλλο εργαλείο, τα δεδομένα με τα οποία έχετε τροφοδοτήσει τους πολυάριθμους διακομιστές του Διαδικτύου μπορεί να χρησιμοποιηθούν για την εκπαίδευση της Τεχνητής Νοημοσύνης.

Οι εταιρείες τεχνολογίας έχουν σαρώσει τεράστιους όγκους πληροφοριών, συχνά χωρίς να λαμβάνουν υπόψη τους δημιουργούς περιεχομένου, τους νόμους περί πνευματικών δικαιωμάτων ή την προστασία της ιδιωτικής ζωής.

Επιπλέον, όλο και περισσότερες εταιρείες που διαθέτουν πληθώρα αναρτήσεων επιδιώκουν να συμμετάσχουν στη χρυσοφόρα εξόρμηση της Τεχνητής Νοημοσύνης, πουλώντας ή παραχωρώντας άδεια χρήσης αυτών των πληροφοριών.

Ωστόσο, καθώς συσσωρεύονται οι αγωγές και οι έρευνες γύρω από το AΙ και τις αδιαφανείς πρακτικές δεδομένων, έχουν γίνει μικρές κινήσεις για να δοθεί στους ανθρώπους περισσότερος έλεγχος στο τι γίνεται με αυτά που δημοσιεύουν στο Διαδίκτυο. Ορισμένες εταιρείες επιτρέπουν πλέον σε ιδιώτες και επιχειρηματικούς πελάτες να μην επιθυμούν να χρησιμοποιείται το περιεχόμενό τους στην εκπαίδευση της Τεχνητής Νοημοσύνης ή να πωλείται για εκπαιδευτικούς σκοπούς.

Δείτε τι μπορείτε -και τι δεν μπορείτε- να κάνετε

Πριν φτάσουμε στον τρόπο με τον οποίο μπορείτε να εξαιρεθείτε, αξίζει να γνωρίζετε κάποια πράγματα. Πολλές εταιρείες που κατασκευάζουν Τεχνητή Νοημοσύνη έχουν ήδη σαρώσει τον ιστό, οπότε οτιδήποτε έχετε δημοσιεύσει είναι πιθανότατα ήδη στα συστήματά τους. Οι εταιρείες Τεχνητής Νοημοσύνης τείνουν επίσης να είναι μυστικοπαθείς σχετικά με το τι έχουν πραγματικά σαρώσει, αγοράσει ή χρησιμοποιήσει για να εκπαιδεύσουν τα συστήματά τους. «Ειλικρινά, δεν γνωρίζουμε τόσα πολλά», λέει ο Niloofar Mireshghallah, ερευνητής που επικεντρώνεται στην προστασία της ιδιωτικής ζωής στο Πανεπιστήμιο της Ουάσινγκτον.

Ο Mireshghallah εξηγεί ότι οι εταιρείες μπορούν να καταστήσουν περίπλοκο το να εξαιρεθεί κανείς από τη χρήση δεδομένων για την εκπαίδευση της AI, και ακόμα και όταν αυτό είναι εφικτό, πολλοί άνθρωποι δεν έχουν «σαφή ιδέα» για τα δικαιώματα στα οποία έχουν συμφωνήσει ή για το πώς χρησιμοποιούνται τα δεδομένα. Και αυτό πριν ληφθούν υπόψη διάφοροι νόμοι, όπως η προστασία των πνευματικών δικαιωμάτων και οι ισχυροί νόμοι της Ευρώπης για την προστασία της ιδιωτικής ζωής. Το Facebook, η Google, η X και άλλες εταιρείες έχουν γράψει στις πολιτικές απορρήτου τους ότι μπορούν να χρησιμοποιήσουν τα δεδομένα σας για την εκπαίδευση της Τεχνητής Νοημοσύνης.

Ο παρακάτω κατάλογος περιλαμβάνει μόνο εταιρείες που διαθέτουν επί του παρόντος διαδικασίες εξαίρεσης. Για παράδειγμα, η Meta δεν το προσφέρει ως επιλογή. «Αν και δεν διαθέτουμε επί του παρόντος μια λειτουργία opt-out, έχουμε δημιουργήσει εργαλεία εντός της πλατφόρμας που επιτρέπουν στους ανθρώπους να διαγράψουν τις προσωπικές τους πληροφορίες από τις συνομιλίες με την Meta AI στις εφαρμογές μας», λέει ο Emil Vazquez, εκπρόσωπος της Meta. Δείτε τα πλήρη βήματα αυτής της διαδικασίας.

Επίσης, το Copilot της Microsoft ανακοίνωσε μια νέα διαδικασία εξαίρεσης για την εκπαίδευση της AI που μπορεί να κυκλοφορήσει σύντομα.

Ακόμα και αν τα δεδομένα δεν είναι προσωποποιημένα (τα εισαγόμενα δεδομένα καθαρίζονται από κάθε πληροφορία που θα μπορούσε να χρησιμοποιηθεί για την ταυτοποίησή σας ως πηγή), οι χρήστες με γνώμονα την προστασία της ιδιωτικής ζωής μπορεί να θέλουν περισσότερο δυνητικό έλεγχο των πληροφοριών τους και να επιλέξουν να εξαιρεθούν όταν γίνει διαθέσιμη επιλογή.

Πώς να εξαιρεθείτε από την εκπαίδευση της AI

Εάν αποθηκεύετε τα αρχεία σας στο Creative Cloud της Adobe, η εταιρεία μπορεί να τα αναλύσει για να βελτιώσει το λογισμικό της. Αυτό δεν ισχύει για τυχόν αρχεία που είναι αποθηκευμένα μόνο στη συσκευή σας. Επίσης, η Adobe δεν θα χρησιμοποιήσει τα αρχεία για να εκπαιδεύσει ένα παραγωγικό μοντέλο AI, με μία εξαίρεση. «Δεν αναλύουμε το περιεχόμενό σας για την εκπαίδευση μοντέλων AI, εκτός αν επιλέξετε να υποβάλλετε περιεχόμενο στην αγορά Adobe Stock», αναφέρεται στην ενημερωμένη σελίδα FAQ της εταιρείας.

Αν χρησιμοποιείτε έναν προσωπικό λογαριασμό Adobe, είναι εύκολο να εξαιρεθείτε από την ανάλυση περιεχομένου. Ανοίξτε τη σελίδα απορρήτου της Adobe, μετακινηθείτε προς τα κάτω στην ενότητα Ανάλυση περιεχομένου για τη βελτίωση του προϊόντος και κάντε κλικ στο κουμπί απενεργοποίησης. Αν έχετε επαγγελματικό ή σχολικό λογαριασμό, η επιλογή σας είναι αυτόματα απενεργοποιημένη.

Amazon: AWS

Οι υπηρεσίες Τεχνητής Νοημοσύνης από τις υπηρεσίες Amazon Web Services, όπως το Amazon Rekognition ή το Amazon CodeWhisperer, ενδέχεται να χρησιμοποιούν δεδομένα πελατών για τη βελτίωση των εργαλείων της εταιρείας, αλλά είναι δυνατό να εξαιρεθείτε από την εκπαίδευση της Τεχνητής Νοημοσύνης. Αυτή ήταν παλαιότερα μία από τις πιο περίπλοκες διαδικασίες στη λίστα, αλλά έχει εξορθολογιστεί τους τελευταίους μήνες. Στη σελίδα υποστήριξης από την Amazon περιγράφεται η πλήρης διαδικασία για την εξαίρεση του οργανισμού σας.

Figma

Το Figma, ένα δημοφιλές λογισμικό σχεδιασμού, μπορεί να χρησιμοποιήσει τα δεδομένα σας για την εκπαίδευση του μοντέλου. Εάν ο λογαριασμός σας έχει αδειοδοτηθεί μέσω ενός προγράμματος Organization ή Enterprise, έχετε αυτομάτως εξαιρεθεί. Από την άλλη πλευρά, οι λογαριασμοί Starter και Professional επιλέγονται από προεπιλογή. Αυτή η ρύθμιση μπορεί να αλλάξει σε επίπεδο ομάδας ανοίγοντας τις ρυθμίσεις στην καρτέλα AI και απενεργοποιώντας την εκπαίδευση περιεχομένου.

Google Gemini

Για τους χρήστες του chatbot της Google, Gemini, οι συνομιλίες μπορεί μερικές φορές να επιλέγονται για ανθρώπινη εξέταση προκειμένου να βελτιωθεί το μοντέλο AI. Η επιλογή της απενεργοποίησης είναι απλή, ωστόσο. Ανοίξτε το Gemini στο πρόγραμμα περιήγησής σας, κάντε κλικ στην επιλογή Δραστηριότητα και επιλέξτε το μενού Απενεργοποίηση.

Εδώ μπορείτε απλώς να απενεργοποιήσετε τη Δραστηριότητα των εφαρμογών Gemini Apps ή μπορείτε να εξαιρεθείτε καθώς και να διαγράψετε τα δεδομένα των συνομιλιών σας. Ενώ αυτό σημαίνει στις περισσότερες περιπτώσεις ότι οι μελλοντικές συνομιλίες δεν θα φαίνονται για ανθρώπινη εξέταση, τα ήδη επιλεγμένα δεδομένα δεν διαγράφονται μέσω αυτής της διαδικασίας. Σύμφωνα με τον κόμβο απορρήτου της Google για το Gemini, αυτές οι συνομιλίες μπορεί να παραμείνουν για τρία χρόνια.

Grammarly

Η Grammarly ενημέρωσε τις πολιτικές της, ώστε οι προσωπικοί λογαριασμοί να μπορούν πλέον να εξαιρεθούν από την εκπαίδευση AI. Αυτό μπορείτε να το κάνετε πηγαίνοντας στο λογαριασμό, στη συνέχεια στις Ρυθμίσεις και απενεργοποιώντας το διακόπτη Βελτίωση προϊόντος και εκπαίδευση. Είναι ο λογαριασμός σας μέσω εταιρικής ή εκπαιδευτικής άδειας; Τότε, έχετε αυτομάτως εξαιρεθεί.

Grok AI (X)

Η Kate O’Flaherty έγραψε ένα σπουδαίο άρθρο για το WIRED σχετικά με το Grok AI και την προστασία της ιδιωτικής σας ζωής στο X, την πλατφόρμα όπου λειτουργεί το chatbot. Πρόκειται για μια άλλη κατάσταση όπου εκατομμύρια χρήστες ενός ιστότοπου ξύπνησαν μια μέρα και επιλέχθηκαν αυτόματα για εκπαίδευση AI με την ελάχιστη δυνατή ειδοποίηση.

Εάν εξακολουθείτε να έχετε λογαριασμό στο X, μπορείτε να εξαιρεθείτε από τη χρήση των δεδομένων σας για την εκπαίδευση του Grok, μεταβαίνοντας στην ενότητα Ρυθμίσεις και προστασία της ιδιωτικής ζωής και στη συνέχεια στην ενότητα Προστασία και ασφάλεια. Ανοίξτε την καρτέλα Grok και, στη συνέχεια, ξετικάρετε την επιλογή κοινής χρήσης των δεδομένων σας.

HubSpot

Το HubSpot, μια δημοφιλής πλατφόρμα λογισμικού μάρκετινγκ και πωλήσεων, χρησιμοποιεί αυτόματα δεδομένα από τους πελάτες για να βελτιώσει το μοντέλο μηχανικής μάθησης. Δυστυχώς, δεν υπάρχει κάποιο κουμπί που να μπορείτε να πατήσετε για να απενεργοποιήσετε τη χρήση δεδομένων για την εκπαίδευση της Τεχνητής Νοημοσύνης. Πρέπει να στείλετε ένα μήνυμα ηλεκτρονικού ταχυδρομείου στη διεύθυνση [email protected] με ένα μήνυμα που να ζητά να εξαιρεθούν τα δεδομένα που σχετίζονται με το λογαριασμό σας.

LinkedIn

Οι χρήστες του ιστότοπου έμαθαν έκπληκτοι τον Σεπτέμβριο ότι τα δεδομένα τους ενδεχομένως να χρησιμοποιούνται για την εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης. «Στο τέλος της ημέρας, οι άνθρωποι θέλουν αυτό το πλεονέκτημα στην καριέρα τους και αυτό που κάνουν οι υπηρεσίες μας gen-AI είναι να τους βοηθήσουν να αποκτήσουν αυτή τη βοήθεια», λέει η Eleanor Crum, εκπρόσωπος του LinkedIn.

Μπορείτε να εξαιρεθείτε επισκεπτόμενοι το προφίλ σας και ανοίγοντας τις Ρυθμίσεις. Πατήστε στο Data Privacy (Απόρρητο δεδομένων) και απενεργοποιήστε το ρυθμιστικό με την ένδειξη Use my data for training content creation AI models (Χρήση των δεδομένων μου για την εκπαίδευση μοντέλων Τεχνητής Νοημοσύνης δημιουργίας περιεχομένου).

OpenAI: ChatGPT και Dall-E

Οι άνθρωποι αποκαλύπτουν κάθε είδους προσωπικές πληροφορίες κατά τη χρήση ενός chatbot. Το OpenAI παρέχει ορισμένες επιλογές για το τι θα συμβεί σε αυτά που λέτε στο ChatGPT -συμπεριλαμβανομένης της δυνατότητας τα μελλοντικά μοντέλα Τεχνητής Νοημοσύνης του να μην εκπαιδεύονται στο περιεχόμενο.

«Παρέχουμε στους χρήστες εύκολα προσβάσιμους τρόπους ελέγχου των δεδομένων τους, συμπεριλαμβανομένων εργαλείων αυτοεξυπηρέτησης για πρόσβαση, εξαγωγή και διαγραφή προσωπικών πληροφοριών μέσω του ChatGPT. Αυτό περιλαμβάνει εύκολα προσβάσιμες επιλογές για να εξαιρεθούν από τη χρήση του περιεχομένου τους για την εκπαίδευση μοντέλων», αναφέρει η Taya Christianson, εκπρόσωπος της OpenAI. (Οι επιλογές διαφέρουν ελαφρώς ανάλογα με τον τύπο του λογαριασμού σας, και τα δεδομένα από πελάτες επιχειρήσεων δεν χρησιμοποιούνται για την εκπαίδευση μοντέλων).

Στην καρτέλα Βοήθεια, η OpenAI αναφέρει ότι οι χρήστες του ChatGPT που θέλουν να εξαιρεθούν θα πρέπει να μεταβούν στις Ρυθμίσεις, Έλεγχος Δεδομένων και στη συνέχεια να καταργήσουν την επιλογή Βελτίωση του μοντέλου για όλους.

Το OpenAI αφορά πολύ περισσότερα από το ChatGPT. Για τη γεννήτρια εικόνων Dall-E 3, η νεοσύστατη εταιρεία διαθέτει μια φόρμα που σας επιτρέπει να στέλνετε εικόνες που θα αφαιρεθούν από «μελλοντικά σύνολα δεδομένων εκπαίδευσης». Ζητάει το όνομά σας, το email σας, αν έχετε τα δικαιώματα της εικόνας ή αν επικοινωνείτε εκ μέρους μιας εταιρείας, λεπτομέρειες της εικόνας και τυχόν μεταφορτώσεις της εικόνας (των εικόνων).

Το OpenAI αναφέρει επίσης ότι αν έχετε έναν «μεγάλο όγκο» εικόνων που φιλοξενούνται στο Διαδίκτυο και θέλετε να αφαιρεθούν από τα δεδομένα εκπαίδευσης, τότε μπορεί να είναι «πιο αποτελεσματικό» να προσθέσετε το GPTBot στο αρχείο robots.txt του ιστότοπου όπου φιλοξενούνται οι εικόνες.

Παραδοσιακά, το αρχείο robots.txt ενός ιστότοπου -ένα απλό αρχείο κειμένου που βρίσκεται συνήθως στη διεύθυνση websitename.com/robots.txt- χρησιμοποιείται για να λέει στις μηχανές αναζήτησης και σε άλλες, αν μπορούν να συμπεριλάβουν τις σελίδες σας στα αποτελέσματά τους. Τώρα μπορεί επίσης να χρησιμοποιηθεί για να πείτε στους ανιχνευτές AI να μην ξαφρίζουν ό,τι έχετε δημοσιεύσει -και οι εταιρείες AI έχουν δηλώσει ότι θα τιμήσουν αυτή τη ρύθμιση.

Quora

Η Quora λέει ότι «προς το παρόν» δεν χρησιμοποιεί απαντήσεις σε ερωτήσεις, αναρτήσεις ή σχόλια ανθρώπων για την εκπαίδευση της Τεχνητής Νοημοσύνης. Επίσης, δεν έχει πουλήσει δεδομένα χρηστών για εκπαίδευση AI, λέει εκπρόσωπος της εταιρίας.

Ωστόσο, προσφέρει opt-outs σε περίπτωση που αυτό αλλάξει στο μέλλον. Για να το κάνετε αυτό, επισκεφθείτε τη σελίδα Ρυθμίσεων, κάντε κλικ στην επιλογή Απόρρητο και απενεργοποιήστε την επιλογή «Να επιτρέπεται η εκπαίδευση μεγάλων γλωσσικών μοντέλων στο περιεχόμενό σας».

Οι χρήστες επιλέγουν αυτόματα τη ρύθμιση. Παρά την επιλογή αυτή, υπάρχουν ορισμένες αναρτήσεις του Quora που μπορούν να χρησιμοποιηθούν για την εκπαίδευση LLM. Εάν απαντήσετε σε μια απάντηση που δημιουργείται από μηχανήματα, λένε οι σελίδες βοήθειας της εταιρείας, τότε αυτές οι απαντήσεις μπορεί να χρησιμοποιηθούν για την εκπαίδευση της Τεχνητής Νοημοσύνης. Επισημαίνει ότι οι τρίτοι μπορεί απλώς να βρουν το περιεχόμενό της ούτως ή άλλως.

Slack

Όλα αυτά τα τυχαία μηνύματα Slack στη δουλειά μπορεί να χρησιμοποιηθούν από την εταιρεία για την εκπαίδευση των μοντέλων της. «Η Slack χρησιμοποιεί τη μηχανική μάθηση στο προϊόν της εδώ και πολλά χρόνια. Αυτό περιλαμβάνει μοντέλα μηχανικής μάθησης σε επίπεδο πλατφόρμας για πράγματα όπως οι συστάσεις καναλιών και emoji», λέει η Jackie Rocca, αντιπρόεδρος προϊόντων στο Slack που επικεντρώνεται στην AI.

Παρόλο που η εταιρεία δεν χρησιμοποιεί δεδομένα πελατών για να εκπαιδεύσει ένα μεγάλο γλωσσικό μοντέλο για το προϊόν Slack AI, η Slack μπορεί να χρησιμοποιήσει τις αλληλεπιδράσεις σας για να βελτιώσει τις δυνατότητες μηχανικής μάθησης του λογισμικού. Αυτό θα μπορούσε να περιλαμβάνει πληροφορίες όπως τα μηνύματά σας, το περιεχόμενο και τα αρχεία σας, αναφέρει η σελίδα απορρήτου του Slack.

Ο μόνος πραγματικός τρόπος για να εξαιρεθείτε είναι να ζητήσετε από τον διαχειριστή σας να στείλει email στο Slack στη διεύθυνση [email protected]. Το μήνυμα πρέπει να έχει ως θέμα «Slack Global model opt-out request» και να περιλαμβάνει τη διεύθυνση URL του οργανισμού σας. Το Slack δεν παρέχει χρονοδιάγραμμα για το πόσο καιρό διαρκεί η διαδικασία εξαίρεσης, αλλά θα πρέπει να σας στείλει ένα email επιβεβαίωσης μετά την ολοκλήρωσή της.

Tumblr

Η πλατφόρμα blogging και δημοσίευσης Tumblr-που ανήκει στην Automattic, στην οποία ανήκει και το WordPress-λέει ότι «συνεργάζεται» με εταιρείες AI που «ενδιαφέρονται για το πολύ μεγάλο και μοναδικό σύνολο δημοσιευμένου περιεχομένου» στις πλατφόρμες της ευρύτερης εταιρείας. Αυτό δεν περιλαμβάνει τα μηνύματα ηλεκτρονικού ταχυδρομείου των χρηστών ή το ιδιωτικό περιεχόμενο, αναφέρει εκπρόσωπος της Automattic.

Το Tumblr διαθέτει την επιλογή «αποτροπή κοινής χρήσης από τρίτους» για να σταματήσει αυτό που δημοσιεύετε να χρησιμοποιείται για εκπαίδευση AI, καθώς και να μοιράζεται με άλλους τρίτους, όπως ερευνητές. Εάν χρησιμοποιείτε την εφαρμογή Tumblr, μεταβείτε στις Ρυθμίσεις λογαριασμού, επιλέξτε το ιστολόγιό σας, κάντε κλικ στο εικονίδιο του γραναζιού, επιλέξτε Ορατότητα και ενεργοποιήστε την επιλογή «Αποτροπή κοινοποίησης από τρίτους».

Οι ρητές δημοσιεύσεις, τα διαγραμμένα ιστολόγια και εκείνα που είναι προστατευμένα με κωδικό πρόσβασης ή ιδιωτικά, δεν κοινοποιούνται σε καμία περίπτωση σε τρίτες εταιρείες, αναφέρει η σελίδα υποστήριξης του Tumblr.

WordPress

Όπως και το Tumblr, το WordPress διαθέτει την επιλογή «αποτροπή κοινής χρήσης από τρίτους». Για να την ενεργοποιήσετε, επισκεφθείτε το ταμπλό του ιστότοπού σας, κάντε κλικ στις Ρυθμίσεις, Γενικά και, στη συνέχεια, το Απόρρητο, επιλέξτε το πλαίσιο Αποτροπή κοινοποίησης από τρίτους.

«Προσπαθούμε επίσης να συνεργαστούμε με τους crawlers (όπως το commoncrawl.org) για να αποτρέψουμε την απόσπαση και την πώληση περιεχομένου χωρίς να δίνουμε στους χρήστες μας επιλογή ή έλεγχο σχετικά με τον τρόπο χρήσης του περιεχομένου τους», αναφέρει εκπρόσωπος της Automattic.

Η ιστοσελίδα σας

Εάν έχετε τον δικό σας ιστότοπο, μπορείτε να ενημερώσετε το αρχείο robots.txt για να πείτε στα bots της AI να μην σαρώνουν τις σελίδες σας. Οι περισσότεροι ειδησεογραφικοί ιστότοποι δεν επιτρέπουν στα άρθρα τους να ανιχνεύονται από τα AI bots. Το αρχείο robots.txt του WIRED, για παράδειγμα, δεν επιτρέπει την ανίχνευση από bots των Google, Amazon, Facebook, Anthropic ή Perplexity, μεταξύ άλλων.

Αυτή η επιλογή εξαίρεσης δεν αφορά όμως μόνο τους εκδότες: κάθε ιστότοπος, μεγάλος ή μικρός, μπορεί να τροποποιήσει το αρχείο robots του για να αποκλείσει τα AI crawlers. Το μόνο που χρειάζεται να κάνετε είναι να προσθέσετε μια εντολή disallow – παραδείγματα μπορείτε να βρείτε εδώ.

Με πληροφορίες από The Wired