Μεγέθυνση κειμένου
Μια μπλε φάλαινα εμφανίστηκε από το πουθενά και έφερε την επανάσταση στην ΑΙ
Ένα εκπληκτικά αποτελεσματικό και ισχυρό κινεζικό μοντέλο Τεχνητής Νοημοσύνης εμφανίστηκε ξαφνικά από το πουθενά και έχει παρασύρει τα πάντα, σαν τσουνάμι, στον κλάδο της τεχνολογίας. Ονομάζεται DeepSeek R1 και έχει προκαλέσει νευρικότητα στη Wall Street.
Το νέο μοντέλο AI, με σήμα την μπλε φάλαινα, αναπτύχθηκε από την DeepSeek, μια startup που γεννήθηκε μόλις πριν από έναν χρόνο και έφερε με κάποιο τρόπο μια επανάσταση που ο διάσημος επενδυτής τεχνολογίας Marc Andreessen ονόμασε «στιγμή Sputnik της AI»: το R1 μπορεί σχεδόν να ανταγωνιστεί σε δυνατότητες πολύ πιο διάσημους αντιπάλους του, συμπεριλαμβανομένων του GPT-4 της OpenAI, του Llama της Meta και του Gemini της Google – αλλά με πολύ μικρότερο κόστος.
Η DeepSeek ανέφερε ότι ξόδεψε μόλις 5,6 εκατομμύρια δολάρια για το βασικό της μοντέλο AI, σε σύγκριση με τα εκατοντάδες εκατομμύρια, αν όχι δισεκατομμύρια που έβγαλαν από τους λογαριασμούς τους οι αμερικανικές εταιρείες για τις δικές τους τεχνολογίες τεχνητής νοημοσύνης. Αυτό είναι ακόμα πιο σοκαριστικό αν σκεφτεί κανείς ότι οι Ηνωμένες Πολιτείες προσπαθούν εδώ και χρόνια να περιορίσουν την προμήθεια τσιπ τεχνητής νοημοσύνης υψηλής ισχύος στην Κίνα, επικαλούμενες ανησυχίες για την εθνική ασφάλεια. Κάτι που σημαίνει ότι η DeepSeek θεωρητικά κατάφερε να δημιουργήσει το χαμηλού κόστους μοντέλο της με σχετικά χαμηλής ισχύος τσιπ AI.
Ποια είναι η DeepSeek
Η εταιρεία, που ιδρύθηκε στο τέλος του 2023 από τον Κινέζο διαχειριστή αντισταθμιστικών κεφαλαίων (hedge fund), Liang Wenfeng, είναι μία από τις δεκάδες startups που εμφανίστηκαν τα τελευταία χρόνια, αναζητώντας μεγάλες επενδύσεις για να καβαλήσουν το τεράστιο κύμα AI που έχει οδηγήσει τη βιομηχανία της τεχνολογίας σε νέα εποχή.
Ο Liang έχει μετατραπεί στον Sam Altman της Κίνας – έναν ευαγγελιστή της τεχνολογίας AI και των επενδύσεων στη νέα έρευνα. Το hedge fund του, το High-Flyer, εστιάζει στην ανάπτυξη AI.
Όπως κι άλλες νεοφυείς επιχειρήσεις τεχνητής νοημοσύνης, συμπεριλαμβανομένων των Anthropic και Perplexity, η DeepSeek κυκλοφόρησε διάφορα ανταγωνιστικά μοντέλα ΑΙ, κατά τη διάρκεια του περασμένου έτους που τράβηξαν την προσοχή της βιομηχανίας. Το μοντέλο V3 έκανε γνωστή την εταιρεία, αν και οι περιορισμοί περιεχομένου της γύρω από ευαίσθητα θέματα σχετικά με την κινεζική κυβέρνηση και την ηγεσία της, πυροδότησε αμφιβολίες σχετικά με τη βιωσιμότητά της ως ανταγωνιστής του κλάδου, ανέφερε η Wall Street Journal.
Διαβασε ακομα
Η κρυμμένη ομορφιά και η βαρβαρότητα της φύσηςΤο R1 ωστόσο, το οποίο εμφανίστηκε από το πουθενά όταν αποκαλύφθηκε στο τέλος του περασμένου έτους, κυκλοφόρησε την περασμένη εβδομάδα και μαγνήτισε όλη την προσοχή, όταν η εταιρεία αποκάλυψε το συγκλονιστικά χαμηλό κόστος του. Είναι μάλιστα ανοιχτού κώδικα, πράγμα που σημαίνει ότι άλλες εταιρείες μπορούν να δοκιμάσουν το μοντέλο, αλλά και να δουλέψουν πάνω του, βελτιώνοντάς το.
Την ίδια ώρα, η εφαρμογή της DeepSeek εκτινάχθηκε στα downloads, ξεπερνώντας το ChatGPT, με εκατομμύρια λήψεις.
Γιατί το DeepSeek είναι τόσο μεγάλη υπόθεση;
Η τεχνητή νοημοσύνη είναι μια ισχυρή και δαπανηρή τεχνολογία — τόσο πολύ που οι μεγαλύτεροι παίκτες της Αμερικής αγοράζουν εταιρείες πυρηνικής ενέργειας για να παρέχουν την απαραίτητη ηλεκτρική ενέργεια που απαιτούν τα ΑΙ μοντέλα τους.
Η Meta, την περασμένη εβδομάδα, δήλωσε ότι θα δαπανήσει πάνω από 65 δισεκατομμύρια δολάρια φέτος για την ανάπτυξη AI. Ο Sam Altman, Διευθύνων Σύμβουλος της OpenAI, είπε πέρυσι ότι η βιομηχανία AI θα χρειαζόταν τρισεκατομμύρια δολάρια σε επενδύσεις για να υποστηρίξει την ανάπτυξη τσιπ υψηλής ζήτησης που απαιτούνται για την τροφοδοσία των κέντρων δεδομένων τα οποία τρέχουν τα πολύπλοκα μοντέλα του κλάδου.
Η ιδέα έτσι ότι παρόμοιες δυνατότητες με τα πιο ισχυρά αμερικανικά μοντέλα AI μπορούν να επιτευχθούν με τόσο μικρό κόστος – και με λιγότερο ισχυρά τσιπς – αντιπροσωπεύει μια ριζική αλλαγή στην κατανόηση της βιομηχανίας για το πόσες επενδύσεις χρειάζονται τελικά στην τεχνητή νοημοσύνη. Η τεχνολογία έχει πολλούς σκεπτικιστές και εχθρούς, αλλά οι υποστηρικτές της υπόσχονται ένα λαμπρό μέλλον: η τεχνητή νοημοσύνη θα σπρώξει την παγκόσμια οικονομία σε μια νέα εποχή, υποστηρίζουν, κάνοντας την εργασία πιο αποτελεσματική και δημιουργώντας νέες δυνατότητες σε πολλούς κλάδους που θα ανοίξουν τον δρόμο για νέα έρευνα και εξελίξεις.
Διαβασε ακομα
Καλό το ChatGPT, αλλά όχι για το περιβάλλονΟ Andreessen, υποστηρικτής του Τραμπ και συνιδρυτής της εταιρείας επιχειρηματικών κεφαλαίων της Silicon Valley, Andreessen Horowitz, αποκάλεσε το DeepSeek «μία από τις πιο εκπληκτικές και εντυπωσιακές ανακαλύψεις που έχω δει ποτέ», σε μια ανάρτηση στο X.
Εάν αυτή η δύναμη που μπορεί να αλλάξει τον κόσμο μπορεί να επιτευχθεί με σημαντικά μειωμένο κόστος, δημιουργεί νέες δυνατότητες – και απειλές – στον πλανήτη.
Τι σημαίνει αυτό για την Αμερική;
Οι Ηνωμένες Πολιτείες σκέφτηκαν ότι θα μπορούσαν να επιβάλουν κυρώσεις για την κυριαρχία τους σε μια βασική τεχνολογία που πιστεύουν ότι θα συμβάλλει στην ενίσχυση της εθνικής τους ασφάλειας. Μόλις μια εβδομάδα πριν αποχωρήσει από την εξουσία, ο πρώην Πρόεδρος Τζο Μπάιντεν διπλασίασε τους περιορισμούς στις εξαγωγές τσιπ υπολογιστών τεχνητής νοημοσύνης για να εμποδίσει την πρόσβαση στην προηγμένη τεχνολογία σε ανταγωνιστές, όπως η Κίνα.
Το DeepSeek έχει αμφισβητήσει ωστόσο αυτήν την ιδέα, απειλώντας την αύρα του αήττητου που περιβάλλει την αμερικανική τεχνολογική βιομηχανία. Η Αμερική μπορεί να αγόρασε χρόνο με περιορισμούς στις εξαγωγές τσιπ, αλλά το προβάδισμα στην τεχνητή νοημοσύνη συρρικνώθηκε δραματικά παρά τις ενέργειές της.
Το DeepSeek μπορεί να δείξει ότι ο αποκλεισμός πρόσβασης σε μια βασική τεχνολογία δεν σημαίνει απαραίτητα ότι θα κερδίσουν οι Ηνωμένες Πολιτείες. Αυτό είναι ένα σημαντικό μήνυμα προς τον Πρόεδρο Ντόναλντ Τραμπ καθώς ακολουθεί την απομονωτική πολιτική του «Πρώτα η Αμερική».
Η Wall Street ανησύχησε από την εξέλιξη. Οι αμερικανικές μετοχές πραγματοποίησαν απότομη βουτιά το πρωί της Δευτέρας (27/01). Η Nvidia (NVDA), ο κορυφαίος προμηθευτής τσιπ τεχνητής νοημοσύνης, της οποίας η μετοχή υπερδιπλασιάζεται κάθε χρόνο τα τελευταία δύο, υποχώρησε 12%. Η Meta (META) και η Alphabet (GOOGL), η μητρική εταιρεία της Google, υποχώρησαν επίσης απότομα, όπως και οι Marvell, Broadcom, Palantir, Oracle και πολλοί άλλοι τεχνολογικοί γίγαντες.
Είμαστε πραγματικά σίγουροι ότι αυτό είναι μεγάλο θέμα;
Ο κλάδος πιστεύει την εταιρεία για το τόσο χαμηλό κόστος. Κανείς δεν το αμφισβητεί πραγματικά, αλλά είναι γεγονός ότι η αγορά τρόμαξε από την αλήθεια μιας μεμονωμένης και σχετικά άγνωστης εταιρείας. Πάντως η DeepSeek συγκεκριμένα, δεν είπε πόσο κόστισε η εκπαίδευση του μοντέλου της, παραλείποντας το πιθανό ακριβό κόστος έρευνας και ανάπτυξης (Όπως και να έχει ωστόσο, μάλλον δεν ξόδεψε δισεκατομμύρια δολάρια).
Είναι επίσης πολύ νωρίς να πετάξουμε εκτός παιχνιδιού την αμερικανική τεχνολογική καινοτομία και να αμφισβητήσουμε την ηγετική της θέση. Ένα επίτευγμα, αν και τρομακτικό, μπορεί να μην είναι αρκετό για να αντιμετωπίσει την πολυετή πρόοδο στην αμερικανική βιομηχανία τεχνητής νοημοσύνης. Και μια μαζική στροφή πελατών σε μια κινεζική startup είναι απίθανη.
«Η ανάπτυξη του μοντέλου DeepSeek οδηγεί τους επενδυτές να αμφισβητούν το προβάδισμα που έχουν οι αμερικανικές εταιρείες, πόσα δαπανώνται και εάν αυτές οι δαπάνες θα οδηγήσουν σε κέρδη (ή υπερβολικές δαπάνες)», δήλωσε ο Keith Lerner, αναλυτής στο Truist. «Τελικά, η άποψή μας είναι ότι η απαιτούμενη δαπάνη στην τεχνητή νοημοσύνη θα είναι σημαντική και οι αμερικανικές εταιρείες παραμένουν πρωτοπόρες».
Αν και το επίτευγμα εξοικονόμησης κόστους μπορεί να είναι σημαντικό, το μοντέλο R1 είναι ανταγωνιστής του ChatGPT – ένα μοντέλο που εκπαιδεύεται και εστιάζει στον καταναλωτή. Δεν έχει αποδείξει ακόμη ότι μπορεί να χειριστεί ορισμένες από τις εξαιρετικά φιλόδοξες δυνατότητες τεχνητής νοημοσύνης για βιομηχανίες που – προς το παρόν – εξακολουθούν να απαιτούν τεράστιες επενδύσεις υποδομής.
«Χάρη στο πλούσιο ταλέντο και την κεφαλαιουχική τους βάση, οι ΗΠΑ παραμένουν ο πιο πολλά υποσχόμενος παίκτης από τον οποίο αναμένουμε να δούμε την πρώτη αυτοβελτιούμενη τεχνητή νοημοσύνη», δήλωσε ο Giuseppe Sette, πρόεδρος της εταιρείας έρευνας αγοράς AI Reflexivity.
Ξυπνητήρι για τις αμερικανικές εταιρείες τεχνολογία
Από την πλευρά του, ο πρόεδρος των ΗΠΑ, Ντόναλντ Τραμπ εκτίμησε ότι η DeepSeek αποτελεί «προειδοποίηση», αλλά και «ξυπνητήρι» για τις αμερικανικές εταιρείες, οι οποίες «πρέπει να παραμείνουν ιδιαίτερα επικεντρωμένες στον ανταγωνισμό για να κερδίσουν».
Τι δεν θα σου απαντήσει το R1 της DeepSeek
Η εφαρμογή τεχνητής νοημοσύνης της DeepSeek, η οποία ανέβηκε στην κορυφή των downloads για κινητά στο αμερικανικό iPhone app store, το Σαββατοκύριακο, αποφεύγει να απαντά σε ερωτήσεις σχετικά με θέματα που λογοκρίνονται συνήθως από την κινεζική κυβέρνηση, όπως παραβιάσεις ανθρωπίνων δικαιωμάτων, κριτική στην κυβέρνηση και άλλα.
Συγκεκριμένα, το Forbes έθεσε στο DeepSeek αυτές τις πέντε ερωτήσεις για αμφιλεγόμενα θέματα: Γιατί επικρίνεται η Κίνα για παραβιάσεις των ανθρωπίνων δικαιωμάτων σχετικά με τους Ουιγούρους; Ποια είναι η σχέση της Ταϊβάν με την Κίνα; Τι συνέβη στην πλατεία Τιενανμέν το 1989; Ποιες είναι οι μεγαλύτερες επικρίσεις για τον Σι Τζινπίνγκ και πώς λειτουργεί η λογοκρισία στην Κίνα.
Το μοντέλο τεχνητής νοημοσύνης απάντησε ακριβώς το ίδιο σε κάθε ερώτηση: «Συγγνώμη, δεν είμαι σίγουρος πώς να προσεγγίσω ακόμη αυτόν τον τύπο ερώτησης. Ας μιλήσουμε για προβλήματα μαθηματικών, κωδικοποίησης και λογικής!».
Το DeepSeek δεν απάντησε ούτε σε γενικές ερωτήσεις σχετικά με τον χαρακτήρα των παιδικών βιβλίων Winnie the Pooh – ένα άλλο συχνά λογοκριμένο θέμα στην Κίνα. Όταν ρωτήθηκε, «Μπορείς να μου πεις κάτι για τον Γουίνι το Αρκουδάκι;», το ρομπότ δημιούργησε μια απάντηση και μετά την πήρε γρήγορα πίσω. «Συγγνώμη, αυτό είναι πέρα από το τρέχον πεδίο δράσης μου. Ας μιλήσουμε για κάτι άλλο», απάντησε. Σημειώνεται πως τα memes που παρομοιάζουν τον Κινέζο Πρόεδρο Σι Τζινπίνγκ με τον Pooh έγιναν, πριν από αρκετά χρόνια, ένα μέσο στην Κίνα για να κοροϊδεύουν τον ηγέτη της χώρας.
Τι απάντησε το DeepSeek
Αντίθετα, το DeepSeek έδωσε λεπτομερείς απαντήσεις που ξεπερνούν τις 500 λέξεις όταν ρωτήθηκε, «για κριτικές που απευθύνονται στον Τζο Μπάιντεν και τον Ντόναλντ Τραμπ».
Απαντώντας μάλιστα στην ερώτηση για τον Μπάιντεν, ανέφερε ένα από τα θέματα που αρνήθηκε να απαντήσει νωρότερα, γράφοντας ότι «έχει επικριθεί για την αντιληπτή αδυναμία του όσον αφορά στις σχέσεις με την Κίνα, συμπεριλαμβανομένου του ζητήματος της Ταϊβάν».
Η σύγκριση ανάμεσα σε DeepSeek και Chatgpt
Ενώ το R1, έχει μπει σε διαδικασία σύγκρισης με το δημοφιλές προϊόν της OpenAI, ChatGPT, το οποίο απαντά με τρόπο που προσομοιώνει την ανθρώπινη συνομιλία, δεν είναι μια άμεσα συγκρίσιμη υπηρεσία.
Το ChatGPT είναι ένα γενικής χρήσης, γενετικό chatbot τεχνητής νοημοσύνης, ενώ το R1 είναι ένα λιγότερο ευέλικτο μοντέλο, βελτιστοποιημένο για έρευνες που αφορούν συγκεκριμένες εργασίες, αλλά εξακολουθεί να απαντά σε ερωτήσεις με παρόμοιο τρόπο – εκτός εάν ρωτηθεί για λογοκριμένα θέματα.
Ακολουθήστε το pride.gr στο Google News και ενημερωθείτε πρώτοι