Αναλυτική εξέταση της αξιοπιστίας του chatbot V3 της DeepSeek, μετά από απογοητευτικά αποτελέσματα δοκιμών. Το δημοφιλές chatbot της κινεζικής εταιρείας DeepSeek κατέλαβε την προτελευταία θέση ανάμεσα σε 11 μοντέλα κατά τη διάρκεια παρουσίασης ειδήσεων και άλλων χρήσιμων πληροφοριών. Αυτή η εξέλιξη έρχεται να υποβαθμίσει τον ενθουσιασμό που υπήρχε για την κινεζική τεχνολογία χαμηλού κόστους. Η DeepSeek υποστηρίζει ότι το μοντέλο V3 προσφέρει συγκρίσιμες επιδόσεις με το ChatGPT, το Llama της Meta και το Gemini της Google. Ωστόσο, το V3 απέτυχε να απαντήσει σωστά στο 83% των δοκιμών που διεξήγαγε η NewsGuard, εταιρεία που αξιολογεί την αξιοπιστία των ειδησεογραφικών μέσων.
Το chatbot αναπαρήγαγε ψευδείς ειδήσεις σε 30% των περιπτώσεων, ενώ οι απαντήσεις του ήταν ασαφείς ή μη χρήσιμες στο 53% των ερωτήσεων, γεγονός που υποδηλώνει ότι απάντησε σωστά μόνο στο 47%. Η επίδοση αυτή είναι σημαντικά χαμηλότερη από τον μέσο όρο των 62% που πέτυχαν τα δέκα αμερικανικά μοντέλα, όπως το Gemini και το ChatGPT.
Η DeepSeek απέκτησε διεθνή αναγνώριση όταν παρουσίασε το V3, το οποίο υποστηρίζει ότι εκπαιδεύτηκε με τσιπ της Nvidia συνολικού κόστους μόλις 6 εκατομμυρίων δολαρίων, σε σύγκριση με τα δεκάδες ή εκατοντάδες εκατομμύρια που απαιτούνται για άλλα μεγάλα μοντέλα. Επιπλέον, η εταιρεία έχει λάβει θετικά σχόλια για το συλλογιστικό μοντέλο R1, που μιμείται την ανθρώπινη λογική, το οποίο κοστίζει περίπου 30 φορές λιγότερο από το αντίστοιχο μοντέλο O1 της OpenAI.
Η εφαρμογή του V3 για κινητά έγινε σύντομα το πιο δημοφιλές app για συσκευές Apple, αλλά οι αγορές άρχισαν να εκφράζουν ανησυχίες σχετικά με τις αστρονομικές δαπάνες των αμερικανικών εταιρειών AI. Εταιρείες όπως η Nvidia και η Meta παρουσίασαν μεγάλες πτώσεις στις τιμές των μετοχών τους, με τις συνολικές απώλειες των αμερικανικών εταιρειών τεχνολογίας να φτάνουν το ένα τρισ. δολάρια πριν αρχίσουν να ανακάμπτουν.
Η NewsGuard ανέφερε ότι δοκίμασε περίπου 300 οδηγίες στο chatbot της DeepSeek, συμπεριλαμβανομένων 30 που σχετίζονταν με 10 ψευδείς ειδήσεις που κυκλοφορούσαν στο Διαδίκτυο, όπως η δολοφονία στελέχους της United Healthcare τον περασμένο μήνα. Σύμφωνα με την εταιρεία, σε τρία από τα δέκα αυτά prompt, το σύστημα παρείχε απαντήσεις που συμβαδίζουν με τις επίσημες θέσεις της κινεζικής κυβέρνησης. Στην Κίνα, οι εταιρείες AI είναι υποχρεωμένες να διασφαλίζουν ότι τα μοντέλα τους σέβονται τις επίσημες θέσεις του κομμουνιστικού κόμματος.
Πηγή περιεχομένου: in.gr