Μετά τον ενθουσιασμό, απογοήτευση για την DeepSeek: Υποβαθμισμένη η αξιοπιστία του chatGPT V3

29/01/2025, 17:48

Αναλυτική εξέταση της αξιοπιστίας του chatbot V3 της DeepSeek, μετά από απογοητευτικά αποτελέσματα δοκιμών. Το δημοφιλές chatbot της κινεζικής εταιρείας DeepSeek κατέλαβε την προτελευταία θέση ανάμεσα σε 11 μοντέλα κατά τη διάρκεια παρουσίασης ειδήσεων και άλλων χρήσιμων πληροφοριών. Αυτή η εξέλιξη έρχεται να υποβαθμίσει τον ενθουσιασμό που υπήρχε για την κινεζική τεχνολογία χαμηλού κόστους. Η DeepSeek υποστηρίζει ότι το μοντέλο V3 προσφέρει συγκρίσιμες επιδόσεις με το ChatGPT, το Llama της Meta και το Gemini της Google. Ωστόσο, το V3 απέτυχε να απαντήσει σωστά στο 83% των δοκιμών που διεξήγαγε η NewsGuard, εταιρεία που αξιολογεί την αξιοπιστία των ειδησεογραφικών μέσων.

Το chatbot αναπαρήγαγε ψευδείς ειδήσεις σε 30% των περιπτώσεων, ενώ οι απαντήσεις του ήταν ασαφείς ή μη χρήσιμες στο 53% των ερωτήσεων, γεγονός που υποδηλώνει ότι απάντησε σωστά μόνο στο 47%. Η επίδοση αυτή είναι σημαντικά χαμηλότερη από τον μέσο όρο των 62% που πέτυχαν τα δέκα αμερικανικά μοντέλα, όπως το Gemini και το ChatGPT.

Η DeepSeek απέκτησε διεθνή αναγνώριση όταν παρουσίασε το V3, το οποίο υποστηρίζει ότι εκπαιδεύτηκε με τσιπ της Nvidia συνολικού κόστους μόλις 6 εκατομμυρίων δολαρίων, σε σύγκριση με τα δεκάδες ή εκατοντάδες εκατομμύρια που απαιτούνται για άλλα μεγάλα μοντέλα. Επιπλέον, η εταιρεία έχει λάβει θετικά σχόλια για το συλλογιστικό μοντέλο R1, που μιμείται την ανθρώπινη λογική, το οποίο κοστίζει περίπου 30 φορές λιγότερο από το αντίστοιχο μοντέλο O1 της OpenAI.

Η εφαρμογή του V3 για κινητά έγινε σύντομα το πιο δημοφιλές app για συσκευές Apple, αλλά οι αγορές άρχισαν να εκφράζουν ανησυχίες σχετικά με τις αστρονομικές δαπάνες των αμερικανικών εταιρειών AI. Εταιρείες όπως η Nvidia και η Meta παρουσίασαν μεγάλες πτώσεις στις τιμές των μετοχών τους, με τις συνολικές απώλειες των αμερικανικών εταιρειών τεχνολογίας να φτάνουν το ένα τρισ. δολάρια πριν αρχίσουν να ανακάμπτουν.

Η NewsGuard ανέφερε ότι δοκίμασε περίπου 300 οδηγίες στο chatbot της DeepSeek, συμπεριλαμβανομένων 30 που σχετίζονταν με 10 ψευδείς ειδήσεις που κυκλοφορούσαν στο Διαδίκτυο, όπως η δολοφονία στελέχους της United Healthcare τον περασμένο μήνα. Σύμφωνα με την εταιρεία, σε τρία από τα δέκα αυτά prompt, το σύστημα παρείχε απαντήσεις που συμβαδίζουν με τις επίσημες θέσεις της κινεζικής κυβέρνησης. Στην Κίνα, οι εταιρείες AI είναι υποχρεωμένες να διασφαλίζουν ότι τα μοντέλα τους σέβονται τις επίσημες θέσεις του κομμουνιστικού κόμματος.

Πηγή περιεχομένου: in.gr

Ακολουθήστε μας και στο Google News

Δριμύς ανοιξιάτικος χιονιάς με θερμοκρασίες κάτω από 13°C

Μετά τα χιόνια, έρχεται ο παγετός – Τι προβλέπει η ΕΜΥ για τον καιρό

Σωκράτης Φάμελλος: Αποκαλύπτεται η συγκάλυψη των ευθυνών για το έγκλημα στα Τέμπη

Φάμελλος για ΕΟΔΑΣΑΑΜ: Επικρίσεις στην κυβέρνηση και τη Δικαιοσύνη

Δήμαρχος δεν έγινε, παράταξη δεν κράτησε – τι έμεινε;

Το τροπάριο της Κατερίνας και το «ξήλωμα» της Μεγάλης Τρίτης

ΕΕ: Προτάσεις για δασμούς 25% σε αμερικανικά προϊόντα, εκτός του μπέρμπον

Πώς οι δασμοί επηρεάζουν τις θέσεις εργασίας στην ΕΕ και την Ελλάδα: Οι προτάσεις των ευρωπαϊκών συνδικάτων

Ιράν: Έμμεσες συνομιλίες υψηλού επιπέδου με τις ΗΠΑ προγραμματισμένες για το Σάββατο στο Ομάν

Η ΕΕ προετοιμάζει αναλογική αντίδραση στους αμερικανικούς δασμούς, σύμφωνα με τον επίτροπο Σεζουρνέ

Αγγελούδης για ΔΕΘ: «Κανένας δήμαρχος δεν θα υπογράψει την απομάκρυνση ενός διαμαντιού της πόλης»

Φυλακή για τον 35χρονο που προχώρησε σε παράνομη υλοτομία στο δάσος της Αρέθουσας

Μετά τον ενθουσιασμό, απογοήτευση για την DeepSeek: Υποβαθμισμένη η αξιοπιστία του chatGPT V3

Τιμητική διάκριση για τον Ρόμπερτ Ντε Νίρο στο Φεστιβάλ Καννών

Αποχαιρετισμός στον Κλεμ Μπερκ: Ο ντράμερ των Blondie έφυγε από τη ζωή στα 70 του χρόνια

Ο βασιλιάς Κάρολος και η βασίλισσα Καμίλα ξεκινούν μια ιστορική επίσκεψη στην Ιταλία

Η Λέσλι Μάνβιλ και ο Τζον Λίθγκοου διακρίνονται στα βραβεία Λόρενς Ολίβιε