Νέο μοντέλο τεχνητής νοημοσύνης μεταφράζει ομιλίες σε 101 γλώσσες με αυξημένη ακρίβεια

Νέο μοντέλο τεχνητής νοημοσύνης μεταφράζει ομιλίες σε 101 γλώσσες με αυξημένη ακρίβεια

Ερευνητική ομάδα της αμερικανικής εταιρείας τεχνολογίας Meta δημιούργησε ένα μοντέλο τεχνητής νοημοσύνης που μπορεί να μεταφράζει απευθείας την ομιλία από μια γλώσσα σε άλλη.

Τα περισσότερα υπάρχοντα συστήματα μετάφρασης με μηχανική μάθηση είναι προσανατολισμένα στο κείμενο ή περιλαμβάνουν πολλαπλά βήματα, όπως η αναγνώριση ομιλίας, η μετάφραση σε κείμενο και η μετατροπή του κειμένου σε ομιλία. Στην προσπάθεια αντιμετώπισης αυτών των περιορισμών, το νέο μοντέλο, που ονομάζεται SEAMLESSM4T, κάνει άμεσες μεταφράσεις για έως και 101 γλώσσες.

Σύμφωνα με τη δημοσίευση στο περιοδικό Nature, το SEAMLESSM4T μπορεί να μεταφράσει από ομιλία σε ομιλία αναγνωρίζοντας 101 γλώσσες και μεταφράζοντας σε 36, καθώς και άλλες μορφές μετάφρασης όπως ομιλία σε κείμενο, κείμενο σε ομιλία και αυτόματη αναγνώριση ομιλίας. Για τη μετάφραση από ομιλία σε ομιλία, το SEAMLESSM4T μεταφράζει με έως και 23% μεγαλύτερη ακρίβεια από τα υπάρχοντα συστήματα.

Ο αναπληρωτής καθηγητής στο Τεχνολογικό Πανεπιστήμιο του Ταλίν στην Εσθονία, Τάνελ Αλουμέ, σημειώνει ότι η μεγαλύτερη αρετή αυτού του μοντέλου είναι η δημόσια διάθεση όλων των δεδομένων και του κώδικα για τη βελτιστοποίηση της τεχνολογίας. Ωστόσο, επισημαίνει ότι παραμένουν ορισμένα εμπόδια, όπως η περιορισμένη μετάφραση γλωσσών ή η δυσκολία μετάφρασης σε θορυβώδη περιβάλλοντα.

Η Άλισον Κένεκε, επίκουρη καθηγήτρια στο Τμήμα Επιστήμης της Πληροφορικής του Πανεπιστημίου Cornell, διακρίνει ως πολύ ενδιαφέρον το γεγονός ότι οι ερευνητές ποσοτικοποίησαν την τοξική, επιβλαβή ή προσβλητική γλώσσα που μπορεί να εισάγουν οι μεταφράσεις και αναζήτησαν τυχόν μεροληψία λόγω φύλου.

Σύνδεσμος για την επιστημονική δημοσίευση:

https://www.nature.com/articles/s41586-024-08359-z

Loading

Play