News Το VALL-E της Microsoft χρειάζεται 3″ για να μιμηθεί την φωνή του καθενός By i.tsompas 13 Ιανουαρίου, 2023666 views ShareTweet 0 Μια νέα ψηφιακή υπηρεσία που βασίζεται στην τεχνητή νοημοσύνη εμφάνισε η Microsoft και ισχυρίζεται πως μπορεί να μιμηθεί οποιαδήποτε ανθρώπινη φωνή. Η νέα δημιουργία της εταιρείας φέρνει την ονομασία VALL-E, όπως και ο προηγούμενος αλγόριθμος DALL-E. Αν δεν γνωρίζετε, το τελευταίο δημιουργεί μια εικόνα με βάση ένα κείμενο. Το VALL-E μπορεί να μιμηθεί τη χροιά και τον τρόπο ομιλίας ακούγοντας τη φωνή ενός πραγματικού προσώπου σε μόλις τρία δευτερόλεπτα. Αν και ο ήχος μοιάζει λίγο με τη φωνή ενός ρομπότ, το αποτέλεσμα εξακολουθεί να είναι εντυπωσιακό. Η Microsoft το αποκάλεσε “μοντέλο γλώσσας νευρωνικού κωδικοποιητή”. Το VALL-E κατασκευάστηκε με βάση το EnCodec (έναν κωδικοποιητή ήχου που χρησιμοποιεί τεχνικές μηχανικής μάθησης), που αναπτύχθηκε από τη Meta πριν από ένα χρόνο, το 2022. Άλλες μέθοδοι μετατροπής κειμένου σε ομιλία λαμβάνουν υπόψη τις κυματομορφές, αλλά το VALL-E δημιουργεί ξεχωριστούς κωδικοποιητές ήχου από κείμενο και ήχο. Στην πραγματικότητα, αναλύει πώς ακούγεται ένα άτομο. Στη συνέχεια, αναλύει αυτές τις πληροφορίες σε ξεχωριστά μέρη (που ονομάζονται “tokens”) μέσω του EnCodec. Και στο τέλος, χρησιμοποιεί δεδομένα προπόνησης για να ταιριάξει με αυτό που “γνωρίζει” για το πώς θα ακουγόταν αυτή η φωνή αν έλεγε άλλες φράσεις εκτός του δείγματος των τριών δευτερολέπτων. Το VALL-E διδάχθηκε χρησιμοποιώντας ειδική βιβλιοθήκη. Το τελευταίο περιέχει 60.000 ώρες αγγλικής ομιλίας από περισσότερα από 7.000 άτομα. Οι προγραμματιστές προτείνουν ότι η μέθοδος θα μπορούσε να χρησιμοποιηθεί για εφαρμογές μετατροπής κειμένου σε ομιλία υψηλής ποιότητας. Για παράδειγμα, μπορείτε να το χρησιμοποιήσετε για την επεξεργασία εγγραφών ομιλίας όπου επιτρέπεται η αλλαγή ανθρώπινων λέξεων. Ως αποτέλεσμα, μπορείτε να δημιουργήσετε ηχητικό περιεχόμενο (όπως φωνητικά για ηχητικά βιβλία) και πολλά άλλα. Φυσικά, μια τέτοια τεχνολογία μπορεί επίσης να εγκυμονεί έναν συγκεκριμένο κίνδυνο. Αργά ή γρήγορα, κάποιοι χρήστες θα το κάνουν εργαλείο εκβιασμού. Ας πούμε, μπορούν να χρησιμοποιήσουν την τεχνητή νοημοσύνη για να αποδείξουν ότι διάσημοι άνθρωποι είπαν κάτι που δεν είπαν. [via] Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε Συνδεθείτε για να σχολιάσετε Καλώς ήλθατε {{inv_username}} comments Συνδεθείτε για να απαντήσετε Aπαντήστε {{inv_error}} New Comment Post Comment Logout Σύνδεση Email Κωδικός Σύνδεση Κλείσιμο
Gadgets “Προδόθηκαν” μέσω διαρροής οι τιμές του Nothing Phone (3) ενώ μάθαμε και για ένα άλλο νέο προϊόν By i.tsompas2 ώρες ago0
Apps Πως εκδίδεται ο Προσωπικός Αριθμός μέσω της πλατφόρμας myinfo.gov.gr By Τέτη Ηγουμενίδη4 ώρες ago0
Apps Ελάχιστες οι ανακοινώσεις της Apple στο WWDC 25 όσον αφορά την τεχνητή νοημοσύνη By i.tsompas4 ώρες ago0
Apps YouTube: Πήρε το θάρρος και αναγνώρισε σφάλμα της εφαρμογής σε συσκευές Android By i.tsompas10 ώρες ago0
Mobiles Xiaomi: Υπόσχεται να φέρει σημαντικές διορθώσεις σφαλμάτων για 12 προβλήματα συσκευών By i.tsompas11 ώρες ago0
Mobiles Αισιόδοξα νέα, το Honor Magic V5 έρχεται με μεγαλύτερη μπαταρία κατά 20% By i.tsompas11 ώρες ago0
Apps Αργότερα φέτος αναμένεται να δούμε μια ειδικά σχεδιασμένη εφαρμογή του Instagram για iPad By i.tsompas13 ώρες ago0
Mobiles Η Oppo στον τελικό του UEFA Champions League έκανε επίδειξη της τεχνητής νοημοσύνης και των κινητών της By i.tsompas14 ώρες ago0
Gadgets Φανερώθηκε το Red Magic Gaming Tablet 3 Pro και αναμένεται να κυκλοφορήσει αυτόν τον μήνα By i.tsompas24 ώρες ago0