Μετά από μια επιτυχημένη φάση δοκιμών beta, η ElevenLabs ξεκίνησε επίσημα τη νέα της πλατφόρμα τεχνητής νοημοσύνης, η οποία μπορεί να μιμηθεί αποτελεσματικά φωνές σε 30 γλώσσες.
Η ElevenLabs δηλώνει ότι η σημαντική πρόοδος έγκειται στο νέο μοντέλο Multilingual v2 AI, το οποίο αναγνωρίζει αυτόματα γλώσσες, συμπεριλαμβανομένων των κορεατικών, των ολλανδικών, των Ελληνικών και των βιετναμέζικων, και μπορεί να παράγει περίτεχνα τις γλώσσες αντιγράφοντας ακόμη και το συναισθηματικό ηχόχρωμα. Αυτό το μοντέλο τεχνητής νοημοσύνης, σε συνδυασμό με ένα φιλικό προς το χρήστη περιβάλλον εργασίας, απλοποιεί τη διαδικασία για τους καθημερινούς χρήστες.
Η ElevenLabs προσφέρει δύο υπηρεσίες κλωνοποίησης φωνής: ένα εργαλείο μετατροπής κειμένου σε ομιλία, το οποίο μετατρέπει το γραπτό περιεχόμενο σε προφορικές λέξεις, και το εργαλείο “VoiceLab”, το οποίο έχει σχεδιαστεί για την κλωνοποίηση συγκεκριμένων φωνών.
Ωστόσο, παρά τη σημαντική αυτή πρόοδο στην τεχνητή νοημοσύνη, πολυάριθμα ηθικά και δεοντολογικά ζητήματα παραμένουν άλυτα”.
Έχουν εκφραστεί ανησυχίες σχετικά με την πιθανή κατάχρηση του λογισμικού κλωνοποίησης φωνής από κακόβουλους χρήστες για την αναπαραγωγή των φωνών ατόμων με επιρροή για τη διάδοση ρητορικής μίσους και παραπληροφόρησης. Παρ’ όλα αυτά, η εταιρεία έχει αναγνωρίσει αυτές τις ανησυχίες και έχει λάβει μέτρα, όπως ο περιορισμός της κλωνοποίησης φωνής σε λογαριασμούς επί πληρωμή και η εισαγωγή εργαλείων ανίχνευσης με βάση την τεχνητή νοημοσύνη.
Μια άλλη ανησυχία είναι ότι η τεχνητή νοημοσύνη θα μπορούσε να αντικαταστήσει τη δουλειά των voice over καλλιτεχνών, καθώς οι επιχειρήσεις μπορεί να θεωρήσουν πιο οικονομική τη χρήση της τεχνητής νοημοσύνης. Επιπλέον, η χρήση τεχνητής νοημοσύνης από την Lukeman Literary για τη μετάφραση των audio books σε άλλες γλώσσες δείχνει ότι η τάση αυτή θα συνεχίσει να αναπτύσσεται.
Σύμφωνα με την ElevenLabs, η ομάδα χρειαζόταν προηγουμένως εβδομάδες για την παραγωγή ενός και μόνο ηχητικού βιβλίου, λόγω της ανάγκης να βρει τον κατάλληλο καλλιτέχνη φωνητικής, να κλείσει ένα στούντιο ηχογράφησης, να ηχογραφήσει και να διαχειριστεί το post-production. Ωστόσο, η διαδικασία μπορεί πλέον να ολοκληρωθεί μέσα σε λίγες ώρες. Κάπως έτσι δηλαδή λέμε «Αντίο» σε ηθοποιούς, ηχολήπτες και στούντιο ηχογραφήσεων. Και μετά πολλοί αναρωτιούνται γιατί υπάρχουν τόσες πολλές φωνές που μιλούν εναντίον της τεχνητής νοημοσύνης!