396
Οσοι αντέδρασαν απλώς στο σύστημα αναγνώρισης προσώπου της Apple, τώρα θα πρέπει να αποδράσουν από το Internet | Shutterstock

Το YouTube θα ακούει τη φωνή σου και θα σε «φωτογραφίζει»

Protagon Team Protagon Team 20 Ιουνίου 2019, 09:45
Οσοι αντέδρασαν απλώς στο σύστημα αναγνώρισης προσώπου της Apple, τώρα θα πρέπει να αποδράσουν από το Internet
|Shutterstock

Το YouTube θα ακούει τη φωνή σου και θα σε «φωτογραφίζει»

Protagon Team Protagon Team 20 Ιουνίου 2019, 09:45

«Η εξωτερική σου εμφάνιση είναι καθρέφτης του τρόπου που αφηγείσαι». Με αυτή την αρχή, ερευνητές από το Τεχνολογικό Ινστιτούτο της Μασαχουσέτης (MIT) και τη Google, δημιουργούν έναν αλγόριθμο, ο οποίος θα σχεδιάζει φωτογραφίες μας, αποκλειστικά και μόνο από τον τόνο της φωνής μας. Το νέο τεχνολογικό επίτευγμα θα «τρέξει» μέσα από την πλατφόρμα του YouTube.

Ο αλγόριθμος εκπαιδεύεται μέσα από χιλιάδες βίντεο του YouTube, τα οποία τον έχουν τροφοδοτήσει περισσότεροι από 100.000 άνθρωποι που μιλούν. Αυτό που αναζητά το σύστημα τεχνητής νοημοσύνης, είναι μοτίβα που συνδέουν τα χαρακτηριστικά της ομιλίας ενός ανθρώπου, με τα χαρακτηριστικά του προσώπου. Ακολούθως, το πρόγραμμα θα δημιουργήσει φωνές ανθρώπων, που δυνητικά θα ταίριαζαν σε κάποιο πρόσωπο. Και στη συνέχεια θα το «πάρει» αντίθετα, δημιουργώντας από τις φωνές τα πρόσωπα.

Στο πλαίσιο των δοκιμών, το σύστημα πέτυχε αρκετές ομοιότητες στην αποκάλυψη του προσώπου, όπως αναφέρουν οι Times. Τα πιο συχνά επιτυχημένα χαρακτηριστικά στις δοκιμές, ήταν το φύλο, η ηλικία και η εθνικότητα. Οι ερευνητές έχουν παρατηρήσει ότι μπορούν να αναπαράγουν με συγκεκριμένο τρόπο χαρακτηριστικά του προσώπου, από τον τρόπο που παράγονται οι ήχοι. Για παράδειγμα, η μύτη διαδραματίζει πολύ σημαντικό ρόλο στην παραγωγή συγκεκριμένων συχνοτήτων της φωνής και παραγόμενων ήχων, έτσι είναι ένα από τα όργανα του προσώπου που μπορεί ο αλγόριθμος να αναπαραστήσει με μεγάλη επιτυχία.

Πέρα όμως από την ανατομία του προσώπου, η ανθρώπινη φωνή επηρεάζεται από διάφορους ψυχολογικούς και κοινωνικούς παράγοντες, οι οποίοι επιτρέπουν στο σύστημα τεχνητής νοημοσύνης να καταλήξει σε «συμπεράσματα» για την εξωτερική μας εμφάνιση.

Οσον αφορά τη χρήση και τη χρησιμότητα αυτής της τεχνολογίας, σε έρευνα που δημοσιεύεται στην επιθεώρηση arXiv, οι ειδικοί υπογραμμίζουν ότι «προβλέποντας την εικόνα ενός ανθρώπου απευθείας από τη φωνή του, μπορεί να βοηθήσει σε συγκεκριμένες εφαρμογές, όπως η προσάρτηση ενός προσώπου σε μία τηλεφωνική επικοινωνία με άγνωστο «πομπό», σύμφωνα με τα χαρακτηριστικά της φωνής του. Αυτό περιλαμβάνει και άβαταρ ή σκίτσα των ανθρώπων που θα δημιουργούνται αποκλειστικά και μόνο από τον τόνο της φωνής τους».

Ιδιωτικότητα και εγκληματικότητα

Ωστόσο, όπως σε κάθε τεχνολογική εξέλιξη, το νόμισμα έχει δύο όψεις. Αρκετοί υποστηρίζουν ότι η τεχνολογία θα βοηθήσει στη μείωση της εγκληματικότητας, άλλοι ότι ξεπερνά κάθε όριο για τα προσωπικά δεδομένα και την ασφάλεια. Η Google από την πλευρά της, αναφέρει ότι όπως κάθε νέο δημιούργημα τεχνητής νοημοσύνης, έτσι και αυτό θα έχει τους απαραίτητους ηθικούς φραγμούς, θα είναι σημαντικό για την κοινωνία και σίγουρα θα είναι ένα σημαντικό εργαλείο για την αποφυγή ενίσχυσης της βίας.