Το Inside the Tech είναι μια σειρά blog που συνοδεύει το δικό μας Tech Talks Podcast. Στο επεισόδιο 20 του podcast, The Evolution of Roblox Avatars, ο Διευθύνων Σύμβουλος της Roblox David Baszucki μίλησε με τον Senior Director of Engineering Kiran Bhat, τον Senior Director of Product Mahesh Ramasubramanian και την Principal Product Manager Effie Goenawan, σχετικά με το μέλλον της καθηλωτικής επικοινωνίας μέσω avatars και τεχνικές προκλήσεις που επιλύουμε για να το τροφοδοτήσουμε. Σε αυτήν την έκδοση του Inside the Tech, μιλήσαμε με τον Senior Engineering Manager Andrew Portner για να μάθουμε περισσότερα για μία από αυτές τις τεχνικές προκλήσεις, την ασφάλεια στην καθηλωτική φωνητική επικοινωνία και πώς η δουλειά της ομάδας βοηθά στην προώθηση ενός ασφαλούς και πολιτικού ψηφιακού περιβάλλοντος για όλους η πλατφόρμα μας.
Ποιες είναι οι μεγαλύτερες τεχνικές προκλήσεις που αντιμετωπίζει η ομάδα σας;
Δίνουμε προτεραιότητα στη διατήρηση μιας ασφαλούς και θετικής εμπειρίας για τους χρήστες μας. Η ασφάλεια και η ευγένεια είναι πάντα στο επίκεντρο για εμάς, αλλά ο χειρισμός τους σε πραγματικό χρόνο μπορεί να είναι μια μεγάλη τεχνική πρόκληση. Όποτε υπάρχει ένα πρόβλημα, θέλουμε να μπορούμε να το ελέγξουμε και να αναλάβουμε δράση σε πραγματικό χρόνο, αλλά αυτό είναι δύσκολο δεδομένης της κλίμακας μας. Για να χειριστούμε αποτελεσματικά αυτήν την κλίμακα, πρέπει να αξιοποιήσουμε αυτοματοποιημένα συστήματα ασφαλείας.
Μια άλλη τεχνική πρόκληση στην οποία εστιάζουμε είναι η ακρίβεια των μέτρων ασφαλείας μας για μέτρο. Υπάρχουν δύο προσεγγίσεις εποπτείας για την αντιμετώπιση παραβιάσεων πολιτικής και την παροχή ακριβών σχολίων σε πραγματικό χρόνο: η αντιδραστική και η προληπτική εποπτεία. Για την αντιδραστική εποπτεία, αναπτύσσουμε μοντέλα μηχανικής εκμάθησης (ML) για τον ακριβή εντοπισμό διαφορετικών τύπων παραβιάσεων πολιτικής, τα οποία λειτουργούν ανταποκρινόμενα σε αναφορές από άτομα στην πλατφόρμα. Προληπτικά, εργαζόμαστε για την ανίχνευση δυνατοτήτων σε πραγματικό χρόνο περιεχόμενο που παραβιάζει τις πολιτικές μας, εκπαιδεύοντας τους χρήστες για τη συμπεριφορά τους. Η κατανόηση του προφορικού λόγου και η βελτίωση της ποιότητας του ήχου είναι μια πολύπλοκη διαδικασία. Βλέπουμε ήδη πρόοδο, αλλά ο απώτερος στόχος μας είναι να έχουμε ένα μοντέλο υψηλής ακρίβειας που θα μπορεί να ανιχνεύει συμπεριφορά παραβίασης πολιτικής σε πραγματικό χρόνο.
Ποιες είναι μερικές από τις καινοτόμες προσεγγίσεις και λύσεις που χρησιμοποιούμε για να αντιμετωπίσουμε αυτές τις τεχνικές προκλήσεις;
Έχουμε αναπτύξει ένα από άκρο σε άκρο μοντέλο ML που μπορεί να αναλύει δεδομένα ήχου και παρέχει ένα επίπεδο εμπιστοσύνης με βάση τον τύπο των παραβιάσεων πολιτικής (π.χ. πόσο πιθανό είναι αυτός ο εκφοβισμός, η βωμολοχία κ.λπ.). Αυτό το μοντέλο έχει βελτιώσει σημαντικά την ικανότητά μας να κλείνουμε αυτόματα ορισμένες αναφορές. Αναλαμβάνουμε δράση όταν το μοντέλο μας έχει αυτοπεποίθηση και μπορεί να είμαστε σίγουροι ότι ξεπερνά τους ανθρώπους. Μέσα σε λίγους μήνες μετά την κυκλοφορία, μπορέσαμε να εποπτεύσουμε σχεδόν όλες τις αναφορές κατάχρησης φωνής στα αγγλικά με αυτό το μοντέλο. Έχουμε αναπτύξει αυτά τα μοντέλα εσωτερικά και είναι απόδειξη της συνεργασίας μεταξύ πολλών τεχνολογιών ανοιχτού κώδικα και της δικής μας δουλειάς για τη δημιουργία της τεχνολογίας πίσω από αυτό.
Ο καθορισμός του κατάλληλου σε πραγματικό χρόνο φαίνεται αρκετά περίπλοκος. Πώς λειτουργεί αυτό;
Γίνεται πολλή σκέψη για να γίνει το σύστημα με βάση τα συμφραζόμενα. Εξετάζουμε επίσης μοτίβα με την πάροδο του χρόνου πριν αναλάβουμε δράση, ώστε να είμαστε σίγουροι ότι οι ενέργειές μας είναι δικαιολογημένες. Οι πολιτικές μας ποικίλλουν ανάλογα με την ηλικία του ατόμου, είτε βρίσκεται σε δημόσιο χώρο είτε σε ιδιωτική συνομιλία και πολλούς άλλους παράγοντες. Εξερευνούμε νέους τρόπους για την προώθηση της ευγένειας σε πραγματικό χρόνο και η ML βρίσκεται στην καρδιά της. Πρόσφατα κυκλοφορήσαμε αυτοματοποιημένες ειδοποιήσεις ώθησης (ή “ωθήσεις”) για να υπενθυμίσουμε στους χρήστες τις πολιτικές μας. Εξετάζουμε επίσης άλλους παράγοντες όπως ο τόνος της φωνής για να κατανοήσουμε καλύτερα τις προθέσεις ενός ατόμου και να διακρίνουμε πράγματα όπως ο σαρκασμός ή τα αστεία. Τέλος, χτίζουμε επίσης ένα πολύγλωσσο μοντέλο, καθώς μερικοί άνθρωποι μιλούν πολλές γλώσσες ή ακόμη και αλλάζουν γλώσσα στη μέση πρόταση. Για να είναι δυνατό κάτι από όλα αυτά, πρέπει να έχουμε ένα ακριβές μοντέλο.
Επί του παρόντος, επικεντρωνόμαστε στην αντιμετώπιση των πιο εμφανών μορφών κακοποίησης, όπως η παρενόχληση, οι διακρίσεις και οι βωμολοχίες. Αυτά αποτελούν την πλειοψηφία των αναφορών κατάχρησης. Στόχος μας είναι να έχουμε σημαντικό αντίκτυπο σε αυτούς τους τομείς και να θέσουμε τα πρότυπα του κλάδου για το πώς είναι η προώθηση και η διατήρηση μιας πολιτικής διαδικτυακής συνομιλίας. Είμαστε ενθουσιασμένοι με τις δυνατότητες χρήσης της ML σε πραγματικό χρόνο, καθώς μας δίνει τη δυνατότητα να προωθήσουμε αποτελεσματικά μια ασφαλή και πολιτική εμπειρία για όλους.
Πόσο μοναδικές είναι οι προκλήσεις που λύνουμε στο Roblox; Τι είμαστε σε θέση να λύσουμε πρώτα;
Η τεχνολογία Chat with Spatial Voice δημιουργεί μια πιο καθηλωτική εμπειρία, μιμούμενη την επικοινωνία του πραγματικού κόσμου. Για παράδειγμα, αν στέκομαι στα αριστερά κάποιου, θα με ακούσει στο αριστερό του αυτί. Δημιουργούμε ένα ανάλογο του τρόπου λειτουργίας της επικοινωνίας στον πραγματικό κόσμο και αυτή είναι μια πρόκληση που είμαστε σε θέση να λύσουμε πρώτα.
Ως gamer ο ίδιος, έχω γίνει μάρτυρας πολλών παρενοχλήσεων και εκφοβισμού στα διαδικτυακά παιχνίδια. Είναι ένα πρόβλημα που συχνά δεν ελέγχεται λόγω της ανωνυμίας των χρηστών και της έλλειψης συνεπειών. Ωστόσο, οι τεχνικές προκλήσεις που αντιμετωπίζουμε γύρω από αυτό είναι μοναδικές σε σχέση με αυτό που αντιμετωπίζουν άλλες πλατφόρμες σε μερικούς τομείς. Σε ορισμένες πλατφόρμες παιχνιδιών, οι αλληλεπιδράσεις περιορίζονται σε συμπαίκτες. Το Roblox προσφέρει διάφορους τρόπους για να κάνετε hangout σε ένα κοινωνικό περιβάλλον που μιμείται περισσότερο την πραγματική ζωή. Με τις εξελίξεις στην ML και την επεξεργασία σήματος σε πραγματικό χρόνο, είμαστε σε θέση να εντοπίζουμε και να αντιμετωπίζουμε αποτελεσματικά την καταχρηστική συμπεριφορά, πράγμα που σημαίνει ότι δεν είμαστε μόνο ένα πιο ρεαλιστικό περιβάλλον, αλλά και ένα περιβάλλον όπου όλοι αισθάνονται ασφαλείς να αλληλεπιδρούν και να συνδέονται με άλλους. Ο συνδυασμός της τεχνολογίας μας, της καθηλωτικής μας πλατφόρμας και της δέσμευσής μας να εκπαιδεύουμε τους χρήστες σχετικά με τις πολιτικές μας, μας βάζουν σε θέση να αντιμετωπίσουμε αυτές τις προκλήσεις κατά μέτωπο.
Ποια είναι μερικά από τα βασικά πράγματα που έχετε μάθει κάνοντας αυτή την τεχνική εργασία;
Νιώθω ότι έχω μάθει πολλά. Δεν είμαι μηχανικός ML. Έχω δουλέψει ως επί το πλείστον στο μπροστινό μέρος στο gaming, οπότε το να μπορώ να εμβαθύνω περισσότερο από ό,τι έχω για το πώς λειτουργούν αυτά τα μοντέλα ήταν τεράστιο. Ελπίζω ότι οι ενέργειες που αναλαμβάνουμε για την προώθηση της ευγένειας μεταφράζονται σε ένα επίπεδο ενσυναίσθησης στη διαδικτυακή κοινότητα που έλειπε.
Μια τελευταία μάθηση είναι ότι τα πάντα εξαρτώνται από τα δεδομένα εκπαίδευσης που εισάγετε. Και για να είναι ακριβή τα δεδομένα, οι άνθρωποι πρέπει να συμφωνήσουν στις ετικέτες που χρησιμοποιούνται για την κατηγοριοποίηση ορισμένων συμπεριφορών που παραβιάζουν τις πολιτικές. Είναι πολύ σημαντικό να εκπαιδεύεστε σε ποιοτικά δεδομένα στα οποία μπορούν να συμφωνήσουν όλοι. Είναι ένα πραγματικά δύσκολο πρόβλημα να λυθεί. Αρχίζετε να βλέπετε περιοχές όπου η ML είναι πολύ πιο μπροστά από οτιδήποτε άλλο, και στη συνέχεια άλλες περιοχές όπου είναι ακόμα στα αρχικά στάδια. Υπάρχουν ακόμη πολλοί τομείς στους οποίους η ML εξακολουθεί να αναπτύσσεται, επομένως είναι σημαντικό να γνωρίζουμε τα τρέχοντα όριά της.
Με ποια τιμή Roblox ευθυγραμμίζεται περισσότερο η ομάδα σας;
Ο σεβασμός στην κοινότητα είναι η καθοδηγητική μας αξία σε όλη αυτή τη διαδικασία. Πρώτον, πρέπει να επικεντρωθούμε στη βελτίωση της ευγένειας και στη μείωση των παραβιάσεων πολιτικής στην πλατφόρμα μας. Αυτό έχει σημαντικό αντίκτυπο στη συνολική εμπειρία χρήστη. Δεύτερον, πρέπει να εξετάσουμε προσεκτικά πώς θα αναπτύξουμε αυτές τις νέες δυνατότητες. Πρέπει να προσέχουμε τα ψευδώς θετικά στοιχεία (π.χ. εσφαλμένη επισήμανση κάτι ως κατάχρηση) στο μοντέλο και να αποφεύγουμε την εσφαλμένη τιμωρία των χρηστών. Η παρακολούθηση της απόδοσης των μοντέλων μας και ο αντίκτυπός τους στην αφοσίωση των χρηστών είναι ζωτικής σημασίας.
Τι σας ενθουσιάζει περισσότερο για το πού κατευθύνεται η Roblox και η ομάδα σας;
Έχουμε σημειώσει σημαντική πρόοδο στη βελτίωση της δημόσιας φωνητικής επικοινωνίας, αλλά απομένουν ακόμη πολλά να γίνουν. Η ιδιωτική επικοινωνία είναι μια συναρπαστική περιοχή για εξερεύνηση. Πιστεύω ότι υπάρχει μια τεράστια ευκαιρία να βελτιωθεί η ιδιωτική επικοινωνία, να επιτραπεί στους χρήστες να εκφραστούν σε στενούς φίλους, να έχουν μια φωνητική κλήση που μεταφέρεται σε εμπειρίες ή κατά τη διάρκεια μιας εμπειρίας ενώ αλληλεπιδρούν με τους φίλους τους. Πιστεύω ότι υπάρχει επίσης μια ευκαιρία να προωθηθούν αυτές οι κοινότητες με καλύτερα εργαλεία που θα επιτρέψουν στους χρήστες να αυτοοργανώνονται, να συμμετέχουν σε κοινότητες, να μοιράζονται περιεχόμενο και να μοιράζονται ιδέες.
Καθώς συνεχίζουμε να μεγαλώνουμε, πώς επεκτείνουμε την τεχνολογία συνομιλίας μας για να υποστηρίξουμε αυτές τις αναπτυσσόμενες κοινότητες; Απλώς ξύνουμε την επιφάνεια σε πολλά από αυτά που μπορούμε να κάνουμε και νομίζω ότι υπάρχει μια ευκαιρία να βελτιώσουμε την ευγένεια της διαδικτυακής επικοινωνίας και της συνεργασίας σε ολόκληρο τον κλάδο με τρόπο που δεν είχε γίνει πριν. Με τη σωστή τεχνολογία και δυνατότητες ML, βρισκόμαστε σε μοναδική θέση να διαμορφώσουμε το μέλλον της πολιτικής διαδικτυακής επικοινωνίας.