Τρίτη 7 Ιουνίου 2016

Deep Text: Η Τεχνολογία επιτήρησης και αναγνώρισης της κάθε λέξης που γράφετε

Οι εταιρείες στυλ Microsoft, Facebook, έχουν πάθει ένα κάτι τις με την Τεχνητή Νοημοσύνη. Πριν ένα δίμηνο περίπου είδαμε το chatbot τεχνητής νοημοσύνης της Microsoft, την Tay, ένα αυτοματοποιημένο πρόγραμμα συνομιλίας που στόχο της είχε να προσελκύσει νεαρά άτομα σε κουβεντούλα....
Έρχεται λοιπόν τώρα και το Facebook, που με ανακοίνωσή του την Τετάρτη (1 Ιουνίου 2016) μας κάνει γνωστό ότι ανέπτυξε ειδικό λογισμικό τεχνητής νοημοσύνης που θα χρησιμοποιεί για να...
καταλαβαίνει καλύτερα τα θέματα τα οποία συζητούμε οι χρήστες μεταξύ μας (για το καλό μας βρε κουτά). Ο λόγος για το Deep Text, ένα σύνολο τεχνολογιών αναγνώρισης και κατανόησης κειμένου και λόγου σε πάνω από 20 γλώσσες. Το σύστημα έχει βασιστεί σε ερευνητικές εργασίες των Ρόναν Κόλομπερτ (Ronan Collobert) και Γιαν ΛεΚουν (Yann LeCun) του Facebook AI Research (Facebook's Artificial Intelligence Lab ή αλλιώς FAIR· της ομάδας, δηλαδή, του Facebook που ασχολείται με την Τεχνητή Νοημοσύνη).

Το Deep Text λοιπόν είναι μια νέα μηχανή, τεχνητής νοημοσύνης, επεξεργασίας γλώσσας η οποία εφαρμόζει μια τεχνική της επιστήμης των υπολογιστών που ονομάζεται deep learning (μάθηση εις βάθος).

Η τεχνική deep learning έρχεται για να δώσει την λύση στο παλαιότερο πρόβλημα των υπολογιστών που δεν είναι άλλο από την κατανόηση της ανθρώπινης ομιλίας. Γιατί καλά μεν τα κομπιούτερς, μα να καταλάβουν τι θέλει να πει ο ποιητής, ο άνθρωπος δηλαδή, κομματάκι δύσκολο.
Στην ανακοίνωσή τους λοιπόν εξηγούν ότι:
The community on Facebook is truly global, so it's important for DeepText to understand as many languages as possible. Traditional NLP techniques require extensive preprocessing logic built on intricate engineering and language knowledge. There are also variations within each language, as people use slang and different spellings to communicate the same idea. Using deep learning, we can reduce the reliance on language-dependent knowledge, as the system can learn from text with no or little preprocessing. This helps us span multiple languages quickly, with minimal engineering effort.
δηλαδή:
Η κοινότητα του Facebook είναι παγκόσμια, γι' αυτό είναι σημαντικό το DeepText να καταλαβαίνει όσο το δυνατόν περισσότερες γλώσσες. Οι παραδοσιακές τεχνικές NLP (Neuro-Linguistic Programming, προγραμματισμού νευρωγλωσσίας) απαιτούν εκτεταμένη λογική προ-επεξεργασία χτισμένη σε περίπλοκη μηχανική και σε γνώση της γλώσσας. Συν των άλλων, υπάρχουν και παραλλαγές μέσα σε κάθε γλώσσα, καθώς οι άνθρωποι χρησιμοποιούν αργκό και διαφορετική ορθογραφία για να γνωστοποιήσουν την ίδια έννοια. Χρησιμοποιώντας την deep learning (ελληνιστί, μάθηση εις βάθος), μπορούμε να μειώσουμε την εξάρτηση από γνώση η οποία εξαρτάται από την γλώσσα, καθώς το σύστημα μπορεί να μαθαίνει από το κείμενο με ελάχιστη ή καθόλου προ-επεξεργασία. Αυτό μας βοηθά να επικεντρωνόμαστε σε πολλές γλώσσες γρήγορα, με ελάχιστη μηχανική προσπάθεια.
Με αυτόν τον στόχο, να κατανοήσουν καλύτερα τα θέματα που συζητάμε ντε (τα ίδια θα λέμε; αυτός γαρ ο καημός τους), βαδίζουν πρόσω ολοταχώς:
With this goal in mind, we built DeepText, a deep learning-based text understanding engine that can understand with near-human accuracy the textual content of several thousands posts per second, spanning more than 20 languages.
ούτως ειπείν:
Με αυτόν τον στόχο κατά νου, φτιάξαμε το DeepText, μία μηχανή κατανόησης κειμένου εις βάθος, που μπορεί να καταλάβει με σχεδόν ανθρώπινη ακρίβεια το περιεχόμενο αρκετών χιλιάδων posts (δημοσιευμάτων) ανά δευτερόλεπτο, που εκτείνονται σε περισσότερες από 20 γλώσσες.
Θα καταλαβαίνουν πολλά αυτά τα καλόπαιδα του Facebook και θα μας βοηθούν. Ναι σας λέω, δεν με πιστεύετε; Ιδού:
We're also beginning to use high-accuracy, multi-language DeepText models to help people find the right tools for their purpose. For example, someone could write a post that says, “I would like to sell my old bike for $200, anyone interested?” DeepText would be able to detect that the post is about selling something, extract the meaningful information such as the object being sold and its price, and prompt the seller to use existing tools that make these transactions easier through Facebook.
ελληνιστί:
Αρχίζουμε να χρησιμοποιούμε και υψηλής ακρίβειας μοντέλα DeepText πολλαπλών γλωσσών για να βοηθήσουμε τους ανθρώπους να βρουν τα σωστά εργαλεία για αυτό που θέλουν και σκοπεύουν να κάνουν. Για παράδειγμα, κάποιος θα μπορούσε να γράψει ένα μήνυμα που λέει, «θα ήθελα να πουλήσω το παλιό μου ποδήλατο για 200 δολάρια· ενδιαφέρεται κανείς;». Το DeepText θα μπορεί να ανιχνεύσει ότι το εν λόγω ποστ (η ανάρτηση) έχει να κάνει με κάποια πώληση, να εξάγει τις πληροφορίες που έχουν ουσία - όπως το αντικείμενο που είναι προς πώλησιν και την τιμή του - και να παροτρύνει τον πωλητή να χρησιμοποιήσει τα υφιστάμενα εργαλεία για τέτοιου είδους συναλλαγές μέσω του Facebook ώστε να διευκολυνθεί ο χρήστης.

Το DeepText μπορεί ακόμα και να αποφασίζει ποιο σχόλιο είναι σημαντικό, ποιο είναι άνευ σημασίας (και να το αποκρύπτει). Και όλα αυτά για... μια καλύτερη ποιότητα βρε αδερφέ. Γιατί το Facebook ενδιαφέρεται ΚΑΙ για αυτό· και θέλει να υπάρχει μια καλύτερη ποιότητα στα σχόλια (όποιος δεν με πιστεύει, να σηκώσει το χέρι του). Μέχρι και τις διασημότητες θα προστατεύει (ναι σας λέω), και τους πολιτικούς:

Το Facebook λοιπόν, για χάριν της ποιότητας πάντα, πρέπει να καταλαβαίνει τους σκοπούς μας, τι θέλουμε να πούμε ακόμα και με τις εικόνες που ανεβάζουμε, τα συναισθήματά μας, τα πάντα λέμε, όλα:
DeepText has the potential to further improve Facebook experiences by understanding posts better to extract intent, sentiment, and entities (e.g., people, places, events), using mixed content signals like text and images, and automating the removal of objectionable content like spam. Many celebrities and public figures use Facebook to start conversations with the public. These conversations often draw hundreds or even thousands of comments. Finding the most relevant comments in multiple languages while maintaining comment quality is currently a challenge. One additional challenge that DeepText may be able to address is surfacing the most relevant or high-quality comments.
δηλαδή:
Το DeepText έχει την δυνατότητα να βελτιώσει περαιτέρω τις εμπειρίες σας στο Facebook. Πώς θα γίνει αυτό; Με το να κατανοούμε τις προθέσεις των μηνυμάτων και των posts σας (των δημοσιευμάτων σας) για να βγάζουμε συμπεράσματα για τις προθέσεις, τα συναισθήματα, και τις οντότητες (για παράδειγμα, να βγάζουμε συμπεράσματα για τους ανθρώπους, για τα μέρη, για τις εκδηλώσεις και τα γεγονότα), χρησιμοποιώντας μεικτά σήματα περιεχομένου, όπως κείμενο και εικόνες, καθώς και την αυτοματοποίηση της απομάκρυνσης του ανάρμοστου περιεχομένου όπως το spam. Πολλές διασημότητες και δημόσια πρόσωπα χρησιμοποιούν το Facebook για να ξεκινήσουν συζητήσεις με το κοινό. Αυτές οι συνομιλίες συχνά επιφέρουν εκατοντάδες ή ακόμα και χιλιάδες σχόλια. Η πρόκληση είναι να βρίσκουμε τα πιο σχετικά σχόλια σε πολλές γλώσσες, διατηρώντας παράλληλα την ποιότητα στα σχόλια. Μια επιπλέον πρόκληση για το DeepText είναι να μπορεί να αναδεικνύει τα πιο σχετικά ή τα πιο υψηλής ποιότητας σχόλια.

 Δείτε και δύο μικρά βίντεο όπου εξηγείται η τεχνολογία του Deep Text:
 Μπορείτε να τα δείτε:
- είτε με αγγλικούς υπότιτλους, πηγαίνοντας:
Ρυθμίσεις - το δεύτερο εικονίδιο κάτω δεξιά - > Υπότιτλοι > Αγγλικά
- είτε με Μετάφραση υποτίτλων, πηγαίνοντας:
Ρυθμίσεις > Υπότιτλοι > Αγγλικά > Μετάφραση υπότιτλων > Ελληνικά. (θα πρέπει πρώτα να κλικάρετε το «Αγγλικά» - ή οποιαδήποτε άλλη γλώσσα - για να ενεργοποιηθεί η επιλογή Μετάφραση).





Πηγή

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου