Site icon Pingvin.Pro

Google створює найпотужнішого синтаксичного аналізатора мови з відкритим вихідним кодом

Google

Дні спілкування з нашими комп’ютерами, використовуючи пальці, наближаються до кінця. У четвер, Google оголосив  про запуск структури нейронної мережі синтаксичного аналізу мови під назвою SyntaxNet, як системи з відкритим вихідним кодом. Випущений код включає в себе все необхідне, щоб навчити його під власний набір даних, хоча Google також випускає версію з англійською мовою: Parsey McParseface.




Ці програми, як і інші аналізатори мови, складають основу систем обробки природної мови (ОПМ). Такі системи дозволяють додаткам, як Google Now і Siri, зрозуміти слова, які ви говорити або друкуєте, маркувати кожне слово, а потім розпізнати значення зі сказаного чи надрукованого. Проблема полягає в тому, що речення стають все більш складними і довшими, через це їх важче розшифрувати. Речення складається з усього 20 слів, але воно може мати сотні різних інтерпретацій синтаксису. Як не дивно, Parsey McParseyface оцінюється як найбільш точною моделлю синтаксичного аналізу, котрі наявні в даний час, з точністю розуміння близько 95 відсотків.