pups_alik: (Пупс Алик)
[personal profile] pups_alik
13.03.2017 / 11:53

В мире программного обеспечения для распознавания речи показатель ошибок 5,1% является главной целью для достижения. Компании, которые разрабатывают программное обеспечение с данным коэффициентом ошибок, по сути, создают ИИ, соответствующий возможностям людей, которые пропускают примерно 5% слов в обычном разговоре. Но недавно компания IBM объявила о том, что она сделала прорыв в этой точке, достигнув показателя 5,5%. Это сигнализирует о большой победе в искусственном интеллекте, который может в конечном итоге хорошо функционировать в смартфонах и голосовых помощниках, как Siri, Alexa и Google Assistant, - сообщает Robotics.ua.


IBM Watson, ibm, коммуникация с роботом, США, распознавание речи - Искусственный интеллект и экспертные системы - Robotics

ИИ приближается к уровню человека

«Способность распознавать речь, а также людей – это наша постоянная проблема, поскольку человеческая речь, особенно во время спонтанного разговора, чрезвычайно сложная», - заявила Джулия Хиршберг, профессор информатики в Колумбийском университете.

На протяжении последнего года IBM работала над тем, чтобы побить свой прежний рекорд в 6,9%. Чтобы снизить частоту ошибок почти на 1,5 процента, компания настраивала аспекты акустики, которые подбирают различные формы речи.

Хотя эксперты, наряду с Хиршбергом, утверждают, что машины все еще не могут подбирать определенные нюансы речи, такие как тон и метафора, программное обеспечение значительно продвинулось в области механической транскрипции. В последнем тесте программному обеспечению приходилось различать то, о чем люди говорили в повседневных темах разговоров, к примеру, о покупке автомобиля, разбавляя свою речь заиканиями, словами-паразитами и бормотанием.

IBM говорит, что 5,5% ошибок, допущенных ИИ – это большой прогресс. «Другие в отрасли преследуют этот рубеж вместе с нами. Некоторым удалось достичь 5,9 процентов, приблизившись к человеческому показателю, - пишет исследователь IBM Джордж Саон.

Согласно robotics.ua, в 2016 году исследователи из Microsoft объявили о том, что они создали компьютер, который мог бы выиграть у людей в понимании разговора. В данном программном обеспечении частота ошибок составила 6,3%, что значительно выше нового показателя IBM. Но, учитывая, что компания ставила перед собой цель в 5,1%, Саон сказал, что «рано пока пить шампанское».
Согласно robotics.ua, в 2016 году исследователи из Microsoft объявили о том, что они создали компьютер, который мог бы выиграть у людей в понимании разговора. В данном программном обеспечении частота ошибок составила 6,3%, что значительно выше нового показателя IBM. Но, учитывая, что компания ставила перед собой цель в 5,1%, Саон сказал, что «рано пока пить шампанское».

Ольга Славинская

Date: 2017-03-19 09:18 pm (UTC)
From: [identity profile] twilighshade.livejournal.com
Распознавание речи это наверное один из самых сложных, тут и определение акцента, от которого зависит качество распознавания и учёт "фефектов фикции", что в комплексе требует настоящего обучаемого ИИ.

Profile

pups_alik: (Default)
pups_alik

April 2017

S M T W T F S
       1
2 3 4 5678
9101112131415
16171819202122
23242526272829
30      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 2nd, 2025 03:13 am
Powered by Dreamwidth Studios