Подслушивают ли нас смартфоны?

“Я спрашивал друга про товар, смартфону было слышно, а теперь у меня и у друга в браузере реклама этого товара!”. По Фейсбуку гуляет тема злокозненности Фейсбука же

Возможна ли схема с подслушиванием?

Технически – да, распознавание речи в реальном времени вполне работает. Это может подтвердить каждый кто общался по телефону с “автоматической барышней” из банковской поддержки, там часто работает как раз система определяющие ключевые слова – “лимит на карточке”, “заблокировать”, “кредит”. Вроде бы – отчего же не прикрутить такую же штуку к смартфону и получить от него поток ключевых слов для рекламы.

Дело в том что хоть это и возможно, но реализация на практике будет весьма непроста. Основной вопрос – где будет обрабатываться звук?

Если это происходит на сервере:

  • Это чудовищное нарушение тайны личной жизни (потому что слушается все, без разбору), и если это подтверждается, компании пойдут по миру от судебных исков.
  • Это огромный расход мобильного трафика, легко определяемый еще и потому что это трафик исходящий. Так что это легко бы устанавливалось по профилю потребления данных.
  • Про всякие мелочи вроде забитых трафиком сотовых станций и чудовищного обьема обработки инфы на серверах я даже и не говорю.

Если это происходит на самом устройстве:

  • С точки зрения тайны личной жизни вроде полегче, устройство не сливает ваши разговоры, а только вычленяет из них ключевые слова для рекламы. И это означает что оно непрерывно пишет и распознает звуковую дорожку весьма сомнительного качества. У вас где лежит мобильник? В кармане штанов? Ну вот сделайте эксперимент, поставьте его на запись, спрячьте в карман и поговорите, скажем, с женой или собакой. Результат записи будет весьма труднопонимаем из-за кучи артефактов.
  • И вот такую грязную запись нужно в прямом эфире распознавать. Кто работал со всякими программами звукообработки тот знает что они как бы так помягше – требуют для работы весьма впечатляющей компьютерной мощности. Значит, смартфон, обрабатывающий вашу речь 24/7 будет дико жрать батарею, греться и зависать. Вот сейчас он живет часов 20 без зарядки, да? А в режиме распознавания будет четыре-пять.

Дополнительный момент – нужно понимать что за всю эту музыку кто-то должен будет заплатить живыми деньгами. И похоже что вся овчинка не стоит выделки – рекламодатели сейчас платят за приведенные клики так дешево, что вот эти все сложности с распознаванием разговоров – неокупаемы. Вот здесь очень хороший фб-пост на эту тему.

И самое главное – это еще и просто никому не нужно. ФБ с Гуглом и так знают о нас чудовищно много – по каким магазинам вы ходите, с кем живете, чем интересуетесь. Отсюда настолько высокая точность таргетирования, когда поговорил и тут же увидел рекламу.

Магия вроде “да я же не гуглил, только разговаривал об этом”  обьясняется зачастую очень просто. Ну ты не гуглил, ладно. А можешь ли ты быть уверен что человек, с которым ты говорил – не гуглил? Не гуглила твоя жена или ребенок, сидя за компом в той же wi-fi-сети… А ведь у Гугла есть данные о том что вы связаны.

Ну а дальше все работает на самом обычном confirmation bias – когда до того как ты заинтересовался покупкой бойлера его в рекламе “не было”, а когда заинтересовался – он внезапно “появился и уже везде”.