«Я спрашивал друга про товар, смартфону было слышно, а теперь у меня и у друга в браузере реклама этого товара!». По Фейсбуку гуляет тема злокозненности Фейсбука же
Возможна ли схема с подслушиванием?
Технически — да, распознавание речи в реальном времени вполне работает. Это может подтвердить каждый кто общался по телефону с «автоматической барышней» из банковской поддержки, там часто работает как раз система определяющие ключевые слова — «лимит на карточке», «заблокировать», «кредит». Вроде бы — отчего же не прикрутить такую же штуку к смартфону и получить от него поток ключевых слов для рекламы.
Дело в том что хоть это и возможно, но реализация на практике будет весьма непроста. Основной вопрос — где будет обрабатываться звук?
Если это происходит на сервере:
- Это чудовищное нарушение тайны личной жизни (потому что слушается все, без разбору), и если это подтверждается, компании пойдут по миру от судебных исков.
- Это огромный расход мобильного трафика, легко определяемый еще и потому что это трафик исходящий. Так что это легко бы устанавливалось по профилю потребления данных.
- Про всякие мелочи вроде забитых трафиком сотовых станций и чудовищного обьема обработки инфы на серверах я даже и не говорю.
Если это происходит на самом устройстве:
- С точки зрения тайны личной жизни вроде полегче, устройство не сливает ваши разговоры, а только вычленяет из них ключевые слова для рекламы. И это означает что оно непрерывно пишет и распознает звуковую дорожку весьма сомнительного качества. У вас где лежит мобильник? В кармане штанов? Ну вот сделайте эксперимент, поставьте его на запись, спрячьте в карман и поговорите, скажем, с женой или собакой. Результат записи будет весьма труднопонимаем из-за кучи артефактов.
- И вот такую грязную запись нужно в прямом эфире распознавать. Кто работал со всякими программами звукообработки тот знает что они как бы так помягше — требуют для работы весьма впечатляющей компьютерной мощности. Значит, смартфон, обрабатывающий вашу речь 24/7 будет дико жрать батарею, греться и зависать. Вот сейчас он живет часов 20 без зарядки, да? А в режиме распознавания будет четыре-пять.
Дополнительный момент — нужно понимать что за всю эту музыку кто-то должен будет заплатить живыми деньгами. И похоже что вся овчинка не стоит выделки — рекламодатели сейчас платят за приведенные клики так дешево, что вот эти все сложности с распознаванием разговоров — неокупаемы. Вот здесь очень хороший фб-пост на эту тему.
И самое главное — это еще и просто никому не нужно. ФБ с Гуглом и так знают о нас чудовищно много — по каким магазинам вы ходите, с кем живете, чем интересуетесь. Отсюда настолько высокая точность таргетирования, когда поговорил и тут же увидел рекламу.
Магия вроде «да я же не гуглил, только разговаривал об этом» обьясняется зачастую очень просто. Ну ты не гуглил, ладно. А можешь ли ты быть уверен что человек, с которым ты говорил — не гуглил? Не гуглила твоя жена или ребенок, сидя за компом в той же wi-fi-сети… А ведь у Гугла есть данные о том что вы связаны.
Ну а дальше все работает на самом обычном confirmation bias — когда до того как ты заинтересовался покупкой бойлера его в рекламе «не было», а когда заинтересовался — он внезапно «появился и уже везде».