Джу Енг Лі, Університет Іннополіс - про репутацію користувачів, вимірі довіри і безпеки даних в соцмережах

Джу Енг Лі - глава Лабораторії мережевих наук та інформаційних технологій Університету Іннополіс, доцент.

Отримала ступінь PhD в Університеті Сиракьюз(США). Має досвід роботи в університетському середовищі і індустрії (JPMorgan, Sun Microsystems). Професор Лі розробляє алгоритми визначення активності та репутації користувачів соціальних мереж. Її дослідження фокусується на репутації розподілених обчислень і оцінки ступеня вузлів в соціальній мережі.

Репутація: віртуальна і реальна

Репутація - це сприйняття користувача іншими людьми. У реальному житті це відбувається повсюдно. Підозрюєте ви про це чи ні, але при першій зустрічі з людиною у вас є певні очікування або передчуття щодо нього. Потім в процесі розмови або взаємодії ви оновлюєте це своє уявлення. Всі ці фактори входять в репутацію.

Репутація - не тільки про людей, а також про компанії, урядові організації та будь-які структури, з якими ми співпрацюємо. Я нечасто користуюся соцмережами і знаю тільки саміпопулярні: Facebook і Instagram. У них люди спілкуються за допомогою коментарів і фотографій. Концепція репутації на цих популярних майданчиках не так широко застосовується, оскільки в основному взаємодії там - міжособистісні. У Facebook ми не відкриваємо внесок в банку, не здійснюємо угоди і не розпоряджаємося фінансами. У широкому сенсі нам не потрібно багато довіри для комунікації на цих платформах, оскільки якщо наш співрозмовник виявиться поганим людиною, ми не багато втратимо.

В основному репутаційна система використовується на комерційних майданчиках, таких як Amazon і eBay в США або Ozon і Яндекс.Маркет в Росії. Тут необхідна довіра між продавцем іпокупцем. Якщо ви платите гроші, а товар не відправляють - ви втрачаєте щось. Тому репутація та довіра важливі з економічних міркувань. Зазвичай на цих платформах використовують централізовану систему репутації, з якої ви напевно знайомі. Наприклад, у Amazon є п'ятизірковий рейтингова система, де можна написати продавцеві після отримання товару і поставити оцінку. Це одна з найпоширеніших репутаційних систем. Вона централізована, оскільки бере на себе управління алгоритмом. Якщо ви поставили три зірки, а потім хтось інший - чотири або п'ять, то система автоматично усереднити ці значення і покаже результат іншим користувачам. Такий тип оцінки дуже ефективний для комерційних майданчиків.

Є також децентралізовані або розподілені системи репутації. Вони застосовуються там, де немає центральногоавторитету, наприклад, в тимчасових (peer-to-peer) системах обміну файлами. Тут немає інстанції, яка розповість вам про репутацію іншого користувача. Але у кожного є власне уявлення про ту чи іншу людину. Можливо, я взаємодіяла з користувачем, який не відправив мені файл або у нього дуже повільний зв'язок. А інший міг мати з ним дуже приємний досвід взаємодії. Так що у нас різні уявлення про цю людину і його репутація не є середнім арифметичних наших думок.

Я намагаюся з'ясувати, які алгоритми використовуються в популярних мережах. Наприклад, Stack Overflow або Quora (популярнісистеми питань і відповідей - «Хайтек»). На них ви задаєте питання, і потім люди на нього відповідають. Якщо відповідь стає більш популярним, автор збільшує репутацію. Це загальна схема, але кожна платформа використовує різні алгоритми. Зазвичай їх схема заснована на зворотному зв'язку між взаємодіями користувачів: якщо взаємодія пройшло вдало, репутація росте, в зворотному випадку знижується.

Нещодавно ми розробили алгоритм, який абсолютно не залежить від цього типу зворотного зв'язку. Єдине, що ми використовуємо, - час ічастота взаємодії. Те, як часто ми взаємодіємо, дійсно впливає на репутацію. Не важливо, гарне це спілкування чи ні, головне - його число і частота. Ми порівняли нашу розробку зі стандартним алгоритмом Stack Overflow на одному наборі даних. З'ясувалося, що їх результати дуже схожі. Це означає, що без знання про сприйняття користувача іншими учасниками можна досить точно визначити його репутацію.

ІІ, фейковий акаунти і агітація

Останнім часом соцмережі стали важливі через величезну числа зареєстрованих користувачів. Тепер у політичних партій і комерційнихорганізацій з'явився новий канал впливу на всіх цих людей. Раніше, якщо будь-яка компанія хотіла просувати товар, - вона використовувала рекламні ролики по ТБ або банери на узбіччі дороги. Але з тих пір, як соціальні мережі стали популярні, все усвідомили, що реклама в них набагато ефективніше. Вибудовувати маркетинг всередині соцмережі дешевше, а інформація поширюється набагато швидше. Тепер досить створити невелику новина замість покупки дорогого ролика на ТВ.

Основну роль в популяризації соціальних платформ зіграло молоде покоління. Коли я була молодшою, ненавиділа читати газети ііншу пресу. У соцмережах все інакше. Якщо хтось скаже, що відбувається щось цікаве, - слух пошириться дуже швидко. Тому соцмережі і замінили традиційні газети і журнали.

Зараз ІІ може створити фейковий аккаунт і вести власну активність. З тих пір, як соціальні майданчики стали важливимінформаційним медіумом, їх використовують для впливу на людей в політичних цілях. Партії з їх допомогою намагаються переманити людей на свою сторону. Для цього вони транслюють вибіркову частину інформації, яка вигідна для них. Це реалізується за допомогою ІІ і алгоритмів навчання. Тут важливо вибрати відповідну групу людей. Якщо ви хочете, щоб за вас проголосували, потрібно вибрати правильну людину. Їм не повинен бути ваш затятий противник або прихильник. Це може дати зворотний ефект. Необхідно вибрати людей «на пограниччі», які можуть поміняти свою думку. І, звичайно, таких людей легко визначити на основі їх інтересів і взаємодій в соцмережах.

Стеження в соцмережах, Корея і вразливість особистих даних

На великих медіа та соціальних платформах неможливо уникнути витоку інформації. Оскільки, по-перше, ви її туди ставите. По-друге, навіть якщо великі компанії на кшталт Facebook стверджують, що не поділяться вашою інформацією, їх довге і заплутане угоду користувача, яке насправді ніхто не читає, дозволить цьому статися.

Головна проблема в скандалі з Cambridge Analytica в тому, що аналітична компанія отримала доступ до френдстрічку і даними всіх друзів. Вони розробили додаток, яке визначалополітичні погляди користувачів. Facebook повинен був надати інформацію тільки про тих людей, які ним скористалися. Хоча навіть якби витік не відбулася, є безліч алгоритмів, які дозволили б зробити висновок про всю мережі, грунтуючись на даних про її частини.

Передача інформації третім особам не є чимось новим або рідкісним. Facebook - це компанія, а не НКО, і їй потрібноотримувати прибуток. Для цього доводиться ділитися частиною інформації з іншими компаніями. Як саме вона це робить, скільки і яку інформацію віддає, ніхто не знає. Так що користувач повинен усвідомлювати цю небезпеку з самого початку. Все, що пов'язано з соціальними платформами, з'явилося недавно. Тому уряд не знає, як реагувати на подібні скандали. Відповідну політику ще належить виробити. Зараз єдиний, хто може захистити ваші дані, - це ви самі. Я не хочу сказати, що не варто користуватися соцмережами. Вони дуже зручні і дозволяють знайти нових друзів. Але повністю заборонити передачу інформації третім особам не вийде - це буде відбуватися постійно. Тому нам необхідний правильний підхід до такого виду ситуацій - нема на індивідуальному, а на урядовому рівні.

У Кореї є дуже популярний месенджер KakaoTalk. Багато хто думав, що держава переглядаєісторію листування в ньому, щоб дізнатися, як люди ставляться до діючого уряду. У той час деякі з моїх друзів відмовилися використовувати певні слова. Вони спотворювали імена і слова, щоб уникнути спостереження. Думаю, у багатьох країнах уряд дійсно робить це. Звичайно, не визнаючи публічно, оскільки це незаконно. Однак чи може уряд ефективно використовувати цю інформацію? Якщо ви звинувачуєте когось на підставі фотографії з особистого чату, то повинні визнати, що незаконно спостерігали за цією людиною. Ми ніколи не знаємо, що насправді відбувається у внутрішньоурядових структурах. На індивідуальному рівні немає способу змінити ситуацію.

Маючи в своєму розпорядженні достатню кількість інформації можна дізнатися про людину все, якщо це буде потрібно. Той же випадок з Cambridge Analytica: вони лише розробили додаток - невеликий психологічний тест, який робить висновок про особу на підставі кількох питань. Це дозволило їм визначити політичні дані респондентів і використовувати це в передвиборній гонці. Знаючи, де ви живете, в який університет ходили, можна визначити весь ваш культурний бекграунд. Навіть володіючи невеликою кількістю інформації: з ким ви розмовляєте, хто дружить з вашими друзями, - можна зробити висновок про настільки багато речей. Ось чому інформація користувачів в соцмережах стала критично важливою.