Tak odlišná AI: deepfakes, NLP a kybernetická bezpečnost

Už jsme si zvykli na slovní spojení „umělá inteligence“, na to, co nabízí chytrý telefon nebo televize

filmy nebo hudbu, kterou máme rádi, achladnička nebo chytrý reproduktor Alexa vám připomenou, že potřebujete koupit mléko nebo že právě začíná stejný zápas, o kterém jste nedávno diskutovali s přáteli.

Ale to neznamená, že schopnosti technologievyčerpán nebo omezen pouze prostým každodenním životem. Pandemie způsobila nový skok ve vývoji AI a algoritmů strojového učení (ML), také kvůli dramaticky změněným ekonomickým podmínkám a zvykům lidí. Spotřeba médií raketově vzrostla, pomáhá sociální izolace. To vše si vyžádalo více personalizované interakce se zákazníky, médii a zábavou (M&E). Například Netflix s pomocí algoritmů AI dokázal nejen udržet kvalitu streamování, ale také ji výrazně zlepšit: platforma předpovídá budoucí potřeby diváků a umísťuje zdroje na strategicky důležitá místa serveru. Díky předběžnému umístění video prostředků blíže k odběratelům mohou uživatelé streamovat vysoce kvalitní video i ve špičce. Možnosti umělé inteligence jsou ale samozřejmě mnohem širší a nemají prakticky žádné hranice: od pokročilých kvantových výpočetních systémů a lékařské diagnostiky až po spotřební elektroniku a chytré osobní asistenty. Pokud máte pochybnosti, zeptejte se Alice nebo Siri.

Odborníci se domnívají, že 80 % technologií, kterébude vyvíjen v následujících letech, bude založen na algoritmech AI a ML. Počet a rozmanitost aplikací umělé inteligence neustále roste a výzkumníci a vědci neustále nacházejí nové způsoby, jak je využít. Podle výzkumu má dnes 77 % zařízení, která v životě používáme, zabudovanou umělou inteligenci.

AI se šíří rychlým tempemjak na úrovni čipů, tak na úrovni softwaru. Oba směry navíc úzce souvisejí. Výrobci jako NVIDIA, Intel a Qualcomm aktivně zdokonalují hardware, což činí systémy AI rychlejšími a složitějšími. To vede k větší demokratizaci AI. Stále více vývojářů softwaru a zaměstnanců podnikových IT může při práci s daty používat algoritmy umělé inteligence. To si již všimlo mnoho poskytovatelů cloudových služeb: AWS, Azure, Google, Oracle a IBM. Vkládají a rozšiřují své nabídky AI pro veřejná a hybridní cloudová nasazení. To v konečném důsledku znamená větší dostupnost výpočetního výkonu, rámců a algoritmů potřebných k aplikaci AI na vše od inteligentních reproduktorů přes mobilní zařízení až po podnikový prodej a plánovací software.

Jak AI pracuje s texty a proč pomáhá starším lidem

Generativní modely založené nakonverzační AI, v době pandemie, jsou stále více žádané než kdy jindy. Důvod je prostý - život a práce na dálku způsobily, že lidé při používání digitálních zdrojů požadovali personalizaci. Až donedávna mohl takový zážitek vytvořit jen člověk. Nyní byl nahrazen chatboty a technologií zpracování přirozeného jazyka (NLP).

Nedávná zpráva z výzkumu a trhů ukázalže se očekává růst globálního konverzního trhu s umělou inteligencí ze 4,8 miliard USD v roce 2020 na 13,9 miliard USD v roce 2025.

Technologie NLP vám umožňuje napodobovat člověkamluvit. A chatboti pracující na jejím základě jsou dnes jedním z nejoblíbenějších způsobů personalizace a optimalizace nákladů: jejich implementace umožňuje mnoha podnikům snížit náklady až o 90 %. Ale největší hodnotou konverzační umělé inteligence je to, že umožňuje personalizovanou komunikaci. Může být vyškolen tak, aby byl vícejazyčný, nebo dokonce poskytoval empatickou podporu uživateli. Inteligentní chatboti mohou například pomoci starším lidem vyrovnat se s osamělostí. Osmar Zayane, odborník na umělou inteligenci z University of Alberta, například vedl projekt, jehož cílem bylo vyvinout chatbota, který by mohl simulovat dynamickou konverzaci a poskytovat sociální uspokojení starším dospělým, kteří zažívají osamělost.

Jedním z nejúčinnějších jazykových modelů jeTransformátor. Google s touto metodou generování textu aktivně experimentuje. Začátkem letošního roku společnost oznámila, že je schopna trénovat model obsahující 1,6 bilionu parametrů. V dubnu 2021 překonal rekord Google výzkumná skupina čínské společnosti Huawei, která oznámila vytvoření čínského ekvivalentu GPT-3: model 750 GB s názvem PanGu-Alpha obsahuje až 200 miliard parametrů - 25 o milion více než GPT-3. a byl vyškolen v oblasti 1,1 TB elektronických knih, encyklopedií, zpráv, sociálních médií a webových stránek.

Metoda "zřídka aktivovaná" použitá vjeho modely Google a Huawei kombinuje několik modelů v globálnějším a umožňuje vám také vybudovat zábleskovou síť, která rozhoduje o tom, který model se v každém případě použije.

V průběhu experimentu se vědci zeptalitrénované modely úkol předpovídat slova v pasážích. Zároveň v textu chybělo asi 15% slov. Google však nepopírá, že použití AI pro generování textu stále není plně přizpůsobeno reálnému světu. Nejprve kvůli přítomnosti předsudků a různých typů xenofobie, které způsobují stereotypní myšlení v umělé inteligenci. Například model AI může umístit adjektivum „nezbedný“ vedle slova „žena“ nebo říct pacientovi, aby se zabil, jak tomu bylo během experimentu francouzské společnosti Nabla.

Model GPT-3, který byl představen v loňském roce, úspěšně prošelvyrovnala se s tím, co bylo dříve považováno za výlučně lidský fond práce - napsala článek pro The Guardian, ve kterém vysvětlila, proč AI neohrožuje lidstvo, a také se naučila překládat texty, odpovídat na otázky, psát poezii a prózu.

Sber použil podobnou metodiku výukyjazykový model pro vašeho asistenta. Model byl proškolen v ruské literatuře a doplnil své znalosti datovou sadou s dialogy. Kromě toho má Joeyův asistent zabudovaný mechanismus hodnocení, který mu umožňuje vybrat nejzajímavější odpovědi. Joy navíc nevybírá předem připravené repliky, staví fráze v reálném čase. Komunikace s ním tedy vypadá jako komunikace s člověkem.

Kde se již aktivně používají algoritmy umělé inteligence

  • kino a televize;
  • personalizace uživatelské zkušenosti;
  • sociální média;
  • žurnalistika;
  • hudba;
  • hry;
  • sport;
  • lék;
  • kybernetická bezpečnost;
  • boj proti padělání;
  • automatizace a personalizace výroby;
  • shromažďování a zpracování informací.

Jak AI pomáhá lidem vytvářet obsah

Algoritmy AI pomáhají lidem rozvíjet jejichtalenty, kreativita. To, za co jsou modely strojů vždy kritizovány, je nedostatek schopnosti vytvořit to, co člověk nedokáže. Ale snadno umožňují člověku rozšířit svůj prostor pro představivost. V internetovém prostoru nyní uživatelé přemýšlejí o obrazu, který lidem prezentují, o obsahu. Abyste nasbírali co nejvíce odběratelů, potřebujete vysoce kvalitní produkt, na rozdíl od čehokoli jiného, ​​a zároveň charakteristický pro autora. V PicsArt aktivně využíváme AI, aby uživatelé mohli pracovat s obrázky bez jakýchkoli omezení. Algoritmy nám pomáhají provádět složité změny, jako je změna pozadí, odstranění nepotřebných objektů, zlepšení kvality obrázků a změna jejich stylu. To nám také umožňuje zlepšit celkovou uživatelskou zkušenost.

Používají se všechna metadata, která shromažďujemepřímo zlepšit uživatelský komfort. Je to ctnostný cyklus: anonymizovaná uživatelská data v souladu s ochranou soukromí nám pomáhají vylepšovat náš produkt, lepší produkt zvyšuje využití a více využití generuje více dat, díky čemuž je naše AI ještě chytřejší. Tento cyklus je nezbytný pro masivní růst firmy, jako je ta naše.

AI navíc pomáhá uživatelům PicsArtpro zjednodušení jejich práce: za tímto účelem služba implementuje systémy pro vyhledávání obsahu podle značek, doporučení samolepek a hledání podobných obrázků, které vybírají fotografie podle nejběžnějších barev nebo podle popisu grafu v obrázcích. Existují modely, které jednoduše hodnotí fotografie pro podobnost.

Pokud mluvíme přímo o neobvyklýchzpůsoby práce s obrázky, pak je to samozřejmě nyní populární zpracování - přeměna fotografie na karikaturu nebo anime, použití efektů a vizuálních řešení, jako je plátno, efekt Skica, přenos stylu, upscale nebo vylepšení obrázku podle technická a umělecká kritéria. Cíl je v každém případě stejný - vytvořit obsah, který přiláká více pozornosti.

Uživatelé rádi, že mohou používatsnadno použitelné nástroje k vytváření obrazů z vašich fotografií, které vypadají jako dílo velkých umělců. Staňte se v zásadě digitálním umělcem. Ale za tím se skrývá práce modelů hlubokého učení.

Vysvětlit, jak takovémodel, lze provést analogii. Představte si situaci, kdy dostanete dva obrázky: vaši fotografii a obraz od umělce, a poté budete požádáni, abyste nakreslili fotografii, ale pomocí barev a barev z obrázku. Jak bys to udělal Například bych se pokusil načrtnout tužkou a pak to zkusit vybarvit podle umělcova stylu, aniž bych zapomněl na samotný náčrt.

Jeden z uměleckých efektů PicsArt - plátno - na základěAlgoritmy AI vybírají pro fotografii nahranou uživatelem slavný obraz nebo sochu z dob starověku, středověku nebo renesance. Pomocí technologie rozpoznávání obličeje vytváří umělecký efekt dvojitý obraz osoby a uměleckého díla. K vytvoření plátna bylo provedeno více než 6 000 experimentů s nakloněním a obličejem, aby se našla optimální kombinace prvků. K trénování neuronové sítě bylo zapotřebí datové sady s více než 2 000 uměleckými díly.

Umělá inteligence pomáhá aprofesionální fotografové, kteří musí zpracovat stovky fotografií. IT gigant Adobe používá ve svém produktu Sensei modul umělé inteligence. Je schopen analyzovat fotografie a porovnávat je s databází tisíců profesionálně upravených obrázků. Na základě této analýzy inteligentně doporučí nejvhodnější úpravy a úpravy pro váš snímek.

Luminar AI editor fotografií také používá AIlze vidět přímo z jeho názvu. Je pravda, že někteří uživatelé považují přístup editora za příliš automatizovaný, ale editorské nástroje podle vývojářů umožňují retušovat tváře bez obtížných a náročných operací, přidat fotografii počasí a upravit jim barvy a osvětlení. Model Composition AI automaticky srovnává obrázky a navrhuje oříznutí na základě pokynů pro kompozici a zpětné vazby od profesionálních fotografů.

Jak AI určuje, zda je fotka nebo video hluboce falešné

Algoritmy AI způsobily zrod hlubokých padělků a nyní samy o soběbojují. Tato oblast je jednou z priorit kybernetické bezpečnosti. Používání tváří nebo hlasů vrcholových manažerů je nový typ podvodu. Ale na rozdíl od sofistikovaných technologií, jako je ransomware, se falešné útoky spoléhají na sociální inženýrství: spoléhají se na podvod. Podle ZDnet je průměrná ztráta na stížnost za takové útoky 75 000 $. Průměrná ztráta z malwaru na stížnost je 4 400 $. Proto vědci z Dawesova centra pro budoucí zločiny na University College London hodnotili hluboké padělání simulovaným lidským zvukem a videem obrázky jako nejnebezpečnější kriminální hrozba spojená s umělou inteligencí.

Historie si s tím opravdu hrajeVývojáři AI. Manish Agravala ze Stanfordu před dvěma lety pomohl vyvinout technologii synchronizace rtů, která umožnila editorům videa téměř plynule měnit slova řečníků. Nástroj mohl snadno vkládat slova, která dotyčná osoba nikdy neřekla, dokonce i uprostřed věty, nebo mazat slova, která dotyčná osoba řekla. Pouhému oku a dokonce i mnoha počítačovým systémům vše vypadalo organicky.

Ale tato technologie vytvořila obrovské příležitostipro podvodníky, politické vydírání a zločin. Například v Rusku podvodníci vytvořili hlubokou kopii zakladatele Flocktory a Dbrain Dmitrije Matskeviče. U téměř půlhodinového videa mluvil deepfake-Matskevich o platformě s novým výdělkovým systémem. Doména spojená s tímto videem samozřejmě patřila kybernetickým zločincům.

Proto rok po ukončení vývojeTechnologie Agrawal pro synchronizaci rtů zavedly algoritmus AI, který dokáže detekovat hluboké falešné chyby ve videu. Program přesně detekuje více než 80% padělků a rozpozná nejmenší nesrovnalosti mezi zvuky vydávanými lidmi a tvarem jejich úst.

Ale podle Agrawala dlouhodoběneexistuje žádné technické řešení pro hledání a identifikaci padělků. Technologie pro jejich vytváření také nezůstávají stát: dnes, při dostatečném počtu vzorků obličeje a hlasu člověka, může tvůrce hlubokého videa přimět člověka „říci“ cokoli.

Nástroj Agrawal funguje na základěAlgoritmus AI, který hledá nesrovnalosti mezi „vizuály“ nebo tvary úst a „fonémy“ fonetickými zvuky. Vědci se zejména podívali na ústa člověka, když vydával zvuky „B“, „M“ nebo „P“, protože je téměř nemožné vydat tyto zvuky bez těsného uzavření rtů.

Algoritmy AI se budou nadále aktivně vyvíjet,nabízet uživatelům digitálních služeb stále více možností: od zajištění bezpečnosti a zlepšování kvality medicíny až po kreativitu a hlasové asistenty. Zavádění AI bude stále aktivnější a bude se rozvíjet trh.

V loňském roce OpenAI udělala největší skokzpracování přirozeného jazyka. Tento model umělé inteligence však vyžadoval obrovské množství výpočetních zdrojů. Microsoft plánuje pomoci OpenAI spolupracovat na využití superpočítačů společnosti k vytváření ještě výkonnějších a spolehlivějších modelů AI. S největší pravděpodobností bude větší důraz kladen na AI, což také pomůže optimalizovat a snížit spotřebu energie těchto strojů náročných na data.

Google DeepMind, AI for Good od společnosti Microsoft,Facebook AI, Intel University Research & Collaboration Office (URC), NVIDIA AI a OpenAI jsou jen některé z nejvýznamnějších společností a organizací, které provádějí výzkum AI. Pomohou lidem řešit mnoho problémů souvisejících se zdravím, chudobou, vzděláním, životním prostředím a vším dalším, co se týká našeho života.

Přečtěte si také:

Japonští vědci vyvrtali oceánské dno poblíž Fukušimy v hloubce 8 000 metrů

Matematický model mozku umožní AI myslet jako člověk

Uran získal status nejpodivnější planety ve sluneční soustavě. Proč?