Vad är naturlig språkbehandling?
Textbearbetning på naturligt språk – allmän riktning
Analys tillämpad på artificiell intelligensbetyder att förstå språket, och syntes betyder att generera läs- och skrivkunnig text. Att lösa dessa problem innebär att skapa en bekvämare form av interaktion mellan en dator och en person.
Mål och begränsningar
Teoretiskt, byggandet av ett naturligt språkgränssnitt för datorer är ett mycket attraktivt mål. Tidiga system som SHRDLU, som arbetar med en begränsad "kubvärld" och använder en begränsad vokabulär, såg extremt bra ut och inspirerade deras skapare. Optimismen minskade dock snabbt när dessa system konfronterades med den verkliga världens komplexitet och tvetydighet.
Naturlig språkförståelse övervägs iblandAI är en fullständig uppgift, eftersom erkännande av ett levande språk kräver enorm kunskap om systemet om den omgivande världen och förmågan att interagera med det. Själva definitionen av betydelsen av ordet "förstå" är en av de viktigaste uppgifterna för artificiell intelligens.
Svårigheter att förstå det ryska språket
Förståelsens kvalitet beror på många faktorer: på språket, på den nationella kulturen, på samtalspartnern själv etc. Det här är några exempel på de svårigheter som textförståelsessystem står inför.
- Svårigheter med att avslöja anaforer (igenkänning,vad menas med användningen av pronomen): meningarna "Vi gav bananerna till aporna för att de var hungriga" och "Vi gav bananerna till aporna för att de var övermogna" liknar syntaktisk struktur. I ett av dem pronomenetdom ärhänvisar till apor, och i en annan till bananer. Rätt förståelse beror på datorns kunskap om vad bananer och apor kan vara.
- Ordens fria ordning kan leda till en helt annan tolkning av frasen: "Varelse bestämmer medvetandet" - vad avgör vad?
- På ryska kompenseras fri ordning med en utvecklad morfologi, officiella ord och skiljetecken, men i de flesta fall utgör detta ett ytterligare problem för en dator.
- Neologismer kan påträffas i tal, till exempel verbet "Femtio rubel" - det vill säga skicka 50 rubel. Systemet ska kunna skilja sådana fall från stavfel och förstå dem korrekt.
- Korrekt förståelse av homonymer är ett annat problem.I frasen "Den grå vargen i dövaskogträffade en rödhårigräv»Markerade ord hörs på samma sätt och utankunskap om vem som är döv och vem är röd är oumbärlig (förutom att räven kan vara röd och skogen kan vara döv, kan skogen också vara röd (en egenskap, i detta fall, som betecknar den dominerande färgen på lövverket i skogen ), medan räven kan vara döv, vilket ger upphov till ett ytterligare problem som uppstår från det föregående, även om det delvis kompenseras av morfologi - adjektiven i denna mening är klart olika i kön).
Populära uppgifter:
- Taligenkänning
- Textanalys:
- Utvinning av information,
- Informationssökning,
- Analys av uttalanden,
- Sentimentanalys av texten,
- Frågesvarssystem.
- Skapar text
- Talsyntes
Allmänna klassificeringen:
- Kategorisering av texter
- Klassificering av karaktärsekvenser:
- Namngiven entitetsigenkänning,
- Bestämning av ordens ord.
- Frasigenkänning
- Extrahera information från text
- Syntaktisk kommentar
- Semantisk kommentar
- Skapar text:
- Generering av text baserat på erkänt tal,
- Maskinöversättning,
- Generalisering av texten.
Hur använder AI för att skriva AI på jobbet?
- Washington posten
I augusti 2016, The Washington Post för första gångenbörjade använda botten Heliograf, som skrev korta nyheter om de olympiska spelen i Rio de Janeiro. Prestationen för "Heliograf" var imponerande: bot genererade nyheter snabbare än redaktören hade tid att ställa in uppgiften, och läsarna kunde inte skilja automatiska anteckningar från handskrivna.
- Bloomberg
Cirka 30% av alla nyheter från Bloomberg idagskapas med hjälp av Cyborg-modulen. Det genererar dem enligt mallen: vad som hände, när, var, med vem, vem och hur kommenterade händelsen. Detta sparar kostnader för journalister, men du kan inte göra det utan dem. Cyborg är bara ett automatiseringssystem, inte en avancerad AI.
- Reuters
Den internationella byrån Reuters använder programvaraNyheter Tracer. Det är ett AI-prediktivt verktyg som utvärderar Twitter-berättelser baserat på statistiska kriterier och ryktekriterier. Bot kontrollerar över 700 miljoner tweets varje dag.
- Väktaren
För första gången har artificiell intelligens gått utövernyhetsnoteringar och började generera analytiska artiklar. I januari 2019 publicerade The Guardian den första berättelsen skriven av den artificiella intelligensen ReporterMate. Det ägnades åt mängden donationer som samlats in av olika parter i Australien. Förutom texten genererade AI grafer och rankade spelen baserat på träningslägrets resultat.
Läs mer:
Den första exakta världskartan skapades. Vad är fel med alla andra?
Den stormigaste platsen på jorden: varför Drake Passage är den farligaste vägen till Antarktis
Ny uranförening slår rekord för avvikande ledningsförmåga