บทกวีการเขียนเชิงวิเคราะห์และเรื่องตลก: AI เรียนรู้ที่จะเขียนอย่างมีความหมายได้อย่างไร

การประมวลผลภาษาธรรมชาติคืออะไร?

การประมวลผลข้อความภาษาธรรมชาติ—ทิศทางทั่วไป

ปัญญาประดิษฐ์และภาษาศาสตร์เชิงคณิตศาสตร์ ศึกษาปัญหาการวิเคราะห์และการสังเคราะห์ข้อความด้วยคอมพิวเตอร์ในภาษาธรรมชาติ

การวิเคราะห์ใช้กับปัญญาประดิษฐ์หมายถึงการเข้าใจภาษาและการสังเคราะห์หมายถึงการสร้างข้อความที่อ่านออกเขียนได้ การแก้ปัญหาเหล่านี้จะหมายถึงการสร้างรูปแบบปฏิสัมพันธ์ระหว่างคอมพิวเตอร์และบุคคลที่สะดวกยิ่งขึ้น

วัตถุประสงค์และข้อ จำกัด

ในทางทฤษฎีการสร้างภาษาธรรมชาติอินเทอร์เฟซสำหรับคอมพิวเตอร์เป็นเป้าหมายที่น่าสนใจมาก ระบบยุคแรก ๆ เช่น SHRDLU ซึ่งทำงานกับ "โลกลูกบาศก์" ที่ จำกัด และใช้คำศัพท์ที่ จำกัด ดูดีมากและสร้างแรงบันดาลใจให้กับผู้สร้าง อย่างไรก็ตามการมองโลกในแง่ดีลดน้อยลงอย่างรวดเร็วเมื่อระบบเหล่านี้เผชิญกับความซับซ้อนและความคลุมเครือของโลกแห่งความเป็นจริง

บางครั้งมีการพิจารณาความเข้าใจภาษาตามธรรมชาติAI เป็นงานที่สมบูรณ์เนื่องจากการรับรู้ภาษาที่มีชีวิตต้องอาศัยความรู้มากมายเกี่ยวกับระบบเกี่ยวกับโลกรอบข้างและความสามารถในการโต้ตอบกับมัน คำจำกัดความของความหมายของคำว่า "เข้าใจ" เป็นหนึ่งในงานหลักของปัญญาประดิษฐ์

ความยากลำบากในการทำความเข้าใจภาษารัสเซีย

คุณภาพของความเข้าใจขึ้นอยู่กับปัจจัยหลายประการ ได้แก่ ภาษาวัฒนธรรมประจำชาติตัวของคู่สนทนาเป็นต้นสิ่งเหล่านี้เป็นตัวอย่างของความยากลำบากที่ระบบทำความเข้าใจข้อความต้องเผชิญ

  • ความยากลำบากในการเปิดเผยอานาฟอร์ (การรับรู้ความหมายเมื่อใช้คำสรรพนาม): ประโยค "เราให้กล้วยแก่ลิงเพราะพวกเขาหิว" และ "เราให้กล้วยแก่ลิงเพราะมันสุกเกินไป" มีโครงสร้างทางวากยสัมพันธ์คล้ายคลึงกัน หนึ่งในนั้นคือสรรพนามพวกเขาเป็นหมายถึงลิง และอีกนัยหนึ่งหมายถึงกล้วย ความเข้าใจที่ถูกต้องขึ้นอยู่กับความรู้ของคอมพิวเตอร์ว่ากล้วยและลิงคืออะไร
  • การเรียงลำดับคำที่ไม่เสียค่าใช้จ่ายสามารถนำไปสู่การตีความวลีที่แตกต่างไปจากเดิมอย่างสิ้นเชิง: "การกำหนดสติสัมปชัญญะ" - อะไรเป็นตัวกำหนดว่าอะไร?
  • ในภาษารัสเซียคำสั่งซื้อฟรีจะได้รับการชดเชยโดยสัณฐานวิทยาที่พัฒนาขึ้นคำที่เป็นทางการและเครื่องหมายวรรคตอน แต่ในกรณีส่วนใหญ่สิ่งนี้ทำให้เกิดปัญหาเพิ่มเติมสำหรับคอมพิวเตอร์
  • Neologisms สามารถพบได้ในคำพูดตัวอย่างเช่นคำกริยา "ห้าสิบรูเบิล" นั่นคือส่ง 50 รูเบิล ระบบควรสามารถแยกแยะกรณีดังกล่าวออกจากการพิมพ์ผิดและทำความเข้าใจได้อย่างถูกต้อง
  • ความเข้าใจที่ถูกต้องเกี่ยวกับคำพ้องเสียงเป็นอีกปัญหาหนึ่ง ในการรู้จำเสียงพูดปัญหาของการออกเสียงพ้องเสียงเกิดขึ้น ในวลี “หมาป่าสีเทาในถิ่นทุรกันดารป่าไม้ได้พบกับคนผมแดงสุนัขจิ้งจอก»คำที่ไฮไลต์จะได้ยินในลักษณะเดียวกันและไม่มีความรู้ว่าใครเป็นคนหูหนวกและใครเป็นสีแดงเป็นสิ่งที่ขาดไม่ได้ (ยกเว้นว่าสุนัขจิ้งจอกสามารถเป็นสีแดงและป่าสามารถหูหนวกได้ป่าก็สามารถเป็นสีแดงได้เช่นกัน (ลักษณะเฉพาะในกรณีนี้แสดงถึงสีที่โดดเด่นของใบไม้ในป่า ) ในขณะที่สุนัขจิ้งจอกอาจหูหนวกซึ่งก่อให้เกิดปัญหาเพิ่มเติมที่เกิดจากปัญหาก่อนหน้าแม้ว่ามันจะถูกชดเชยบางส่วนด้วยสัณฐานวิทยา - คำคุณศัพท์ในประโยคนี้มีความแตกต่างกันอย่างชัดเจนในเรื่องเพศ

งานยอดนิยม:

  • การรู้จำเสียง
  • การวิเคราะห์ข้อความ:
  • การสกัดข้อมูล
  • ค้นหาข้อมูล
  • การวิเคราะห์งบ
  • การวิเคราะห์ความรู้สึกของข้อความ
  • ระบบถาม - ตอบ
  • กำลังสร้างข้อความ
  • การสังเคราะห์เสียง

การจำแนกประเภททั่วไป:

  • การจัดหมวดหมู่ของข้อความ
  • การจำแนกลำดับอักขระ:
  • ชื่อการรับรู้เอนทิตี
  • การกำหนดส่วนของการพูดของคำ
  • การจดจำวลี
  • การแยกข้อมูลออกจากข้อความ
  • คำอธิบายประกอบเชิงไวยากรณ์
  • คำอธิบายประกอบเชิงความหมาย
  • กำลังสร้างข้อความ:
  • การสร้างข้อความตามคำพูดที่เป็นที่รู้จัก
  • แปลด้วยเครื่อง
  • ลักษณะทั่วไปของข้อความ

การเขียน AI ใช้ในที่ทำงานอย่างไร?

  • โพสต์วอชิงตัน

ในเดือนสิงหาคม 2559 The Washington Post เป็นครั้งแรกเริ่มใช้บอท Heliograf ซึ่งเขียนข่าวสั้น ๆ เกี่ยวกับการแข่งขันกีฬาโอลิมปิกในริโอเดจาเนโร ประสิทธิภาพของ "Heliograf" นั้นน่าประทับใจ: บอทสร้างข่าวได้เร็วกว่าที่บรรณาธิการมีเวลากำหนดงานและผู้อ่านไม่สามารถแยกแยะบันทึกอัตโนมัติจากบันทึกที่เขียนด้วยลายมือได้

  • บลูมเบิร์ก

ประมาณ 30% ของข่าว Bloomberg ทั้งหมดในวันนี้ถูกสร้างขึ้นโดยใช้โมดูล Cyborg มันสร้างขึ้นตามแม่แบบ: เกิดอะไรขึ้นเมื่อไหร่ที่ไหนกับใครและแสดงความคิดเห็นเกี่ยวกับเหตุการณ์นั้นอย่างไร วิธีนี้ช่วยประหยัดค่าใช้จ่ายสำหรับผู้สื่อข่าว แต่คุณไม่สามารถทำได้หากไม่มีพวกเขา Cyborg เป็นเพียงระบบอัตโนมัติไม่ใช่ AI ขั้นสูง

  • สำนักข่าวรอยเตอร์

หน่วยงานระหว่างประเทศ Reuters ใช้ซอฟต์แวร์ตัวติดตามข่าว เป็นเครื่องมือทำนายผล AI ที่ประเมินเรื่องราวใน Twitter ตามเกณฑ์ทางสถิติและชื่อเสียง บอทตรวจสอบมากกว่า 700 ล้านทวีตทุกวัน

  • ผู้พิทักษ์

เป็นครั้งแรกที่ปัญญาประดิษฐ์ก้าวไปไกลกว่านี้บันทึกข่าวและเริ่มสร้างบทความเชิงวิเคราะห์ ในเดือนมกราคม 2019 The Guardian ได้ตีพิมพ์เรื่องแรกที่เขียนโดยปัญญาประดิษฐ์ ReporterMate อุทิศให้กับจำนวนเงินบริจาคที่รวบรวมโดยหลายฝ่ายในออสเตรเลีย นอกเหนือจากข้อความแล้ว AI ยังสร้างกราฟและให้คะแนนเกมตามผลของค่ายฝึกอบรม

อ่านเพิ่มเติม:

แผนที่แรกที่แม่นยำของโลกถูกสร้างขึ้น คนอื่นผิดอะไร

สถานที่ที่มีพายุมากที่สุดในโลก: ทำไม Drake Passage จึงเป็นเส้นทางที่อันตรายที่สุดไปยังแอนตาร์กติกา

สารประกอบยูเรเนียมใหม่ทำลายสถิติการนำไฟฟ้าที่ผิดปกติ