การประมวลผลภาษาธรรมชาติคืออะไร?
การประมวลผลข้อความภาษาธรรมชาติ—ทิศทางทั่วไป
การวิเคราะห์ใช้กับปัญญาประดิษฐ์หมายถึงการเข้าใจภาษาและการสังเคราะห์หมายถึงการสร้างข้อความที่อ่านออกเขียนได้ การแก้ปัญหาเหล่านี้จะหมายถึงการสร้างรูปแบบปฏิสัมพันธ์ระหว่างคอมพิวเตอร์และบุคคลที่สะดวกยิ่งขึ้น
วัตถุประสงค์และข้อ จำกัด
ในทางทฤษฎีการสร้างภาษาธรรมชาติอินเทอร์เฟซสำหรับคอมพิวเตอร์เป็นเป้าหมายที่น่าสนใจมาก ระบบยุคแรก ๆ เช่น SHRDLU ซึ่งทำงานกับ "โลกลูกบาศก์" ที่ จำกัด และใช้คำศัพท์ที่ จำกัด ดูดีมากและสร้างแรงบันดาลใจให้กับผู้สร้าง อย่างไรก็ตามการมองโลกในแง่ดีลดน้อยลงอย่างรวดเร็วเมื่อระบบเหล่านี้เผชิญกับความซับซ้อนและความคลุมเครือของโลกแห่งความเป็นจริง
บางครั้งมีการพิจารณาความเข้าใจภาษาตามธรรมชาติAI เป็นงานที่สมบูรณ์เนื่องจากการรับรู้ภาษาที่มีชีวิตต้องอาศัยความรู้มากมายเกี่ยวกับระบบเกี่ยวกับโลกรอบข้างและความสามารถในการโต้ตอบกับมัน คำจำกัดความของความหมายของคำว่า "เข้าใจ" เป็นหนึ่งในงานหลักของปัญญาประดิษฐ์
ความยากลำบากในการทำความเข้าใจภาษารัสเซีย
คุณภาพของความเข้าใจขึ้นอยู่กับปัจจัยหลายประการ ได้แก่ ภาษาวัฒนธรรมประจำชาติตัวของคู่สนทนาเป็นต้นสิ่งเหล่านี้เป็นตัวอย่างของความยากลำบากที่ระบบทำความเข้าใจข้อความต้องเผชิญ
- ความยากลำบากในการเปิดเผยอานาฟอร์ (การรับรู้ความหมายเมื่อใช้คำสรรพนาม): ประโยค "เราให้กล้วยแก่ลิงเพราะพวกเขาหิว" และ "เราให้กล้วยแก่ลิงเพราะมันสุกเกินไป" มีโครงสร้างทางวากยสัมพันธ์คล้ายคลึงกัน หนึ่งในนั้นคือสรรพนามพวกเขาเป็นหมายถึงลิง และอีกนัยหนึ่งหมายถึงกล้วย ความเข้าใจที่ถูกต้องขึ้นอยู่กับความรู้ของคอมพิวเตอร์ว่ากล้วยและลิงคืออะไร
- การเรียงลำดับคำที่ไม่เสียค่าใช้จ่ายสามารถนำไปสู่การตีความวลีที่แตกต่างไปจากเดิมอย่างสิ้นเชิง: "การกำหนดสติสัมปชัญญะ" - อะไรเป็นตัวกำหนดว่าอะไร?
- ในภาษารัสเซียคำสั่งซื้อฟรีจะได้รับการชดเชยโดยสัณฐานวิทยาที่พัฒนาขึ้นคำที่เป็นทางการและเครื่องหมายวรรคตอน แต่ในกรณีส่วนใหญ่สิ่งนี้ทำให้เกิดปัญหาเพิ่มเติมสำหรับคอมพิวเตอร์
- Neologisms สามารถพบได้ในคำพูดตัวอย่างเช่นคำกริยา "ห้าสิบรูเบิล" นั่นคือส่ง 50 รูเบิล ระบบควรสามารถแยกแยะกรณีดังกล่าวออกจากการพิมพ์ผิดและทำความเข้าใจได้อย่างถูกต้อง
- ความเข้าใจที่ถูกต้องเกี่ยวกับคำพ้องเสียงเป็นอีกปัญหาหนึ่ง ในการรู้จำเสียงพูดปัญหาของการออกเสียงพ้องเสียงเกิดขึ้น ในวลี “หมาป่าสีเทาในถิ่นทุรกันดารป่าไม้ได้พบกับคนผมแดงสุนัขจิ้งจอก»คำที่ไฮไลต์จะได้ยินในลักษณะเดียวกันและไม่มีความรู้ว่าใครเป็นคนหูหนวกและใครเป็นสีแดงเป็นสิ่งที่ขาดไม่ได้ (ยกเว้นว่าสุนัขจิ้งจอกสามารถเป็นสีแดงและป่าสามารถหูหนวกได้ป่าก็สามารถเป็นสีแดงได้เช่นกัน (ลักษณะเฉพาะในกรณีนี้แสดงถึงสีที่โดดเด่นของใบไม้ในป่า ) ในขณะที่สุนัขจิ้งจอกอาจหูหนวกซึ่งก่อให้เกิดปัญหาเพิ่มเติมที่เกิดจากปัญหาก่อนหน้าแม้ว่ามันจะถูกชดเชยบางส่วนด้วยสัณฐานวิทยา - คำคุณศัพท์ในประโยคนี้มีความแตกต่างกันอย่างชัดเจนในเรื่องเพศ
งานยอดนิยม:
- การรู้จำเสียง
- การวิเคราะห์ข้อความ:
- การสกัดข้อมูล
- ค้นหาข้อมูล
- การวิเคราะห์งบ
- การวิเคราะห์ความรู้สึกของข้อความ
- ระบบถาม - ตอบ
- กำลังสร้างข้อความ
- การสังเคราะห์เสียง
การจำแนกประเภททั่วไป:
- การจัดหมวดหมู่ของข้อความ
- การจำแนกลำดับอักขระ:
- ชื่อการรับรู้เอนทิตี
- การกำหนดส่วนของการพูดของคำ
- การจดจำวลี
- การแยกข้อมูลออกจากข้อความ
- คำอธิบายประกอบเชิงไวยากรณ์
- คำอธิบายประกอบเชิงความหมาย
- กำลังสร้างข้อความ:
- การสร้างข้อความตามคำพูดที่เป็นที่รู้จัก
- แปลด้วยเครื่อง
- ลักษณะทั่วไปของข้อความ
การเขียน AI ใช้ในที่ทำงานอย่างไร?
- โพสต์วอชิงตัน
ในเดือนสิงหาคม 2559 The Washington Post เป็นครั้งแรกเริ่มใช้บอท Heliograf ซึ่งเขียนข่าวสั้น ๆ เกี่ยวกับการแข่งขันกีฬาโอลิมปิกในริโอเดจาเนโร ประสิทธิภาพของ "Heliograf" นั้นน่าประทับใจ: บอทสร้างข่าวได้เร็วกว่าที่บรรณาธิการมีเวลากำหนดงานและผู้อ่านไม่สามารถแยกแยะบันทึกอัตโนมัติจากบันทึกที่เขียนด้วยลายมือได้
- บลูมเบิร์ก
ประมาณ 30% ของข่าว Bloomberg ทั้งหมดในวันนี้ถูกสร้างขึ้นโดยใช้โมดูล Cyborg มันสร้างขึ้นตามแม่แบบ: เกิดอะไรขึ้นเมื่อไหร่ที่ไหนกับใครและแสดงความคิดเห็นเกี่ยวกับเหตุการณ์นั้นอย่างไร วิธีนี้ช่วยประหยัดค่าใช้จ่ายสำหรับผู้สื่อข่าว แต่คุณไม่สามารถทำได้หากไม่มีพวกเขา Cyborg เป็นเพียงระบบอัตโนมัติไม่ใช่ AI ขั้นสูง
- สำนักข่าวรอยเตอร์
หน่วยงานระหว่างประเทศ Reuters ใช้ซอฟต์แวร์ตัวติดตามข่าว เป็นเครื่องมือทำนายผล AI ที่ประเมินเรื่องราวใน Twitter ตามเกณฑ์ทางสถิติและชื่อเสียง บอทตรวจสอบมากกว่า 700 ล้านทวีตทุกวัน
- ผู้พิทักษ์
เป็นครั้งแรกที่ปัญญาประดิษฐ์ก้าวไปไกลกว่านี้บันทึกข่าวและเริ่มสร้างบทความเชิงวิเคราะห์ ในเดือนมกราคม 2019 The Guardian ได้ตีพิมพ์เรื่องแรกที่เขียนโดยปัญญาประดิษฐ์ ReporterMate อุทิศให้กับจำนวนเงินบริจาคที่รวบรวมโดยหลายฝ่ายในออสเตรเลีย นอกเหนือจากข้อความแล้ว AI ยังสร้างกราฟและให้คะแนนเกมตามผลของค่ายฝึกอบรม
อ่านเพิ่มเติม:
แผนที่แรกที่แม่นยำของโลกถูกสร้างขึ้น คนอื่นผิดอะไร
สถานที่ที่มีพายุมากที่สุดในโลก: ทำไม Drake Passage จึงเป็นเส้นทางที่อันตรายที่สุดไปยังแอนตาร์กติกา
สารประกอบยูเรเนียมใหม่ทำลายสถิติการนำไฟฟ้าที่ผิดปกติ