มันเริ่มต้นอย่างไร
หากต้องการสอนคอมพิวเตอร์ให้ "มองเห็น" คุณต้องมีเซ็นเซอร์ที่อ่านได้ก่อน
ข้อความที่พิมพ์ได้รับการพิสูจน์แล้วว่าเป็นการทดสอบที่สมบูรณ์แบบย่อมาจากอัลกอริธึมรุ่นแรก - ก็เพียงพอที่จะเพิ่มความคมชัดของภาพและค้นหาการเปลี่ยนจากสีขาวเป็นสีดำและในทางกลับกัน ทำให้สามารถระบุขอบเขตของตัวอักษรและรูปร่างได้ หลังจากนั้นจึงระบุตัวอักษรแต่ละตัวได้โดยเปรียบเทียบกับตัวอย่างที่เตรียมไว้ก่อนหน้านี้
การสร้างไลบรารีโอเพ่นซอร์สเช่นOpenCV ได้เปิดประตูสู่การทดลองกับภาพโดยพลการ ด้วยรูปร่างของขอบที่ตรวจพบของวัตถุ คอมพิวเตอร์สามารถเข้าใจตำแหน่งที่บุคคล ดวงตามนุษย์ นก รถยนต์ถูกพรรณนา - ระบบการมองเห็นของคอมพิวเตอร์ไปไกลกว่าขอบเขตของการจดจำข้อความ
กล้องวงจรปิดปรากฎสัญญาณถ้ามีคนปรากฏในกรอบ แอปพลิเคชั่นที่มีการมองเห็นด้วยคอมพิวเตอร์ได้ตกลงในโทรศัพท์มือถือ: การระบุใบหน้า ลายนิ้วมือ เรตินา หรือเครื่องสแกนรหัส QR เป็นคุณสมบัติทั่วไปมานานแล้ว และตอนนี้ ไม่ใช่อัลกอริธึมดั้งเดิมสำหรับการเปรียบเทียบกับกลุ่มตัวอย่างมีหน้าที่ทำความเข้าใจสิ่งที่ปรากฎ แต่เป็นโครงข่ายประสาทเทียมที่ได้รับการฝึกฝนโดยใช้เทคโนโลยีการเรียนรู้ของเครื่อง
ทำไมการมองเห็นด้วยคอมพิวเตอร์จึงดีกว่าการมองเห็นของมนุษย์
ข้อได้เปรียบแรกและชัดเจนของ CV คือมากการรับรู้ที่กว้างขึ้น คอมพิวเตอร์วิทัศน์ไม่เหมือนกับการจ้องมองของเรา ไม่จำกัดเฉพาะสเปกตรัมที่มองเห็นได้ สิ่งสำคัญคือเซ็นเซอร์สามารถสร้างภาพสำหรับการประมวลผลต่อไปและอะไรคือที่มาของภาพนี้ - เครื่องถ่ายภาพความร้อน, กล้องไลดาร์, กล้องวิดีโอ, เครื่องเอ็กซ์เรย์, เครื่องอัลตราซาวนด์หรือเครื่อง MRI - ไม่สำคัญ
ข้อได้เปรียบที่สองของระบบการมองเห็นด้วยคอมพิวเตอร์คือขาดปัจจัยมนุษย์ ไม่เหนื่อย ไม่ฟุ้งซ่าน ไม่อยากนอน มีมุมมอง 360 องศา ข้อมูลที่จำเป็นสามารถขอได้จากที่เก็บถาวรเพื่อดูอีกครั้ง
นอกจากนี้ ในกระบวนการเรียนรู้ โครงข่ายประสาทเทียมสามารถเปิดเผยการเชื่อมต่อที่ไม่ชัดเจนต่อการรับรู้ของมนุษย์ ตัวอย่างเช่น ระบบจะวิเคราะห์ภาพอวัยวะภายในของมนุษย์และสร้างแนวคิดว่าควรมีลักษณะอย่างไร ดังนั้นจึงเป็นไปได้ที่จะกำหนดไม่เพียง แต่ประเภทของอวัยวะ แต่ยังรวมถึงระดับความเบี่ยงเบนจากบรรทัดฐาน - โดยเฉพาะอย่างยิ่งเพื่อตรวจหาเนื้องอกที่ไม่ได้รับการวินิจฉัยโดยวิธีอื่น
คอมพิวเตอร์วิทัศน์เปลี่ยนวิธีที่เรามองโลกอย่างไร
เทคโนโลยีคอมพิวเตอร์วิทัศน์ตอนนี้ใช้ในทางการแพทย์เพื่อตรวจหาเนื้องอกมะเร็ง ในอุตสาหกรรมเพื่อควบคุมการประกอบที่ขั้นตอนการผลิตและในรถยนต์ ซึ่งเป็นระบบรักษาความปลอดภัยเพิ่มเติม เราไม่รีรอที่จะใช้คอมพิวเตอร์วิทัศน์เพื่อปลดล็อกอุปกรณ์ และเราสาบานต่อกล้องบนถนนที่ปรับให้เป็นปกติ
คอมพิวเตอร์วิทัศน์กำลังเปลี่ยนแปลงแม้กระทั่งการรับรู้ของกีฬา- ระบบติดตามอัตโนมัติควบคุมกล้องถ่ายทอดสดช่วยแยกแยะช่วงเวลาที่ขัดแย้ง - ไม่ว่าลูกบอลยังคงอยู่ในสนามเทนนิสหรือข้ามเส้นประตูไม่ว่าจะมีการละเมิดหรือตำแหน่งล้ำหน้า
บันทึกจะถูกเก็บไว้ด้วยความช่วยเหลือของคอมพิวเตอร์วิทัศน์ความแออัดของยานพาหนะ ระบบจะตรวจสอบจำนวนล้อหลังของรถบรรทุกที่สัมผัสกับพื้นผิวถนน จำนวนล้อที่ผิดรูป และคำนวณน้ำหนักบรรทุกของรถ สิ่งที่เหลืออยู่คือการจดจำป้ายทะเบียนและเข้าสู่ฐานข้อมูล
คอมพิวเตอร์วิทัศน์ไม่สามารถถูกแทนที่ได้ในคลังสินค้าการบัญชี การทำงานในลักษณะนี้: เครื่องสแกนอ่านบาร์โค้ดบนกล่องพร้อมกับผลิตภัณฑ์และป้อนข้อมูลลงในฐานข้อมูล ยิ่งกว่านั้น ไม่จำเป็นต้องสแกนทุกกล่อง เพราะสะดวกกว่ามากในการอ่านรหัส QR จากกล่องทั้งหมดบนพาเลทพร้อมกัน
ระบบการประมวลผลยังคงพัฒนาต่อไปข้อความ - ในระบบการจัดการเอกสารสมัยใหม่ การสแกนข้อตกลงหรือใบแจ้งหนี้จะถูกดาวน์โหลดเป็นเอกสาร PDF แต่ด้วยการมองเห็นด้วยคอมพิวเตอร์ จึงสามารถค้นหา จำแนกหรือคัดลอกได้
พื้นที่แยกต่างหากคือการบูรณาการของคอมพิวเตอร์วิสัยทัศน์และเทคโนโลยีอวกาศ ในภาคการเกษตร ตรวจสอบสถานะของพืชผลโดยใช้ดาวเทียม กระทรวงสถานการณ์ฉุกเฉินจะตรวจสอบการเกิดเพลิงไหม้และน้ำท่วม Google ได้ใช้ภาพถ่ายดาวเทียมเพื่อใช้คอมพิวเตอร์วิทัศน์ในการระบุและทำแผนที่อาคารทั้งหมดในแอฟริกา ตั้งแต่อุโมงค์ที่ขุดบนเนินเขาริมฝั่งแม่น้ำไปจนถึงอาคารสูง
เทคโนโลยีการมองเห็นด้วยคอมพิวเตอร์มีความจำเป็นสำหรับการสร้างความเป็นจริงเสริม - ต้องขอบคุณการจดจำจุดอ้างอิงที่ทำให้สามารถฝังภาพที่สังเคราะห์ลงในเฟรมได้อย่างถูกต้องและรวมพื้นที่จริงและเสมือนเข้าด้วยกัน ตัวอย่างเช่น ในแอปพลิเคชันสำหรับติดตั้งเครื่องประดับจากระยะไกล กล้องสมาร์ทโฟนจะอ่านตำแหน่งมือของผู้ใช้ สร้างแบบจำลอง และเพิ่มแหวนที่เลือกเข้าไป มาสก์ 3D ที่คุ้นเคยแล้วบน Instagram ก็เป็นหนึ่งในอาการแสดงของการมองเห็นด้วยคอมพิวเตอร์ร่วมกับ VR / AR
ได้รับความนิยมและมีความเชี่ยวชาญสูงแอปพลิเคชั่นที่ให้ข้อมูลเกี่ยวกับต้นไม้จากภาพถ่ายใบไม้ ช่วยให้คนเก็บเห็ดรู้ว่าพวกเขาได้ถ้วยรางวัลที่กินได้หรือไม่ และนักสะสมสามารถรับข้อมูลเกี่ยวกับเหรียญได้อย่างรวดเร็วเพียงแค่เล็งกล้องสมาร์ทโฟนไปที่มัน
ข้อเสียของระบบการมองเห็นด้วยคอมพิวเตอร์คืออะไร
ระบบการมองเห็นของคอมพิวเตอร์มีความละเอียดอ่อนอย่างยิ่งไปจนถึงทรัพยากรฮาร์ดแวร์ ยิ่งเซ็นเซอร์ภายนอกมีความละเอียดมากขึ้นและพลังในการประมวลผลมากเท่าใด กระบวนการรับรู้ก็จะยิ่งเชื่อถือได้และแม่นยำยิ่งขึ้น ดังตัวอย่างเทคโนโลยีจดจำใบหน้าสำหรับการปลดล็อกโทรศัพท์มือถือ เมื่อ 10 ปีที่แล้ว การจัดแสงนี้ต้องการแสงที่ดีและระยะห่างจากใบหน้าที่ชัดเจน วันนี้โทรศัพท์รู้จักเจ้าของแม้ในเวลากลางคืน
ข้อเสียอีกประการของ CV ที่สามารถนำมาประกอบกับ"ความเจ็บปวดที่เพิ่มขึ้น" - ข้อผิดพลาดในการจำแนกวัตถุที่คล้ายคลึงกัน ตัวอย่างเช่น บุคคลสามารถแยกแยะลิงจากจิงโจ้และจิ้งจกจากจระเข้ได้อย่างง่ายดาย แต่สำหรับคอมพิวเตอร์ ท่าทางและมุมการถ่ายภาพบางอย่างไม่ง่ายนัก
ข้อจำกัดอีกประการหนึ่งของการมองเห็นด้วยคอมพิวเตอร์คือกระบวนการตัดสินใจ. รถยนต์ระดับพรีเมียมที่ทันสมัยสามารถมองเห็นได้ไกลกว่าบุคคล: ไม่มีจุดบอด ไม่ผ่านความมืดในเวลากลางคืนหรือมีหมอก สามารถตรวจจับการเข้าใกล้ของวัตถุด้วยการแผ่รังสีความร้อน แต่ในสถานการณ์จริงบนท้องถนน บุคคลยังคงตัดสินใจได้ดีขึ้นโดยคำนึงถึงสถานการณ์ปัจจุบัน และเพื่อเพิ่มความปลอดภัย ออโตไพลอตต้องตรวจสอบไม่เพียงแต่สถานการณ์การจราจร แต่ยังรวมถึงคนขับด้วย
ในโลกของแมชชีนวิชัน การระบุตัวตนเป็นหนึ่งในกระบวนการพื้นฐานซึ่งทำให้เกิดคำถามมากมายเกี่ยวกับความเป็นส่วนตัวและข้อมูลส่วนบุคคลในทันที ดังนั้นจึงจำเป็นต้องคำนึงถึงข้อกำหนดทางกฎหมายและข้อจำกัดทางจริยธรรมที่เกี่ยวข้องกับการประเมินการกระทำของมนุษย์ของคอมพิวเตอร์และผลที่ตามมาของการตัดสินใจโดยอัลกอริทึม หัวข้อของค่าปรับที่เขียนผิดพลาดคือการยืนยันที่ชัดเจนในเรื่องนี้
อนาคตจะเป็นอย่างไรสำหรับเรา
เรื่องสยองขวัญที่พบบ่อยที่สุดเรื่องหนึ่งที่เกี่ยวข้องกับการมองเห็นด้วยคอมพิวเตอร์ - ภาพของ "ค่ายกักกันดิจิทัล" การควบคุมทั้งหมดซึ่งไม่สามารถซ่อนได้ ระบบการมองเห็นของคอมพิวเตอร์ในอนาคตจะไม่เพียงควบคุมการเคลื่อนไหวเท่านั้น แต่ยังรวมถึงความตั้งใจด้วย การขมวดคิ้วหมายถึงความเศร้า การมองไปรอบๆ หมายถึงการวางแผนบางอย่าง ภาพยนตร์เรื่อง dystopian ที่น่าอัศจรรย์ยังเพิ่มความหวาดกลัวและการปฏิเสธในความคาดหมายของอนาคตดังกล่าว
นักเขียนบทชอบที่จะกวนประสาท ทำให้คนใหม่ๆ หวาดกลัวเทคโนโลยี ในทางปฏิบัติ โลกทุกวันนี้ "โปร่งใส" สำหรับเทคโนโลยีการควบคุม แต่ข้อดีของการนำคอมพิวเตอร์วิทัศน์มาใช้จะช่วยให้ในอนาคตไม่ต้องกังวลกับงานประจำมากมาย ตัวอย่างเช่น เรามักจะลืมเกี่ยวกับเครื่องบันทึกเงินสดในซูเปอร์มาร์เก็ต - ระบบระบุตัวคุณที่ทางเข้า ควบคุมสิ่งที่คุณใส่ในตะกร้า คำนวณต้นทุนที่ทางออก และหักเงินจากบัญชี ต้องขอบคุณคอมพิวเตอร์วิทัศน์ ทำให้สามารถเปลี่ยนเส้นทางกระแสข้อมูลได้อย่างรวดเร็วเพื่อหลีกเลี่ยงปัญหาการจราจรติดขัด และการจราจรโดยทั่วไปจะปลอดภัยยิ่งขึ้น
คอมพิวเตอร์วิทัศน์คือเทคโนโลยีแห่งอนาคตซึ่งส่งผลต่อชีวิตของเราอยู่แล้ว มันถูกรวมเข้ากับโลกสมัยใหม่อย่างล้ำลึก และเราใช้ความสามารถของมันทุกวัน แต่เรายังคงอยู่ที่จุดเริ่มต้นของเส้นทาง ซึ่งเราไม่เพียงแต่ต้องแก้ปัญหาทางเทคนิคของการเพิ่มพลังการประมวลผลเท่านั้น แต่ยังต้องเรียนรู้ที่จะใช้ชีวิตในความเป็นจริงใหม่ด้วย ในการทำเช่นนี้ คุณจะต้องเอาชนะโรคกลัวและออกกฎหมายที่จะป้องกันไม่ให้เทคโนโลยีไม่สามารถควบคุมได้
อ่านเพิ่มเติม:
ดูภาพกาแล็กซีที่รวมตัวกัน 2 กาแล็กซี ห่างกัน 9 ปี
Elon Musk: Starship สามารถบรรทุกสินค้าได้มากกว่าจรวดอื่นๆ ถึง 1,000 เท่า
สสารมืดย้อนกลับอนุภาคธรรมดาและเติมเต็มจักรวาล