ในโลกยุคปัจจุบันที่ทุกอย่างดำเนินไปอย่างรวดเร็ว การมีกล้องวงจรปิดเพียงอย่างเดียวไม่เพียงพอ แล้วถ้ากล้องของคุณไม่เพียงแต่บันทึกภาพได้เท่านั้น แต่ยังเข้าใจและตีความสิ่งที่กล้องมองเห็นได้อีกด้วยล่ะจะเป็นอย่างไร
นี่ไม่ใช่ภาพอนาคต แต่เป็นสิ่งที่เกิดขึ้นแล้วในปัจจุบัน การใช้ปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่องจักรทำให้กล้องที่รองรับโปรโตคอลสตรีมมิ่งแบบเรียลไทม์ (RTSP) ของคุณสามารถเปลี่ยนเป็นระบบเฝ้าระวังอัจฉริยะที่ทรงพลังได้
พลังและความเรียบง่ายของ AI Computer Vision
การมองเห็นคอมพิวเตอร์ AI ของกล้องที่รองรับ RTSP จะถูกปลดล็อคเมื่อสตรีมวิดีโอถูกป้อนเข้าสู่อุปกรณ์ (เช่น Raspberry-Pi) ที่ใช้ Python, OpenCV ที่ได้รับการฝึกอบรมไว้ล่วงหน้า ชุดข้อมูล COCOหากกล้อง IP ที่มีอยู่ของคุณรองรับ RTSP สิ่งสำคัญคือคุณสามารถทำตามคำแนะนำด้านล่างเพื่อเพิ่มระบบวิชันคอมพิวเตอร์แบบ AI สำหรับการตรวจจับวัตถุเพื่อปรับปรุงประสิทธิภาพการทำงานและความปลอดภัยด้วยโค้ด Python ประมาณ 11 บรรทัดพร้อมด้วยไลบรารี OpenCV
ชุดข้อมูล COCO
COCO ย่อมาจาก Common Objects in Context เป็นชุดข้อมูลการตรวจจับวัตถุ การแบ่งส่วน และการสร้างคำบรรยายขนาดใหญ่ ซึ่งใช้กันอย่างแพร่หลายในการวิจัยและพัฒนาระบบคอมพิวเตอร์วิชัน ต่อไปนี้คือคุณสมบัติหลักบางส่วนของชุดข้อมูล COCO:
- วัตถุที่หลากหลาย: COCO ประกอบด้วยภาพฉากชีวิตประจำวันอันซับซ้อนพร้อมวัตถุต่างๆ ที่ให้บริบทที่หลากหลาย
- หมายเหตุ: ชุดข้อมูลประกอบด้วยคำอธิบายประกอบที่ครอบคลุมสำหรับงานต่างๆ มากมาย:
- การตรวจจับวัตถุ: กรอบขอบเขตและป้ายสำหรับหมวดหมู่วัตถุมากกว่า 80 หมวดหมู่
- การแบ่งส่วน:ทั้งการแบ่งส่วนอินสแตนซ์ (โครงร่างระดับพิกเซลโดยละเอียดสำหรับอินสแตนซ์ของวัตถุแต่ละรายการ) และการแบ่งส่วนทางความหมาย (การจำแนกประเภทในระดับพิกเซลสำหรับประเภทของวัตถุแต่ละประเภท)
- การตรวจจับจุดสำคัญ: คำอธิบายประกอบสำหรับจุดสำคัญของมนุษย์ (เช่น ข้อต่อ เช่น ข้อศอก เข่า) เพื่อการประมาณท่าทาง
- คำบรรยายภาพ: คำบรรยายภาพเพื่อสนับสนุนงานต่างๆ เช่น การสร้างคำอธิบายภาพ
ขนาด: COCO ประกอบด้วยภาพที่มีป้ายกำกับมากกว่า 200,000 ภาพพร้อมอินสแตนซ์ที่มีป้ายกำกับมากกว่า 2.5 ล้านรายการ ทำให้เป็นชุดข้อมูลที่ครอบคลุมมากที่สุดชุดหนึ่งที่มีสำหรับงานการมองเห็นด้วยคอมพิวเตอร์
แผนผังสถาปัตยกรรม
รูปที่ 1: กล้องวงจรปิดกับการประมวลผลภาพคอมพิวเตอร์ด้วย AI
- RTSP สตรีมมิ่ง:กล้อง IP ส่วนใหญ่สามารถสตรีมวิดีโอสดโดยใช้ RTSP
- กำลังประมวลผล:ฟีด RTSP จะถูกส่งไปยังระบบภายนอกที่รัน OpenCV พร้อมด้วยโมเดลที่ผ่านการฝึกอบรมล่วงหน้าจากชุดข้อมูล COCO (เช่น Raspberry-PI)
- การตรวจจับวัตถุ:การตั้งค่านี้ช่วยให้สามารถระบุและจำแนกประเภทได้แบบเรียลไทม์ 80 วัตถุที่รู้จักโดยทั่วไป การใช้ แบบจำลองการตรวจจับวัตถุ YOLO (You Only Look Once)
- ข้อมูลเชิงลึกที่สามารถดำเนินการได้:วัตถุที่ตรวจพบสามารถส่งสัญญาณเตือน ทำให้กระบวนการเป็นอัตโนมัติ และให้ข้อมูลที่มีค่าสำหรับการวิเคราะห์
โค้ดตัวอย่าง
ด้านล่างนี้คือโค้ด Python 11 บรรทัด (เช่น รันใน Raspberry-pi) แสดงให้เห็นว่าการใช้สตรีม RTSP ของกล้อง IP เพื่อตรวจจับวัตถุโดยใช้ชุดข้อมูล COCO นั้นง่ายดายเพียงใด
นำเข้า cv2 นำเข้า cvlib เป็น cv จาก cvlib.object_detection นำเข้า draw_bbox #live ฟีดกล้องจากกล้อง IP ผ่านโปรโตคอลสตรีมมิ่งแบบเรียลไทม์ (RTSP) วิดีโอ = cv2.VideoCapture("rtsp://[ที่อยู่ IP rtsp ของคุณ]/สด") ในขณะที่ True: ret, frame = video.read() bbox, label, conf = cv.detect_common_objects(frame) output_image = draw_bbox(frame, bbox, label, conf) cv2.imshow("Object Detection", output_image) ถ้า cv2.waitKey(1) & 0xFF == ord("q"): break
การประยุกต์ใช้ในโลกแห่งความเป็นจริง
การผสานรวม AI และคอมพิวเตอร์วิชันเข้ากับกล้องที่รองรับ RTSP เปิดโอกาสให้เกิดความเป็นไปได้มากมาย:
- การรักษาความปลอดภัยที่เพิ่มขึ้นตรวจจับการเข้าถึงที่ไม่ได้รับอนุญาต กิจกรรมที่น่าสงสัย หรือวัตถุเฉพาะโดยอัตโนมัติ และแจ้งเตือนเจ้าหน้าที่รักษาความปลอดภัยทันที
- การเพิ่มประสิทธิภาพการขายปลีก:ตรวจสอบพฤติกรรมของลูกค้า จัดการสินค้าคงคลัง และเพิ่มประสิทธิภาพเค้าโครงร้านค้าโดยวิเคราะห์การโต้ตอบกับผลิตภัณฑ์
- การจัดการการจราจร:ปรับปรุงการวางผังเมืองและการควบคุมการจราจรโดยวิเคราะห์การไหลของยานพาหนะและคนเดินเท้า
- ระบบอัตโนมัติทางอุตสาหกรรม:ดูแลกระบวนการผลิต ตรวจสอบการปฏิบัติตามความปลอดภัย และปรับปรุงประสิทธิภาพการทำงานโดยการตรวจจับวัตถุและสิ่งผิดปกติเฉพาะเจาะจง
เพิ่มประสิทธิภาพให้กับกล้อง IP ของคุณด้วย AI
ด้วยการบูรณาการกล้องที่รองรับ RTSP เข้ากับ OpenCV และ YOLO กล้อง IP ของคุณที่รองรับ RTSP ก็จะฉลาดขึ้นทันทีด้วยความสามารถในการตรวจจับวัตถุ AI ช่วยเพิ่มประสิทธิภาพการรักษาความปลอดภัยและประสิทธิภาพการทำงาน
เกี่ยวกับผู้เขียน
เฟลิกซ์ เป็นหัวหน้าฝ่ายวิศวกรรมการขายประจำภูมิภาคเอเชียแปซิฟิกของ Cisco Meraki โดยเป็นผู้นำทีมวิศวกรฝ่ายขายระดับโลกที่มีความมุ่งมั่นในการช่วยให้ลูกค้าปรับปรุงผลลัพธ์ทางธุรกิจด้วย SASE, SD-WAN, ความปลอดภัย, Wi-Fi6, โซลูชันที่ขับเคลื่อนด้วย API, การวิเคราะห์พฤติกรรม, การเฝ้าระวังวิดีโอ และโซลูชันการจัดการอุปกรณ์เคลื่อนที่ (MDM)
เขามีความหลงใหลในเทคโนโลยี ขับเคลื่อนวัฒนธรรมแห่งการเติบโตควบคู่ไปกับการสร้างทีมงานที่มีความรอบรู้
อ้างอิง
- https://youtu.be/V62M9d8QkYM (บทช่วยสอนที่ยอดเยี่ยม)
- https://github.com/AlexeyAB/darknet/blob/master/cfg/yolov7.cfg (ดาวน์โหลด yolo config และ weights)
- รหัสที่มา: https://github.com/Kent-Taylor/object-detection/blob/main/main.py
#ปัญญาประดิษฐ์ #ai #aiml #การเรียนรู้เชิงลึก #opencv #การตรวจจับวัตถุ #การมองเห็นคอมพิวเตอร์ #cocodataset #mscoco #yolo #rtspกล้อง #กล้องอัจฉริยะ #ai #การเขียนโปรแกรม #python #การเรียนรู้ของเครื่องจักร #การพัฒนาซอฟต์แวร์
สมัครสมาชิกเพื่อรับอัปเดตบทความบล็อกล่าสุด
ฝากความคิดเห็นของคุณ: