ในโลกยุคปัจจุบันที่ทุกอย่างดำเนินไปอย่างรวดเร็ว การมีกล้องวงจรปิดเพียงอย่างเดียวไม่เพียงพอ แล้วถ้ากล้องของคุณไม่เพียงแต่บันทึกภาพได้เท่านั้น แต่ยังเข้าใจและตีความสิ่งที่กล้องมองเห็นได้อีกด้วยล่ะจะเป็นอย่างไร

นี่ไม่ใช่ภาพอนาคต แต่เป็นสิ่งที่เกิดขึ้นแล้วในปัจจุบัน การใช้ปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่องจักรทำให้กล้องที่รองรับโปรโตคอลสตรีมมิ่งแบบเรียลไทม์ (RTSP) ของคุณสามารถเปลี่ยนเป็นระบบเฝ้าระวังอัจฉริยะที่ทรงพลังได้

พลังและความเรียบง่ายของ AI Computer Vision

การมองเห็นคอมพิวเตอร์ AI ของกล้องที่รองรับ RTSP จะถูกปลดล็อคเมื่อสตรีมวิดีโอถูกป้อนเข้าสู่อุปกรณ์ (เช่น Raspberry-Pi) ที่ใช้ Python, OpenCV ที่ได้รับการฝึกอบรมไว้ล่วงหน้า ชุดข้อมูล COCOหากกล้อง IP ที่มีอยู่ของคุณรองรับ RTSP สิ่งสำคัญคือคุณสามารถทำตามคำแนะนำด้านล่างเพื่อเพิ่มระบบวิชันคอมพิวเตอร์แบบ AI สำหรับการตรวจจับวัตถุเพื่อปรับปรุงประสิทธิภาพการทำงานและความปลอดภัยด้วยโค้ด Python ประมาณ 11 บรรทัดพร้อมด้วยไลบรารี OpenCV

ชุดข้อมูล COCO

COCO ย่อมาจาก Common Objects in Context เป็นชุดข้อมูลการตรวจจับวัตถุ การแบ่งส่วน และการสร้างคำบรรยายขนาดใหญ่ ซึ่งใช้กันอย่างแพร่หลายในการวิจัยและพัฒนาระบบคอมพิวเตอร์วิชัน ต่อไปนี้คือคุณสมบัติหลักบางส่วนของชุดข้อมูล COCO:

  • วัตถุที่หลากหลาย: COCO ประกอบด้วยภาพฉากชีวิตประจำวันอันซับซ้อนพร้อมวัตถุต่างๆ ที่ให้บริบทที่หลากหลาย
  • หมายเหตุ: ชุดข้อมูลประกอบด้วยคำอธิบายประกอบที่ครอบคลุมสำหรับงานต่างๆ มากมาย:
    • การตรวจจับวัตถุ: กรอบขอบเขตและป้ายสำหรับหมวดหมู่วัตถุมากกว่า 80 หมวดหมู่
    • การแบ่งส่วน:ทั้งการแบ่งส่วนอินสแตนซ์ (โครงร่างระดับพิกเซลโดยละเอียดสำหรับอินสแตนซ์ของวัตถุแต่ละรายการ) และการแบ่งส่วนทางความหมาย (การจำแนกประเภทในระดับพิกเซลสำหรับประเภทของวัตถุแต่ละประเภท)
    • การตรวจจับจุดสำคัญ: คำอธิบายประกอบสำหรับจุดสำคัญของมนุษย์ (เช่น ข้อต่อ เช่น ข้อศอก เข่า) เพื่อการประมาณท่าทาง
    • คำบรรยายภาพ: คำบรรยายภาพเพื่อสนับสนุนงานต่างๆ เช่น การสร้างคำอธิบายภาพ

ขนาด: COCO ประกอบด้วยภาพที่มีป้ายกำกับมากกว่า 200,000 ภาพพร้อมอินสแตนซ์ที่มีป้ายกำกับมากกว่า 2.5 ล้านรายการ ทำให้เป็นชุดข้อมูลที่ครอบคลุมมากที่สุดชุดหนึ่งที่มีสำหรับงานการมองเห็นด้วยคอมพิวเตอร์

แผนผังสถาปัตยกรรม

รูปที่ 1: กล้องวงจรปิดกับการประมวลผลภาพคอมพิวเตอร์ด้วย AI

  1. RTSP สตรีมมิ่ง:กล้อง IP ส่วนใหญ่สามารถสตรีมวิดีโอสดโดยใช้ RTSP
  2. กำลังประมวลผล:ฟีด RTSP จะถูกส่งไปยังระบบภายนอกที่รัน OpenCV พร้อมด้วยโมเดลที่ผ่านการฝึกอบรมล่วงหน้าจากชุดข้อมูล COCO (เช่น Raspberry-PI)
  3. การตรวจจับวัตถุ:การตั้งค่านี้ช่วยให้สามารถระบุและจำแนกประเภทได้แบบเรียลไทม์ 80 วัตถุที่รู้จักโดยทั่วไป การใช้ แบบจำลองการตรวจจับวัตถุ YOLO (You Only Look Once)
  4. ข้อมูลเชิงลึกที่สามารถดำเนินการได้:วัตถุที่ตรวจพบสามารถส่งสัญญาณเตือน ทำให้กระบวนการเป็นอัตโนมัติ และให้ข้อมูลที่มีค่าสำหรับการวิเคราะห์

โค้ดตัวอย่าง

ด้านล่างนี้คือโค้ด Python 11 บรรทัด (เช่น รันใน Raspberry-pi) แสดงให้เห็นว่าการใช้สตรีม RTSP ของกล้อง IP เพื่อตรวจจับวัตถุโดยใช้ชุดข้อมูล COCO นั้นง่ายดายเพียงใด

นำเข้า cv2 นำเข้า cvlib เป็น cv จาก cvlib.object_detection นำเข้า draw_bbox #live ฟีดกล้องจากกล้อง IP ผ่านโปรโตคอลสตรีมมิ่งแบบเรียลไทม์ (RTSP) วิดีโอ = cv2.VideoCapture("rtsp://[ที่อยู่ IP rtsp ของคุณ]/สด") ในขณะที่ True: ret, frame = video.read() bbox, label, conf = cv.detect_common_objects(frame) output_image = draw_bbox(frame, bbox, label, conf) cv2.imshow("Object Detection", output_image) ถ้า cv2.waitKey(1) & 0xFF == ord("q"): break

การประยุกต์ใช้ในโลกแห่งความเป็นจริง

การผสานรวม AI และคอมพิวเตอร์วิชันเข้ากับกล้องที่รองรับ RTSP เปิดโอกาสให้เกิดความเป็นไปได้มากมาย:

  • การรักษาความปลอดภัยที่เพิ่มขึ้นตรวจจับการเข้าถึงที่ไม่ได้รับอนุญาต กิจกรรมที่น่าสงสัย หรือวัตถุเฉพาะโดยอัตโนมัติ และแจ้งเตือนเจ้าหน้าที่รักษาความปลอดภัยทันที
  • การเพิ่มประสิทธิภาพการขายปลีก:ตรวจสอบพฤติกรรมของลูกค้า จัดการสินค้าคงคลัง และเพิ่มประสิทธิภาพเค้าโครงร้านค้าโดยวิเคราะห์การโต้ตอบกับผลิตภัณฑ์
  • การจัดการการจราจร:ปรับปรุงการวางผังเมืองและการควบคุมการจราจรโดยวิเคราะห์การไหลของยานพาหนะและคนเดินเท้า
  • ระบบอัตโนมัติทางอุตสาหกรรม:ดูแลกระบวนการผลิต ตรวจสอบการปฏิบัติตามความปลอดภัย และปรับปรุงประสิทธิภาพการทำงานโดยการตรวจจับวัตถุและสิ่งผิดปกติเฉพาะเจาะจง

เพิ่มประสิทธิภาพให้กับกล้อง IP ของคุณด้วย AI

ด้วยการบูรณาการกล้องที่รองรับ RTSP เข้ากับ OpenCV และ YOLO กล้อง IP ของคุณที่รองรับ RTSP ก็จะฉลาดขึ้นทันทีด้วยความสามารถในการตรวจจับวัตถุ AI ช่วยเพิ่มประสิทธิภาพการรักษาความปลอดภัยและประสิทธิภาพการทำงาน 

เกี่ยวกับผู้เขียน

เฟลิกซ์ เป็นหัวหน้าฝ่ายวิศวกรรมการขายประจำภูมิภาคเอเชียแปซิฟิกของ Cisco Meraki โดยเป็นผู้นำทีมวิศวกรฝ่ายขายระดับโลกที่มีความมุ่งมั่นในการช่วยให้ลูกค้าปรับปรุงผลลัพธ์ทางธุรกิจด้วย SASE, SD-WAN, ความปลอดภัย, Wi-Fi6, โซลูชันที่ขับเคลื่อนด้วย API, การวิเคราะห์พฤติกรรม, การเฝ้าระวังวิดีโอ และโซลูชันการจัดการอุปกรณ์เคลื่อนที่ (MDM)

เขามีความหลงใหลในเทคโนโลยี ขับเคลื่อนวัฒนธรรมแห่งการเติบโตควบคู่ไปกับการสร้างทีมงานที่มีความรอบรู้

อ้างอิง

  1. https://youtu.be/V62M9d8QkYM (บทช่วยสอนที่ยอดเยี่ยม)
  2. https://github.com/AlexeyAB/darknet/blob/master/cfg/yolov7.cfg (ดาวน์โหลด yolo config และ weights)
  3. รหัสที่มา: https://github.com/Kent-Taylor/object-detection/blob/main/main.py

#ปัญญาประดิษฐ์ #ai #aiml #การเรียนรู้เชิงลึก #opencv #การตรวจจับวัตถุ #การมองเห็นคอมพิวเตอร์ #cocodataset #mscoco #yolo #rtspกล้อง #กล้องอัจฉริยะ #ai #การเขียนโปรแกรม #python #การเรียนรู้ของเครื่องจักร #การพัฒนาซอฟต์แวร์

โพสโดย พิธีกร
โพสก่อนหน้า
คุณอาจชอบเช่นกัน

ฝากความคิดเห็นของคุณ:

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *