Trong thế giới phát triển nhanh như ngày nay, chỉ có camera giám sát là không đủ. Sẽ thế nào nếu camera của bạn không chỉ có thể ghi lại mà còn có thể hiểu và diễn giải những gì chúng nhìn thấy?
Đây không phải là viễn cảnh của tương lai—mà đang diễn ra ngay bây giờ. Bằng cách tận dụng trí tuệ nhân tạo (AI) và máy học, camera có khả năng phát trực tuyến theo thời gian thực (RTSP) của bạn có thể được chuyển đổi thành hệ thống giám sát thông minh, mạnh mẽ.
Sức mạnh và sự đơn giản của AI Computer Vision
Tầm nhìn máy tính AI của camera có khả năng RTSP được mở khóa khi luồng video được đưa vào thiết bị (ví dụ Raspberry-Pi) chạy Python, OpenCV với được đào tạo trước Bộ dữ liệu COCO. Nếu camera IP hiện tại của bạn có khả năng RTSP, bạn có thể làm theo hướng dẫn bên dưới để thêm công nghệ thị giác máy tính AI nhằm phát hiện đối tượng nhằm cải thiện hiệu quả hoạt động và bảo mật với khoảng 11 dòng mã Python cùng thư viện OpenCV.
Bộ dữ liệu COCO
COCO là viết tắt của Common Objects in Context, là một tập dữ liệu phát hiện, phân đoạn và chú thích đối tượng quy mô lớn. Nó được sử dụng rộng rãi trong nghiên cứu và phát triển thị giác máy tính. Sau đây là một số tính năng chính của tập dữ liệu COCO:
- Các đối tượng đa dạng: COCO chứa hình ảnh về những cảnh đời thường phức tạp với nhiều đồ vật khác nhau, cung cấp nhiều bối cảnh khác nhau.
- Chú thích: Bộ dữ liệu bao gồm các chú thích mở rộng cho một số tác vụ:
- Phát hiện đối tượng: Hộp giới hạn và nhãn cho hơn 80 danh mục đối tượng.
- Phân đoạn: Cả phân đoạn trường hợp (phác thảo chi tiết ở cấp độ pixel cho từng trường hợp đối tượng) và phân đoạn ngữ nghĩa (phân loại ở cấp độ pixel cho từng loại đối tượng).
- Phát hiện điểm chính: Chú thích cho các điểm chính của con người (ví dụ: các khớp như khuỷu tay, đầu gối) để ước tính tư thế.
- Chú thích hình ảnh: Chú thích mô tả cho hình ảnh để hỗ trợ các tác vụ như tạo mô tả hình ảnh.
Kích thước: COCO bao gồm hơn 200.000 hình ảnh được gắn nhãn với hơn 2,5 triệu trường hợp được gắn nhãn, khiến nó trở thành một trong những tập dữ liệu toàn diện nhất hiện có cho các tác vụ thị giác máy tính.
Sơ đồ kiến trúc
Hình 1: Camera an ninh để xử lý thị giác máy tính AI
- Phát trực tuyến RTSP: Hầu hết các camera IP có thể truyền phát video trực tiếp bằng RTSP
- Xử lý: Nguồn cấp dữ liệu RTSP được định tuyến đến một hệ thống bên ngoài chạy OpenCV, được trang bị các mô hình được đào tạo trước từ tập dữ liệu COCO (ví dụ: Raspberry-PI)
- Phát hiện đối tượng: Thiết lập này cho phép nhận dạng và phân loại theo thời gian thực 80 đồ vật thường được nhận biết sử dụng Mô hình phát hiện đối tượng YOLO (Bạn chỉ nhìn một lần).
- Thông tin chi tiết có thể hành động:Các đối tượng được phát hiện có thể kích hoạt cảnh báo, tự động hóa quy trình và cung cấp dữ liệu có giá trị để phân tích.
Đoạn mã
11 dòng mã python bên dưới (ví dụ chạy trên Raspberry-pi) cho thấy cách sử dụng luồng RTSP của camera IP để phát hiện vật thể bằng bộ dữ liệu COCO đơn giản như thế nào.
import cv2 import cvlib as cv from cvlib.object_detection import draw_bbox #live camera feed từ camera IP qua Giao thức phát trực tuyến thời gian thực (RTSP) video = cv2.VideoCapture("rtsp://[địa chỉ ip rtsp của bạn]/live") while True: ret, frame = video.read() bbox, label, conf = cv.detect_common_objects(frame) output_image = draw_bbox(frame, bbox, label, conf) cv2.imshow("Phát hiện đối tượng", output_image) if cv2.waitKey(1) & 0xFF == ord("q"): break
Ứng dụng trong thế giới thực
Việc tích hợp AI và thị giác máy tính với camera có hỗ trợ RTSP mở ra nhiều khả năng:
- Tăng cường bảo mật: Tự động phát hiện truy cập trái phép, hoạt động đáng ngờ hoặc các đối tượng cụ thể và ngay lập tức cảnh báo cho nhân viên an ninh.
- Tối ưu hóa bán lẻ: Theo dõi hành vi của khách hàng, quản lý hàng tồn kho và tối ưu hóa cách bố trí cửa hàng bằng cách phân tích các tương tác với sản phẩm.
- Quản lý giao thông:Cải thiện quy hoạch đô thị và kiểm soát giao thông bằng cách phân tích luồng xe cộ và người đi bộ.
- Tự động hóa công nghiệp:Giám sát các quy trình sản xuất, theo dõi việc tuân thủ an toàn và cải thiện hiệu quả hoạt động bằng cách phát hiện các đối tượng và bất thường cụ thể.
Tăng cường sức mạnh cho camera IP của bạn ngay bây giờ với AI
Bằng cách tích hợp camera có hỗ trợ RTSP với OpenCV và YOLO, camera IP có hỗ trợ RTSP của bạn có thể trở nên thông minh hơn ngay lập tức với khả năng phát hiện đối tượng bằng AI, giúp tăng cường bảo mật và hiệu quả hoạt động.
Về tác giả
Felix là Trưởng phòng Kỹ thuật bán hàng khu vực Châu Á - Thái Bình Dương tại Cisco Meraki, lãnh đạo một nhóm kỹ sư bán hàng đẳng cấp thế giới và đầy nhiệt huyết để giúp khách hàng cải thiện kết quả kinh doanh với các giải pháp SASE, SD-WAN, bảo mật, Wi-Fi6, dựa trên API, phân tích hành vi, giám sát video và quản lý thiết bị di động (MDM).
Anh ấy đam mê công nghệ, thúc đẩy văn hóa tăng trưởng đồng thời xây dựng các đội ngũ toàn diện.
Tài liệu tham khảo
- https://youtu.be/V62M9d8QkYM (Hướng dẫn tuyệt vời)
- https://github.com/AlexeyAB/darknet/blob/master/cfg/yolov7.cfg (tải xuống cấu hình và trọng số yolo)
- Mã nguồn: https://github.com/Kent-Taylor/object-detection/blob/main/main.py
#rí tuệ nhân tạo #ai #aiml #học sâu #opencv #Phát hiện đối tượng #Tầm nhìn máy tính #cocobộ dữ liệu #mscoco #yolo #rtspcameras #camera thông minh #ai#Lập trình #python #học máy #Phát triển phần mềm
Đăng ký để nhận thông tin cập nhật bài viết mới nhất trên blog
Để lại bình luận của bạn: