Tại sao lựa chọn công nghệ 3D Stereo?

Tại sao lại là 3D Stereo? ? Con người cảm nhận trực quan môi trường của họ bằng hai mắt – và rô-bốt cũng vậy ?. Câu trả lời nằm ở một công nghệ gọi là thị giác kép “stereo vision“, cho phép rô-bốt cảm nhận độ sâu bằng cách sử dụng hai camera giống như hai mắt của chúng ta.

Thị giác kép dựa trên thực tế là cùng một đối tượng được nhìn từ hai góc độ khác nhau sẽ xuất hiện ở các vị trí hơi khác nhau trong hai hình ảnh. Bằng cách so sánh vị trí của các đối tượng trong hình ảnh camera bên trái và bên phải, chúng ta có thể tính toán khoảng cách giữa camera và từng đối tượng. Thông tin khoảng cách này là thứ cho phép robot tạo bản đồ 3D về môi trường xung quanh chúng.

Chìa khóa ? khái niệm đằng sau steoreo vision là sự khác biệt. Sự chênh lệch đề cập đến sự dịch chuyển của một điểm đối tượng trong hình ảnh camera bên trái và bên phải. Sự chênh lệch càng lớn, đối tượng càng gần máy ảnh. Ví dụ: nếu bạn giơ ngón tay lên trước mặt và nhắm một mắt, sau đó đổi mắt, bạn sẽ nhận thấy ngón tay của mình có vẻ hơi giật. Đây là sự chênh lệch mà stereo vision dựa vào.

✨ Một trong những lợi ích của stereo vision là công nghệ cảm biến thụ động. Điều này có nghĩa là nó không phát ra bất kỳ tín hiệu nào để đo khoảng cách mà thay vào đó sử dụng ánh sáng mà môi trường phát ra hoặc phản xạ. Điều này làm cho nó trở nên lý tưởng để sử dụng cả trong nhà và ngoài trời và nhiều thiết bị sử dụng stereo vision có thể hoạt động cùng nhau mà không gây nhiễu lẫn nhau.

Tuy nhiên, có một số thách thức đối với stereo vision. Để thuật toán kết hợp 2 camera tìm thấy các điểm đối tượng tương ứng trong hình ảnh camera bên trái và bên phải, phải có kết cấu hoặc thay đổi giá trị cường độ hình ảnh do mẫu hoặc cấu trúc bề mặt trong hình ảnh. Không thể kết hợp 2 camera đối với các vùng hoàn toàn không có kết cấu, chẳng hạn như một bức tường trắng phẳng không có bất kỳ cấu trúc bề mặt nào có thể nhìn thấy được. Vấn đề này có thể được giải quyết bằng cách chiếu một mẫu hình, ví dụ: máy chiếu randomdot của Roboception chiếu vào hiện trường. Mẫu hình không cần phải được hiệu chỉnh hoặc biết. Cấu tạo bề mặt chồng chéo từ nhiều cảm biến không làm giảm hiệu suất. Ngược lại, cấu tạo bề mặt sẽ giúp ích cho thuật toán.

Bạn thấy đấy: Thị giác kép “stereo vision” là một công nghệ mạnh mẽ ? và rất mạnh mẽ cho phép rô-bốt “nhìn” thế giới trong không gian ba chiều. 

Nguồn Roboception: https://www.linkedin.com/feed/update/urn:li:activity:7061639068660453376/