2009-01-09 40 views
5

Làm cách nào để chụp ảnh đối tượng (trong trường hợp này là đối tượng được xác định trước) và phát triển thuật toán để cắt đối tượng đó ra khỏi ảnh với nền có độ phức tạp khác nhau.Nhận dạng hình ảnh và dựng hình 3D

Thêm vào đó, đối tượng của ảnh (nói một ngôi nhà, xe hơi, chó - nhưng luôn luôn có một loại) sẽ cần phải được biến thành hình vẽ 3d. Tôi biết có sẵn các công cụ dựng hình 3D (với chi phí, miễn phí, hoặc với một số điều khoản), nhưng để làm việc này đối tượng (chủ đề) sẽ cần được đo bằng mọi cách - ví dụ: nếu đây là một người, chúng ta cần phải đo chiều cao, độ cong của vai, bán kính mặt, chiều dài của mỗi ngón tay, v.v.

Tính khả thi của việc giải quyết vấn đề này là gì? Có ai biết bất kỳ liên kết tốt nào đặc biệt trong lĩnh vực nghiên cứu này không? Tôi đã nhìn thấy các giải pháp nguồn mở cho vấn đề này khiến tôi có câu hỏi về sự dễ dàng khi đo đối tượng trong khi dò tìm xung quanh nó để cắt nó ra.

Cảm ơn


Về cơ bản tôi muốn đưa ra một hình ảnh 2d (hình ảnh điển hình: đó là dễ dàng hơn một bức ảnh phức tạp có chứa nhiều đối tượng, vv)

http://benmartin3d.com/WIP/Project1/image1small.jpg,

Nhưng hiệu quả Tôi muốn biến nó thành một hình ảnh 3D, vì vậy tôi không muốn làm gì liên quan đến việc xây dựng một công cụ dựng hình/dựng hình 3D?

Hơn nữa, liên kết mà tôi đã cung cấp đi vào 3ds max, với một vài thuộc tính được đặt và hiển thị kết xuất.

+0

Có vẻ như bạn có thể có thêm thông tin/ràng buộc mà bạn không chia sẻ. Trước hết, để làm lại, bạn cần ít nhất hai hình ảnh. Thứ hai việc xây dựng lại chính nó không nói gì về quy mô. Để xác định kích thước của một cái gì đó trong một hình ảnh, bạn phải có một tham chiếu. –

+0

Không hề. Tôi chỉ không biết gì về lĩnh vực này (là một nhà phát triển web chung đầu tiên và quan trọng nhất). Đây là lý do tại sao tôi nhận được ý kiến ​​ở đây và nghiên cứu vấn đề trước khi tôi viết một dòng mã để giải quyết vấn đề này. – dotnetdev

Trả lời

4

Có vẻ như bạn muốn thực hiện một số việc, tất cả trong miền của tầm nhìn máy tính.

  1. Object Recognition (tức là tìm ra đối tượng được xác định trước)
  2. 3D Tái thiết (làm cho các mô hình 3d từ hình ảnh)
  3. Hình ảnh Phân đoạn (cắt ra chỉ là đối tượng bạn đang lo lắng về từ nền)

Tôi đã xếp hạng chúng theo thứ tự dễ nhất đến khó nhất (theo hiểu biết hạn chế của tôi). Tất cả cùng nhau tôi sẽ nói đó là một vấn đề rất phức tạp. Tôi sẽ xem xét các liên kết Wikipedia sau để biết thêm thông tin:

Computer Vision Overview (Wikipedia)

The Eight Point Algorithm (for 3d reconstruction)

Image Segmentation

+1

Phân đoạn hình ảnh không khó, nếu bạn có thể giả định những gì bạn đang phân đoạn tuân theo các quy tắc nhất định. Ví dụ tôi nhớ từ trường là các hạt gạo được chụp ảnh khi chúng tiến hành dọc theo băng tải. Thông qua phân khúc, kích thước và chất lượng của chúng có thể được đo lường. –

+1

Tôi đồng ý rằng phân đoạn có thể đơn giản trong một môi trường bị hạn chế cao như một nhà máy có các đối tượng rất đồng nhất. Nhưng nói chung vấn đề phân khúc đối tượng là khó khăn. –

0

Giả sử nó có thể, đó sẽ là vô cùng khó khăn, đặc biệt là với chỉ một hình ảnh của đối tượng. Rasterizer phải đoán ở độ sâu và khoảng cách của vật thể.

Điều bạn mô tả âm thanh rất giống với Microsoft PhotoSynth.

1

Bạn nói đúng đây là một tập hợp cực kỳ khó khăn, đặc biệt là việc suy ra thông tin 3D từ một hình ảnh 2D. Chỉ có một sự hiểu biết rất hạn chế về cách hệ thống thị giác của chúng tôi ngoại suy thông tin 3D từ hình ảnh 2D, một cách tiếp cận như vậy được gọi là "Shape from Shading" và tìm kiếm google được liên kết cho biết có bao nhiêu (và do đó ít) chúng ta biết.

Rob

1

Đây là một nhiệm vụ rất khó khăn. Phần khó nhất là không nhận ra hoặc phân đoạn đối tượng khỏi hình ảnh, mà là suy luận hình học 3-D của đối tượng từ hình ảnh 2 chiều. Bạn sẽ có nhiều thành công hơn nếu bạn có thể sử dụng máy ảnh lập thể (hoặc máy quét laze, nếu bạn có quyền truy cập vào một máy ảnh);

Đối với trường hợp hình ảnh 2-D, hãy thử googling cho "hình dạng-từ-che". Đây là một phương pháp để suy ra hình dạng 3-D từ hình ảnh 2 chiều. Nó làm cho giả định về điều kiện chiếu sáng và tính chất bề mặt (BRDF và hình học) có thể thất bại trong nhiều trường hợp, nhưng nếu bạn đang sử dụng nó chỉ cho một lớp đối tượng được xác định trước (ví dụ như khuôn mặt người) nó có thể hoạt động tốt.

Các vấn đề liên quan