Bộ dữ liệu ô tô Stanford
Bối cảnh
Các biểu diễn đối tượng 3D là tài nguyên có giá trị để phát hiện lớp đối tượng đa khung nhìn và hiểu cảnh. Nhận dạng chi tiết là một lĩnh vực con đang phát triển của thị giác máy tính có nhiều ứng dụng trong thế giới thực để phân biệt sự khác biệt về ngoại hình tinh tế. Bộ dữ liệu về ô tô này chứa các bộ thử nghiệm và đào tạo tuyệt vời để hình thành các mô hình có thể phân biệt các ô tô với nhau. Dữ liệu có nguồn gốc từ Phòng thí nghiệm AI của Đại học Stanford (tham khảo cụ thể bên dưới trong phần Lời cảm ơn).
Nội dung
Bộ dữ liệu Ô tô chứa 16.185 hình ảnh của 196 loại ô tô. Dữ liệu được chia thành 8.144 hình ảnh huấn luyện và 8.041 hình ảnh thử nghiệm, trong đó mỗi lớp được chia đại khái theo tỷ lệ 50-50. Các lớp thường ở cấp độ Make, Model, Year, ex. 2012 Tesla Model S hoặc 2012 BMW M3 coupe.
Sự nhìn nhận
Nguồn dữ liệu và hình ảnh biểu ngữ: http://ai.stanford.edu/~jkrause/cars/car_dataset.html chứa tất cả các hộp giới hạn và nhãn cho cả đào tạo và kiểm tra.
Nếu bạn sử dụng tập dữ liệu này, vui lòng trích dẫn bài báo sau:
Biểu diễn đối tượng 3D để phân loại chi tiết
Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
Hội thảo IEEE lần thứ 4 về Biểu diễn và Nhận dạng 3D, tại ICCV 2013 (3dRR-13). Sydney, Úc. Ngày 8 tháng 12 năm 2013.
Cảm hứng
- Bạn có thể tạo thành một mô hình có thể cho biết sự khác biệt giữa các loại ô tô theo loại hoặc màu sắc không?
- Những chiếc xe nào được sản xuất bởi Tesla vs BMW?