Bagian apa pun, yang baru-baru ini dirilis oleh Facebook Research, melakukan sesuatu yang menurut sebagian besar orang tenggelam dalam visi komputer menakutkan: mengetahui secara andal piksel mana dalam gambar yang termasuk dalam suatu objek. Membuat ini lebih mudah adalah tujuan dari Segment Anything Model (SAM), yang baru-baru ini dirilis di bawah Lisensi Apache 2.0.
Hasilnya terlihat bagus, dan memang ada Presentasi interaktif tersedia Anda dapat bermain dengan berbagai cara kerja SAM. Seseorang dapat mengambil sesuatu dengan menunjuk dan mengklik gambar, atau gambar dapat dibagi secara otomatis. Sejujurnya, sangat mengesankan melihat SAM membuat penyamaran berbagai objek dalam sebuah gambar tampak begitu mudah. Apa yang memungkinkan ini adalah pembelajaran mesin, dan sebagian dari itu adalah fakta bahwa model di belakang sistem telah dilatih pada kumpulan data besar gambar dan topeng berkualitas tinggi, yang membuatnya sangat efisien dalam fungsinya.
Setelah gambar tersegmentasi, topeng ini dapat digunakan untuk berinteraksi dengan sistem lain seperti deteksi objek (yang mengidentifikasi dan memberi label objek tersebut) dan aplikasi visi komputer lainnya. Sistem ini bekerja lebih kuat jika mereka benar-benar tahu ke mana harus mencari. ini Posting blog dari Meta AI Dia membahas beberapa detail tambahan tentang apa yang mungkin dilakukan dengan SAM, detail lengkapnya masuk makalah penelitian.
Sistem seperti itu mengandalkan kumpulan data berkualitas tinggi. Tentu saja, tidak ada yang mengalahkan banyak data dunia nyata, tetapi kami juga telah melihat bahwa menghasilkan data otomatis yang sebenarnya tidak ada dapat dilakukan, dan mendapatkan hasil yang bermanfaat.
More Stories
PlayStation 5 Pro rencananya akan diumumkan dalam beberapa minggu
Kuo: Peningkatan RAM ke 12GB tahun depan akan terbatas pada iPhone 17 Pro Max
Perusahaan kecerdasan buatan Midjourney sedang menggoda produk perangkat keras dalam bentuk baru