Bergabunglah dengan Leaders di Boston pada tanggal 27 Maret untuk malam eksklusif yang berisi networking, ide, dan percakapan. Minta undangan di sini.
Layanan pembuatan gambar kecerdasan buatan yang terkenal Di tengah penerbangan Ini telah meluncurkan salah satu fitur yang paling banyak diminta: kemampuan untuk membuat ulang karakter secara konsisten di seluruh gambar baru.
Secara alami, hal ini telah menjadi rintangan besar bagi pembuat gambar AI hingga saat ini.
Ini karena sebagian besar pembuat gambar AI mengandalkan “Model difusi“, alat yang mirip dengan atau berdasarkan algoritma pembuatan gambar sumber terbuka Stability AI, Stable Diffusion, yang bekerja secara kasar dengan mengambil teks yang dimasukkan oleh pengguna dan mencoba menyatukan gambar piksel demi piksel yang cocok dengan deskripsi tersebut, seperti yang telah kami lakukan belajar dari eksperimen serupa dengan gambar dan tag teks dalam grup Data pelatihan besar (dan kontroversial) yang terdiri dari jutaan gambar buatan manusia.
Mengapa kepribadian yang konsisten begitu kuat – dan sulit dipahami – bagi AI generatif
Namun, seperti model bahasa berbasis teks (LLM) besar seperti ChatGPT OpenAI atau Command-R baru Cohere, masalah dengan semua aplikasi AI generatif adalah ketidakkonsistenan respons: AI menghasilkan sesuatu yang baru untuk setiap prompt yang dimasukkan ke dalamnya. , meskipun klaim diulangi atau beberapa kata kunci yang sama digunakan.
acara VB
Tur Dampak Kecerdasan Buatan – Boston
Mintalah undangan
Ini bagus untuk membuat konten yang benar-benar baru – dalam kasus Midjourney, gambar. Namun bagaimana jika Anda membuat film, novel, novel grafis, buku komik, atau media visual lain yang Anda sukai Sama Karakter atau karakter yang akan dilalui dan muncul dalam adegan dan latar berbeda, dengan ekspresi wajah dan alat peraga berbeda?
Skenario yang tepat ini, yang biasanya diperlukan untuk kesinambungan narasi, sangat sulit dicapai dengan menggunakan AI generatif – hingga saat ini. Tapi Midjourney sekarang sedang mengatasi masalah itu, memperkenalkan tag baru, “–cref” (kependekan dari “referensi karakter”) yang dapat ditambahkan pengguna di akhir petunjuk teks mereka di Midjourney Discord dan akan mencoba mencocokkan wajah karakter. Fitur, tipe tubuh, dan bahkan pakaian dari URL yang ditempelkan pengguna di tag yang disebutkan berikutnya.
Seiring dengan kemajuan dan peningkatan fitur ini, Midjourney dapat berubah dari sekadar permainan keren atau sumber ide menjadi alat yang lebih profesional.
Cara menggunakan fitur kepribadian baru yang konsisten di Midjourney
Tag ini berfungsi paling baik dengan gambar Midjourney yang dibuat sebelumnya. Jadi, misalnya, alur kerja pengguna adalah membuat atau mengambil URL karakter yang dibuat sebelumnya.
Mari kita mulai dari awal dan katakanlah kita sedang membuat karakter baru dengan perintah ini: “Pria botak dan berotot dengan manik-manik dan penutup mata.”
Kami akan mengupgrade gambar yang paling kami sukai, lalu Control-klik gambar tersebut di server Midjourney Discord untuk menemukan opsi “Salin Tautan”.
Selanjutnya, kita dapat menulis perintah baru di “Kenakan tuksedo putih sambil berdiri di vila -cref.” [URL]” dan tempel URL gambar yang baru saja kita buat, dan Midjourney akan mencoba membuat karakter yang sama dari sebelumnya dalam pengaturan yang baru diketik.
Seperti yang akan Anda lihat, hasilnya jauh dari sesuai dengan angka aslinya (atau bahkan klaim awal kami), namun tentu saja menggembirakan.
Selain itu, pengguna dapat mengontrol sampai batas tertentu “bobot” seberapa dekat gambar baru dihasilkan dengan karakter asli dengan menerapkan tanda “-cw” diikuti dengan angka dari 1 hingga 100 di akhir prompt baru ( setelah “-cref [URL]”, jadi seperti ini:” -cref [URL] – CW 100.” Semakin rendah angka “CW”, semakin besar kontras pada gambar yang dihasilkan. Semakin tinggi angka “CW”, semakin mirip gambar baru yang dihasilkan dengan referensi aslinya.
Seperti yang bisa Anda lihat di contoh kita, memasukkan “cw 8” sangat rendah sebenarnya akan menghasilkan apa yang kita inginkan: tuksedo putih. Meski kini dia sudah melepas penutup mata khas karakter kita.
Ya, tidak ada yang tidak bisa diperbaiki oleh “area berbeda” – bukan?
Ya, penutup matanya dipasang pada mata yang salah… tapi kita sampai di sana!
Anda juga dapat menggabungkan beberapa karakter menjadi satu menggunakan dua tag “–cref” beserta URL masing-masing.
Fitur ini diluncurkan tadi malam, namun artis dan pencipta sedang mengujinya sekarang. Cobalah sendiri jika Anda memiliki Midjourney. Dan baca catatan lengkap pendiri David Holz tentang topik di bawah ini:
Hai @semua orang di sini, kami sedang menguji fitur Referensi Karakter baru hari ini, ini mirip dengan fitur Referensi Pola, hanya saja alih-alih mencocokkan pola referensi, fitur ini mencoba membuat karakter cocok dengan gambar Referensi Karakter.
Bagaimana itu bekerja
- Dia menulis
--cref URL
Setelah Anda dimintai URL gambar profil Anda - Anda dapat gunakan
--cw
Untuk mengatur “kekuatan” referensi dari 100 menjadi 0 - Kekuatan 100 (
--cw 100
) Default dan menggunakan wajah, rambut, dan pakaian - (sangat 0)
--cw 0
) hanya akan fokus pada wajah (baik untuk mengganti baju/rambut dll)
Untuk apa ini dimaksudkan
- Fitur ini berfungsi paling baik bila menggunakan karakter yang dibuat dari gambar Midjourney. Ini tidak dirancang untuk orang/gambar nyata (dan kemungkinan akan mendistorsinya seperti yang dilakukan perintah gambar normal)
- Cref bekerja mirip dengan perintah gambar biasa kecuali bahwa ia “berfokus” pada ciri-ciri karakter
- Keakuratan teknik ini terbatas, teknik ini tidak akan meniru lesung pipit/bintik-bintik/atau logo kemeja dengan tepat.
- Cref bekerja dengan model Niji dan MJ biasa dan juga dapat digabungkan dengan
--sref
Opsi Lanjutan
- Anda dapat menggunakan lebih dari satu URL untuk menggabungkan informasi/karakter dari beberapa gambar seperti ini
--cref URL1 URL2
(Ini mirip dengan beberapa gambar atau petunjuk gaya)
Bagaimana cara kerjanya di web alfa?
- Seret atau tempel gambar ke bilah visualisasi, yang sekarang berisi tiga ikon. Tentukan grup ini apakah berupa vektor gambar, referensi gaya, atau referensi karakter. Shift+Pilih opsi untuk menggunakan gambar untuk beberapa kategori
Ingat, meskipun MJ V6 masih dalam tahap alfa, fitur lain mungkin berubah secara tiba-tiba, namun versi beta resmi dari V6 akan segera hadir. Kami ingin berbagi pemikiran semua orang tentang Ide dan Fitur dan kami harap Anda menikmati rilis awal ini dan kami harap ini membantu Anda saat bermain dalam membangun cerita dan dunia
Misi VentureBeat Ini akan menjadi alun-alun digital bagi para pengambil keputusan teknis untuk mendapatkan pengetahuan tentang teknologi perusahaan yang transformasional dan transaksional. Temukan ringkasan kami.
More Stories
PlayStation 5 Pro rencananya akan diumumkan dalam beberapa minggu
Kuo: Peningkatan RAM ke 12GB tahun depan akan terbatas pada iPhone 17 Pro Max
Perusahaan kecerdasan buatan Midjourney sedang menggoda produk perangkat keras dalam bentuk baru