Untuk pertama kalinya, Midjourney memberikan kepribadian yang konsisten untuk gambar AI publik

Bergabunglah dengan Leaders di Boston pada tanggal 27 Maret untuk malam eksklusif yang berisi networking, ide, dan percakapan. Minta undangan di sini.

Layanan pembuatan gambar kecerdasan buatan yang terkenal Di tengah penerbangan Ini telah meluncurkan salah satu fitur yang paling banyak diminta: kemampuan untuk membuat ulang karakter secara konsisten di seluruh gambar baru.

Secara alami, hal ini telah menjadi rintangan besar bagi pembuat gambar AI hingga saat ini.

Ini karena sebagian besar pembuat gambar AI mengandalkan “Model difusi“, alat yang mirip dengan atau berdasarkan algoritma pembuatan gambar sumber terbuka Stability AI, Stable Diffusion, yang bekerja secara kasar dengan mengambil teks yang dimasukkan oleh pengguna dan mencoba menyatukan gambar piksel demi piksel yang cocok dengan deskripsi tersebut, seperti yang telah kami lakukan belajar dari eksperimen serupa dengan gambar dan tag teks dalam grup Data pelatihan besar (dan kontroversial) yang terdiri dari jutaan gambar buatan manusia.

Mengapa kepribadian yang konsisten begitu kuat – dan sulit dipahami – bagi AI generatif

Namun, seperti model bahasa berbasis teks (LLM) besar seperti ChatGPT OpenAI atau Command-R baru Cohere, masalah dengan semua aplikasi AI generatif adalah ketidakkonsistenan respons: AI menghasilkan sesuatu yang baru untuk setiap prompt yang dimasukkan ke dalamnya. , meskipun klaim diulangi atau beberapa kata kunci yang sama digunakan.

acara VB

Tur Dampak Kecerdasan Buatan – Boston

Kami sangat bersemangat untuk perhentian berikutnya di AI Impact Tour di Boston pada tanggal 27 Maret. Acara eksklusif dan hanya disponsori ini, bekerja sama dengan Microsoft, akan mencakup diskusi tentang praktik terbaik untuk integrasi data pada tahun 2024 dan seterusnya. Tempat terbatas, jadi mintalah undangan hari ini.

Mintalah undangan

Ini bagus untuk membuat konten yang benar-benar baru – dalam kasus Midjourney, gambar. Namun bagaimana jika Anda membuat film, novel, novel grafis, buku komik, atau media visual lain yang Anda sukai Sama Karakter atau karakter yang akan dilalui dan muncul dalam adegan dan latar berbeda, dengan ekspresi wajah dan alat peraga berbeda?

Skenario yang tepat ini, yang biasanya diperlukan untuk kesinambungan narasi, sangat sulit dicapai dengan menggunakan AI generatif – hingga saat ini. Tapi Midjourney sekarang sedang mengatasi masalah itu, memperkenalkan tag baru, “–cref” (kependekan dari “referensi karakter”) yang dapat ditambahkan pengguna di akhir petunjuk teks mereka di Midjourney Discord dan akan mencoba mencocokkan wajah karakter. Fitur, tipe tubuh, dan bahkan pakaian dari URL yang ditempelkan pengguna di tag yang disebutkan berikutnya.

Seiring dengan kemajuan dan peningkatan fitur ini, Midjourney dapat berubah dari sekadar permainan keren atau sumber ide menjadi alat yang lebih profesional.

Cara menggunakan fitur kepribadian baru yang konsisten di Midjourney

Tag ini berfungsi paling baik dengan gambar Midjourney yang dibuat sebelumnya. Jadi, misalnya, alur kerja pengguna adalah membuat atau mengambil URL karakter yang dibuat sebelumnya.

Mari kita mulai dari awal dan katakanlah kita sedang membuat karakter baru dengan perintah ini: “Pria botak dan berotot dengan manik-manik dan penutup mata.”

Kami akan mengupgrade gambar yang paling kami sukai, lalu Control-klik gambar tersebut di server Midjourney Discord untuk menemukan opsi “Salin Tautan”.

Selanjutnya, kita dapat menulis perintah baru di “Kenakan tuksedo putih sambil berdiri di vila -cref.” [URL]” dan tempel URL gambar yang baru saja kita buat, dan Midjourney akan mencoba membuat karakter yang sama dari sebelumnya dalam pengaturan yang baru diketik.

Seperti yang akan Anda lihat, hasilnya jauh dari sesuai dengan angka aslinya (atau bahkan klaim awal kami), namun tentu saja menggembirakan.

Selain itu, pengguna dapat mengontrol sampai batas tertentu “bobot” seberapa dekat gambar baru dihasilkan dengan karakter asli dengan menerapkan tanda “-cw” diikuti dengan angka dari 1 hingga 100 di akhir prompt baru ( setelah “-cref [URL]”, jadi seperti ini:” -cref [URL] – CW 100.” Semakin rendah angka “CW”, semakin besar kontras pada gambar yang dihasilkan. Semakin tinggi angka “CW”, semakin mirip gambar baru yang dihasilkan dengan referensi aslinya.

Seperti yang bisa Anda lihat di contoh kita, memasukkan “cw 8” sangat rendah sebenarnya akan menghasilkan apa yang kita inginkan: tuksedo putih. Meski kini dia sudah melepas penutup mata khas karakter kita.

Ya, tidak ada yang tidak bisa diperbaiki oleh “area berbeda” – bukan?

Ya, penutup matanya dipasang pada mata yang salah… tapi kita sampai di sana!

Anda juga dapat menggabungkan beberapa karakter menjadi satu menggunakan dua tag “–cref” beserta URL masing-masing.

Fitur ini diluncurkan tadi malam, namun artis dan pencipta sedang mengujinya sekarang. Cobalah sendiri jika Anda memiliki Midjourney. Dan baca catatan lengkap pendiri David Holz tentang topik di bawah ini:

Hai @semua orang di sini, kami sedang menguji fitur Referensi Karakter baru hari ini, ini mirip dengan fitur Referensi Pola, hanya saja alih-alih mencocokkan pola referensi, fitur ini mencoba membuat karakter cocok dengan gambar Referensi Karakter.

Bagaimana itu bekerja

Dia menulis --cref URL Setelah Anda dimintai URL gambar profil Anda
Anda dapat gunakan --cw Untuk mengatur “kekuatan” referensi dari 100 menjadi 0
Kekuatan 100 (--cw 100) Default dan menggunakan wajah, rambut, dan pakaian
(sangat 0)--cw 0) hanya akan fokus pada wajah (baik untuk mengganti baju/rambut dll)

Untuk apa ini dimaksudkan

Fitur ini berfungsi paling baik bila menggunakan karakter yang dibuat dari gambar Midjourney. Ini tidak dirancang untuk orang/gambar nyata (dan kemungkinan akan mendistorsinya seperti yang dilakukan perintah gambar normal)
Cref bekerja mirip dengan perintah gambar biasa kecuali bahwa ia “berfokus” pada ciri-ciri karakter
Keakuratan teknik ini terbatas, teknik ini tidak akan meniru lesung pipit/bintik-bintik/atau logo kemeja dengan tepat.
Cref bekerja dengan model Niji dan MJ biasa dan juga dapat digabungkan dengan --sref

Opsi Lanjutan

Anda dapat menggunakan lebih dari satu URL untuk menggabungkan informasi/karakter dari beberapa gambar seperti ini --cref URL1 URL2 (Ini mirip dengan beberapa gambar atau petunjuk gaya)

Bagaimana cara kerjanya di web alfa?

Seret atau tempel gambar ke bilah visualisasi, yang sekarang berisi tiga ikon. Tentukan grup ini apakah berupa vektor gambar, referensi gaya, atau referensi karakter. Shift+Pilih opsi untuk menggunakan gambar untuk beberapa kategori

Ingat, meskipun MJ V6 masih dalam tahap alfa, fitur lain mungkin berubah secara tiba-tiba, namun versi beta resmi dari V6 akan segera hadir. Kami ingin berbagi pemikiran semua orang tentang ⁠Ide dan Fitur dan kami harap Anda menikmati rilis awal ini dan kami harap ini membantu Anda saat bermain dalam membangun cerita dan dunia

Misi VentureBeat Ini akan menjadi alun-alun digital bagi para pengambil keputusan teknis untuk mendapatkan pengetahuan tentang teknologi perusahaan yang transformasional dan transaksional. Temukan ringkasan kami.

Ayhan

“Web nerd. General bacon practitioner. Social media ninja. Award-winning coffee specialist. Food advocate.”

Mengapa kepribadian yang konsisten begitu kuat – dan sulit dipahami – bagi AI generatif

acara VB

Cara menggunakan fitur kepribadian baru yang konsisten di Midjourney

Kini iPhone Eropa menjadi lebih menyenangkan

Penawaran Harian: Apple iPad, Octopath Traveler II, Razer Wolverine V2, dan banyak lagi

PlayStation 5 Pro rencananya akan diumumkan dalam beberapa minggu

Kanada mengenakan tarif 100% pada impor mobil listrik Tiongkok

Jejak kaki dinosaurus yang identik ditemukan di dua benua

Federico Chiesa menyelesaikan kepindahannya ke Liverpool dari Juventus

Kini iPhone Eropa menjadi lebih menyenangkan

Mengapa kepribadian yang konsisten begitu kuat – dan sulit dipahami – bagi AI generatif

acara VB

Cara menggunakan fitur kepribadian baru yang konsisten di Midjourney

Tinggalkan Balasan Batalkan balasan

More Stories

Kini iPhone Eropa menjadi lebih menyenangkan

Penawaran Harian: Apple iPad, Octopath Traveler II, Razer Wolverine V2, dan banyak lagi

PlayStation 5 Pro rencananya akan diumumkan dalam beberapa minggu

You may have missed

Kanada mengenakan tarif 100% pada impor mobil listrik Tiongkok

Jejak kaki dinosaurus yang identik ditemukan di dua benua

Federico Chiesa menyelesaikan kepindahannya ke Liverpool dari Juventus

Kini iPhone Eropa menjadi lebih menyenangkan