Lihatlah Seni Generatif Al yang baharu

Seni Generatif Al ialah sejenis seni, dalam kebanyakan kes visual, yang berasaskan kerjasama antara manusia dan sistem autonomi. “Sistem autonomi” ditakrifkan sebagai Kepintaran Buatan perisian, algoritma atau model yang mampu melaksanakan operasi yang kompleks tanpa memerlukan campur tangan pengaturcara.

Daripada penjajaran pelik imej yang dicipta oleh Dall-E Mini kepada Nft pasaran, imej yang dihasilkan oleh algoritma AI semakin memasuki imaginasi arus perdana. Sebenarnya, dua projek penting mengenai subjek yang patut dianalisis ialah: Pertengahan perjalanan and DALL-E2.

Sudah tentu, berita itu juga telah sampai ke Twitter. Mengulas mengenainya, antara lain, ialah Charles Hoskinson, yang menulis:

Seni yang dihasilkan AI. Saya dapat membuat gambar ini dalam beberapa minit sahaja. Saya tidak dapat bayangkan betapa hebatnya teknologi ini dalam masa 3 tahun pic.twitter.com/jOToCZj7ki
- Charles Hoskinson (@IOHK_Charles) Februari 1, 2023

Seni Generatif Al: eksperimen dan ciri awal

Setelah memahami apa itu Seni Generatif, adalah penting untuk menekankan salah satu prinsip pengasasnya: rawak. Yang merupakan sifat asas Seni Generatif.

Malah, bergantung pada jenis perisian, sistem autonomi mampu memproses hasil yang sentiasa berbeza dan unik setiap kali arahan jana dilaksanakan, atau ia boleh mengembalikan bilangan keputusan yang berubah-ubah sebagai tindak balas kepada input pengguna.

Eksperimen pertama dalam Seni Generatif bermula pada tahun 1960-an dengan eksperimen Harold Cohen dan beliau AARON program. Cohen mula-mula menggunakan perisian bersendirian untuk menjana karya seni abstrak yang diilhamkan oleh silkscreens Seni Pop. Karya Cohen kini dipamerkan di Galeri Tate di London.

Satu lagi sifat Seni Generatif, tetapi satu lagi yang semakin kurang prerogatif, ialah pengulangan corak atau elemen abstrak yang disediakan oleh pengaturcara dan dilaksanakan dalam kod perisian.

Di samping itu, pembangunan rangkaian saraf yang semakin kompleks yang beroperasi pada perkaitan imej teks telah membolehkan pembangunan model generatif yang mampu mencipta imej yang semakin realistik dan tepat. Contoh paling terkenal bagi kategori Seni Generatif ini ialah Papak.

Dall-E ialah rangkaian neural multimodal berdasarkan GPT-3 model pembelajaran mendalam daripada OpenAI, syarikat yang sama yang juga baru-baru ini dibangunkan SembangGPT, chatbot yang dilancarkan pada November 2022 dan dioptimumkan dengan “diawasi” dan teknik pembelajaran pengukuhan.

Kembali ke Dall-E, kita melihat bahawa sistem ini mampu menghasilkan imej daripada penerangan teks, dipanggil "segera," berdasarkan set data pasangan imej teks.

Versi pertama Dall-E, yang dipersembahkan kepada umum pada Januari 2021 dan kekal sebagai hak prerogatif sebilangan kecil profesional dalam bidang itu, mewakili revolusi sebenar dari segi model generatif jenis ini, mengatasi inovasi GPT- 3 sendiri.

Juga penting ialah hakikat bahawa ketepatan keputusan yang diproses oleh Dall-E terbukti menjadi skop yang sempurna untuk penyelesaian OpenAI yang lain: CLIP (Pralatihan Bahasa-Imej Kontrastif).

Klasifikasi imej dan kedudukan rangkaian saraf yang dilatih berdasarkan perkaitan imej teks, seperti kapsyen yang terdapat di Internet. Terima kasih kepada campur tangan CLIP, yang mengurangkan bilangan hasil yang dicadangkan kepada pengguna setiap gesaan kepada 32, Dall-E didapati mengembalikan imej yang memuaskan dalam kebanyakan kes.

Pertengahan perjalanan: reka bentuk, infrastruktur manusia, dan kecerdasan buatan

Seperti yang dijangkakan, Pertengahan perjalanan merupakan projek penting yang merupakan sebahagian daripada konsep Seni Generatif Al yang baru muncul. Khususnya, Midjourney ialah makmal penyelidikan bebas yang meneroka cara pemikiran baharu dan mengembangkan kuasa imaginasi spesies manusia.

Menggunakannya adalah mudah: mula-mula akaun mesti dibuat pada Perpecahan, platform yang menganjurkan pelbagai komuniti, di mana Midjourney adalah salah satu daripadanya. Di dalam aplikasi terdapat pelbagai ruang sembang di mana seseorang boleh mengambil bahagian secara aktif atau tidak dalam perbincangan.

Adalah penting untuk menunjukkan bahawa untuk mencuba menggunakan Kepintaran Buatan buat kali pertama seseorang mesti pergi ke “orang baru” saluran, di mana 25 render percuma disediakan.

Satu paparan sepadan dengan penjanaan empat varian berbeza yang dijana daripada input teks yang sama.

Oleh itu, 25 render merujuk kepada 25 kerja pemprosesan yang dilakukan oleh bot Midjourney. Akibatnya, penjanaan imej memerlukan interaksi dengan bot Midjourney melalui mesej teks yang dipanggil "prompt," di mana akan terdapat kata kunci yang menerangkan imej yang ada dalam fikiran pengguna.

Anda boleh menambah seberapa banyak butiran yang anda mahu, yang penting ialah membahagikan kata kunci dengan koma. Setelah rendering selesai, komputer mengembalikan empat imej berbeza berdasarkan penerangan untuk dipilih.

Di samping itu, sebaik sahaja atur cara selesai membuat persembahan, anda boleh menyampaikan pilihan anda berdasarkan imej dan, jika anda mahu, mempunyai empat lagi versi yang dijana semula.

DALL-E 2: sistem AI baharu untuk karya seni

Selain Midjourney, DALL-E 2 juga merupakan sistem AI baharu yang boleh mencipta imej dan karya seni yang realistik daripada penerangan bahasa semula jadi. Bukan itu sahaja, DALL-E 2 juga boleh menggabungkan konsep, atribut dan gaya.

Kekuatan sistem AI baharu juga terletak pada keupayaan untuk mengembangkan imej melebihi apa yang ada dalam kanvas asal, mencipta gubahan luas baharu. Selain itu, ia boleh membuat perubahan yang realistik pada imej sedia ada daripada kapsyen bahasa semula jadi dan boleh menambah serta mengalih keluar elemen dengan mengambil kira bayang-bayang, pantulan dan tekstur.

Keupayaan DALL-E 2 juga termasuk mengambil imej dan mencipta beberapa variasi daripadanya yang diilhamkan oleh yang asal. DALL-E 2 telah mempelajari hubungan antara imej dan teks yang digunakan untuk menerangkannya.

Ia menggunakan proses yang dipanggil "penyebaran," yang bermula dengan corak titik rawak dan secara beransur-ansur mengubah corak itu ke arah imej apabila ia mengenali aspek tertentu imej tersebut.

Jadi, selepas OpenAI memperkenalkan DALL-E pada Januari 2021, kini sistem terbaharu, DALL-E 2, menjana imej yang lebih realistik dan tepat dengan resolusi empat kali ganda.

DALL-E 2 bermula sebagai projek penyelidikan dan kini boleh didapati sebagai a versi beta. Pengurangan keselamatan yang sistem telah dibangunkan dan terus dipertingkatkan termasuk: mengehadkan keupayaan sistem untuk menjana imej ganas, benci atau dewasa, dan penggunaan berperingkat berasaskan pembelajaran.

Sumber: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/