Maksud Teks-Ke-3D Baharu Nvidia Untuk Kejuruteraan & Reka Bentuk Produk

tl; dr: AI Generatif berkembang pada kadar yang menggembirakan. Algoritma terbaharu oleh Nvidia menukarkan teks ke dalam jaringan 3D dua kali lebih cepat daripada projek yang diterbitkan hampir 2 bulan lalu. Ini bermakna keupayaan teknikal kini sudah melebihi keupayaan kami untuk bekerja dengan mereka.

Minggu lepas kertas oleh saintis Nvidia menunjukkan kelajuan eksponen di mana ruang AI generatif berkembang. Ledakan aktiviti ini - terutamanya yang dapat dilihat sejak 9 bulan lalu - akan memberi kesan pada setiap bahagian kehidupan, tidak terkecuali pada reka bentuk produk, kejuruteraan dan pengeluaran. Perubahan itu akan membebaskan industri daripada kekangan struktur dalam cara idea disampaikan, memperkasakan kitaran inovasi yang lebih pantas dan akhirnya membolehkannya menyampaikan janji kemampanannya.

Contoh Meshes daripada algoritma Magic 3D Nvidia Research, dengan gesaan yang digunakan untuk menjananya.

Penyelidikan Imaginasi Dalam Nvidia

Setelah diberitahu selama bertahun-tahun bahawa AI secara asasnya akan merevolusikan cara kita bekerja, hanya sedikit yang menjangkakan sektor kreatif menjadi antara mangsa pertamanya. Kemunculan penjana teks seperti manusia GPT-3 pada tahun 2020 membawa kemungkinan menjadi tumpuan yang lebih tajam. Ia telah menjadi perjalanan liar sejak itu: DALL-E (teks-ke-imej), Whisper (pengecaman pertuturan), dan terbaru Stable Diffusion (teks-ke-imej) bukan sahaja meningkatkan keupayaan pertuturan dan alatan AI visual, tetapi juga mengurangkan sumber yang diperlukan untuk menggunakannya (daripada 175bn parameter untuk GPT-3 kepada 900mn untuk Stable Diffusion).

Saiz Stable Diffusion bermakna ruang cakera kurang daripada 5gb – mampu dijalankan pada mana-mana komputer riba. Bukan itu sahaja; tidak seperti OpenAI (yang dibiayai terutamanya oleh Microsoft dan menerbitkan GPT-3, DALL-E dan Whisper), Stable Diffusion ialah sumber terbuka, bermakna orang lain boleh membina pembelajarannya dengan lebih mudah. Ini bermakna kita hanya melihat permulaan kitaran inovatif – banyak lagi yang akan datang, seperti yang ditunjukkan oleh kertas Nvidia sekarang.

Penyokong Stable Diffusion (stability.ai) meneruskan aliran turbo ini dengan menyediakan geran teknologi dan kewangan kepada pasukan lain yang membawa penerokaan ke arah baharu. Di samping itu, pelbagai projek menyediakan alatan kepada julat pengguna yang lebih meluas. Antaranya ialah pemalam untuk Blender, alat reka bentuk sumber terbuka, dan setara Photoshop proprietari Adobe. Akses API penuh kepada alatan sedang dibiayai dengan dolar Modal Teroka yang besar, bermakna ratusan juta pembangun perisian, bukan sahaja beberapa ratus ribu jurutera data, kini akan mencipta alatan mereka sendiri pada algoritma ini.

Pertuturan, imej dan teks adalah antara menegak pertama yang terganggu oleh teknologi ini. Tetapi 3D tidak jauh ketinggalan. Di luar seni generatif khusus, kartun adalah titik pertama aplikasi yang jelas. Sudah ada penjana Pokémon berdasarkan Stable Diffusion. Kesan Visual dan filem adalah seterusnya. Tetapi banyak sektor lain mungkin akan terganggu - antaranya reka bentuk dalaman dengan Interiorai.com mengetuai pertuduhan.

Dalam semua keterujaan ini, menerapkan inovasi pada Reka Bentuk & Kejuruteraan terasa seperti difikirkan semula. Namun ia berkemungkinan menjadi kawasan yang paling terjejas dengan ketara. Sudah tentu, terdapat cabaran awal: Untuk satu, Stable Diffusion dan rakan senegaranya masih belum begitu tepat. Itu bukan masalah untuk kartun, tetapi ia merupakan cabaran utama bagi sebarang percubaan untuk mengubah teks menjadi geometri 3D penuh yang digunakan dalam konteks industri. Itulah kawasan yang mempunyai minat baru (projek yang dipanggil Bits101 telah dilancarkan di Israel pada 2015). Ini mungkin merupakan titik penting industri, tetapi terdapat banyak cabaran pertengahan yang mungkin lebih mudah untuk diselesaikan. Ini termasuk pengecaman objek yang dipertingkatkan (algoritma Yolo telah digunakan untuk memberi kesan yang hebat), yang akan membawa kepada petikan dan anotasi yang lebih baik - meningkatkan kualiti dan mengurangkan kesilapan. Pemalam juga harus memudahkan penggunaan Generatif AI untuk membangunkan reka bentuk asas (Primitives), yang kemudiannya boleh diedit selanjutnya dalam alatan reka bentuk untuk meningkatkan toleransi mengikut keperluan. Itu adalah pendekatan yang telah digunakan dalam Altair's Inspire, yang menggunakan Analisis Elemen Terhingga untuk melakukan perkara yang sama. Primitif ini juga boleh berfungsi sebagai pangkalan data sintetik bagi model beranotasi, yang mana terdapat kekurangan dalam industri CAD 3D. Ketua Pegawai Eksekutif dan pengasas Physna menunjukkan ini dalam artikel memperincikan percubaan mereka sendiri untuk menggunakan kaedah baru ini untuk mencipta reka bentuk 3D terperinci, yang juga menyerlahkan beberapa perangkap dalam menggunakan data sintetik untuk memacu algoritma ini. perpustakaan haus alatan untuk menentukan strategi pemesinan yang terbaik.

Cabaran ini penting dan menguntungkan untuk ditangani dalam dan untuk diri mereka sendiri. Namun impak utamanya adalah untuk membantu mengembangkan laluan idea kepada reka bentuk dengan akhirnya mengurangkan pergantungan pada reka bentuk 3D untuk menyampaikan niat. Reka bentuk, sama ada 2D atau 3D, telah berfungsi sebagai cara utama untuk menterjemahkan keperluan pelanggan kepada produk akhir. Itu mengekang industri kerana reka bentuk ini berfungsi sebagai kotak hitam di mana semua cerapan pelanggan yang berharga, kekangan pembuatan dan objektif syarikat disimpan, tidak dapat dirungkai, namun dikenal pasti sahaja. Ini bermakna apabila sesuatu berubah, adalah mustahil untuk melaraskan reka bentuk sahaja. Inilah sebabnya inovasi pembuatan seperti pencetakan 3D mengambil masa yang lama untuk diterima pakai dan sentiasa mengecewakan pelabur jangka pendek. Komponen yang membentuk pesawat adalah "ditetapkan" dari saat ia direka bentuk, walaupun hayat produktif selama 20 tahun. Hampir tiada skop inovasi – ini mesti menunggu pelancaran generasi akan datang.

Keupayaan untuk menukar satu kekangan dan membenarkan algoritma seperti Stable Diffusion untuk menyusun semula reka bentuk dan parameter pengeluaran akan mempercepatkan penggunaan inovasi baharu dengan ketara dan membolehkan kami membina produk yang lebih ringan, berprestasi lebih baik, dengan lebih pantas. Seperti yang mereka lakukan dalam Formula 1 atau Reka Bentuk Sistem, jurutera masa depan akan bertindak sebagai pengurus kekangan yang boleh menyatakan dengan kata-kata dan merujuk kepada sumber data tentang objektif dan batasan produk.

Tanpa mempercepatkan proses kejuruteraan untuk produk baharu dan sedia ada dengan cara ini, kami hampir tidak mempunyai cara untuk mencapai sasaran kemampanan yang bercita-cita tinggi yang mesti kami tetapkan sendiri. Untuk melakukan ini, kita mesti terlebih dahulu bersetuju dengan bahasa yang boleh kita gunakan untuk berkomunikasi di luar reka bentuk. Model semantik baharu ini adalah jurang yang jelas dalam inovasi yang digariskan di atas. Sebilangan syarikat telah mula mencubanya, seperti nTopologi dengan konsep Fields. Namun, kadar perubahan adalah perlahan, tidak seperti algoritma yang akan disuap oleh model semantik. Algoritma baharu Nvidia dilaporkan lebih dua kali lebih pantas daripada DreamFusion, diterbitkan kurang daripada 2 bulan yang lalu. Syarikat produk dan kejuruteraan perlu berusaha untuk menangkap idea mereka dalam cara baharu yang kalis masa hadapan sekarang untuk memanfaatkan sepenuhnya kemungkinan yang dimiliki oleh ledakan AI generatif ini. Kepantasan perubahan dalam algoritma telah menunjukkan, sekali lagi, bahawa Undang-undang Morse terpakai di mana-mana bahawa alat sedang didigitalkan. Cabaran kekal sebagai ketidakupayaan manusia untuk menerima perubahan ini dan menggunakan kaedah komunikasi baharu yang mampu membuka potensi mereka, walaupun tugas itu mendesak.

Sumber: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering–product-design/