OpenAI dan Microsoft melaksanakan Vall-E

OpenAI dan Microsoft teruskan pertempuran dengan Google dalam kecerdasan buatan dengan melaksanakan Vall-E, bot sembang suara baharu. Ini ialah perisian sintesis pertuturan yang boleh mensimulasikan suara manusia selepas hanya tiga saat mendengar.

Dalam erti kata lain, ini adalah bahagian terbaru sistem kecerdasan buatan generatif yang dibangunkan oleh Microsoft dan OpenAI, yang sejak 2019 Bill Gates dikaitkan dengan pelbagai tahun, perkongsian berbilion dolar.

Vall-E: semua butiran tentang chatbot baharu daripada OpenAI dan Microsoft

Valle-E ialah alat AGI, Kecerdasan Am Buatan, iaitu kecerdasan buatan "umum" atau "kuat" yang boleh mensimulasikan kecerdasan manusia. Oleh itu, bertentangan dengan apa yang kita ketahui setakat ini, iaitu AI "sempit" atau "lemah".

Yang terakhir ini dapat bertindak balas dengan tindakan pratetap kepada tugas tertentu, tetapi tidak bertindak balas terhadap tindakan yang tidak dirancang. Dalam beberapa tahun kebelakangan ini, chatbots AI tidak menunjukkan prestasi seperti yang diharapkan oleh penciptanya kerana ia terhad kepada tugas kecil dan mempunyai kadar ralat yang tinggi.

Valle-E dibangunkan untuk digunakan dengan berkualiti tinggi alat sintesis pertuturan dan untuk mencipta audio asli daripada contoh contoh. OpenAI mentakrifkan Valle-E sebagai a "model bahasa codec semula jadi," kerana operasinya berasaskan teknologi yang dipanggil InCodec.

Permulaan itu, dibiayai oleh Elon Musk dan Sam Altman, antara lain, turut membanggakan penciptaan ChatGPT, bot sembang yang boleh mengekalkan perbualan interaktif dengan pengguna dengan mengingati dan belajar daripada tindakan dan preseden sebelumnya.

Oleh itu, sama seperti SembangGPT mampu menjana kod secara autonomi, Valle-E juga direka bentuk untuk mencipta codec audio diskret daripada mendengar sampel audio.

Berkelakuan tepat sebagai manusia.

Bersama dengan GPT-3 perisian untuk teks dan Dall-E/Resapan Stabil untuk imej, sistem audio Valle-E melengkapkan triptych ChatGPT dan bertujuan untuk merevolusikan bidang AI generatif.

Gesaan Pembesar Suara, Kebenaran Dasar, Garis Dasar dan Vall-E.

Kecanggihan alat baharu yang dilancarkan oleh OpenAI dan Microsoft terletak pada keupayaan Valle-E untuk mengenali timbre, infleksi, dan nada emosi daripada orang yang bercakap dan memainkannya semula selepas hanya tiga saat mendengar.

Aplikasi dalam penyuntingan audio adalah banyak, begitu juga kritikan terhadap potensi perisian untuk manipulasi dan penyalahgunaan. Tidak menghairankan, tidak seperti apa yang berlaku dengan ChatGPT, Microsoft tidak menyediakan kod untuk Vall-E untuk orang lain mencuba.

Contoh ucapan yang telah disintesis oleh perisian juga boleh didapati di tapak Valle-E. Khususnya, beberapa varian pensampelan boleh didengar termasuk: Gesaan Pembesar Suara, Kebenaran Dasar, Garis Dasar dan Vall-E.

Pilihan pertama ialah klip audio yang konotasi pertuturannya perlu diterbitkan semula oleh AI; dalam yang kedua, ayat diucapkan yang mana AI perlu mencadangkan perbandingan. Yang ketiga, sebaliknya, adalah contoh yang dihasilkan dengan teknologi sintesis pertuturan yang tersedia pada masa ini. Akhir sekali, Vall-E ialah ucapan asal yang dihasilkan oleh perisian Microsoft.

Potensi dan bahaya OpenAI dan AI Microsoft.

Penyelidik Microsoft dan OpenAI nampaknya menyedari potensi bahaya teknologi ini. Malah, mereka berkomunikasi dalam kertas awam perkara berikut:

"Memandangkan Vall-E boleh mensintesis pertuturan yang mengekalkan identiti pembesar suara, teknologi sedemikian boleh menimbulkan potensi risiko yang berkaitan dengan penggunaan model yang tidak betul, seperti memalsukan pengenalan suara atau menyamar sebagai seseorang."

Oleh itu, Microsoft menambah, untuk mengurangkan risiko sedemikian, model pengesanan boleh dibina untuk membezakan sama ada klip audio telah disintesis oleh Vall-E. Dalam hal ini, kedua-dua gergasi itu juga akan melaksanakan prinsip kecerdasan buatan Microsoft semasa pembangunan model selanjutnya.

Walau bagaimanapun, risiko emulasi bukanlah satu-satunya faktor yang menimbulkan keraguan dan ketakutan. Vall-E telah dilatih menggunakan perpustakaan audio LibriLight yang dibuat oleh meta, yang mengandungi 60 ribu jam ucapan bahasa Inggeris yang kebanyakannya diekstrak daripada buku audio domain awam, dirakam dan dibaca oleh sukarelawan.

Walau apa pun, untuk meningkatkan kapasiti sintesisnya, Vall-E perlu mengembangkan kumpulan pembelajarannya ke seluruh Internet. Langkah seterusnya inilah yang membolehkan GPT-3, pendahulu ChatGPT, mencapainya pemprosesan ayat yang mengagumkan, menulis dan keupayaan pemasangan.

Walaupun begitu, perisian itu juga cenderung untuk merumuskan kandungan ganas, seksis dan perkauman dengan tepat kerana ia berfungsi pada contoh yang diambil secara sembarangan dari seluruh Web. Inilah yang juga boleh berlaku dengan Vall-E baharu.

Dalam kes ini, operasi penapisan memerlukan penggunaan ramai kakitangan manusia, yang, pada masa ini, gergasi digital besar nampaknya tidak menjangka memandangkan gelombang pemberhentian pekerja yang menjejaskan teknologi besar.

Google memperkenalkan Bard untuk bersaing dengan OpenAI dan Microsoft

Seperti yang dijangkakan, bersaing dengan Microsoft dan OpenAI ialah Google, yang akan diperkenalkan Bard, chatbot daripada Deepmind, syarikat yang diperoleh oleh Google Abjad. Bard kelihatan seperti salinan tepat ChatGPT, tetapi tanpa kecacatan dalam kemas kini.

Sundar Pichai, Ketua Pegawai Eksekutif Google, mempersembahkan perisian baharu itu sebagai alat yang menarik maklumat daripada web untuk memberikan respons yang segar dan berkualiti tinggi. Dengan "segar," maksudnya dikemas kini secara berterusan, sesuatu yang masih gagal dilakukan oleh AI Microsoft.

Secara ringkasnya, Bard berhasrat untuk menjana jawapan terperinci kepada soalan mudah. Operasinya adalah berdasarkan TheMDA, Model Bahasa untuk Aplikasi Dialog, yang pernah disifatkan oleh salah seorang jurutera Google sendiri sebagai "sentient".

Tidak dinafikan bahawa pengumuman Google tentang pelancaran Bard telah dijangkakan oleh peminat teknologi. Lagipun, menurut laporan dalam Wall Street Journal, Alphabet, syarikat induk Google, telah melabur lebih daripada $ 31 bilion dalam kecerdasan buatan pada 2021, lebih daripada pesaing lain.

Selepas kejayaan ChatGPT, syarikat itu memutuskan untuk memanggil yang terbaik: pengasas Larry Page dan Sergey Brin. Walau apa pun, tidak ada keraguan bahawa perisian kecerdasan buatan adalah sumber yang tidak ternilai dalam bidang inovasi.

Malah, walaupun Amazon, Meta dan Apple sudah tentu tidak akan berdiam diri dan menonton apa yang dilakukan oleh orang lain tanpa mengambil tindakan. Walau bagaimanapun, walaupun persaingan adalah pemecut yang hebat dari segi penyelidikan, terdapat risiko bahawa, dalam perlumbaan untuk kecerdasan buatan terbaik, sistem yang cacat dengan ralat, had dan risiko akan digunakan tanpa memberi perhatian terlalu banyak kepada gambaran besar.

Sumber: https://en.cryptonomist.ch/2023/02/14/openai-microsoft-implement-vall-e/