MacWhisper Adalah Perisian Transkripsi Percuma yang Saya Nantikan

Adakah anda sedang mencari perisian Mac untuk menyalin fail audio ke dalam fail teks bertulis? Terdapat banyak alat berbayar, seperti Otter.ai dan Trint, yang boleh menelan belanja wang sebenar apabila anda mula menggunakannya terlalu banyak. Tetapi MacWhisper adalah penyelesaian percuma yang ditunggu-tunggu oleh internet. Atau, sekurang-kurangnya, yang saya tunggu-tunggu.

OpenAI mengeluarkan program percuma yang sangat berkuasa pada September 2022 yang membenarkan orang yang mempunyai pengetahuan teknologi untuk menukar fail audio dan video mereka kepada transkrip yang sangat tepat. Masalahnya ialah ia tidak begitu mudah diakses oleh pengguna biasa, kerana anda perlu biasa menggunakan arahan dalam apl Terminal.

Tetapi dengan MacWhisper, yang pertama kali dikesan oleh 9to5Mac, seseorang akhirnya telah membangunkan GUI, atau antara muka pengguna grafik, yang dibina di atas Whisper OpenAI dan meninggalkan semua perkara teknologi yang mengelirukan di bawah hud, membenarkan anda hanya menyeret dan melepaskan fail audio anda dan mendapatkan transkripsi dengan cepat. Dan MacWhisper sangat tepat kerana Whisper OpenAI telah dilatih 680,000 jam data audio di web.

Salah satu perkara yang menarik tentang MacWhisper ialah anda tidak memuat naik fail audio atau video yang anda mahu transkripsikan ke Internet. Itu penting untuk wartawan yang mungkin sedang mengusahakan cerita sensitif, atau sesiapa sahaja yang secara amnya berhati-hati untuk memuat naik fail peribadi mereka ke awan. Fail itu kekal pada desktop anda, bermakna tiada kemungkinan sesiapa boleh memintas audio anda.

Sekali lagi, MacWhisper hanyalah antara muka pengguna baharu untuk program percuma yang diperkenalkan oleh OpenAI lewat tahun lepas, tetapi ia benar-benar akan menjadikan transkripsi audio mudah untuk sesiapa sahaja. Kerana saya telah menggunakan Whisper dan mendapati ia amat berguna sejak ia dikeluarkan. Malah saya kini akan menggunakan MacWhsiper, kerana ia pasti akan mempercepatkan aliran kerja saya.

Sebagai satu contoh sahaja, selepas berita tentang kejatuhan syarikat kripto FTX, saya menggunakan Whisper untuk menyalin berpuluh-puluh jam wawancara YouTube lama dengan pengasas syarikat Sam Bankman-Fried. Dari situ, saya dapat mencari transkrip dan mencari idea pelik dan menarik untuk artikel untuk ditulis, seperti ketika SBF berkata pada Jun 2021 bahawa blockchain akan membetulkan Enron. Perbandingan SBF dengan Enron adalah satu kebetulan yang ganjil, memandangkan semua yang kita tahu sekarang tentang bagaimana FTX runtuh. Tetapi saya tidak akan pernah menemui detik itu dalam temu bual lama yang tidak jelas tanpa mempunyai berpuluh-puluh transkrip yang boleh saya cari. Dan proses itu, walaupun lebih mudah daripada mendengar jam dan jam pita, masih kikuk dan tidak terlalu automatik.

Selepas memasang Whisper pada mesin saya, saya pernah menaip "whisper audiofilename.mp3 —model tiny.en" ke dalam apl Terminal Mac pada bila-bila masa saya mahu menyalin fail. Dengan WhisperMac, saya hanya boleh menyeret dan melepaskan fail audio saya dan ia melakukan keajaibannya tanpa sebarang menaip tambahan.

Saya menguji MacWhisper dengan episod NBC Nightly News yang saya muat turun daripada YouTube. Selain daripada beberapa ralat, seperti mentafsir perkataan "windchills" sebagai "windhills," dan mendengar Lester Holt sebagai "Lester Hold," transkrip itu sangat tepat. MacWhisper adalah percuma, tetapi terdapat peringkat berbayar perisian yang mungkin lebih tepat sedikit kerana ia menggunakan model latihan OpenAI yang lebih intensif, tetapi versi percuma akan berfungsi dengan baik untuk kebanyakan orang.

MacWhisper membolehkan anda mengeksport perkataan yang ditranskripsi dalam beberapa format berbeza, termasuk teks biasa, CSV atau format fail sari kata seperti SRT dan VTT.

Dan MacWhisper bukan hanya untuk bahasa Inggeris. Anda boleh menyalin audio dalam 100 bahasa yang berbeza, yang sangat berguna. Satu-satunya ciri yang MacWhisper tidak mempunyai, yang saya suka bermain-main dengan aplikasi Whisper dalam Terminal, ialah terjemahan bahasa. Saya telah menterjemah video tular dalam bahasa Rusia dan Cina dan telah diberitahu oleh orang yang bertutur dalam bahasa itu di Twitter bahawa terjemahan itu adalah tepat.

Ciri lain yang MacWhisper tidak mempunyai, walaupun ia juga tidak tersedia daripada OpenAI's Whisper, adalah keupayaan untuk membezakan pembesar suara. Sebagai contoh, jika anda menyalin temu bual dengan dua pembesar suara, tiada tanda jelas yang menunjukkan apabila seorang pembesar suara telah berhenti dan seorang lagi telah bermula. Tetapi saya mengesyaki seseorang akan membina keupayaan itu akhirnya. Perkhidmatan berbayar seperti Trint melakukan ini secara automatik, dan ia akan menjadi bagus untuk mempunyai secara percuma akhirnya, tetapi anda mendapat apa yang anda bayar.

Terdapat juga ciri dengan MacWhisper di mana anda boleh menukar pertuturan daripada mikrofon komputer anda kepada teks, yang mungkin berguna jika anda ingin menyalin sesuatu dengan cepat.

Saya menghabiskan masa berbulan-bulan tertanya-tanya apabila seseorang akhirnya akan membangunkan GUI untuk Whisper, kerana beberapa orang mencubanya tetapi tidak mencipta sesuatu yang sangat mesra pengguna. Tetapi MacWhisper, yang dibangunkan oleh Jordi Bruin, adalah perisian yang saya tunggu-tunggu. Bruin juga telah membangunkan perisian seperti MacGPT, yang membolehkan pengguna mengakses ChatGPT daripada bar menu mereka.

Anda boleh memuat turun MacWhisper secara percuma, dengan pendaftaran e-mel, di tapak web Bruin.

Sumber: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/