Sama-sama Pakai Bahasa, Tapi Kenapa Nulis dan Ngomong Beda Banget?

Saat tahu ada fitur “speech to text” di Google Docs, saya senang sekali. Fasilitas itu saya pikir akan sangat membantu para penulis.

Bayangan saya, para penulis bisa menulis tanpa harus menyentuhkan jarinya ke tuts papan ketik. Cukup cerita saja, sebuah tulisan utuh bisa lahir.

Bayangkan, betapa produktifnya para penulis jika sambil buang air besar saja bisa nulis satu artikel!

Bayangkan, betapa terbantunya mahasiswa kalau bisa menulis satu bab skripsi sambil tiduran!

Tapi begitu saya mencoba, penggunaan fitur ini tidak seperti yang saya bayangkan.

Secara teknis, akurasi konversi suara ke teks sudah lumayan bagus. Tapi struktur tulisan yang dihasilkan ternyata benar-benar beda dengan yang ditulis manual pakai ketikan tangan.

Perbedaan itu, terutama sangat mencolok pada struktur gagasan.

Saat menulis dengan tangan, struktur tulisan bisa sangat rapi. Kebanyakan paragraf berpola deduktif. Kalimat utama di depan kemudian diperkuat dengan penjelasan yang relevan.

Saat pakai “speech to text”, pola semacam itu sangat sulit dipertahankan. Watak bahasa lisan tidak bisa ditinggalkan: spontan, ekspresif, dan kurang tertib.

Karena itulah, dalam paragraf yang ditulis pakai “speech to text”, selain cenderung muter-muter juga banyak sekali pengulangan.

Inilah yang membuat saya tertarik menyelidiki: kok bisa begitu?

Salah satu penjelasan paling meyakinkan disampaikan Maryanne Wolf, psikolog dari Tufts University, Massachusetts (dalam artikel Nicolas Carr di The Atlantic, 2008).

Menurutnya, kemampuan menulis manusia bukanlah kemampuan alamiah yang terkodekan dalam gen manusia sebagaimana bicara.

Manusia sudah bicara sejak ratusan ribu tahun lalu, mungkin sejak masih berkoloni Afrika saja. Tapi manusia baru mulai menulis sekitar lima ribu tahun lalu (jika patokannya adalah huruf pertama yang dihasilkan bangsa Sumeria).

Meskipun bicara dan menulis sama-sama keterampilan ekspresif berbahasa, dua kemampuan itu digerakkan oleh bagian otak yang berbeda.

Karena bagian otak yang bekerja beda, informasi diproses oleh otak dengan cara berbeda. Karena itu, hasilnya juga beda.

Ini mungkin bukan argumentasi baru. Sejak tahun 1960-an, sudah ada doktrin “medium is the messages” yang disampaikan Marshal McLuhan.

Konon pada 1882 Friedrich Nietzsche pernah bereksperimen. Ia mencoba mengetik prosa dengan mata tertutup. Hasilnya, prosa yang ditulis dengan mata terbuka dan tertutup ternyata beda, menjadi lebih telegrafik (mungkin maksudnya lebih ringkas).

Piilihan media suara dan grafis dalam menyampaikan gagasan bukan pilihan teknis semata, Ketika kita memilih media mana yang kita pilih, kita juga sedang memilih dengan cara bagaimana otak memprosesnya.

Karena itu, wajar kalau “speech to text” – sejauh ini, rasa saya – kurang cocok untuk membuat naskah akademik.

Mungkin, teknologi itu cocok untuk nulis novel. Biar dialognya “ngalir” seperti pertengkaran Rhoma dan Ani.

“Tadinya kupikir kau adalah gadis lain di kampung ini. Tapi rupanya kau tidak lebih dari gambaran dari gadis kampung yang mudah didapat di sembarang jalan. Kau perempuan yang lemah!”

“Tidak, Rhoma!”

Rahmat Petuguran

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.