Ayo Bangkit sobat..!!!!!

Audio Data

pengantar

Audio data datang dalam berbagai bentuk kadang-kadang membingungkan. Jumlah cara mendasar di mana suara dapat diwakili sebenarnya cukup kecil. Berbagai jenis file audio adalah karena fakta bahwa ada cukup beberapa pendekatan untuk data audio mengompresi dan sejumlah cara yang berbeda dari kemasan data. Kami pertama-tama menjelaskan bagaimana data audio sendiri diwakili, maka bagaimana itu dibungkus ke file. Orang sering berbicara tentang format audio sembarangan tanpa membedakan antara format data dan format file, tetapi sangat penting untuk menjaga perbedaan ini dalam pikiran banyak format file dapat berisi tanggal direpresentasikan di lebih dari satu cara dan sebagian besar representasi data dapat dikemas di lebih dari satu format file. Mengatakan bahwa file suara adalah “. Wav” file mengatakan apa-apa tentang format data audio. Demikian pula, mengatakan bahwa file berisi data PCM mengatakan apa-apa tentang format file.

Perwakilan dari Sound itu sendiri
Fundamental Aspek Representasi Sound

Suara terdiri dari variasi terdengar dalam tekanan udara. Mikrofon mengubah variasi tekanan udara menjadi tegangan yang bervariasi. Untuk mewakili suara digital, kita harus mengkonversi tegangan ini bervariasi menjadi serangkaian angka yang mewakili amplitudonya. Proses ini dikenal sebagai konversi analog-ke-digital. Data Audio terdiri dari angka tersebut dikatakan dalam format modulasi kode pulsa, disingkat PCM. Audio data sering disimpan dalam format lain, biasanya dalam rangka untuk kompres itu, namun hampir selalu dimulai dalam format PCM.

Angka-angka yang dihasilkan oleh konverter analog-ke-digital, secara umum, sewenang-wenang. Meskipun data tekanan asli memiliki dimensi dynes per sentimeter persegi, hubungan antara nilai-nilai tekanan aktual dan nomor-nomor yang dihasilkan oleh konversi analog-ke-digital ditentukan baik oleh karakteristik respon mikrofon dan oleh preamplifier di analog-ke -digital converter. Kita jarang mengetahui sifat yang tepat baik mikrofon atau konverter analog-ke-digital. Selanjutnya, kita biasanya menyesuaikan konverter analog-ke-digital, atau preamplifier yang mendahului, untuk memilih tingkat input yang terbaik. Kami ingin menggunakan rentang dinamis terbesar mungkin, sehingga dapat mengambil keuntungan dari detail penuh sinyal, sementara pada saat yang sama memastikan bahwa kami tidak melampaui batas dari elektronik dan kliping menghindari, yang mendistorsi sinyal. Oleh karena itu, hampir tidak pernah terjadi bahwa kita tahu berapa banyak dynes per sentimeter persegi nomor mewakili. Untuk sebagian besar tujuan ini tidak masalah karena semua kita peduli tentang adalah amplitudo relatif dari sinyal. tingkat tekanan absolut yang menarik untuk beberapa pekerjaan di psychophysics pendengaran. Dalam hal ini, perlu untuk mengkalibrasi sistem dan memperbaiki parameter (seperti keuntungan preamplifier).

Tekanan udara variasi, dan oleh karena itu tegangan yang sesuai yang dihasilkan oleh mikrofon, yang terus menerus dalam dua-dimensi. Artinya, nilai-nilai bervariasi terus menerus, dan mereka ada di setiap titik waktu. Namun, sistem digital seperti komputer tidak dapat secara langsung merupakan sinyal kontinyu. Sebaliknya, ia harus mengukur sinyal pada himpunan terhingga kali diskrit. Ini dikenal sebagai sampling. Furtheremore, harus membuat penggunaan jumlah terbatas tingkat amplitudo diskrit. Ini dikenal sebagai kuantisasi. Jumlah level yang digunakan dikenal sebagai resolusi. Resolusi biasanya dinyatakan dalam bit, yaitu, sebagai logaritma-2 dasar tentang jumlah sebenarnya. Sebuah sistem dengan resolusi 8 bit memanfaatkan 2 ^ 8 = 256 level. Sebuah sistem dengan resolusi 16 bit memanfaatkan 2 ^ 16 = 65.536 level. Tingkat sampling dan resolusi menentukan kualitas representasi digital dari suara. “CD-kualitas” suara memiliki resolusi 16 bit dan tingkat sampling dari 44.100 sampel per detik.

Berikut ini adalah terus menerus gelombang:


dan di sini adalah representasi sampel dan terkuantisasi itu:

Sampling Rate

Tingkat pengambilan sampel adalah jumlah kali per detik bahwa amplitudo dari sinyal diukur dan memiliki dimensi sampel per detik. Semakin tinggi sampling rate, semakin akurat sinyal sampel akan mewakili sinyal asli. Pemilihan sampling rate ditentukan oleh Teorema Sampling Nyquist. Teorema ini menyatakan bahwa jika frekuensi maksimum di mana sinyal asli mengandung energi adalah F, maka jika sampel pada tingkat yang ketat lebih besar dari 2F sampel per detik, maka akan mungkin untuk merekonstruksi sinyal asli sempurna dari sinyal sampel. Dengan kata lain, sinyal sampel akan berisi semua informasi dalam sinyal asli.

Penting untuk dicatat bahwa laju sampling harus benar-benar lebih besar dari 2F. Sampling pada tingkat tepat 2F dapat mengakibatkan kesalahan. Sebagai contoh, anggaplah bahwa sinyal asli adalah gelombang sinus frekuensi F. Jika kita sampel pada frekuensi 2F, dengan sampel pertama pada waktu 0, semua contoh kami akan memiliki nilai 0. Gelombang sinus yang asli tidak bisa direkonstruksi dari seperti sinyal sampel. Hal ini mudah dilihat dalam ilustrasi berikut. Semua menunjukkan empat 1Hz gelombang sinus. Dua di sebelah kiri memiliki fase 0. Dua di sebelah kanan memiliki fase π. Kedua atas memiliki amplitudo 1.0. Dua bawah memiliki amplitudo 2.0. Jika kita sampel di dua sampel per detik dengan offset 0, semua contoh kami akan 0 pada semua empat kasus. Sinyal sampel tidak akan berisi informasi yang diperlukan untuk memutuskan mana dari empat sinyal asli untuk merekonstruksi.

 

 

 

 

 

Selanjutnya, teorema Nyquist didasarkan pada asumsi bahwa sinyal asli panjang tak terhingga. Jika tidak, sampling di lebih dari laju Nyquist dari 2F belum tentu mengizinkan reconsruction sempurna. Jika tingkat sampling hanya sedikit lebih besar dari tingkat Nyquist, kenaikan mungkin tidak menggeser titik sampling di atas cukup jauh untuk membuat nilai terkuantisasi berbeda. Perhatikan lagi contoh kita dari gelombang sinus. Mari kita anggap bahwa frekuensi adalah 1000 Hz. Jika kita sampel pada tingkat 2000 sampel per detik kita mungkin berakhir dengan setiap sampel sama dengan 0. Misalkan kita sampel pada tingkat tahun 2001 sampel per detik, yang secara teknis satsifies kriteria Nyquist. Jika sinyal cukup panjang, bahkan jika sampel pertama berada pada nol, beberapa sampel akan menjadi jarak yang signifikan dari nol dan akan ada informasi yang cukup untuk merekonstruksi sinyal. Tetapi jika sinyal cukup pendek, akan diambil sampel pada titik-titik dimana nilai yang begitu dekat dengan nol yang mungkin tidak dibedakan dari nol ketika terkuantisasi. Akibatnya, untuk sinyal pendek perlu menggunakan tingkat sampling secara signifikan lebih tinggi daripada frekuensi Nyquist.

Intuitif mungkin tampak bahwa jika suatu sinyal diambil pada tingkat terlalu rendah akibat akan menjadi bahwa komponen frekuensi yang lebih tinggi akan hilang, tetapi bahwa komponen frekuensi yang lebih rendah akan terpengaruh. Sayangnya, hal ini tidak terjadi. Sebaliknya, apa yang terjadi adalah bahwa energi dari frekuensi yang lebih tinggi diperlakukan seolah-olah berada di frekuensi yang lebih rendah; energi ditambahkan ke energi benar-benar hadir pada frekuensi yang lebih rendah. distorsi ini dikenal sebagai aliasing.

Dalam rangka untuk mendigitalkan sinyal tanpa bahaya aliasing, adalah kebiasaan untuk lulus melalui sebuah low-pass filter pertama dalam rangka untuk menghilangkan energi apapun di atas frekuensi Nyquist. Sebagai contoh, jika kita tertarik pada energi hingga 8Khz, kita dapat sampel pada frekuensi sedikit lebih dari 16.000 sampel per detik, setelah menyaring energi di atas 8Khz. Namun, realisasi fisik low-pass filter tidak cukup dengan memberikan 100% dari energi yang di bawah frekuensi cutoff dan menghilangkan semua energi di atasnya. Penurunan energi di atas frekuensi cutoff nominal bertahap. Jika kita menggunakan filter dengan cutoff nominal 8Khz, kita mungkin masih memiliki energi yang signifikan di daerah sedikit di atas 8Khz. Oleh karena itu, agar aman, jika kita tahu bahwa kita tertarik energi hingga F frekuensi, kami menggunakan low-pass filter dengan cutoff nominal F dan kita memilih tingkat sampling secara signifikan atas 2F. Dengan begitu, laju sampling kami akan cukup tinggi bahwa setiap energi di wilayah tepat di atas frekuensi cutoff nominal tidak akan alias. Praktek yang umum adalah dengan menggunakan tingkat sampling 2.5F.

konverter analog-ke-digital lama yang memungkinkan pilihan tarif sampling harus memiliki filter analog variabel sebelum digitizer. Saat ini, pengolahan sinyal hardware sangat cepat dan murah bahwa pendekatan yang biasa adalah dengan menggunakan low-pass filter dengan frekuensi cutoff tetap, maka sampel pada tingkat tinggi. Sinyal sampel ini kemudian downsampled (dikonversi ke tingkat sampling yang lebih rendah) setelah digital low-pass filter.

Tingkat sampling yang paling umum saat ini adalah 44.100 sampel per detik. Ini adalah tingkat pengambilan sampel yang digunakan untuk CD musik. Karena pasar musik jauh lebih besar dari yang lain (seperti pasar untuk penelitian fonetik akustik), off-the-rak perangkat keras dan perangkat lunak dirancang untuk spesifikasinya. Tingkat sampling memungkinkan untuk konten frekuensi sampai sedikit di atas 20kHz, yang mencakup seluruh rentang bahwa manusia bisa mendengar. Memang, kebanyakan orang dewasa tidak dapat mendengar frekuensi hampir yang tinggi.

Ketika bahan digitalisasi untuk penelitian linguistik, Anda dapat menghemat ruang dengan menggunakan tingkat sampling yang lebih rendah, mengatakan 22.050 sampel per detik. Semua informasi linguistik dalam pidato di bawah 8KHz, sehingga tingkat ini lebih dari cukup.

Sampling rate lain yang kadang-kadang terlihat adalah 8.000 sampel per detik. Angka ini sesuai (menggunakan pengali sebesar 2,5 daripada 2,0 dibahas di atas) untuk frekuensi maksimum 3.2KHz, yang merupakan batas atas dari band telepon. Tingkat ini adalah karena itu cocok untuk aplikasi yang melibatkan pembicaraan telepon. Hal ini terlalu rendah untuk pidato berkualitas baik atau musik, dan tidak diterima untuk penelitian fonetik kebanyakan.

NB : http://billposer.org/Linguistics/Computation/LectureNotes/AudioData.html



Iklan

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout /  Ubah )

Foto Google

You are commenting using your Google account. Logout /  Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout /  Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout /  Ubah )

Connecting to %s