Rabu, 06 Desember 2017

Pengakuan Pidato menggunakan Wit.ai

Teknologi anak bangsa -- Catatan: Artikel ini juga ditampilkan di Teknologi anak bangsa Wit.ai adalah antarmuka NLP (pengolahan bahasa alami) untuk aplikasi yang mampu mengubah kalimat menjadi data terstruktur.Dan yang terpenting, gratis.Jadi, tidak ada batasan panggilan API.API Wit.ai menyediakan banyak jenis layanan NLP termasuk Speech Recognition.

Teknologi anak bangsa -- Pada artikel ini, saya akan menunjukkan bagaimana cara mengkonsumsi Wit Speech API menggunakan Python dengan dependensi minimum.Langkah 1: Buat Kunci API Agar bisa menggunakan API Wit.ai, Anda perlu membuat aplikasi Wit.ai.Setiap aplikasi Wit.ai memiliki token akses server yang dapat digunakan sebagai Kunci API.Ikuti langkah-langkah ini untuk membuat aplikasi Wit.ai dan membuat Kunci API: Buka beranda Wit.ai dan masuk dengan akun GitHub atau Facebook Anda.

Teknologi anak bangsa -- Klik pada `` masuk ke bilah menu di atas dan buat aplikasi baru.Sekarang, buka dasbor aplikasi dan buka Setelan aplikasi Anda.Di Setelan, di bawah Detail API, salin Token Akses Server dan gunakan sebagai kunci API.Langkah 2: Script Python untuk merekam audio Jelas, kita butuhuntuk meneruskan data audio ke Wit API untuk pengenalan suara.

Teknologi anak bangsa -- Untuk ini, kami membuat skrip Python untuk merekam audio dari mikrofon.Untuk tujuan ini, kita akan menggunakan modul PyAudio.Instalasi Windows: Instal saja modul PyAudio dengan menggunakan perintah pip sederhana: pip install pyaudio MAC OS X: Instal perpustakaan portaudio menggunakan Homebrew dan kemudian pasang modul PyAudio menggunakan pip: brew install portaudio pip install pyaudio Linux: Instal paket pengembangan perpustakaan portaudio menggunakan perintah ini: sudo apt-get install portaudio19-dev Kemudian, pasang modul PyAudio menggunakan pip: pip install pyaudio Sekarang, perhatikan kode di bawah ini untuk merekam audio dari mikrofon: impor pyaudio gelombang impor def record_audio (RECORD_SECONDS, WAVE_OUTPUT_FILENAME): # --------- SETTING PARAMS UNTUK FILE AUDIO KAMI ------------ # FORMAT = pyaudio.paInt16 # format gelombang CHANNELS = 2 # tidak saluran audio RATE = 44100 # frame rate CHUNK = 1024 # frame per audiomencicipi # ------------------------------------------------- ------- # # membuat objek PyAudio audio = pyaudio.PyAudio () # buka arus baru untuk mikrofon # Ini menciptakan objek kelas PortAudio Stream Wrapper stream = audio.open (format = FORMAT, saluran = SALURAN, rate = RATE, input = True, frames_per_buffer = CHUNK) # ----------------- mulai merekam ------------------- # cetak ("Mendengarkan ...") # daftar untuk menyimpan semua frame audio frame = [] untuk saya dalam jangkauan (int (RATE--------- menyimpan audio ------------------------ # # buat objek file gelombang waveFile = wave.open (WAVE_OUTPUT_FILENAME, `wb`) # Pengaturan untuk objek file gelombang waveFile.setnchannels (CHANNELS) waveFile.setsampwidth (audio.get_sample_size (FORMAT)) waveFile.setframerate (RATE) waveFile.writeframes (b ``.join (frame)) # menutup objek file gelombang waveFile.close () def read_audio (WAVE_FILENAME): # berfungsi untuk membaca file audio (wav) dengan terbuka (WAVE_FILENAME, `rb`) sebagai f: audio = f.read () kembali audio Di sini, kita menggunakan file PyAudio untuk merekam audio dalam format WAV.

Teknologi anak bangsa -- Untuk menulis stream audio ke WaveFile, kami menggunakan gelombang perpustakaan Python built-in.Setelah audio dicatat menggunakan PyAudio, file tersebut akan disimpan sebagai file wav di direktori saat ini.Simpan skrip Python ini sebagai Recorder.py (seperti yang akan kita impor skrip Python ini dengan nama ini dalam skrip Python utama).Langkah 3: Script Python untuk berinteraksi dengan Wit Speech API Sekarang, waktunya untuk menulis skrip Python untuk berinteraksi dengan WitAPI ucapan Pertimbangkan kode di bawah ini: permintaan impor impor json dari Recorder import record_audio, read_audio # Wit speech API endpoint API_ENDPOINT = `https://api.wit.ai/speech` # Wit.ai api access token wit_access_token = `XXXXXXXXXXXXXXXXXX` def RecognizeSpeech (AUDIO_FILENAME, num_seconds = 5): # Rekam audio dengan panjang tertentu dalam file audio tertentu record_audio (num_seconds, AUDIO_FILENAME) # membaca audio audio = read_audio (AUDIO_FILENAME) # menentukan header untuk permintaan HTTP header = {`otorisasi`: `Pembawa` + wit_access_token, `Content-Type`: `audio / wav`} # membuat permintaan posting HTTP resp = request.post (API_ENDPOINT, header = header, data = audio) # Mengubah konten tanggapan ke format JSON data = json.loads (resp.content) # mendapatkan teks dari data teks = data [`_ teks`] # kembalikan teksnya kembali teks jika __name__ == "__main__": text = KenaliSpeech (`myspeech.wav `, 4) cetak (" nAnda berkata: {}".

Teknologi anak bangsa -- format (teks)) Wit Speech API menerima permintaan HTTP POST.Permintaan POST harus berisi: header header = {`otorisasi`: `Pembawa` wit_access_token, `Content-Type`: `audiose kosong Github repository: Wit Speech API Wrapper Berikut adalah video demo tentang bagaimana skrip di atas bekerja: Advertisements Share this: Twitter Facebook Google Suka ini: Like Loading ...Related .

Tidak ada komentar:

Posting Komentar