Mesej rahsia untuk Alexa dan Co.

Arahan audio tersembunyi boleh memanipulasi pembantu suara

Pembantu suara seperti Alexa adalah praktikal tetapi mudah dimanipulasi, penyelidik kini membuktikan. © Petmal / iStock
membaca dengan kuat

Manipulasi yang tidak munasabah: Pengiktirafan ucapan Alexa, Cortana, Siri dan Co boleh menjadi pintu masuk untuk manipulasi halus, seperti yang ditemui penyelidik IT Jerman. Untuk saluran yang tidak didengar oleh kami - tersembunyi dalam lagu radio, sebagai contoh - perintah rahsia boleh dihantar kepada pembantu. Mesej manipulatif ini kemudian menjadikan sistem membuka pintu atau membeli barang dalam talian - tanpa disedari oleh kami.

Sama ada Alexa, Siri, Cortana atau yang lain: Penolong sistem dengan pengiktirafan ucapan menikmati populariti yang semakin meningkat. Sistem pembelajaran ini - selalunya berdasarkan rangkaian saraf - bertindak balas kepada arahan suara kami, membantu kami mengawal peranti kami, menyampaikan maklumat dari web, atau bahkan membeli secara dalam talian untuk kami. Pembantu digital ini biasanya diaktifkan oleh nama mereka yang diucapkan.

Pesanan tersembunyi

"Betul, selagi awak menghidupkan fungsi penolong, " jelas Thorsten Holz dari Ruhr-Universität Bochum dan pasukannya. "Tetapi ia menjadi masalah jika penyerang boleh melakukannya juga. Ia semakin teruk lagi apabila anda tidak mendengar bahawa serangan itu berlaku. "

Ini mungkin disebabkan oleh hakikat bahawa bagi kita arahan audio yang hampir tidak boleh didengar tertanam dalam suara-suara yang tidak berbahaya - seperti lagu radio, jingle promosi atau sejenisnya. Serangan yang sama, yang dikenali dalam jargon teknikal sebagai Contoh Adversarial, telah diterangkan beberapa tahun lalu untuk perisian pengenalan imej. Juga mungkin penyingkiran audio dengan cara cookies akustik.

Kami mendengar sesuatu yang tidak berbahaya, tetapi pembantu suara mendapat arahan yang tidak dapat didengar. © Holz et al. / Ruhr-Universität Bochum

Manipulasi berjaya

Sama ada dan bagaimana manipulasi seperti itu, penyelidik Bochum telah mencuba dalam eksperimen. Mereka menyembunyikan arahan audio dalam saluran bukan muzik dari fail MP3. Komponen tambahan berbunyi seperti bunyi rawak kepada manusia, yang tidak atau tidak ketara dalam isyarat keseluruhan. "Apabila telinga sibuk memproses nada kuat kekerapan tertentu, kita tidak boleh mendengar suara lain yang lebih lembut untuk beberapa milisaat pada kekerapan itu, " jelas rakan sekerja Wood, Dorothea Kolossa. paparan

Dalam ujian, para penyelidik menyembunyikan perintah sewenang-wenang dalam pelbagai jenis isyarat audio, seperti ucapan, burung atau muzik. Fail audio yang dimanipulasi dimasukkan ke dalam sistem pengenalan suara Kaldi - perisian yang digunakan oleh Alexa dan pembantu digital lain. Hasilnya: sistem pengiktirafan pertuturan memahami arahan tersembunyi dan melaksanakannya.

Buat pembantu sistem lebih selamat

"Sebagai salah satu daripada banyak contoh di mana serangan seperti itu dapat dieksploitasi, seseorang dapat membayangkan pembantu bahasa yang dapat melaksanakan perintah dalam talian, " kata Holz. "Kami boleh memanipulasi fail audio, seperti lagu yang dimainkan di radio, untuk mempunyai perintah untuk membeli produk tertentu." Jika pembantu mempunyai akses kepada komponen-komponen yang tersembunyi, ia boleh Oleh itu, penyerang juga memberi arahan, misalnya, untuk membuka kunci pintu atau buta Venetian.

Dengan eksperimen mereka, para penyelidik ingin mengenal pasti potensi risiko dan membantu menjadikan pembantu bahasa lebih mantap terhadap serangan tersebut. Untuk manipulasi audio yang dikemukakan sekarang, dapat difikirkan bahawa sistem mengira bahagian-bahagian sesuatu isyarat audio tidak boleh didengar untuk manusia, dan mengeluarkannya. "Bagaimanapun, ada cara lain untuk menyembunyikan arahan rahsia dalam fail daripada prinsip MP3, " jelas Kolossa. Dan mereka akan memerlukan perlindungan yang lain lagi.

Bahaya masih rendah, tetapi sekarang

Bahaya serangan audio tersebut masih agak rendah, seperti yang ditekankan para penyelidik. Bagi kebanyakan pembantu bahasa kini tidak berada di kawasan berkaitan keselamatan yang sedang digunakan, tetapi hanya untuk kemudahan. Tetapi itu boleh berubah di masa depan. "Tetapi apabila sistem menjadi lebih canggih dan popular, kerja pada mekanisme perlindungan perlu diteruskan, " kata Holz.

Di samping itu, sistem pengiktirafan pertuturan dalam ujian mereka mendapat fail audio yang dimanipulasi oleh kabel dan tidak secara akustik di udara. Dalam kajian masa depan, para penyelidik ingin menunjukkan bahawa serangan berfungsi dengan baik apabila isyarat dimainkan melalui pembesar suara dan diangkut melalui udara ke pembantu pertuturan. "Disebabkan bunyi bising latar belakang, serangan itu tidak akan menjadi lebih cekap lagi, " mengesyaki rakan sekerja Holz Lea Sch nherr. "Tetapi kami mengandaikannya masih berfungsi."

Contoh-contoh fail audio yang dimanipulasi dan penjelasan lain boleh didapati di laman web penyelidik.

(Ruhr-University Bochum, 25.09.2018 - NPO)