Dozen Blogs
  • Tecnologia
  • CONTATTI
  • Tecnologia
  • CONTATTI
04.04.2023 In Tecnologia

Riconoscimento di voci in ambienti rumorosi

Grazie all’intelligenza artificiale di Whisper.

whisper

Il riconoscimento vocale oggigiorno funziona piuttosto bene quando la voce è
scandita chiaramente e non c’è rumore di sottofondo, ma fallisce miseramente se chi
parla si mangia un po’ le parole, ha un accento molto marcato oppure si trova in
un ambiente rumoroso. Se poi si tratta di una voce che canta, accompagnata e
magari coperta da tanti strumenti, non c’è niente da fare.

Ma alcuni mesi fa la società OpenAI, già nota per altri prodotti di intelligenza artificiale di cui ho parlato in questo blog, come DALL-E per la generazione di immagini, ha rilasciato Whisper, che è un software di intelligenza artificiale capace di superare queste limitazioni, diventando abile quanto una persona nel decifrare le parole di una conversazione anche in contesti rumorosi.

Per esempio, Whisper è in grado di riconoscere le parole pronunciate in varie lingue, dette a grandissima velocità e registrate con bassa qualità, cantate in una canzone K-Pop o dette con un forte accento, come negli esempi che trovate sul sito di Whisper.

L’azienda ha addestrato Whisper alimentandolo con 680.000 ore di audio abbinato alle trascrizioni corrispondenti in 98 lingue differenti. Oltre a riconoscere il parlato in condizioni difficili, è anche in grado di fornirne una traduzione in inglese abbastanza dignitosa.

Spunti di approfondimento:

Whisper è stato rilasciato come prodotto open source, libero e gratuito, per cui chiunque lo può scaricare e installare liberamente e lo può anche modificare. Richiede un computer piuttosto potente, e i suoi creatori avvisano che il modo in cui Whisper analizza il parlato può a volte fargli “riconoscere” parole che in realtà non ci sono, per cui è sempre necessaria una revisione attenta da parte di una persona. Ma lo sviluppo esplosivo di questi software di intelligenza artificiale dovrebbe far riflettere molto attentamente chiunque faccia trascrizioni per lavoro. Forse dovrà cominciare a pensare a come riorganizzare il proprio lavoro per diventare revisore esperto anziché dattilografo.

Ci sono anche implicazioni più profonde e rivoluzionarie, che è necessario considerare ogni volta che un procedimento che prima era oneroso diventa semplice e automatizzato: se diventa possibile trascrivere enormi quantità di parlato a costo praticamente nullo e il costo dei supporti di registrazione è altrettanto trascurabile, diventa possibile per esempio automatizzare la sorveglianza di massa.

Ti raccomandiamo anche:

Diventa possibile registrare l’audio di tutte le telefonate di un intero paese e trascriverle tutte integralmente, per poi cercare eventuali nomi o parole di interesse o per riconoscere le singole voci, anche a distanza di tempo. C’è chi sospetta che alcuni governi abbiano già questo tipo di capacità, ma con Whisper potrebbe averle anche uno staterello relativamente squattrinato.

Proposte di lettura:

Pensando ad applicazioni meno controverse, invece, un riconoscimento vocale automatizzato con le capacità di Whisper permetterebbe di trasformare in testo, a costi ben più abbordabili di quelli attuali, gli enormi archivi dei programmi radiofonici e televisivi storici e renderli accessibili anche a chi ha difficoltà di udito oltre che ai linguisti, agli storici o a chiunque abbia semplicemente il desiderio di ritrovare una battuta o una dichiarazione fatta da qualcuno magari qualche decennio fa.

E queste sono solo le possibilità che vengono in mente adesso; chissà quali verranno inventate quando questa tecnologia sarà diventata normale.

Fonti aggiuntive: Ars Technica, Slashdot.

Non perderti anche:

Articolo originale disponibile qui

Previous StoryWikipedia scritta dall’AI? Fondatore valuta possibilità
Next StoryRecensione Motorola Edge 40 Pro: dimenticatevi i problemi di autonomia!

Related Articles

  • Samsung conferma: visore XR entro la fine del 2025
    Samsung conferma: visore XR entro la fine del 2025
  • Su Giove violente piogge ghiacciate di acqua e ammoniaca
    Su Giove violente piogge ghiacciate di acqua e ammoniaca

Articoli recenti

  • Samsung conferma: visore XR entro la fine del 2025
  • Su Giove violente piogge ghiacciate di acqua e ammoniaca
  • Apple, stop alla firma di iOS 18.4.1: bloccato il downgrade da iOS 18.5
  • Pirateria, multati in Italia anche gli utenti finali
  • Coupon Unieuro: risparmia su tecnologia, elettrodomestici e tanto altro!

Archivi

  • Maggio 2025
  • Aprile 2025
  • Marzo 2025
  • Febbraio 2025
  • Gennaio 2025
  • Dicembre 2024
  • Novembre 2024
  • Ottobre 2024
  • Settembre 2024
  • Agosto 2024
  • Luglio 2024
  • Giugno 2024
  • Maggio 2024
  • Aprile 2024
  • Marzo 2024
  • Febbraio 2024
  • Gennaio 2024
  • Dicembre 2023
  • Novembre 2023
  • Ottobre 2023
  • Settembre 2023
  • Agosto 2023
  • Luglio 2023
  • Giugno 2023
  • Maggio 2023
  • Aprile 2023
  • Marzo 2023
  • Febbraio 2023
  • Gennaio 2023
  • Dicembre 2022
  • Novembre 2022
  • Ottobre 2022
  • Settembre 2022
  • Agosto 2022
  • Luglio 2022
  • Giugno 2022
  • Maggio 2022
  • Aprile 2022
  • Marzo 2022
  • Febbraio 2022
  • Gennaio 2022
  • Dicembre 2021
  • Novembre 2021
  • Ottobre 2021
  • Settembre 2021
  • Agosto 2021
  • Luglio 2021
  • Giugno 2021
  • Maggio 2021
  • Aprile 2021
  • Marzo 2021
  • Febbraio 2021
  • Gennaio 2021
  • Dicembre 2020
  • Novembre 2020
  • Ottobre 2020
  • Settembre 2020
  • Agosto 2020
  • Luglio 2020
  • Giugno 2020
  • Maggio 2020
  • Aprile 2020
  • Marzo 2020
  • Febbraio 2020
  • Gennaio 2020
  • Dicembre 2019
  • Novembre 2019
  • Ottobre 2019
  • Settembre 2019
  • Agosto 2019
  • Luglio 2019
  • Giugno 2019
  • Maggio 2019
  • Aprile 2019
  • Marzo 2019
  • Febbraio 2019
  • Gennaio 2019
  • Dicembre 2018
  • Novembre 2018
  • Ottobre 2018
  • Settembre 2018
  • Agosto 2018
  • Luglio 2018
  • Agosto 2017
  • Luglio 2017
  • Luglio 2016
  • Giugno 2016
  • Gennaio 2016

Categorie

  • Accessori
  • Acer
  • adsl
  • Alfa Romeo
  • Alpine
  • Alta Definizione
  • Amazon
  • Ambiente
  • AMD
  • android
  • antivirus
  • App
  • Apple
  • Apps
  • Articolo
  • Astronomia
  • Asus
  • Attualità
  • Audi
  • Audio e TV
  • Auto
  • Automobili
  • Bentley
  • Biotech
  • BMW
  • Bugatti
  • Business
  • BYD
  • Canon
  • cartucce
  • casio
  • Cellulari e Smartphone
  • Cinema
  • Citroen
  • cloud
  • compatibile
  • Computer
  • concorso
  • Consigli utili
  • Consumi
  • Continental
  • cover
  • Covid19
  • crittografia
  • Cultura
  • Cupra
  • Curiosità
  • custodia
  • Dacia
  • Daihatsu
  • Dell
  • Design
  • DJI
  • Dodge
  • Doogee
  • eBay
  • Ecologia
  • ecommerce
  • Economia e Mercato
  • Education
  • elearning
  • Elettriche
  • Elon Musk
  • email
  • Energia
  • epilatore
  • Epson
  • Eventi
  • f1
  • facebook
  • FCA
  • Ferrari
  • Fiat
  • Finanza
  • Fisker
  • Food
  • Ford
  • fotocamere
  • fotografia
  • Fotografia digitale
  • Fumetti
  • Games
  • gaming
  • General Motors
  • Gigabyte
  • Giochi
  • giochi online
  • GoDaddy
  • Google
  • GoPro
  • Green
  • guida
  • guide
  • Guide Acquisto
  • Hardware
  • Hisense
  • Honda
  • Honor
  • hosting
  • HP
  • HTC
  • Huawei
  • Hyundai
  • Indossabili
  • Informatica
  • Intel
  • internet
  • iOs
  • ipcamera
  • Jaguar
  • Kia
  • Lab
  • Lamborghini
  • Lancia
  • Land Rover
  • Lavoro
  • Lenovo
  • Lexus
  • LG
  • Libri
  • Linux
  • Lotus
  • luce pulsata
  • malware
  • marketing
  • marte
  • Maserati
  • Mazda
  • Media
  • Medicina
  • mercedes
  • Mercedes Benz
  • Mesh
  • messenger
  • MG
  • Michelin
  • Microsoft
  • Mini
  • Mobile
  • Mondo Apple
  • Mondo Motori
  • monitor
  • Moto
  • Motori
  • motorola
  • Motorsport
  • MSI
  • Musica
  • nasa
  • News
  • Nikon
  • Nintendo
  • NIO
  • Nissan
  • Nokia
  • Notebook
  • Nothing
  • Notizie di astronomia
  • Notizie di tecnologica
  • Nubia
  • nuove frequenze
  • Nvidia
  • obiettivo
  • occhiali
  • Offerte
  • on demand
  • OnePlus
  • Opel
  • Oppo
  • orologio
  • ottimizzazione
  • Outdoor
  • Pagani
  • Panasonic
  • Peugeot
  • Philips
  • phishing
  • Poco
  • poker
  • Politica
  • Porsche
  • Portatili
  • posta elettronica
  • PrestaShop
  • Prodotti audio e video
  • Prove prodotti
  • Prove software
  • PSA
  • Qualcomm
  • ragno
  • Razer
  • Realme
  • recensione
  • Redmi
  • reflex
  • Regole
  • Renault
  • Risorse dal web
  • robot
  • Rolls Royce
  • router
  • Rumor
  • Salute
  • Samsung
  • Scienza
  • script
  • scuola
  • Seat
  • segnale tv
  • segnale tv 2022
  • Senza categoria
  • Seo
  • Sharp
  • sicurezza
  • sigma
  • siti web
  • Skoda
  • Smart
  • Smart Home
  • smartphone
  • smartwatch
  • sms
  • Social
  • Social Network
  • software
  • sofware
  • Sony
  • Sostenibilità
  • Spazio
  • Speciale
  • Sponsor
  • Sport
  • SsangYong
  • stampanti
  • Startup
  • streaming
  • Subaru
  • Suzuki
  • Tablet
  • Tariffe
  • TCL
  • Tech
  • Tech Recensioni
  • TECNO
  • Tecnologia
  • Tesla
  • Tips and Tricks
  • TLC
  • Toshiba
  • Toyota
  • Tutorial
  • Tv
  • tv dvb
  • Unieuro
  • Utilità
  • Viaggi
  • Video Recensione
  • Videogiochi
  • videosorveglianza
  • vivo
  • Vodafone
  • Volkswagen
  • Volvo
  • Web
  • WiFi
  • Wiko
  • windows
  • Windows 10
  • wireless
  • Wordpress
  • Xiaomi
  • Yamaha
  • zaino
  • zimbra
  • ZTE
  • Tecnologia
  • CONTATTI

All Rights Reserved Copyright © 2015 - 2021 DozenBlogs by Anna Maria Turola 00041 Albano Laziale (RM)  |   Cookie & Privacy Policy   |  info@dozenblogs.com

to top button
Gestisci Consenso Cookie
Usiamo cookie per ottimizzare il nostro sito web ed i nostri servizi.
Cookie funzionali Sempre attivo
L'archiviazione tecnica o l'accesso sono strettamente necessari al fine legittimo di consentire l'uso di un servizio specifico esplicitamente richiesto dall'abbonato o dall'utente, o al solo scopo di effettuare la trasmissione di una comunicazione su una rete di comunicazione elettronica.
Preferenze
L'archiviazione tecnica o l'accesso sono necessari per lo scopo legittimo di memorizzare le preferenze che non sono richieste dall'abbonato o dall'utente.
Statistiche
L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici. L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici anonimi. Senza un mandato di comparizione, una conformità volontaria da parte del vostro Fornitore di Servizi Internet, o ulteriori registrazioni da parte di terzi, le informazioni memorizzate o recuperate per questo scopo da sole non possono di solito essere utilizzate per l'identificazione.
Marketing
L'archiviazione tecnica o l'accesso sono necessari per creare profili di utenti per inviare pubblicità, o per tracciare l'utente su un sito web o su diversi siti web per scopi di marketing simili.
Gestisci opzioni Gestisci servizi Gestisci {vendor_count} fornitori Per saperne di più su questi scopi
Visualizza preference
{title} {title} {title}