Estero

L’intelligenza artificiale interpreta lingua dei segni in tempo reale

19 Dicembre 2024

341 Numero visite

L’AI interpreta la lingua dei segni americana con il 98% di accuratezza. Lo studio FAU utilizza MediaPipe e YOLOv8 per un sistema innovativo e accessibile

di Lorenzo De Santis
Redazione Matrice Digitale

Un team di ricercatori della Florida Atlantic University (FAU) ha sviluppato un sistema basato su intelligenza artificiale (AI) in grado di riconoscere con precisione i gesti della lingua dei segni americana (ASL) in tempo reale. Questa innovazione sfrutta tecniche avanzate di computer vision e modelli di deep learning, offrendo una soluzione tecnologica per migliorare la comunicazione tra persone sorde o con difficoltà uditive e il mondo circostante.

L’approccio tecnico: MediaPipe e YOLOv8

Lo studio si concentra sul riconoscimento delle lettere dell’alfabeto ASL utilizzando un dataset personalizzato composto da 29.820 immagini statiche di gesti della mano. Ogni immagine è stata annotata con 21 punti chiave (landmark) usando MediaPipe, un framework di Google dedicato al tracciamento dei movimenti corporei. Questa annotazione dettagliata ha fornito una rappresentazione spaziale accurata della struttura e della posizione della mano.

Questi dati sono stati utilizzati per addestrare YOLOv8, uno dei modelli di deep learning più avanzati per il rilevamento di oggetti, ottimizzando il processo di riconoscimento e classificazione dei gesti.

Bader Alsharif, primo autore della ricerca e candidato al dottorato presso il Dipartimento di Ingegneria Elettrica e Informatica della FAU, ha definito questa integrazione un “approccio innovativo mai esplorato prima, che apre nuove prospettive per applicazioni future.”

Prestazioni del modello e risultati

Il sistema sviluppato ha raggiunto risultati eccezionali, con:

Accuratezza del 98%,
Recall del 98%,
F1 score del 99%,
Media Average Precision (mAP) del 98%,
mAP50-95 del 93%.

Questi numeri dimostrano l’efficacia del modello nel catturare anche le più piccole variazioni nei gesti, rendendolo affidabile e robusto in scenari reali.

Secondo Mohammad Ilyas, coautore dello studio e professore alla FAU, il successo è stato reso possibile dalla combinazione di transfer learning, creazione di dataset dettagliati e ottimizzazione dei parametri di apprendimento.

Applicazioni pratiche e prospettive future

Questo sistema ha il potenziale per essere utilizzato in applicazioni pratiche come strumenti di traduzione in tempo reale, migliorando l’accessibilità per la comunità sorda o con difficoltà uditive. Le potenziali aree di applicazione includono:

Istruzione, per facilitare l’interazione tra studenti sordi e insegnanti.
Sanità, per garantire una comunicazione più efficace tra pazienti e operatori sanitari.
Settori sociali, per ridurre le barriere nella vita quotidiana.

Le future ricerche si concentreranno sull’espansione del dataset per includere un numero maggiore di gesti dinamici, migliorando ulteriormente l’accuratezza del modello. Inoltre, gli sforzi si orienteranno verso l’ottimizzazione per dispositivi edge, come smartphone o tablet, garantendo prestazioni in tempo reale anche in ambienti con risorse limitate.

Lo studio condotto dalla Florida Atlantic University rappresenta un importante passo avanti nella creazione di strumenti basati sull’intelligenza artificiale per la traduzione della lingua dei segni americana in tempo reale. Integrando tecnologie avanzate come MediaPipe e YOLOv8, i ricercatori hanno sviluppato un sistema altamente preciso e affidabile, che può migliorare significativamente l’accessibilità e l’inclusività per milioni di persone in tutto il mondo.

Servizio di accesso alle cure più facile per persone sorde a L’Aquila

Sociale, punti di accesso per persone sorde negli ospedali

Torino, la lite fra fidanzati sordomuti a Orbassano finisce a coltellate: 4 anni ai domiciliari per la donna violenta

Accoltella il compagno sordomuto come lei. Condannata a 4 anni

I non udenti chiedono il rispetto della legge che impone l’uso di Libra da parte di enti pubblici e aziende

Gaza, venti persone non udenti cucinano per 1.750 persone sfollate nel pieno della guerra

Uno studente di Glasgow scopre un mattoncino Lego nell’orecchio dopo due decenni

Viaggi, utenti con disabilità impossibilitati a prenotare a causa dei siti web inaccessibili

Imu disabili e anziani 2025, tutti i requisiti per l’esenzione

Quali bonus ti spettano se hai un Isee entro i 40.000 euro: l’elenco completo

Legge 104, è gratuito il passaggio di proprietà per i veicoli sia nuovi che usati: ecco l’elenco completo e i requisiti

Sociale: la Provincia di Bozen apporta modifiche a diverse prestazioni

San Benedetto del Tronto nella memoria di scrittori, viaggiatori e poeti

Marcianise, al Campania l’Aperitivo Silenzioso che promuove l’inclusione tra udenti e sordi

Angeli e demoni Recensione del romanzo: ”I demoni di Pausilypon” di Pino Imperatore

Il Museo di Lipari “parla” in Braille e in LiS per raccontarsi a non vedenti e non udenti

Bilancio positivo per scacchi ne’ Monti

Campionati italiano non udenti a Rossana

Dall’aiuto ai compagni disabili all’AI per il Parkinson: Mattarella premia 29 Alfieri della Repubblica

Sant’Agata Militello: celebrazione della Santa Messa in LiS, la Lingua dei Segni

Marcianise, al Campania l’Aperitivo Silenzioso che promuove l’inclusione tra udenti e sordi

“Deep”: la tecnologia che abbatte le frontiere per i sordi

Alba. Inaugurata la nuova segnaletica turistica interattiva

Un’applicazione per la comunicazione delle persone sorde

L’intelligenza artificiale interpreta lingua dei segni in tempo reale

L’approccio tecnico: MediaPipe e YOLOv8

Prestazioni del modello e risultati

Applicazioni pratiche e prospettive future

L'informazione completa

Videaf

Uomo sordocieco in difficoltà durante un volo viene aiutato da una...

Barbie, Margot Robbie fuoriclasse vera: eccola alle prese con la lingua...

Sudan, il locale dei sordi

Alunni delle elementari imparano la lingua dei segni per comunicare con...

TIC 44 – Progetto “Culture LSF” vincitore bronzo dei premi 2022...