Dozen Blogs
  • Tecnologia
  • CONTATTI
  • Tecnologia
  • CONTATTI
20.09.2024 In Tecnologia

Co-LLM: l’innovativo algoritmo del MIT migliora la collaborazione tra modelli linguistici AI

Un team di ricercatori del Computer Science and Artificial Intelligence Laboratory (CSAIL) del MIT ha sviluppato un nuovo algoritmo chiamato “Co-LLM”, che promette di rivoluzionare il modo in cui i modelli linguistici di grandi dimensioni (LLM) collaborano tra loro. Questa innovazione potrebbe portare a soluzioni di intelligenza artificiale miglio ed efficienti in vari campi, dalla medicina alla matematica.

L’algoritmo Co-LLM funziona accoppiando un LLM generico con un modello più specializzato, permettendo loro di lavorare insieme in modo sinergico. Il processo è paragonabile a una persona che, non conoscendo completamente la risposta a una domanda, chiede aiuto a un amico esperto in materia.

Shannon Shen, dottoranda in ingegneria elettrica e informatica al MIT e autrice principale dello studio, spiega: “Con Co-LLM, stiamo essenzialmente addestrando un LLM generico a ‘telefonare’ a un modello esperto quando necessario”. Questo approccio organico permette ai modelli di apprendere modelli di collaborazione che assomigliano al modo in cui gli esseri umani riconoscono quando chiamare un esperto per colmare le lacune.

Il cuore dell’innovazione è una “variabile di commutazione”, una sorta di project manager virtuale che decide quando il modello di base necessita dell’aiuto del modello esperto. Questa variabile valuta la competenza di ogni parola nelle risposte dei due LLM, intervenendo nei punti in cui può inserire un token migliore dal modello esperto.

I risultati sono promettenti. Ad esempio, quando è stato chiesto di risolvere un problema matematico come “a3 · a2 se a=5”, il modello generico ha calcolato erroneamente 125 come risposta. Tuttavia, collaborando con un LLM matematico specializzato chiamato Llemma, Co-LLM ha determinato correttamente che la soluzione era 3.125.

L’algoritmo ha dimostrato prestazioni superiori rispetto agli LLM semplici ottimizzati e ai modelli specializzati non ottimizzati che lavorano indipendentemente. Inoltre, a differenza di altri approcci di collaborazione LLM, Co-LLM può guidare due modelli addestrati in modo diverso a lavorare insieme, attivando il modello esperto solo per token particolari, portando a una generazione più efficiente.

Le applicazioni potenziali di questa tecnologia sono vaste. Nel campo medico, Co-LLM potrebbe fornire risposte più accurate a domande complesse, come spiegare i meccanismi alla base di una particolare malattia. Nel settore aziendale, potrebbe essere utilizzato per aggiornare documenti interni utilizzando le informazioni più recenti, combinando dati aggiornati con una forte capacità di ragionamento.

Colin Raffel, professore associato all’Università di Toronto e direttore associato di ricerca presso il Vector Institute, non coinvolto nella ricerca, ha commentato: “Co-LLM presenta un approccio interessante per imparare a scegliere tra due modelli per migliorare l’efficienza e le prestazioni. […] Co-LLM contribuisce a un’importante linea di ricerca che mira a sviluppare ecosistemi di modelli specializzati per superare le prestazioni di costosi sistemi AI monolitici.”

Guardando al futuro, i ricercatori del MIT stanno considerando ulteriori miglioramenti. Stanno esplorando un approccio di deferimento più robusto che possa tornare indietro quando il modello esperto non fornisce una risposta corretta, permettendo all’algoritmo di correggere il corso e dare comunque una risposta soddisfacente. Inoltre, stanno lavorando per mantenere le risposte il più aggiornate possibile, aggiornando il modello esperto quando sono disponibili nuove informazioni.

Articolo originale disponibile qui

Tecnologia
Previous StoryLa Big science incontra le imprese, al via il forum europeo
Next StoryRecensione Narwal Freo Z Ultra: il migliore a riconoscere i piccoli oggetti

Related Articles

  • Samsung e Johns Hopkins, rivoluzione della refrigerazione in arrivo
    Samsung e Johns Hopkins, rivoluzione della refrigerazione in arrivo
  • James Webb scopre un pianeta gigante che orbita una stella morente
    James Webb scopre un pianeta gigante che orbita una stella morente

Articoli recenti

  • Sega annuncia Football Club Champions: free-to-play basato su Football Manager
  • Gli oggetti vecchi, pericolosi perché abbandonati
  • iPhone senza tasti fisici: Apple lavora alla stessa soluzione anche per Watch e iPad
  • Un tatuaggio elettronico misura lo stress mentale
  • Dazi USA, i giudici cancellano le tariffe di Trump: cosa può succedere

Archivi

  • Maggio 2025
  • Aprile 2025
  • Marzo 2025
  • Febbraio 2025
  • Gennaio 2025
  • Dicembre 2024
  • Novembre 2024
  • Ottobre 2024
  • Settembre 2024
  • Agosto 2024
  • Luglio 2024
  • Giugno 2024
  • Maggio 2024
  • Aprile 2024
  • Marzo 2024
  • Febbraio 2024
  • Gennaio 2024
  • Dicembre 2023
  • Novembre 2023
  • Ottobre 2023
  • Settembre 2023
  • Agosto 2023
  • Luglio 2023
  • Giugno 2023
  • Maggio 2023
  • Aprile 2023
  • Marzo 2023
  • Febbraio 2023
  • Gennaio 2023
  • Dicembre 2022
  • Novembre 2022
  • Ottobre 2022
  • Settembre 2022
  • Agosto 2022
  • Luglio 2022
  • Giugno 2022
  • Maggio 2022
  • Aprile 2022
  • Marzo 2022
  • Febbraio 2022
  • Gennaio 2022
  • Dicembre 2021
  • Novembre 2021
  • Ottobre 2021
  • Settembre 2021
  • Agosto 2021
  • Luglio 2021
  • Giugno 2021
  • Maggio 2021
  • Aprile 2021
  • Marzo 2021
  • Febbraio 2021
  • Gennaio 2021
  • Dicembre 2020
  • Novembre 2020
  • Ottobre 2020
  • Settembre 2020
  • Agosto 2020
  • Luglio 2020
  • Giugno 2020
  • Maggio 2020
  • Aprile 2020
  • Marzo 2020
  • Febbraio 2020
  • Gennaio 2020
  • Dicembre 2019
  • Novembre 2019
  • Ottobre 2019
  • Settembre 2019
  • Agosto 2019
  • Luglio 2019
  • Giugno 2019
  • Maggio 2019
  • Aprile 2019
  • Marzo 2019
  • Febbraio 2019
  • Gennaio 2019
  • Dicembre 2018
  • Novembre 2018
  • Ottobre 2018
  • Settembre 2018
  • Agosto 2018
  • Luglio 2018
  • Agosto 2017
  • Luglio 2017
  • Luglio 2016
  • Giugno 2016
  • Gennaio 2016

Categorie

  • Accessori
  • Acer
  • adsl
  • Alfa Romeo
  • Alpine
  • Alta Definizione
  • Amazon
  • Ambiente
  • AMD
  • android
  • antivirus
  • App
  • Apple
  • Apps
  • Articolo
  • Astronomia
  • Asus
  • Attualità
  • Audi
  • Audio e TV
  • Auto
  • Automobili
  • Bentley
  • Biotech
  • BMW
  • Bugatti
  • Business
  • BYD
  • Canon
  • cartucce
  • casio
  • Cellulari e Smartphone
  • Cinema
  • Citroen
  • cloud
  • compatibile
  • Computer
  • concorso
  • Consigli utili
  • Consumi
  • Continental
  • cover
  • Covid19
  • crittografia
  • Cultura
  • Cupra
  • Curiosità
  • custodia
  • Dacia
  • Daihatsu
  • Dell
  • Design
  • DJI
  • Dodge
  • Doogee
  • eBay
  • Ecologia
  • ecommerce
  • Economia e Mercato
  • Education
  • elearning
  • Elettriche
  • Elon Musk
  • email
  • Energia
  • epilatore
  • Epson
  • Eventi
  • f1
  • facebook
  • FCA
  • Ferrari
  • Fiat
  • Finanza
  • Fisker
  • Food
  • Ford
  • fotocamere
  • fotografia
  • Fotografia digitale
  • Fumetti
  • Games
  • gaming
  • General Motors
  • Gigabyte
  • Giochi
  • giochi online
  • GoDaddy
  • Google
  • GoPro
  • Green
  • guida
  • guide
  • Guide Acquisto
  • Hardware
  • Hisense
  • Honda
  • Honor
  • hosting
  • HP
  • HTC
  • Huawei
  • Hyundai
  • Indossabili
  • Informatica
  • Intel
  • internet
  • iOs
  • ipcamera
  • Jaguar
  • Kia
  • Lab
  • Lamborghini
  • Lancia
  • Land Rover
  • Lavoro
  • Lenovo
  • Lexus
  • LG
  • Libri
  • Linux
  • Lotus
  • luce pulsata
  • malware
  • marketing
  • marte
  • Maserati
  • Mazda
  • Media
  • Medicina
  • mercedes
  • Mercedes Benz
  • Mesh
  • messenger
  • MG
  • Michelin
  • Microsoft
  • Mini
  • Mobile
  • Mondo Apple
  • Mondo Motori
  • monitor
  • Moto
  • Motori
  • motorola
  • Motorsport
  • MSI
  • Musica
  • nasa
  • News
  • Nikon
  • Nintendo
  • NIO
  • Nissan
  • Nokia
  • Notebook
  • Nothing
  • Notizie di astronomia
  • Notizie di tecnologica
  • Nubia
  • nuove frequenze
  • Nvidia
  • obiettivo
  • occhiali
  • Offerte
  • on demand
  • OnePlus
  • Opel
  • Oppo
  • orologio
  • ottimizzazione
  • Outdoor
  • Pagani
  • Panasonic
  • Peugeot
  • Philips
  • phishing
  • Poco
  • poker
  • Politica
  • Porsche
  • Portatili
  • posta elettronica
  • PrestaShop
  • Prodotti audio e video
  • Prove prodotti
  • Prove software
  • PSA
  • Qualcomm
  • ragno
  • Razer
  • Realme
  • recensione
  • Redmi
  • reflex
  • Regole
  • Renault
  • Risorse dal web
  • robot
  • Rolls Royce
  • router
  • Rumor
  • Salute
  • Samsung
  • Scienza
  • script
  • scuola
  • Seat
  • segnale tv
  • segnale tv 2022
  • Senza categoria
  • Seo
  • Sharp
  • sicurezza
  • sigma
  • siti web
  • Skoda
  • Smart
  • Smart Home
  • smartphone
  • smartwatch
  • sms
  • Social
  • Social Network
  • software
  • sofware
  • Sony
  • Sostenibilità
  • Spazio
  • Speciale
  • Sponsor
  • Sport
  • SsangYong
  • stampanti
  • Startup
  • streaming
  • Subaru
  • Suzuki
  • Tablet
  • Tariffe
  • TCL
  • Tech
  • Tech Recensioni
  • TECNO
  • Tecnologia
  • Tesla
  • Tips and Tricks
  • TLC
  • Toshiba
  • Toyota
  • Tutorial
  • Tv
  • tv dvb
  • Unieuro
  • Utilità
  • Viaggi
  • Video Recensione
  • Videogiochi
  • videosorveglianza
  • vivo
  • Vodafone
  • Volkswagen
  • Volvo
  • Web
  • WiFi
  • Wiko
  • windows
  • Windows 10
  • wireless
  • Wordpress
  • Xiaomi
  • Yamaha
  • zaino
  • zimbra
  • ZTE
  • Tecnologia
  • CONTATTI

All Rights Reserved Copyright © 2015 - 2021 DozenBlogs by Anna Maria Turola 00041 Albano Laziale (RM)  |   Cookie & Privacy Policy   |  info@dozenblogs.com

to top button
Gestisci Consenso Cookie
Usiamo cookie per ottimizzare il nostro sito web ed i nostri servizi.
Cookie funzionali Sempre attivo
L'archiviazione tecnica o l'accesso sono strettamente necessari al fine legittimo di consentire l'uso di un servizio specifico esplicitamente richiesto dall'abbonato o dall'utente, o al solo scopo di effettuare la trasmissione di una comunicazione su una rete di comunicazione elettronica.
Preferenze
L'archiviazione tecnica o l'accesso sono necessari per lo scopo legittimo di memorizzare le preferenze che non sono richieste dall'abbonato o dall'utente.
Statistiche
L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici. L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici anonimi. Senza un mandato di comparizione, una conformità volontaria da parte del vostro Fornitore di Servizi Internet, o ulteriori registrazioni da parte di terzi, le informazioni memorizzate o recuperate per questo scopo da sole non possono di solito essere utilizzate per l'identificazione.
Marketing
L'archiviazione tecnica o l'accesso sono necessari per creare profili di utenti per inviare pubblicità, o per tracciare l'utente su un sito web o su diversi siti web per scopi di marketing simili.
Gestisci opzioni Gestisci servizi Gestisci {vendor_count} fornitori Per saperne di più su questi scopi
Visualizza preference
{title} {title} {title}