Apple rilascia modelli IA open source eseguibili sul dispositivo

On Apr 26, 2024 0

Apple ha rilasciato oggi diversi modelli LLM (Large Language Model) open source progettati per essere eseguiti sul dispositivo anziché tramite server cloud. Chiamati OpenELM (Open-source Efficient Language Models), gli LLM sono disponibili su Hugging Face Hub , una comunità per la condivisione del codice AI.

Come illustrato in un white paper [ PDF ], esistono otto modelli OpenELM in totale, quattro dei quali sono stati pre-addestrati utilizzando la libreria CoreNet e quattro modelli ottimizzati per le istruzioni. Apple utilizza una strategia di ridimensionamento a livello che mira a migliorare la precisione e l’efficienza.

Apple ha fornito codice, registri di addestramento e versioni multiple anziché solo il modello finale addestrato, e i ricercatori dietro il progetto sperano che porti a progressi più rapidi e “risultati più affidabili” nel campo dell’intelligenza artificiale del linguaggio naturale.

OpenELM, un modello di linguaggio aperto all’avanguardia. OpenELM utilizza una strategia di ridimensionamento a livello per allocare in modo efficiente i parametri all’interno di ciascun livello del modello del trasformatore, garantendo una maggiore precisione. Ad esempio, con un budget di parametri di circa un miliardo di parametri, OpenELM mostra un miglioramento della precisione del 2,36% rispetto a OLMo richiedendo al tempo stesso il doppio dei token di pre-addestramento.

Apple afferma che sta rilasciando i modelli OpenELM per “potenziare e arricchire la comunità di ricerca aperta” con modelli linguistici all’avanguardia. La condivisione di modelli open source offre ai ricercatori un modo per indagare sui rischi e sui dati e sui bias dei modelli. Gli sviluppatori e le aziende possono utilizzare i modelli così come sono o apportare modifiche.

La condivisione aperta delle informazioni è diventata uno strumento importante per Apple per reclutare i migliori ingegneri, scienziati ed esperti perché offre opportunità per documenti di ricerca che normalmente non avrebbero potuto essere pubblicati in base alle politiche segrete di Apple.

Apple non ha ancora introdotto questo tipo di funzionalità IA sui suoi dispositivi, ma si prevede che iOS 18 includa una serie di nuove funzionalità IA e le voci suggeriscono che Apple stia pianificando di eseguire i suoi grandi modelli linguistici sui dispositivi per motivi di privacy.

VIA