Meta publica Llama 2, l’alternativa oberta de GPT-4 i PaLM2

Meta publica Llama 2, l’alternativa oberta de GPT-4 i PaLM2 Dijous, Juliol 20, 2023

El nou model de processament de llenguatge natural s’ha entrenat amb un volum de dades un 40% més gran que la primera versió

L’empresa matriu de Facebook i Instagram, Meta, ha fet pública aquest dimarts Llama 2, el nou model de processament de llenguatge natural (PLN) que busca competir amb el GPT-4 d’OpenAI i el PaLM2 de Google, els quals operen ChatGPT i Google Bard, respectivament. La nova aposta de la multinacional dirigida per Mark Zuckerberg per la intel·ligència artificial destaca pel fet que, a diferència d’altres alternatives, Llama 2 és un model de codi obert i d’ús gratuït per a investigadors i usos comercials.

Llama 2 està entrenat amb un volum de dades un 40% més gran que el seu antecessor, Llama 1, i té el doble d’informació de context, El model de PLN ha passat per un preentrenament de dos bilions de tokens, mentre que les versions destinades als usos com a xatbot i per tenir converses naturals han incorporat més d’un milió d’anotacions fetes per persones físiques. El recurs s’ha publicat en forma de tres models amb diferents mides diferents, de 7.000, 13.000 i 70.000 milions de paràmetres.

En el desenvolupament de Llama 2 han col·laborat entitats com Spotify, Amazon Web Services, IBM, Nvidia, Qualcomm, Intel, Accenture, T-Systems o Telefónica, entre altres, que hi han participat amb feedback i, en alguns casos, la intenció d’incloure l’eina en els seus serveis de proveïment de cloud. Dins de la llarga llista de companyies destaca la presència de Microsoft, que a principis d’any va invertir 10.000 milions de dòlars en OpenAI i que ja incorpora ChatGPT al cercador Bing i a altres aplicacions del seu ecosistema tecnològic. De fet, el model es va anunciar públicament durant l’esdeveniment Inspire organitzat per la creadora de Windows, on es va comunicar una aliança entre les dues empreses per donar accés a Llama 2 a través d’Azure AI.

Una eina de codi obert?

Meta ha destacat el fet que Llama 2 es llança en format de codi obert, però aquesta afirmació no ha acabat de convèncer alguns usuaris. L’Open Source Initiative, una associació sense ànim de lucre que promou el programari de codi obert, va alertar el cap de ciència d’IA de l’empresa, Yann LeCun, sobre el vocabulari emprat: “Enhorabona, però si us plau, vigileu el llenguatge: la llicència autoritza només alguns usos comercials. El terme codi obert té un significat clar i ben comprès que exclou qualsevol restricció en usos comercials”. Aquest avís arriba perquè, tot i que el seu ús és lliure per un gran nombre d’usos, té limitacions. En concret, aquells serveis que superen els 700 milions d’usuaris actius mensuals, que hauran de demanar una llicència expressa a Meta per poder-lo fer servir.

Font: metadata.cat

 

 

« Enrere