[ad_1]
Det är intressant att se hur Microsoft omprövar sig som en ledare i den nya generativa AI-pushen.
Idag har Meta släppt sin senaste Llama 2 stora språkmodell (LLM)som vid testning har överträffade andra chattmodeller med öppen källkod (inklusive GPT) på ”de flesta riktmärken”, inklusive hjälpsamhet och säkerhet.
Llama 2 kommer att göras kommersiellt tillgänglig, gratis, vilket ger ett alternativ till de nuvarande LLM:erna som är tillgängliga via Google och OpenAI, och potentiellt positionerar Meta som en ledare inom det framväxande AI-utvecklingsområdet.
Som en del av den nya releasen delar Meta tre olika versioner av modellen – en tränad på 7 miljarder parametrar, en på 13b och slutligen en 70b-version, samtidigt som den också släpper ’Llama 2 Chat’, en mer finjusterad variant som är byggd speciellt för konversationsanvändning.
I sig är detta en teknisk bedrift, men ännu mer intressant har Meta och Microsoft också meddelat en utökning av deras partnerskap, vilket kommer att göra det möjligt för utvecklare som använder Microsofts verktyg att välja mellan Metas Llama och OpenAI:s GPT-modeller när de bygger sina AI-upplevelser.
Enligt Microsoft:
”I dag, på Microsoft Inspire, tillkännagav Meta och Microsoft stöd för Llama 2-familjen av stora språkmodeller (LLM) på Azure och Windows. Llama 2 är designad för att göra det möjligt för utvecklare och organisationer att bygga generativa AI-drivna verktyg och upplevelser. Meta och Microsoft delar ett åtagande att demokratisera AI och dess fördelar och vi är glada över att Meta tar ett öppet tillvägagångssätt med Llama 2.”
Microsoft har också investerade 10 miljarder dollar i OpenAIoch har redan byggt in GPT i de flesta av dess verktyg och plattformar. Och nu kommer det också att kopplas in Llama 2 till olika applikationer, vilket kommer att se Microsoft bli en nyckelplattform för att underlätta kopplingen mellan konsumenter och dessa ledande LLMs.
Ett nyckelfokus för Metas Llama 2-modell är säkerhet och att säkerställa att resultaten som produceras av systemet är korrekta och begränsar missbruk. Vilket kan vara ett viktigt steg, med tanke på de olika problem som har rapporterats med vissa tidiga LLM:er, inklusive GPT, som ofta har lett användare vilse på grund av ”hallucinationer” och delning av desinformation och/eller skadliga perspektiv.
För att mildra detta har Meta lagt till en betydande träningsbelastning kring olika element, inklusive ”sanning”, ”toxicitet” och ”bias”. Baserat på detta ytterligare arbete säger Meta att Llama 2 Chat ’visar stor förbättring jämfört med den förtränade Llama 2 när det gäller sanningsenlighet och toxicitet”.
”Andelen giftiga generationer krymper till 0 % för Llama 2-Chat av alla storlekar: detta är den lägsta toxicitetsnivån bland alla jämförda modeller. I allmänhet, jämfört med Falcon och MPT, visar den finjusterade Llama 2-Chat den bästa prestandan när det gäller toxicitet och sanningsenlighet.”
Det kan göra detta till ett ännu mer användbart generativt AI-verktyg, som man kan lita mer på för ett bredare utbud av uppgifter. För även om GPT är fantastisk i sin förmåga att producera mänskliga textgenerationer, finns det också betydande risker med att använda dessa utdata utan att kontrollera och återkontrollera alla referenser och språk, för att säkerställa att det inte påverkas negativt av dess olika ingångar.
Om en LLM kunde vara mer pålitlig i detta avseende, skulle det kunna utöka användningsfallet avsevärt, vilket Llama 2 teoretiskt sett är mer rustat att ta itu med.
Det är ett intressant nytt övervägande hur som helst, och integrationen med Microsoft kommer att se Metas nya LLM spela en större roll i en bredare AI-utveckling och kan se att Metas system så småningom blir en nyckelledare i utrymmet.
Microsoft Azure AI-kunder kommer att kunna testa Llama 2 med sina egna exempeldata, för att testa dess prestanda i olika sammanhang.
Du kan läsa mer om Llama 2-processen och datauppsättningen här.
[ad_2]
Source link