18:35 2024-11-17 intpolitic - citeste alte articole pe aceeasi tema
Comentarii Adauga Comentariu

Queen 2.5

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date	Llama-3-70B	Mixtral-8x22B	Qwen2-72B	Qwen2.5-72B
MMLU	79,5	77,8	84,2	86,1
MATH	42.5	41.7	50.9	62.1
HumanEval	48,2	46,3	64,6	59,1
MBPP	70,4	71,7	76,9	84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date	Llama-3-70B	Mixtral-8x22B	Qwen2-72B	Qwen2.5-72B
MMLU	79,5	77,8	84,2	86,1
MATH	42.5	41.7	50.9	62.1
HumanEval	48,2	46,3	64,6	59,1
MBPP	70,4	71,7	76,9	84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă...
Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ...
Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri...
Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ...
Îmbunătățirea matematică: abilitatea matematică a lui Qwen2.5 a cunoscut o îmbunătățire rapidă...
O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane...
Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor...

Card model Qwen2.5

Modele	Params	Parametrii non-Emb	Straturi	Capete (KV)	Încorporarea cravatei	Lungimea contextului	Lungimea generației	Licenţă
Qwen2.5-0.5B	0,49B	0,36B	24	14 / 2	Da	32K	8K	Apache 2.0
Qwen2.5-1.5B	1,54B	1,31B	28	12 / 2	Da	32K	8K	Apache 2.0
Qwen2.5-3B	3.09B	2,77B	36	16 / 2	Da	32K	8K	Cercetarea Qwen
Qwen2.5-7B	7,61B	6,53B	28	28 / 4	Nu	128K	8K	Apache 2.0
Qwen2.5-14B	14.7B	13.1B	48	40 / 8	Nu	128K	8K	Apache 2.0
Qwen2.5-32B	32,5B	31.0B	64	40 / 8	Nu	128K	8K	Apache 2.0
Qwen2.5-72B	72,7B	70,0B	80	64 / 8	Nu	128K	8K	Qwen

Performanțe Qwen2.5

Performanța modelelor Qwen2.5 este evaluată pe o gamă largă de sarcini, incluzând matematică, codare și multilingvism.

Performanță Qwen2.5-72B

Modelul de bază Qwen2.5-72B iese în evidență prin depășirea semnificativă a altor modele din categoria sa într-un spectru larg de sarcini.

Performanță Qwen2.5-14B/32B

Modelele Qwen2.5-14B și Qwen2.5-32B oferă performanțe robuste în sarcini generale precum MMLU și BBH...

Performanță Qwen2.5-7B

Modelul Qwen2.5-7B depășește atât predecesorii, cât și concurenții săi într-o gamă largă de benchmark-uri.

Concluzii

Modelele Qwen2.5 reprezintă un progres semnificativ, oferind performanțe competitive într-o gamă variată de domenii și fiind optimizate pentru utilizare în aplicații diverse.

(Mediafax)

Linkul direct catre Petitie

CEREM NATIONALIZAREA TUTUROR RESURSELOR NATURALE ALE ROMANIEI ! - Initiativa Legislativa care are nevoie de 500.000 de semnaturi - Semneaza si tu !

Citiți și cele mai căutate articole de pe Fluierul:

Securistoidul Pantazi un analfabet funcțional în domeniul economiei declara ritos că "distributivismul este baza marxismului". Mai dobitocule doctrina distributivista a fost creata de un Papă si dezvoltata de un alt Papă

Nimeni nu e mai presus de Lege. Nici măcar Curtean Constituțională

Motivarea judecatorului

Prăbușirea Apple demonstrează că a te gudura pe lângă Trump nu este o garanție a siguranței

Prăbușirea demografică a României se datorează în integralitatea partidelor sistemului care au condus România 35 de ani

Prăbușirea criptomonedelor TerraUS și LUNA s-a datorat unui grup restrâns de speculanți care au pariat "short"

Explicația pe scurt a Tarifelir vamale impuse de Trump și cât de mult ajută economia americană

Rezultatele sondajului Verifield

Donald Trump cere eliberarea lui Marine Le Pen și să fie lăsată să candideze. Nici un cuvânt despre anularea alegerilor și nici despre Călin Georgescu spre satisfacția sorosistilor și a slugilor lor care au dat Lovitura de Stat in România

SpaceX tocmai a făcut un pas mare spre reutilizarea amplificatorului Super Heavy al Starship

ActiveNewx - Bolojan și-a adus la Palat "societatea civilă" SOROS după modelul Iohannis pentru a discuta combaterea ”știrilor false” înainte de alegeri, adică perfecționarea cenzurii

Trăim în URSS. Procurorii CSM si seful PICCJ Alex Florenta cer cercetarea judecătoarei Boboc de la CA Constanta pentru hotararea prin care a stramutat dosarul lui Dan Diaconescu si a desfiintat condamnarea

Elon Musk a criticat vehement verdictul instanței franceze care a blocat candidatura lui Marine Le Pen la alegerile prezidențiale din 2027. Cazul Călin Georgescu a fost din nou Reamintit.

Ca și în cazul lui Călin Georgescu, Regimul Soroșist Macron o interzice pe Marine Le Pen. Le Pen găsită vinovată. Le Pen interzisă să candideze.

La fel ca și Călin Georgescu care avea peste 40% în turul întâi, Marine le Pen conduce detașat in sondaje pentru cursa prezidențială. E momentul ca regimul Neobolsevic Soroșist să o scoată din joc cum a făcut și la noi.

Viktor Orban: "Je suis Marine!". Gunoiul de Viktor Orban de interzicerea lui Călin Georgescu nu a spus nimic desi acesta nu era condamnat deloc. Ce înseamnă să fii lipsit de caracter

Un nou sondaj: Simion pe primul loc, Ponta pe doi. Sondaj Verifield comandat de Nicușor Dan.

Cazul Le Pen, ineligibilitate și executare provizorie: ce spune cu adevărat legea

Sorosistul Securistoid Bănescu noua Față Hidoase a Cenzurii Regimului UEist de la București

Ciutacu alias Saul Bruckner 2 in Scânteia 2 sau Cum sa înjuri in stil bolșevic românii doar pentru că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă poala Pucistului Ciolacu și a lui Gold Ponta înjură oribil votanții lui Georgescu

De ce sa înjuri votanții că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă la greu poala Pucistului Ciolacul și a lui Gold Corporation Ponta ii înjură oribil pe votanții lui Călin Georgescu.

De ce sa înjuri votanții că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă la greu poala Pucistului Ciolacul și a lui Gold Corporation Po ta ii înjură într-un mod oribil pe votanții lui Călin Georgescu.

De ce sa înjuri votanții că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă la greu poala Pucistului Ciolacul și a lui Gold Corporation Ponta ii înjură oribil pe votanții lui Georgescu

Ion Cristoiu: Votul din decembrie a fost moral Lumea s-a săturat de "politruceală" Da, inevitabil, ne despărțim de America (referindu-se la puciști)

Reacția Cristelei Georgescu după ce Puciștii care au dat Lovitura de Stat, l-au interzis pe soțul ei: „Nimic nu este pierdut atât timp cât credinţa este în picioare, cât sufletul nu abdică şi cât capul se ridică din nou.”

Adrian Onciu: Cine sunt, de fapt, extremiștii

CURS-ul lui Buble îl urca pe Crin Antonescu pe locul doi. Sondaj CURS pentru alegerile prezidențiale. 59% dintre români cred că direcția țării impregnată de Puciști este greșită

Ca în Botswana, fiecare Institut de sondare are un candidat preferat. SOCIOPOL-ul lui Palada îl urcă pe Ponta pe locul doi.

În sondajul Atlas Intel Soroșiștul Nicușor Dan, e pe locul doi

Pieleanu "face" sondaje "la refefon"

Ca și bolșevicii în 1946, Soroșiștii nu au stare până nu bagă Cenzura peste tot. Lasconi cere închiderea TikTok înaintea prezidenţialelor: "Fake news-ul să fie dat jos". Soroșiștii de la Funky Citizens decid ei de capul lor, ce e "fake news"

Ramurile Cominterniste directe sau prin alianță se susțin între ele. Celebrul Bombonel, alias Adrian Năstase, care a dat petrolul țării și multe alte bunuri naționale pe Nimic, îl susține pe Victor Ponta. Nu ai nenorocit destul țara asta Bombonele?

Subordonat rețelei soroșiste ca și Nicușor Dan, Bilderbergul Merz pune biciul pe germani. Germania se înarmează până în dinți și vrea să taie pensii, ajutoarele sociale și subvenția pentru energie

Viktor Orbán: "Nu mai puteam să stăm cu mâinile în sân şi să privim cum lanţurile de magazine jefuiesc oamenii". Vă amintiți cum au sărit Soroșiștii pe Călin Georgescu când ne-a spus că Multinaționalele ne jefuiesc? De ce AUR și Simion TAC pe această temă?

Calin Georgescu a avut dreptate când a arătat jaful multinaționalelor. Bulgaria înființează lanțuri de magazine cu adaos 10%, pentru a împiedeca multinaționalele să jefuiască populația. Puciștii de la noi sunt pe-o mână cu multinaționalele

Editorial Cornel Dinu. SMINTEALA clasei politice înaintea unor alegeri prezidențiale compromise din start

În 35 de ani de Soroșism, Familia Tradițională a fost distrusă. UE A AJUNS LA 700.000 DE DIVORȚURI Rata divorțurilor s-a triplat. Unu din doi copii se nasc in afara căsătoriei. Înțelegeți de ce Călin Georgescu a spus că Familia trebuie protejata?

Tăcerea democrației: strigătul unei națiuni pentru libertate<

Așadar dacă pacea se va încheia Nikolaev și Odessa vor rămâne în Ucraina, în sfera de influență Americană. Putin nu va revendica Odesa dacă americanii recunosc Crimeea, Donețk, Lugansk, Zaporojie și Herson ca părți ale Rusiei

Luptătorul din Arenă

Vă sună cunoscut? Am văzut în România. Primarul Istanbulului, progresistul Imamoglu, arestat Principalul adversar al lui Erdogan, Imamoglu își anunțase candidatura la președinție in 2028

Mișcarea Suveranistă e împărțită între "Turul Doi Inapoi" și "Sa mergem înainte cu Simion". Simion și Ana Maria Gavrilă trebuie sa sustina Rolul Important a lui Călin Georgescu în Statul Român dacă vor să castige

Micul Stalinist Nicușor Soros Dan ne spune că a&i lua unui om dreptul de a candida și milioanelor de români dreptul de a-l vota fără o condamnare "e o decizie corectă". Poate in URSS-ul lui Lenin, plicușor cu bani de la Soros

Așadar după mintea actualului Stat Soroșist și a cohortelor de sorosisti care aplaudă: Democrația înseamnă să anulezi alegerile, să-l interzicem, să-i facem dosar penal și să-l băgăm la zdup pe cel CARE A CÂȘTIGAT ALEGERILE PRIN VOT

România propusă de Călin Georgescu vs România puciștilor dirijați de progresista UE. Iată cum arată România Puciștilor : Șomajul în rândul tinerilor e cel mai mare din UE. La țară a ajuns peste 30%

Bilderbergul Macron: UE poate sprijini Ucraina fără aprobarea Rusiei trimițând mii de soldați din fiecare țară a UE.

Libertatea de exprimare a murit. Lasconi de la USR cere și mai multă CENZURĂ. Soroșismului Neobolsevic devine tot mai Totalitar. "cel puțin 2 televiziuni își fac de cap" "avem proiect de Lege" urlă Lasconi

Adrian Onciu - Active News : Continuă telenovela nord-coreeană de admitere sau respingere a candidaților la prezidențiale în funcție de cum dictează autorii loviturii de stat.

Zelenski îi calcă in picioare pe românii bucovineni: Din 32 de licee cu clase cu predare în limba română și 2 școli din 2027 vom rămâne doar cu 4 licee cu predare in română

Fluierul Report

Queen 2.5

Qwen 2.5

Qwen2.5 vs Qwen2

Performanță și comparații

Performanță Qwen2.5-72B

Concluzie

Qwen 2.5

Qwen 2.5

Qwen2.5 vs Qwen2

Performanță și comparații

Performanță Qwen2.5-72B

Concluzie

Qwen2.5 vs Qwen2

Card model Qwen2.5

Performanțe Qwen2.5

Performanță Qwen2.5-72B

Performanță Qwen2.5-14B/32B

Performanță Qwen2.5-7B

Concluzii

Linkul direct catre Petitie

Comentarii:

Adauga Comentariu

Citiți și cele mai căutate articole de pe Fluierul: