Geresni modeliai nei „DeepSeek“ ir kaip juos įdiegti vietoje

Kai kuriuos AI modelius galite įdiegti vietoje

Prieš kelias dienas mano partneris Pablinux pasakė jiems kaip vietoje įdiegti madingą dirbtinio intelekto modelį. Šiame įraše išvardinsiu, kokius modelius laikau geresniais nei „DeepSeek“ ir kaip juos įdiegti bei paleisti mūsų kompiuteryje.

Nepaisant politinių simpatijų ar antipatijų, Kinijos vyriausybės žingsnis buvo diplomatinės rinkodaros šedevras, vertas Sun Tzu. Priešingai nei Donaldo Trumpo „Dramblys Kinijoje“, jie paskelbė apie modelį, kuris siūlo tas pačias funkcijas kaip ir ChatGPT nemokamai ir sunaudoja mažiau išteklių. Tai žinome tik tie, kurie seka temą Jau seniai buvo daug kitų atvirojo kodo modelių (kai kurie iš Šiaurės Amerikos kompanijų, tokių kaip Meta), o „DeepSeek“ našumas yra panašus į „ChatGPT“ tik 5% dažniausiai naudojamų atvejų.

Didelio masto kalbų modeliai

ChatGPT, DeepSeek ir kiti vadinami didelio masto kalbos modeliais. Iš esmės Jie leidžia vartotojui bendrauti su kompiuteriu ta kalba, kuri panaši į tą, kuri naudojama bendraujant su kitu žmogumi. Kad tai pasiektų, jie mokomi naudoti daug teksto ir taisyklių, leidžiančių sukurti naują informaciją iš jau turimos informacijos.
Pagrindinė jo paskirtis – atsakyti į klausimus, apibendrinti tekstus, atlikti vertimus ir atkurti turinį.

Geresni modeliai nei „DeepSeek“ ir kaip juos įdiegti vietoje

Kaip ir „Pablinux“, mes naudosime „Ollama“. Tai įrankis, leidžiantis įdiegti, pašalinti ir naudoti skirtingus atvirojo kodo modelius iš Linux terminalo. Kai kuriais atvejais naršyklė gali būti naudojama kaip grafinė sąsaja, tačiau šiame straipsnyje to neaprašysime.

Kad „Ollama“ teiktų tinkamą vartotojo patirtį, geriausia turėti tam skirtą GPU.Ypač modeliuose su daugiau parametrų. Tačiau mažiau galingus galima naudoti su Raspberry Pi ir kai aš net išbandžiau modelius su 7 milijardais parametrų kompiuteryje su 6 gigabaitais ir be specialaus GPU, kompiuteris veikė be jokių trukdžių. Taip neatsitiko ir su vienu iš 13 mlrd.

Parametrai yra taisyklės, kurias modelis naudoja ryšiams kurti ir šablonams tarp duomenų kurti. Kuo daugiau parametrų ir duomenų, tuo galingesnis bus modelis, turintis mažiau parametrų, kaip Tarzanas.

Mes galime įdiegti Ollama su komandomis
sudo apt install curl
curl -fsSL https://ollama.com/install.sh | sh

Modelį galime įdiegti naudodami komandą:
ollama pull nombre_del modelo
Ir paleiskite jį su:
ollama run nombre_del_modelo
Pašaliname naudodami:
ollama rm nombre_del_modelo
Įdiegtus modelius galime pamatyti įvedę:
ollama list

Toliau pateikiamas nedidelis man įdomiausių modelių sąrašas: Visą galimų modelių sąrašą rasite čia čia:

lama2-necenzūruota

Llama yra bendros paskirties modelis, kurį sukūrė Meta. Šioje versijoje buvo pašalinti visi apribojimai, kuriuos pirminio projekto kūrėjai įvedė dėl teisinių ar politinių priežasčių.. Jis turi dvi versijas, lengvąją, kuri valdo su 8GB ir pilną, kuriai reikia 64. Galima naudoti atsakant į klausimus, rašant tekstus ar atliekant kodavimo užduotis.
Įdiegiama naudojant:
ollama pull llama2-uncensored
Ir jis veikia su:
ollama run llama2-uncensored

codegemma

CodeGemma yra lengvų, bet galingų šablonų pasirinkimas, leidžiantis atlikti įvairias programavimo užduotis kaip užpildyti kodą arba parašyti jį nuo nulio. Supranta natūralią kalbą, gali sekti instrukcijas ir matematiškai samprotauti.

Yra 3 variantai:

  • Nurodykite: Jis paverčia natūralią kalbą kodu ir gali vadovautis instrukcijomis:
  • kodas:  Užpildykite ir generuokite kodą iš esamo kodo dalių.
  • 2b: Greitesnė kodo užbaigimo užduotis.

Tynillama

Kaip rodo pavadinimas, tai mažesnė originalaus Meta modelio versija.. Taigi jis neduos tokių gerų rezultatų, bet jei norite pamatyti, kaip dirbtinio intelekto modelis veikia su kuklia technine įranga, verta pabandyti. Jis turi tik 1100 milijardo parametrų.

Modelių naudojimas vietoje turi privatumo ir prieigos prie necenzūrinių ir nešališkų versijų pranašumų, kurios kai kuriais atvejais būna juokingos. „Microsoft“ AI atsisakė man sukurti takso įvaizdį, nes terminą „kalė“ laikė įžeidžiančiu. Didžiausias trūkumas yra techninės įrangos reikalavimai. Reikės išbandyti modelius ir rasti tokį, kuris būtų pakankamai geras tam, ko jums reikia, ir galėtų veikti su jūsų turima įranga.


Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.