Birka: Lielie valodu modeļi / Lielais valodu modelis

Lieli valodu modeļi (angliskais saīsinājums – LLM (large language models)) ir dziļās mācīšanās algoritmi, kas apmāca sevi ar milzīgu teksta un koda datu kopu. Tie spēj ģenerēt tekstu, tulkot valodas, radīt radošu saturu un atbildēt uz jautājumiem. LLM tiek izmantoti tērzēšanas robotos, tulkošanas programmatūrā, radošajā saturā un atbildēs uz dažādiem jautājumiem. Tos izceļ lielais datu apjoms un dziļās mācīšanās metodes. Tomēr tiem ir arī aizspriedumu veidošanas tendence un grūtības interpretēt dažreiz neskaidru tekstu. Tomēr LLM tehnoloģija turpina attīstīties un solās spēlēt lielu lomu nākotnē, piemēram, Google LaMDA un OpenAI GPT-3 ir daži no šiem inovatīvajiem modeļiem.

DeepSeek R1 latviski. Ātrais tests mārketingam un reklāmai.

DeepSeek R1 ir Ķīnas mākslīgā intelekta modelis, kas piedāvā līdzvērtīgu vai pat pārāku veiktspēju nekā ChatGPT, taču ar stingru cenzūru. Latviešu valodā tas darbojas pieklājīgi, bet nav GPT-4o līmenī. Reklāmas tekstus adaptē labāk nekā OpenAI, bet ziņas un blogus tam uzticēt vēl būtu riskanti.

VID virtuālais asistents Toms izglīto arī par ēdienu receptēm

VID virtuālais asistents Toms ir pārsteidzis ar savām atbildēm, kas ietver arī ēdienu receptes un jautājumus par valodu. Šīs atbildes dažkārt ir licis uzdot jautājumus par viņa kompetenci un apmācību. Toms sniedz atbildes, kas ne vienmēr ir tieši saistītas ar VID darbību, bet ir interesantas un dažkārt negaidītas.

Lielie valodu modeļi: izskaidrojot vienkāršāk

Ir arī labāks skaidrojums, bet es pagaidām, kamēr vēl apgūstu šīs lietas, esmu atradis, ka šis vislabāk palīdz izskaidrot kā veidots ChatGPT, StabileDiffusion, Midjourney... vai kāds cits ģeneratīvais "rīks".