rtıq Azərbaycanın öz "ChatGPT"si var!
Azərbaycan dili üçün indiyə qədər yaradılmış ən böyük open - source NLP korpusu olan “Azcorpus”yaradılıb! Son zamanlar, “ChatGPT” başda olmaqla NLP həllərinin çox məşhurlaşdığının şahidi oluruq. Ancaq, az resurslu dillər üçün NLP tədqiqatında əhəmiyyətli boşluq vardı ki, Azərbaycan dili də istisna deyildi. Artıq gənclərimiz bu boşluğu aradan qaldırıblar!
Qeyd edək ki, bu korpus müxtəlif NLP layihələrində (text generation, chatbots) istifadə oluna biləcək “Azcorpus” Azərbaycan dilində ümumilikdə 1,9 milyon mətndən və təqribən 18 milyon cümlədən ibarətdir. Mətnlər xəbər saytları, jurnallar, vikipediya məqalələri, kitablar daxil olmaqla müxtəlif mənbələrdən seçilmişdir və siyasət, iqtisadiyyat, elm, mədəniyyət, idman, tarix, cəmiyyət və s. o cümlədən bir sıra digər mövzuları əhatə edən mətnlərlə janr və mövzu üzrə əhatə olunub.