
17.07.2024 10:57:00
Дата публикации
IrbisGPT алғашқы ашық бастапқы ұлттық тіл моделі Қазақстанда пайда болды.
Әзірлеушілер Habré сайтында ресми шығарылым шығарды, бұл барлық пайдаланушыларға осы модельді сынауға және оны оқытуға үлес қосуға мүмкіндік берді.
IrbisGPT – бизнесте AI қолдануға маманданған MOST Holding және Gen2b.ai студиясымен бірлесіп әзірленген қоғамдық коммерциялық емес бастама.
Жобаның мақсаты – қазақ тілін сақтау және тарату, сондай-ақ оны Қазақстанда қоғамды, экономиканы және ғылымды дамыту үшін заманауи цифрлық технологияларға біріктіру.
«Бұл жасанды интеллект арқылы қазақ тілін дамыту саласындағы ілкімді жоба. IrbisGPT мемлекеттік тілді қорғауға және насихаттауға көмектеседі деп сенеміз», - деді жобаның негізін қалаушы Бахт Ниязов.
Әзірлеушілердің айтуынша, IrbisGPT-тің қазіргі нұсқасы тамаша оқу әлеуетін көрсетеді.
Ағылшын тілінде жауап беретін немесе қазақ тілінде кездейсоқ сөздерді жасайтын басқа ашық бастапқы код үлгілерінен айырмашылығы, IrbisGPT сұрақтарға мәтінмәнсіз егжей-тегжейлі және дұрыс жауап береді.
Осылайша, IrbisGPT «Дүкен неге жасыл?» деген сұраққа мемлекеттік тілде жауап береді. («Шөп неге жасыл?»), Қазақстанның президенті кім екенін, жылда неше күн бар екенін біледі, тіпті өмірдің мәні туралы философиялық ойлар айта алады.
Модельді оқыту үшін әзірлеушілер қазақ тіліндегі жаңалықтар мен мақалалардан алынған 20 гигабайт «шикі» деректерді пайдаланды, бұл сөздік қорын үш есеге жуық кеңейтті.
Дегенмен, команда бұл жеткіліксіз екенін мойындайды және IrbisGPT-ті одан әрі жақсарту үшін мемлекеттік органдардың сапалы деректерін ұсынуға сүйенеді.
Токенизатордың соңғы сөздігінде (мәтіннен деректерге түрлендіргіш) 60 мыңнан астам токен бар. Сондай-ақ команданың әртүрлі салаларда пайдалы болатын жетілдірілген үлгі архитектурасын жасау жоспары бар.
«Біз мемлекеттік органдармен, азаматтық қоғаммен және жеке сектормен тығыз ынтымақтастықты асыға күтеміз», - деді Gen2b.ai бас директоры Армен Атаян.
IrbisGPT-тің дамуы қазақ тілін цифрлық ортада ілгерілету және оны өмірдің әртүрлі салаларында қолдану үшін жаңа мүмкіндіктер ашады. Әрбір энтузиас пен әзірлеушінің үлесі модельді одан да тиімді етуге көмектеседі, IrbisGPT жасаушылары сенімді.
(мәтінді аудару автоматты түрде жүзеге асырылады)
Әзірлеушілер Habré сайтында ресми шығарылым шығарды, бұл барлық пайдаланушыларға осы модельді сынауға және оны оқытуға үлес қосуға мүмкіндік берді.
IrbisGPT – бизнесте AI қолдануға маманданған MOST Holding және Gen2b.ai студиясымен бірлесіп әзірленген қоғамдық коммерциялық емес бастама.
Жобаның мақсаты – қазақ тілін сақтау және тарату, сондай-ақ оны Қазақстанда қоғамды, экономиканы және ғылымды дамыту үшін заманауи цифрлық технологияларға біріктіру.
«Бұл жасанды интеллект арқылы қазақ тілін дамыту саласындағы ілкімді жоба. IrbisGPT мемлекеттік тілді қорғауға және насихаттауға көмектеседі деп сенеміз», - деді жобаның негізін қалаушы Бахт Ниязов.
Әзірлеушілердің айтуынша, IrbisGPT-тің қазіргі нұсқасы тамаша оқу әлеуетін көрсетеді.
Ағылшын тілінде жауап беретін немесе қазақ тілінде кездейсоқ сөздерді жасайтын басқа ашық бастапқы код үлгілерінен айырмашылығы, IrbisGPT сұрақтарға мәтінмәнсіз егжей-тегжейлі және дұрыс жауап береді.
Осылайша, IrbisGPT «Дүкен неге жасыл?» деген сұраққа мемлекеттік тілде жауап береді. («Шөп неге жасыл?»), Қазақстанның президенті кім екенін, жылда неше күн бар екенін біледі, тіпті өмірдің мәні туралы философиялық ойлар айта алады.
Модельді оқыту үшін әзірлеушілер қазақ тіліндегі жаңалықтар мен мақалалардан алынған 20 гигабайт «шикі» деректерді пайдаланды, бұл сөздік қорын үш есеге жуық кеңейтті.
Дегенмен, команда бұл жеткіліксіз екенін мойындайды және IrbisGPT-ті одан әрі жақсарту үшін мемлекеттік органдардың сапалы деректерін ұсынуға сүйенеді.
Токенизатордың соңғы сөздігінде (мәтіннен деректерге түрлендіргіш) 60 мыңнан астам токен бар. Сондай-ақ команданың әртүрлі салаларда пайдалы болатын жетілдірілген үлгі архитектурасын жасау жоспары бар.
«Біз мемлекеттік органдармен, азаматтық қоғаммен және жеке сектормен тығыз ынтымақтастықты асыға күтеміз», - деді Gen2b.ai бас директоры Армен Атаян.
IrbisGPT-тің дамуы қазақ тілін цифрлық ортада ілгерілету және оны өмірдің әртүрлі салаларында қолдану үшін жаңа мүмкіндіктер ашады. Әрбір энтузиас пен әзірлеушінің үлесі модельді одан да тиімді етуге көмектеседі, IrbisGPT жасаушылары сенімді.
(мәтінді аудару автоматты түрде жүзеге асырылады)