Исландия телен саклау өчен ясалма интеллект куллана. Татарлар да шулай эшли аламы?

Иллюстратив фото

Исландия президенты тәкъдиме белән илнең OpenAI ясалма интеллект ширкәте белән хезмәттәшлеге башланды. Исланд телен нейрочелтәр ярдәмендә ничек сакларга тырышуларын аңлатабыз.

Исландия утрау-дәүләте технологияләр һәм туризм тиз үскән илләрнең берсе. Шул ук вакытта, халык саны нибары 370 мең чамасы булган илдә, Европа берлеге һәм АКШ белән тирән интеграция һәм глобализация сәбәпле, исланд теленең югалу куркынычы туды. Белгечләр бүген исланд теле дигитальләшү юлына басмаса, берничә буыннан соң ул юкка чыгарга мөмкин дип борчыла.

Исландия хакимияте бу проблемны бик яхшы аңлый, илнең мәдәни мирасын саклауны максат итеп куя. Моның өчен хөкүмәттә махсус департамент бар. Аның бурычларының берсе - яңа барлыкка килгән күренешләр һәм технологияләр өчен исланд сүзләрен уйлап табу, чит телләрдән алынмалардан баш тарту.

Мисал өчен, исланд телендә компьютер сүзен толва дип атыйлар ("санлы күрәзәче"). Татар телендә дә санак сүзен кертү омтылышы булды, чикле күләмдә булса да, ул бүген дә кулланыла.

OpenAI белән хезмәттәшлек

Ясалма интеллект чоры башлану белән, милли телләргә югалу куркынычы янаганын аңлаган активистлар яңа технологияләр ярдәмендә телләрне саклап буламы дигән сорауга җавап эзли башлады. Бу сорауны Азатлык та үзенең язмаларында даими күтәреп тора.

Исландия дә бу эштән читтә калмаган. Ил президенты Гудни Йоханнессон тәкъдиме белән Исландия хөкүмәте OpenAI ширкәте белән партнер хезмәттәшлек турында килешү төзегән. Бу эштә хөкүмәткә хосусый бизнес ярдәм иткән диелә. Төп максат: OpenAI-ның GPT исемле танылган нейрочелтәрен исланд телен саклау өчен куллану. Бу эштә алар беренчеләрдән булыр дип саный.

БУ ТЕМАГА: Интернетта сорауларга татарча җавап бирә торган чат боты барлыкка килде

— Милли телдә мәгълүмат базасын туплау һәм локаль програмнар булдыру гына җитми. Без телебезне кешеләр көн саен кулланган програмнар һәм кушымталарга өстәргә тиеш. Ахыр чиктә, ясалма интеллект тел, мәдәният һәм тарихны саклауга гына түгел, безнең икътисади үсешкә дә ярдәм итәчәгенә ышанабыз, — дип саный Йоханна Гудмундсдоттир, ул Almannarómur тел технологияләре үзәге мөдире булып эшли.

GPT нейрочелтәре милли телләрне ничек саклый ала соң? Беренче чиратта, аны бу телдә камил сөйләшергә өйрәтү кирәк, ди исланд активистлары. OpenAI модельләре интернеттагы зур күләмдәге текстларга нигезләнеп өйрәнә. Инглиз, урыс һәм башка зур телләр очрагында ул тиз өйрәнә һәм аның өчен "чимал" да күп. Ә менә сөйләшүчеләр һәм язучылар саны азрак булган телләр өчен бу кыенрак.

Һәркем өчен ачык булган GPT-3.5 мисалын караганда, ул исланд телендә бик күп хаталар ясый. Шунысы кызык, татар теле очрагында да бу ачык күренә: ул ясалма төрки телдә яза.

Ләкин киләсе модель булган GPT-4 инде исланд телендә дә, татар телендә дә шактый яхшы яза, аралаша. Татар теле очрагын без аерым язмада карарбыз. Исланд теленә килгәндә, тел активистлары аның исландча яхшы язуына карамастан, әле барыбер күп хаталар булуын таный.

Волонтерлар төркеме

Тел технологияләре белән шөгыльләнүче Miðeind ehf ширкәте нейрочелтәрләрне исланд теленә яхшырак "өйрәтү" өчен волонтерлар төркемен җыйды, анда 40лап кеше катнаша. Алар GPT-4-не исланд теле грамматикасына өйрәтә һәм исланд мәдәнияте турында аңлатып яза.

Бу процесс RLHF дип атала – "кешедән кире элемтә алу нигезендә өйрәтү". Волонтерлар GPT-4-кә сорау бирә, нейрочелтәр исә 4 төрле вариант җавап бирә. Шуннан соң сынауда катнашучылар иң яхшы җавапны сайлый һәм аңа төзәтмәләр кертә. Бу процесс нейрочелтәрнең киләчәктә тагын да яхшырак һәм дөресрәк җаваплар бирүе өчен кирәк.

RLHF барлыкка килү алдыннан модельне өйрәтү шактый катлаулы процесс булган. Шул ук Miðeind ehf такымы GPT-3-не өйрәтергә тырышкан, алар 300 меңләп мисал язган, ләкин бу нәтиҗә бирмәде, ди ширкәт башлыгы Вильхьялмур Торстейнссон.

Нейрочелтәр мөмкинлекләрен Торстейнссон бик югары бәяли. Мисал өчен, ул бүгенге тормышның авырлыгын исланд телендә шигырь рәвешендә язып бирә ала, аңа хәтта шигырьне Велуспа (борынгы исланд поэмасы) стилендә язарга кушып була, ди ул.

GPT-4-нең исланд телен камил белүенең тагын бер файдасы бар, ди белгечләр. Аны автоматик рәвештә барлык кушымталарга өстәп булачак, һәм кулланучылар, эре ширкәтләр үз интерактив кушымталарында да инглизчә түгел, исланд телен куллана алачак.

— OpenAI исланд теленә дигитал технологияләр чорында исән калырга ярдәм итә, — дип саный Торстейнссон.

БУ ТЕМАГА: Tatar Speech хезмәте тәкъдим ителде. Ясалма интеллект ничек эшли?

Ясалма интеллект татар һәм башкорт телләренә дә ярдәм итә аламы?

Азатлык моңарчы сөйләшкән күп кенә белгеч фикеренчә, ясалма интеллект һәм нейрочелтәрләр мөмкинлекләрен милли телләрне саклау һәм үстерү өчен кулланып була һәм кирәк тә.

— Милли телләрнең киләчәктә саклануы ясалма интеллектка бәйле. Татар яки башкорт телләрен компьютер яхшы гына үзләштерсә, бу телләр бөтен тәрҗемә процессларын оештырып, шул телдә ясалма интеллект ярдәмендә контентны күбрәк, җиңелрәк һәм очсызрак ясап булачак, — дип сөйләгән иде башкорт IT-белгече Илдар Киньябулатов.

Милли телдә теләсә нинди контент булдыруда да ясалма интеллект ярдәм итә ала, дип сөйләгән иде програмчы, хәзерге вакытта Татар яшьләре форумын җитәкләгән Райнур Хәсәнов:

— Нейрочелтәрдән күп төрле контентны ясатып була. Әйтик, рәсемнәр, видеолар ясый торган ясалма интеллект програмнары бар. Димәк, алардан татар мультфильмы да ясатып була, татарча комикслар китабын да яздырып була. Нейрочелтәр хәтта сценарий да яза белә. Дөрес биремнәр биреп, татар телендә дә төрле-төрле продуктлар ясап була, — дигән иде ул.

БУ ТЕМАГА: "Һомай" – башкортча акыллы колонка: сорауга җавап бирә, тәрҗемә итә, әкият һәм музыка куша

"Исланд теле мисалы Татарстан хөкүмәтенә дә кызык була ала"

Исланд хөкүмәтенең OpenAI белән хезмәттәшлеге турында фикерен сорап, без тагын бер ясалма интеллект белгеченә мөрәҗәгать иттек. Аның исемен иминлек максатыннан атамыйбыз. Ул IT-ширкәттә эшли, татар теле белән махсус шөгыльләнмәсә дә, бу өлкәдә яңалыкларны күзәтеп бара.

— Татар теле активистлары ясалма интеллектны телне үстерү максатында куллануга игътибар итә башлаган, монысы яхшы. Ләкин бу эштә артта калмас өчен зурлап һәм тиз рәвештә эшләргә кирәк. Бу исланд теле мисалы Татарстан хөкүмәтенә дә кызыклы була ала, Татарстан да төрле IT-ширкәтләр белән хезмәттәшлек булдырып, аны татарча ясалма интеллект продуктларын булдыру өчен эшләтә ала, — ди ул.

Шул ук вакытта, Татарстанның чит ил оешмалары белән хезмәттәшлек итә алуы бүгенге шартларда икеле. Ясалма интеллект өлкәсендә иң алдыгы оешмалар һәм технологияләр, билгеле, көнбатыш илләрендә, ди белгеч.

БУ ТЕМАГА: Ясалма интеллект, нейрочелтәрләр һәм татар теле үсеше

🛑 Русиядә Азатлык сайты томаланды, нишләргә? Безнең кулланма.
🌐 Безнең Telegram каналына да кушылырга онытмагыз!