Accessibility links

Кайнар хәбәр

Google башкортчага тәрҗемә итә башлый, Яндекс нейрочелтәренә татар телен өсти


Иллюстратив рәсем
Иллюстратив рәсем

Белгеч милли телләр өчен боларның мөһим вакыйгалар булуын, милли телләр өчен мөмкинлекләр ачылуын әйтә. Әмма бу мөмкинлекләр тел активистларының алдагы тырышлыгыннан торуын әйтә.

Соңгы атналар милли телләр өченче куанычлы хәбәрләргә бай булды. Июнь азагында гына Google Translate хезмәте үз базасына яңа 110 тел өстәгән. Алар арасында башкорт һәм чуаш телләре дә бар. Бу яңалыкны тел активистлары зур вакыйга дип бәяли, бу телләр үсешенә уңай йогынты ясар дип көтә.

Русиядә киң таралган Яндекс хезмәте дә милли телләргә караган зур яңалык игълан итте: ул үзенең тәрҗемә хезмәтенә Русиянең 20дән артык телен өстәячәк. Кайбер милли телләр өчен сөйләмне тану һәм сөйләм синтезы кебек нейрочелтәр технологияләре дә өстәләчәк. Беренче чиратта, бу татар теле өчен башкарылачак диелә.

Бу хәбәрләр милли телләр үсешенә ничек файдалы була ала? Бу хезмәтләрне нинди өлкәләрдә кулланып булыр? Безнең язмада укыгыз.

Google: 110 яңа тел

28 июнь көнне Google ширкәте зур хәбәр игълан итте: аның тәрҗемә хезмәтенә берьюлы 110 яңа тел өстәлде. Хезмәт бу 110 телгә һәм шул телләрдән тәрҗемә итәргә мөмкинлек бирә. Бу ширкәт тарихында иң зур яңарту булып тора, моңарчы анда 130 телгә тәрҗемә итеп булган.

Яңа телләр дигәннән, Google үзе бу 110 телдә 614 миллионнан артык кеше сөйләшүен, бу бар кешелекнең 8%-ы булуын искәртә. Алар арасында, мисал өчен, кытай теленең кантон диалекты, мэн, креол, афар, панджаби кебек телләр бар.

Безнең өчен иң кызык булганы: исемлектә Русиядә киң таралган асаба халыклар телләре. Алар арасында Google.Translate хезмәтенә башкорт, кырымтатар, чуаш, саха, удмурт, бурят, коми, чечен, осетин, чукот, абхаз телләре өстәлде. Күпчелек милли телләр өчен бу – мондый дәрәҗәдәге халыкара IT-хезмәттә булуның беренче тәҗрибәсе.

Татар теле Google тәрҗемәченең системына 2020 елда кергән иде. Ул чакта белгечләр бу вакыйганы зур уңыш дип бәяләде. Тик бу уңыш үзеннән үзе барлыкка килмәде, моңарчы озак еллар дәвамында тел активистлары Google тәрҗемә хезмәтенә татар телен өстәү өчен тырышты. 2012 елда "Интернет татарча сөйләшә" чарасы барышында активистлар Google һәм башка сайтларга татар телен куллануны тәкъдим итеп, күпсанлы хат юллаган иде. 2013 елдан Google волонтерлар өчен татар теленә тәрҗемә итү почмагын ачкан иде. Волонтерлар анда тәкъдим ителгән инглизчә сүз-гыйбарәләрне татарчага тәрҗемә итте, булган тәрҗемәләргә тавыш бирде, Google тәрҗемәчесе шул рәвешле татар телен өйрәнгән.

Дөньяда иң популяр сайт булган Google-га милли телнең өстәлүе никадәр мөһим? Бу абруй ягыннан да әһәмиятле, гамәли яктан да бик файдалы, дип саный белгечләр. Мәсәлән, 2020 елда татар проектлары авторы, "Теория" дизайн-студиясе җитәкчесе Илдар Әюпов Google Translate-ка татар телен өстәү абруй ягыннан бик отышлы булган дип әйткән иде.

— Төрле ширкәтләр Google Translate-та нинди телләр бар, димәк, аларга ихтыяҗ бар дигән фикер йөртә ала. Тел шул рәвешле таныла, тарала. Шуңа күрә әлеге вакыйганың кимендә имидж ягыннан файдасы булачак.

Мисал өчен, минем Facebook-тагы дусларым урысча язылган әйберне бер төймәгә басып, инглизчәгә тәрҗемә итә дә, минем белән шул рәвешле аралаша ала. Телне белмәгән килеш тә башка кеше белән аралашу мөмкинлеге бирелә. Хәзер төрле сайтлар, онлайн хезмәтләр шул Google Translate-ның татар телен дә үзләренә өсти алачак, татар телен күбрәк кеше аңлый алачак дигән сүз, — дип аңлаткан иде ул.

Бу Google-га өстәлгән яңа милли телләргә дә карый. Башкорт теле активистлары да моның әһәмиятен белеп, күптәннән Google-дан хезмәткә башкорт телен өстәүне сораганнар. Ахыр чиктә, башкорт теленең өстәлүе дә тел активистлары һәм волонтерлар ярдәмендә мөмкин булып чыкты.

"Һомай" башкорт теле динамигы авторы, IT-белгеч Айгиз Кунафин үз телеграм-каналында язып чыкканча, бу вакыйгага тел активистларының башкорт теленең параллель корпусы җыюы китергән. Хәзерге вакытта, бу корпуста 1 миллионнан артык сүз һәм сүзтезмә тупланган. Бу корпус мәгълүматында Яндекс.Тәрҗемәче һәм ChatGPT4 кебек башка тел модельләре дә башкорт теленә өйрәнгән, ди ул.

"Башкорт телендә булган сайтны хәзер испан телендә дә укып була"

Азатлык белән сөйләшкән башка IT-белгеч тә (иминлек максатыннан аның исемен атамыйбыз) Google-га милли телләрнең күпләп өстәлүен зур вакыйга дип атый, ләкин бу телләр өчен моның күптәннән башкарылырга тиешлеген әйтә.

— Урысча әйткәндә, соң булуы, гомумән, булмауга караганда хәерлерәк, әлбәттә. Google-тәрҗемәчегә эләгү милли телләргә зур мөмкинлекләр ача. Иң гади өстенлек – бу телләргә һәм бу телләрдән хәзер 200дән артык дөнья теленә тәрҗемә ясап була, бу — зур нәрсә.

Икенчедән, бу теләсә нинди сайтны милли телгә тәрҗемә итү мөмкинлеген бирә. Әйтик, мин хәзер француз телендә берәр сайт ачып, аны җиңел генә башкорт теленә тәрҗемә итә алам. Киресенчә, башкорт телендә булган сайтны хәзер, әйтик, испан телендә дә укып була. Әйе, тәрҗемә сыйфаты мәсьәләсе дә бар, бәлки хәзер ул бик үк сыйфатлы түгелдер, әмма алга таба тәрҗемә сыйфаты камилләшәчәк, Google алгоритмнары шулай эшли, – дип аңлатты ул.

Ясалма интеллект һәм нейрочелтәрләр чорында Google-тәрҗемәчедән милли телләрнең булуы да алга таба бу телләрнең технологияләргә кереп үтү өчен дә җиңеләйтәчәк, дип саный ул. Тел корпуслары һәм дата-базаларны җыю белән берлектә бу нигез эшләр, дип аңлата белгеч.

Google тәрҗемәче системында булу милли телне өйрәнүне дә җиңеләйтәчәк. Хәзер тәрҗемә өчен сүзлекләрне эзлисе юк, бер төймә баскан килеш кенә тәрҗемә итеп булыр. Өстәвенә, тулы фразалар һәм җөмләләр тәрҗемәсен дә алып булыр, ди ул.

Азатлык радиосының Әйдә! Online проекты да башкорт телен онлайн өйрәнү мөмкинлеген бирә. Портал сайтында башлангыч дәрәҗәдә тел дәресләре урнаштырылган, анда файдалы сүзләр, диалоглар, аудиолар, тестлар һәм башка кирәкле тел материаллары тәкъдим ителә.

Яндекс: татар сөйләме синтезы һәм сөйләмне текстка әйләндерү

Уңай хәбәрләргә Русиядә иң популяр сайтларны берсе, Яндекс та кушылган. Июль башында ул яңа проект игълан итте: ширкәт үзенең тәрҗемә хезмәтенә Русиянең 20дән артык милли телен өстәячәк. Проект 3 ел дәвам итәчәк дип көтелә.

Татар, башкорт, чуаш кебек телләр Яндекс тәрҗемәчедә күптәннән бар. Яндекс системында алар Google-га кадәр үк барлыкка килде. Мәсәлән, татар теле Яндекс.Тәрҗемәчегә 2015 елда өстәлгән иде.

Хәзер Яндекска Русиянең башка милли телләре өстәләчәк. Аларның беренчесе, осетин теле, хезмәткә инде өстәлгән.

Әмма эш моның белән генә чикләнмәячәк. Кайбер милли телләр өчен (Яндекс төгәл нинди телләр икәнен әйтми) нейрочелтәрләр ярдәмендә сөйләмне текстка әйләндерү һәм сөйләм синтезы кебек функцияләр дә өстәләчәк. Бу милли телләрнең ничек яңгыраганын ишетергә мөмкинлек бирәчәк, ди алар.

Бу мөмкинлек беренче булып татар теле өчен ачылачак. Инде хәзер Яндекс Тәрҗемәче хезмәтендә берәр фразаны татар теленә тәрҗемә итү очрагында, аны тыңлау мөмкинлеге бар. Тәрҗемә сыйфаты да, нейрочелтәрнең татарча тавышы да чагыштырмача сыйфатлы.

Азатлык сөйләшкән белгеч татарча сөйләм синтезы Яндекс очрагында яңа булмавын хәтерләтте. 2024 ел башында гына татар телендә текстны тавышка һәм тавышны текстка әйләндерә торган хезмәт эшли башлады. Бу эшне Татарстан фәннәр академиясенең Гамәли семиотика институты башкарды.

— Әлегә Tatar.Speech хезмәтенең функционалы тулы түгел, мәсәлән, ул зур күләмдә текстларны тавышка әйләндерә алмый, хезмәткә текстны йөкләү мөмкинлеге дә әлегә күренми. Аудионы да шунда ук сөйләп түгел, йөкләү мөмкинлеге кирәк. Шулай да, бу татар теле өчен зур яңалык булды. Хәзер Яндекста да мондый функционалның барлыкка килүе татар теле өчен зур мөмкинлекләр ача, — ди IT-белгече.

Аның сүзләренчә, күп кенә яңа дигитал продуктлар шул хезмәтләргә таянып эшли ала. Төп сорау милли телләр активистлары һәм IT-белгечләре бу мөмкинлекләрне никадәр актив файдалана алуында, ди ул.

🛑 Русиядә Азатлык сайты томаланды, нишләргә? Безнең кулланма.
🌐 Безнең Telegram каналына да кушылырга онытмагыз!

Форум

Русия хакимиятләре Азатлык радиосын "теләнмәгән оешма" дип тамгалады. Фикер язар алдыннан Русиянең "теләнмәгән оешмалар" турындагы кануны таләпләре белән танышырга киңәш итәбез.
XS
SM
MD
LG