• RUB:
    6.68
  • USD:
    520.93
  • EUR:
    609.07
Басты сайтқа өту
Жоба 01 Тамыз, 2025

Ымдау тілін түсіндіретін кешен

270 рет
көрсетілді

Ақпараттық және есептеуіш технологиялар институтының жетекші ғылыми қызметкері, PhD, техника ғылымдарының кандидаты, қауымдастырылған профессор Әйгерім Ерімбетованың жетекшілігімен «Есту және сөйлеу қабілеті бұзылған адамдарға арналған жасанды интеллект негізіндегі сурдо-ресурстар кешені» әзірленіп жатыр. Жобаға Л.Н.Гумилёв атындағы Еуразия ұлттық университеті мен Әл-Фараби атындағы Қазақ ұлттық университетінің зерттеуші ғалымдары тартылған.

Жобаның мақсаты – қазақ және орыс тіл­деріндегі ымдау тілін қолданушылардың қоғаммен өзара байланысын арттыруға бағытталған инновациялық кешен құру. Кешенге қимылды тану, мәтінді қимылға және керісінше түрлендіру, сөйлеу синтезі, сондай-ақ аудионы мәтінге айналдыру сияқты бірнеше негізгі компоненттер енеді.

2021–2023 жылдар аралығында жас ғалымдар «Мүмкіндігі шектеулі адамдарды қолдаудың инклюзивті интеллектуалды жүйе­сінің модельдері мен әдіс­тері» атты гранттық қаржылан­дыру жобасы аясында елеулі нәтиже­лерге қол жеткізді. Атап айт­қанда, қазақ тіліндегі мәтіндерді өңдеуге арналған лексикалық-морфологиялық талдау блогі әзір­леніп, оның негізінде муль­тимедиялық тезаурустар құ­рылды және кеңейтілді. Сондай-ақ ымдау сөздік-тезаурус дерекқоры мен дактильді анимация құруға арналған бағдарламалық шешім­дер жасалды.

Жаңа жобада ғалымдар жасанды интеллект пен компьютерлік көру алгоритмдері негізінде ауыз­ша сөйлеуді ымға, ал қимыл­дарды мәтін мен дыбысқа түр­лен­діре­тін механизмдерді жетілдіріп жатыр. Нейрондық желілер мен машиналық оқыту әдістерін қолдану арқылы жүйе нақты уақыт режімінде жұмыс істеуге қабілетті модульдерді біріктіреді. Жүйе тиім­ділігін бағалау мақсатында әр­түрлі пайдаланушы тобының қатысуымен кешенді тестілеу жұмыстары жүргізіледі. Сонымен қатар жобаның бір бағыты – білім платформалары мен арнайы оқу материалдарын жасау.

Ым тілінің классификациясы MediaPipe деректері мен F1-score, нәтижесін бағалай отырып, ымды мәтінге айналдыратын EfficientNet и ResNet сияқты машиналық тану модельдерін біріктіреді. Мәтінді ымға айналдыру BLEU, WER метрикасы бойын­ша бағаланатын Transformer, Seq2Seq модельдерін қолдану арқылы қозғалысты қашықтан қамтып, қазақ тіліндегі-KSL корпусына негізделеді. Барлық компоненттер мобильді қосымшаға біріктірілгеннен кейін пайдаланушылар аватардың көмегімен мәтін мен сөйлемді ым тілінде түсіне алатын болады. Жүйені әзірлеуде PyTorch, TensorFlow, NumPy, pandas, MediaPipe және Unity сияқты алдыңғы қатарлы технологиялар мен құралдар қолданылып жатыр.

Барлық компоненттер бірік­тірілгеннен кейін жүйе мобильді қосымша түрінде ұсынылады. Қолданушылар мәтінді арнайы аватардың көмегімен ымдау тілінде түсіне алатын болады.

Жоба бағдарламалық-ныса­налы және гранттық қаржы­ландыру шеңберінде жүзеге асырылып отыр. Ғалымдар АҚШ, Малайзия, Ресей сынды ел­дер­дің тәжірибесін зерттей оты­рып, жергілікті қажетті­лік­терге бейім­делген әдістерді қалып­тастырады. Қазіргі уақыт­та зерт­теушілер АҚШ-тан жет­кізілген сенсорлы датчиктері бар костюмдер көмегімен үлкен көлемдегі қимыл деректерін жинап, жасанды интеллектіге арналған зама­науи және қуатты есептеу жүйелерін қолданып, зерттеу жұмыстарын жүргізіп жатыр. Алайда қазақ тіліндегі материалдардың жеткі­лік­­сіздігі – зерттеушілер үшін басты мәселенің бірі. Себебі еліміздегі арнайы мектептердің көпшілігінде білім орыс тілінде, ал қазақ тіліндегі оқулықтар өте аз.

«Қазіргі уақытта бейнеқор­лар, телебағдарламалар мен арнайы жазбалардан материалдар жинап жатырмыз. Сонымен қатар телебағдар­ламаларда қазақ тілінде ымдап түсіндіретін аватар-жазбалар жасау жобаның бір бағытына айналды»,  дейді жоба жетекшісі Әйгерім Ерімбетова.

Зерттеу барысында 2 мыңнан астам ерекше қимылдар мен ым қозғалыстары тіркеліп, өңделді. Ғалымдардың айтуынша, ымдау тілін қолданатын адамдарды қоғам жиі түсіне бермейді. Осы орайда жасанды интеллект негі­зіндегі жаңа әзірлеме қоғаммен қарым-қатынасты жеңілдетіп, есту және сөйлеу қабілеті бұзылған жандардың әлеуметтенуіне оң ықпал етеді. Бүгінде Қазақстанда есту қабілеті нашар 30 мыңнан астам адам бар әрі бұл көрсеткіш жыл сайын артып барады.

Жобаның әзірге ел ішінде баламасы жоқ. Келешекте бұл кешенді шешім денсаулық сақтау, құқық қорғау, әкімшілік және ақпараттық қызметтерде, сондай-ақ білім плат­фор­маларында қолдануға мүм­кіндік береді.

 

АЛМАТЫ