«Болашақ» для одаренных детей и казахский язык на основе ИИ — Асхат Аймагамбетов о законопроекте

Фото: Фото: Мажилис Парламента РК

Мажилис принял поправки в законопроект «О внесении изменений и дополнений в некоторые законодательные акты Республики Казахстан по вопросам культуры, образования и наставничества». Председатель Комитета по социально-культурному развитию Асхат Аймагамбетов рассказал о нововведениях этого документа корреспонденту Kazinform. 

— Асхат Канатович, в этом законопроекте есть нормы, направленные на унификацию использования казахского языка. Начнем с этого.

— В законопроекте есть специальная норма, предусматривающая создание цифрового национального словарного фонда государственного языка. Эта норма предполагает развитие государственного языка с помощью искусственного интеллекта. Такие системы, как Chat GPT, Алиса и другие, должны эффективно работать на казахском языке.

Для этого необходим унифицированный словарь, то есть языковая информационная система. Во-первых, она будет бесплатной, а во-вторых, доступной для всех. Независимо от того, бизнесмен это или переводчик, любой гражданин сможет зайти в эту систему, проверить и исправить нужный текст. Например, сейчас многие учреждения сталкиваются с ошибками в переводе текста на казахский язык на вывесках, но из-за того, что информация о нормах языка не доступна в цифровом виде, такие недостатки сложно устранить системно. Мы уверены, что предлагаемая информационная система поможет решить эту проблему. Это только один из примеров.

Цифровой словарный фонд будет служить инструкцией для использования казахского языка в различных сферах жизни. Мы изучили опыт других стран, таких как Эстония, Южная Корея, Финляндия и Россия. Одним словом, в цифровом мире, где мы живем, казахскому языку тоже нужен цифровой словарный фонд.

Словарь — это не только отдельные слова, но и фразы, термины, а также база, которая охватывает знания о каждом слове, его сочетаниях и орфографии. В настоящее время существуют различные списки словарей и терминов, но из-за отсутствия централизованной системы, каждый человек опирается на доступные ему базы данных и не может точно определить, что правильно. Централизованный государственный словарный фонд обеспечит единообразие в использовании казахского языка.

В рамках поручения Президента по развитию искусственного интеллекта проводится масштабная работа. Вы это знаете. Цифровой словарь является ключевым инструментом для улучшения взаимодействия искусственного интеллекта с казахским языком. Это сложный процесс, требующий передачи каждого слова в разнообразных контекстах. Например, чтобы искусственный интеллект понимал, как использовать слово, необходимо предоставить ему множество вариантов его применения в разных ситуациях. В отличие от человека, который может полагаться на интуицию при выборе слова, искусственный интеллект основывается исключительно на алгоритмах. Поэтому важна точная и глубокая проработка каждого слова и выражения. 

Например, мы должны одно слово использовать в 500 разных контекстах. Если этого контекста не дать, робот не поймет, как его правильно использовать. Это большая работа, не просто обычный словарь. Если язык постоянно развивается, то и цифровой словарь должен также обновляться.

— Кто будет разрабатывать этот словарь, кто его утвердит?

— За разработку информационной системы будет отвечать компетентный орган, который определит Правительство. Например, мы предлагаем назначить ответственным за эту работу Национальный научно-практический центр «Тіл-Қазына» имени Шайсултана Шаяхметова. Это позволит избежать создания новых организаций. В закон также вводим понятие «Национальный корпус казахского языка».

Фото: СКГУ

— Насколько мне известно, вопрос создания цифрового корпуса казахского языка уже поднимался ранее. Почему именно сейчас его нужно закрепить в законе?

— Этот вопрос раньше не был должным образом отражен в законодательных актах. Теперь же, внося его в закон, мы стремимся обеспечить системность и бесперебойность работы в этой области. Язык имеет корпуса, которые могут быть классифицированы по множеству параметров: например, по особенностям, специфике, автору, теме или даже жанру. Существуют специализированные корпуса, такие как диалектологический, писательский, поэтический и другие. Каждый корпус может иметь различные типы обозначений, которые могут быть полными или частичными, а могут и вовсе отсутствовать. Под обозначением в данном контексте понимается научно обоснованная информация, которая относится как к отдельным языковым единицам в составе текста, так и к самим текстам. Такая информация может носить лингвистический характер для единиц языка, а для текстов — филологический и энциклопедический.

Национальный корпус казахского языка представляет собой не просто ресурс, а фундаментальную платформу, охватывающую все аспекты существования языка в реальной жизни. Это обширная база данных, включающая тексты, которые отражают разнообразие областей, жанров и стилей, в которых используется казахский язык, охватывая как современный, так и исторический периоды. Однако его значение выходит за рамки простого электронного собрания текстов. Он является источником, который содержит детализированную источниковедческую информацию по каждому тексту. Включенные в корпус тексты снабжены исчерпывающей лингвистической информацией, охватывающей все языковые единицы — от звуков и слов до фразеологизмов, пословиц, суффиксов и других элементов. Эта база оснащена интеллектуальной поисковой системой, которая позволяет проводить глубокий анализ и искать информацию по множеству разнообразных запросов. Важно, чтобы создание и развитие такого корпуса осуществлялось научным сообществом, то есть лингвистической научной средой, что обеспечит высокое качество и надежность ресурса.

Включение Национального корпуса казахского языка в закон является важным шагом в признании его значимости для создания качественного языкового контента в цифровом пространстве и обеспечении устойчивости этого процесса на долгосрочную перспективу.

— Значит, создание Национального корпуса казахского языка потребует работы ученых?

— Безусловно, поэтому мы указали в законе, что за это будет отвечать орган, который курирует государственную научную политику. В настоящее время разрабатываются различные корпусы казахского языка, среди них Институт языкознания имени Ахмета Байтурсынова работает над созданием корпуса с разнообразным обозначением на основе обширной базы текстов различных жанров и стилей нашего языка современного и исторического периода. Однако мы считаем, что Национальный корпус казахского языка должен пополняться, углубляться, совершенствоваться.

— А будет ли в законе предусмотрен какой-либо статус для этого информационного ресурса?

— Это будет открытая информационная система, которая будет служить методическим инструментом, доступным ресурсом для обеспечения единообразия в использовании языка.

Фото: Министерство просвещения РК

— Перейдем к нормам поддержки одаренных детей. В чем заключается новизна этих норм? 

— Это так же очень важный вопрос. На сегодняшний день наших спортсменов поддерживают как меценаты, так и государство. В обществе давно высказывается мнение о том, что победителей международных олимпиад по учебным предметам следует поддерживать так же, как и спортсменов, победивших на Олимпийских играх. Уже сделаны первые шаги в этом направлении.

По поручению Президента с 2021 года победители международных олимпиад по учебным предметам получили возможность поступать в любое учебное заведение Казахстана без прохождения ЕНТ, на основе грантов. В список Министерства образования и науки включены олимпиады, в которых участвуют около 100-200 стран и которые признаны в мире. Только победители этих олимпиад могут рассчитывать на такую поддержку. Существует ряд образовательных конкурсов, признанных в мире, но ограниченных по масштабу и не имеющих столь высокой конкуренции. Они не включены в этот список.

Также введен механизм единовременных премий в размере 5 миллионов тенге для победителей олимпиад, включенных в список Министерства. Предлагаемые в данном законопроекте нормы можно рассматривать как логичное продолжение этих мер поддержки.

Конкретнее говоря, мы предлагаем поддерживать не только победителей международных олимпиад, но и талантливых молодых людей, победивших в научных конкурсах. Например, есть молодые люди, которые трижды получили мировое признание в области робототехники. Но действующее законодательство не позволяет оказать им поддержку, аналогичную поддержке победителей олимпиад. Мы предлагаем устранить это несоответствие. То есть победители признанных международных научных конкурсов смогут получать поддержку от государства, как это происходит с победителями международных олимпиад по учебным предметам.

Фото: пресс-служба АО «Центр международных программ»

— Почему в законе для них не предусмотрено такое же вознаграждение, как и для победителей Олимпийских игр? Почему вы не предлагаете перераспределить призовые фонды?

— Во-первых, невозможно перераспределить бюджет одной сферы в другую. Во-вторых, мы предлагаем расширить рамки программы «Болашақ». Сейчас по этой программе можно обучаться только в магистратуре и докторантуре. Мы предлагаем включить и бакалавриат. Но это касается не всех, а только одаренных студентов, которые победили на престижных международных олимпиадах или научных конкурсах, включенных в специальный список. Такие студенты смогут по программе «Болашақ» продолжить свое обучение по своему направлению за рубежом за счет государства. Ведь наших детей, проявивших себя на международной арене, уже приглашают лучшие университеты мира.

Но государство уже инвестировало в них с самого детства, начиная с детского сада и до окончания школы. С одной стороны, можно сказать, что мы готовим наших одаренных детей для обучения в лучших учебных заведениях мира за счет наших средств. А после получения диплома бакалавра по программе «Болашақ» эти студенты как минимум 3 года будут обязаны работать в Казахстане.