Узбекский язык — один из крупнейших языков, принадлежащих к тюркской языковой семье, на котором говорят около 50 миллионов человек по всему миру. В последующие годы положение и престиж государственного языка на международном уровне, определяющие перспективу взаимоотношений с другими языками, создание национального корпуса узбекского языка, узбекского языка для соотечественников, проживающих за рубежом, и иностранных граждан, желающих изучать узбекский язык. ведется языковой практикум по разработке языковых учебников, электронных программ и обучению узбекскому языку.

    В «Концепции развития узбекского языка и совершенствования языковой политики на 2020-2030 годы» в качестве приоритета определено обеспечение активной интеграции государственного языка в современные информационные технологии и коммуникации. В концепции на нас, специалистов, возлагается большая ответственность за создание электронного национального корпуса узбекского языка, включающего в себя всю научную, теоретическую и практическую информацию об узбекском языке, и его популяризацию в мировой информационной сети. .

    Современные информационные технологии открыли двери неограниченных возможностей использования функциональных возможностей языка. Компьютерный перевод, автоматическое редактирование и анализ, синтезаторы речи, программное обеспечение для распознавания речи, электронные словари, лингвистические мобильные приложения, тезаурусы и языковая онтология являются доказательством всему этому. В частности, формирование культуры создания и использования современных электронных словарей доказало свою эффективность в приобретении языковых навыков. В частности, роль языковых корпусов, которые создаются быстрыми темпами по всему миру, несравнима с точки зрения демонстрации и освоения языка.

    В связи с этим мы приступили к практической работе совместно с 9 нашими научно-техническими сотрудниками по теме «Проектирование национального корпуса узбекского языка и разработка программного комплекса».

    В первую очередь мы определили основные задачи нашего проекта, такие как анализ существующих иностранных национальных корпусов, определение принципов создания национального корпуса узбекского языка, формулирование требований к программному обеспечению, проектирование, разработка алгоритмов программного обеспечения, тестирование и утверждение.

    В ходе данного практического занятия была создана модель национального корпуса узбекского языка на основе анализа существующих иностранных национальных корпусов. Разработаны модели и алгоритмы автоматической обработки текста, токенизации, лемминга и грамматической классификации. Запущен сайт uzbekcorpora.uz для использования национального корпуса узбекского языка через Интернет.

    Основным результатом исследования станет программный комплекс, разработанный для создания национального корпуса узбекского языка. Данный программный комплекс предназначен для специалистов в области корпусной лингвистики и предоставляет возможность создания авторских или тематических корпусов и узбекского национального корпуса на основе избранных текстов узбекского языка на основе современных интернет-технологий. Программное обеспечение протестировано и готово к использованию путем создания корпуса на основе текстов эпоса «Алпомиш».

    В результате практической работы, проведенной в этом направлении, было опубликовано около 10 статей в зарубежных и местных журналах, 24 статьи опубликованы на конференциях, получено 5 программных сертификатов. На следующих этапах практических исследований будет сформирован корпус на основе коллекции избранных текстов узбекского языка и созданы программы, которые позволят проводить различные научные исследования текстов, вошедших в корпус.

 

Суюн Каримов,

Профессор Самаркандского государственного университета.