• История -Публицистика -Психология -Религия -Тюркология -Фантастика -Поэзия -Юмор -Детям                 -Список авторов -Добавить книгу
  • Константин Пензев

    Хемингуэй. Эпиграфы для глав

    Мусульманские праздники

    Тайны татарского народа


  • Полный список авторов

  • Популярные авторы:
  • Абдулла Алиш
  • Абдрахман Абсалямов
  • Абрар Каримулин
  • Адель Кутуй
  • Амирхан Еники
  • Атилла Расих
  • Ахмет Дусайлы
  • Аяз Гилязов
  • Баки Урманче
  • Батулла
  • Вахит Имамов
  • Вахит Юныс
  • Габдулла Тукай
  • Галимжан Ибрагимов
  • Галимъян Гильманов
  • Гаяз Исхаки
  • Гумер Баширов
  • Гумер Тулумбай
  • Дердменд
  • Диас Валеев
  • Заки Зайнуллин
  • Заки Нури
  • Захид Махмуди
  • Захир Бигиев
  • Зульфат
  • Ибрагим Гази
  • Ибрагим Йосфи
  • Ибрагим Нуруллин
  • Ибрагим Салахов
  • Кави Нажми
  • Карим Тинчурин
  • Каюм Насыри
  • Кул Гали
  • Кул Шариф
  • Лев Гумилёв
  • Локман-Хаким Таналин
  • Лябиб Лерон
  • Магсум Хужин
  • Мажит Гафури
  • Марат Кабиров
  • Марс Шабаев
  • Миргазыян Юныс
  • Мирсай Амир
  • Мурад Аджи
  • Муса Джалиль
  • Мустай Карим
  • Мухаммат Магдиев
  • Наби Даули
  • Нажип Думави
  • Наки Исанбет
  • Ногмани
  • Нур Баян
  • Нурихан Фаттах
  • Нурулла Гариф
  • Олжас Сулейменов
  • Равиль Файзуллин
  • Разиль Валиев
  • Рамиль Гарифуллин
  • Рауль Мир-Хайдаров
  • Рафаэль Мустафин
  • Ренат Харис
  • Риза Бариев
  • Ризаэддин Фахретдин
  • Римзиль Валеев
  • Ринат Мухамадиев
  • Ркаил Зайдулла
  • Роберт Миннуллин
  • Рустем Кутуй
  • Сагит Сунчелей
  • Садри Джалал
  • Садри Максуди
  • Салих Баттал
  • Сибгат Хаким
  • Тухват Ченекай
  • Умми Камал
  • Файзерахман Хайбуллин
  • Фанис Яруллин
  • Фарит Яхин
  • Фатих Амирхан
  • Фатих Урманче
  • Фатых Хусни
  • Хабра Рахман
  • Хади Атласи
  • Хади Такташ
  • Хасан Сарьян
  • Хасан Туфан
  • Ходжа Насретдин
  • Шайхи Маннур
  • Шамиль Мингазов
  • Шамиль Усманов
  • Шариф Камал
  • Шаукат Галиев
  • Шихабетдин Марджани
  • Юсуф Баласагуни




  • Джаудат Сулейман



    Академик-секретарь отделения социально-экономических наук Академии наук Республики Татарстан

    Действительный член Академии наук Республики Татарстан

    Родился в 1955 г. Профессор кафедры теоретической кибернетики КГУ, и.о. академика-секретаря Отделения социально-экономических наук АН РТ, зав. Совместной научно-исследовательской лабораторией АНТ и КГУ «Проблемы ИИ», доктор технических наук (2000), профессор (2003), член-корреспондент АН РТ (2004).
    Сулейманов Д.Ш. – известный ученый, активно и результативно работающий на стыке наук – искусственного интеллекта, социальной педагогики, компьютерных образовательных технологий. Им разработана теория автоматизированного диагностирования ответов обучаемого на естественном языке и предложены методы и технология построения систем, основанных на прагматически-ориентированных моделях. Основная научно-практическая ценность результатов заключается в том, что он развивает новые направления и разрабатывает новую методическую базу в педагогике за счет внедрения новейших достижений из области информационных систем и прикладной математики. Под его руководством и при его участии созданы электронные мультимедийные учебники, активно используемые в школах республики.
    Под его руководством создан программный комплекс татарской локализации компьютерных систем, повсеместно используемый для делопроизводства, издательского дела и преподавания предметов на татарском языке. По заказу правительства РТ совместно с фирмой Microsoft осуществлена полная татарская локализация операционных систем Windows XP и Windows Vista и их приложений. Им получены значительные научно-практические результаты в области прикладной и математической лингвистики. Им разработан и внедрен в практику уникальный педагогический комплекс социально-психологической адаптации и развития одаренных детей «Сэлэт», являющийся эффективной системой работы с одаренными детьми, в рамках которого в течение года реализуется более 20 научно-образовательных и творческих проектов.
    Имеет более 150 публикаций (около 200 п.л.), в том числе 3 монографии, 2 терминологических словаря по информатике, англо-татарско-русский толковый словарь терминов по информатике, 15 учебно-методических пособий. Из них более 70 публикаций (76 п.л.) – по проблемам информатизации образовательных процессов и управления образованием. Соавтор 5 электронных мультимедийных учебников. Является председателем научного совета по педагогике при ОСЭН АН РТ, членом Совета Российской ассоциации ИИ, членом Общественной Палаты РТ, председателем регионального экспертного совета РГНФ. Член союза писателей РТ.
    Сулейманов Д.Ш. является руководителем научно-педагогической школы «Татарская компьютерная лингвистика» и одним из лидеров научного направления «Инновационные образовательные технологии». Член редколлегии Международного электронного журнала «Передовые технологии в образовании». Его ученики стали лауреатами премии Академии наук РТ, 2-х республиканских премий по науке и 2-х республиканских молодежных грантов. Научно-педагогический стаж – 30 лет. Число аспирантов и соискателей (за последних 5 лет) – 7. Общее число подготовленных кандидатов наук – 4. Число проектов, получивших гранты РФФИ, РГНФ, Общественной Палаты РФ, Министерства образования и науки РФ, Кабинета Министров РТ, Академии наук РТ (за последних 5 лет) и выполненных под его руководством: 15.
    Является одним из разработчиков и исполнителей Республиканского национального проекта «Образование», Республиканской программы информатизации образования РТ, Государственной программы по изучению, сохранению и развитию языков народов РТ. Награжден Почетной грамотой Министерства образования РФ (2002), юбилейной медалью «1000-летие г. Казани». Лауреат республиканской премии им. М.Джалиля за результаты в области социально-психологической адаптации одаренных детей (2003).

    Сөләйманов Җәүдәт Шәүкәт улы 1955 елда туган. Техник фәннәр докторы, профессор, ТР ФА академигы. М.Җәлил исемендәге республика премиясе лауреаты. КДУның теретик кибернитика кафедрасы профессоры, ТФА һәм КДУның “ТИ проблемалары” уртак фәнни-тикшеренү лабораториясе мөдире.

    Suleimanov D.Sh., D.Sc. (Engineering), professor, Fellowof TAS was born in 1955. He is a Dzhalil Tatarstan State prize-winner. Dr. Suleimanov is the head of the Joint Laboratory of TAS and KSU for Problems of Artificial Intelligence and a professor of Department of Cybernetics in Kazan State University.

    Джавдет Шевкетович Сулейманов

    Татарский язык и новые информационные технологии

    Введение

    В условиях глобализации и повсеместной информатизации любой естественный язык, для того чтобы выжить и развиваться, должен войти в компьютерные технологии как язык хранения, обработки и передачи информации, стать языком коммуникации в мировой компьютерной сети Интернет. Сегодня трудно найти человека, кто не согласится с этим тезисом.

    Обмен данными на татарском языке расширяет его функции как языка государственного и межгосударственного общения; способствует повышению информированности мировой общественности о татарах и их культуре, открытости республики, активной интеграции ее в мировое информационное сообщество. Внедрение татарского языка в компьютерные технологии подготавливает почву для массового использования компьютеров в процессе труда. Становление и развитие наук на татарском языке также немыслимо без активного применения компьютерных технологий. Очевидно, только такой подход, такая идеология может гарантировать перспективу как татарскому языку, так и татарскому народу. В конечном счете, это в интересах всех народов Татарстана, так как такой подход и, соответственно, стабильное развитие татарского языка является надежной гарантией социальной и общественной стабильности в республике.

    Проблема татарской национальной локализации компьютерных систем, то есть обеспечение решения обозначенных выше задач, в Татарстане была воспринята как одна из важных и безотлагательных для сохранения и развития татарского языка, для обеспечения равного функционирования в компьютерных системах татарского и русского языков, включая делопроизводство и электронные средства массовой информации. Решению этих проблем в Государственной программе РТ по реализации Закона о языках посвящен специальный раздел «Внедрение информационных технологий в системе мер по обеспечению функционирования татарского языка». Еще в 1993 г . правительством была утверждена Государственная инновационная программа «Компьютерное обеспечение функционирования татарского языка как государственного» и выделены финансовые средства.

    В качестве механизма внедрения татарского языка в компьютерные технологии, для проведения фундаментальных научно-исследовательских и прикладных работ в области компьютерной лингвистики, для решения задач в рамках научного направления Академии наук Татарстана: «Татарский народ и народы Татарстана: возрождение и развитие» и для разработки соответствующих стандартов и средств компьютерного обеспечения татарского языка в рамках Государственной программы РТ по сохранению, изучению и развитию языков народов Республики Татарстан, 25 июня 1993 г . была создана Совместная лаборатория Академии наук Татарстана и Казанского госуниверситета «Проблемы искусственного интеллекта» (СНИЛ ПИИ АНТ И КГУ) (научный руководитель д.ф.-м.н., д.т.н. проф. Р.Г. Бухараев, зав. лаб. д.т.н., проф. КГУ, академик АН РТ Д.Ш. Сулейманов). СНИЛ ПИИ АНТ И КГУ является экспертной организацией по внедрению татарского языка в компьютерные технологии (Постановление Кабинета министров РТ № 1062 от 9 декабря 1996 г .) в республике и базовой лабораторией по реализации раздела «Внедрение информационных технологий в системе мер по обеспечению функционирования татарского языка» Государственной программы по сохранению, изучению и развитию языков народов РТ.

    Под компьютерными информационными технологиями понимаются средства обработки данных с применением вычислительной техники, начиная от персональных компьютеров до глобальных сетей типа Интернет. Информационно-поисковые машины, автоматизированные обучающие системы, экспертные системы, машинные переводчики, электронные словари, распознаватели и синтезаторы речи, издательские системы, текстовые и графические редакторы, корректоры текстов, профессиональные автоматизированные рабочие места – все это средства обработки знаний, относящиеся к компьютерным технологиям. К новым информационным технологиям, помимо перечисленного, относится также программный инструментарий для создания средств обработки информации, такие как операционные системы, языки и системы программирования.

    В данной статье рассматривается взаимосвязь компьютерных технологий и татарского языка в следующих трех аспектах: 1) «татарский язык в компьютерных технологиях», то есть создание программных средств, обеспечивающих возможность применения татарского языка в компьютерных технологиях; 2) «компьютерные технологии для татарского языка», то есть создание программных средств для автоматизации работы с татарским языком; 3) «татарский язык для компьютерных технологий», то есть создание новых средств хранения и обработки информации с использованием прагматически-ориентированных лингвистических моделей татарского языка.

     

    1. Татарский язык в компьютерных технологиях

    Первое направление непосредственно связано с проблемой сохранения языка, обеспечения паритетного функционирования его как государственного, предоставления возможности носителям языка прямого общения с компьютерными системами без языка посредника. Эти проблемы, названные нами внедрением татарского языка в компьютерные технологии, решаются разработкой стандартов кодировок, экранных драйверов, драйверов печати для различных компьютерных систем, созданием татарских вариантов интерфейса с пакетами программ и с операционными системами. Этот базовый, минимальный уровень присутствия татарского языка в компьютерных технологиях мы и назвали «татарский язык в компьютерных технологиях». Что же мы имеем сегодня в этом направлении?

    Экранные и клавиатурные драйверы, драйверы печати и шрифтовое обеспечение для татарского языка на кириллической основе утверждены Кабинетом Министров РТ в 1996 г . в качестве стандарта и широко применяются в информационных технологиях в Республике Татарстан. Это означает, что созданы условия для ведения делопроизводства, издательского дела на татарском языке, условия для разработки систем обработки тестов на татарском языке – редакторов, корректоров и др. На основе принятых стандартов по соглашению с фирмой MicroSoft соответствующие средства разработаны и внедрены в операционную среду Windows NT 5.0 и Office-2000. Таким образом, татарский язык стал вторым тюркским языком (после турецкого языка), подготовленным для реализации специалистами самой республики (а не разработчиками фирмы), и доступным в среде Windows уже при ее инсталляции. В настоящее время осуществлена полная татарская локализация программных средств Windows ХР и Windows Vista и офисных приложений. Разработана опытно-эксплуатационная версия пакета драйверов и шрифтового обеспечения для татарского языка на основе латиницы. От имени Академии наук Татарстана подготовлены соответствующие материалы и принято Постановление Кабинета Министров РТ «О стандартах кодировки символов татарского алфавита на основе латинской графики и базовых программах для компьютерных применений» № 625 от 27 сентября 2000 г .

    Кроме базовых возможностей, внедрение татарского языка в компьютерные технологии предполагает и разработку пакетов прикладных программ для автоматизации профессиональной деятельности, для автоматизации обработки текстов на татарском языке, а также для создания татаро-язычного человеко-машинного интерфейса, то есть разработки программных средств общения с компьютерными системами на татарском языке. В настоящее время разработан корректор татарских текстов на основе генеративной морфологии, работающий в среде ДОС и в среде Windows’ 95, 98, 2000, ХР, Vista и помогающий пользователю обнаруживать и исправлять ошибки в тексте. Широко используются на практике электронный русско-татарский словарь, словарь политических терминов, англо-татарско-русский и русско-татарский словники компьютерных терминов, англо-татарско-русский толковый словарь по информатике, включающий порядка 7 000 терминов. Разработан татарский двухуровневый морфологический анализатор, способный производить морфологический разбор и генерацию татарских словоформ. На основе морфологического анализатора разрабатывается татарско-турецкий автоматизированный переводчик (совместно с Белкентским университетом, Анкара, Турция). Распознаватель текстов FineReader Tatar для татарского языка на основе кириллического алфавита, созданная совместно с фирмой ABBYY, позволяет повысить производительность работы машинисток в 10-15 раз при более качественном вводе рукописных текстов.

    Татарская локализация системы ЗАГС, включая экранные формы и файлы помощи, а также автоматизированной системы паспортно-визовой службы являются добрым знаком широкомасштабного проникновения татарского языка в государственные распределенные информационные технологии.

     

    2. Компьютеры на службе татарскому языку

    Второе направление – использование информационных технологий для изучения, развития татарского языка. Современное татарское языкознание развивается практически без привлечения математического аппарата и возможностей вычислительной техники для создания и изучения языковых моделей. Данное направление включает научно-прикладные работы по разработке машинного фонда татарского языка, татарского речевого интерфейса, функционально-структурной модели татарских морфем как формальной и информационно-справочной базы при построении лингвопроцессоров и обучении татарскому языку, подготовка учебно-методического материала, разработка и эксплуатация обучающе-игровых программ на татарском языке. Разработка синтезатора татарской речи, то есть компьютерной программы, воспроизводящей электронные тексты на татарском языке с соответствующей мелодичностью и просодикой, является одной из сложных, наукоемких задач, выполняемых в нашей лаборатории. Совместно фирмой ABBY (г. Москва) разработана татарская версия распознавателя текстов FineReader, создан русско-татарский электронный словарь под оболочкой Лингво, совместно с Белкентским университетом (Турция) разработан двухуровневый морфологический анализатор, являющийся основой татарско-турецкого автоматизированного переводчика, разрабатываемого также в СНИЛ ПИИ АНТ и КГУ.

    Оригинальным и не имеющим аналогов является Интегрированный программно-информационный комплекс «Татарская морфема». Данная компьютерная программа практически является полной моделью татарской морфологии, представляет интерес как база исследований и как основа для различных лингвопроцессоров, то есть средств обработки естественного языка, а также как учебная база по татарскому языкознанию. Данный программный комплекс, включающий также мощные ресурсы помощи по морфологии и трехязычный татарско-русско-английский интерфейс, на Международном семинаре «Диалог: компьютерная лингвистика и ее приложения» привлек внимание американских ученых из города Нью-Мехико, занимающихся машинным переводом, как универсальное средство хранения и обработки информации по морфологии, легко адаптирующееся к различным языкам.

    В последние годы осуществляется интенсивное применение компьютерных систем при создании различных словарей, издании татарских газет, журналов и книг на татарском языке. Разрабатываются обучающие программы, пакеты прикладных программ, ориентированные на обработку татарских текстов. Накопление электронной информации и создание программного инструментария осуществляется во многих организациях, институтах, библиотеках.

    Таким образом, сегодня особенно актуальным стало создание Машинного фонда татарского языка (МФТЯ), представляющего собой наиболее полный источник информации по татарскому языку, систематизирующего и упорядочивающего доступ к информации, а также предъявляющего определенные требования к стандартам хранения, обмена и конвертации текстов.

    В настоящее время внедрение татарского языка в компьютерные системы и накопление электронной информации на татарском языке происходит стихийно, практически отсутствует координация этих работ. Остро стоит вопрос совместимости и сохранности текстов, введенных в компьютер в различных организациях, владельцах ценной информации. Дефицит информации о работах в этой области приводит к дублированию работ, а также и к уничтожению введенных текстов в целях экономии памяти после получения твердой копии. Решение данной проблемы через создание МФТЯ является новым подходом для накопления, систематизации и использования текстовой и иной информации на татарском языке, включая и системы обработки татарских текстов.

    Внедрение татарского языка в компьютерные системы началось в середине 60-х гг. С середины 80-х гг. в рамках Машинного фонда русского языка (МФРЯ) началось создание МФТЯ. В настоящее время происходит перманентное производство татарских текстов, как форматированных, в виде словарей, баз данных систем обработки татарских текстов, так и неформатированных, в виде газет, журналов, книг, а также в виде результата деятельности государственных учреждений, институтов и организаций, имеющих дело с делопроизводством и обработкой информации на татарском языке. Очевидно, такая информация является национальным богатством, основой для научных и практических исследований.

    Идеи машинного фонда татарского языка неоднократно обсуждались на научных семинарах СНИЛ ПИИ АНТ и КГУ с участием лингвистов и специалистов в области компьютерных технологий. Имеется концептуальная проработка архитектуры, организационных, технологических и реализационных аспектов МФТЯ.

    В лаборатории разработана программа автоматизированной поддержки перевода документов в системах учета и регистрации, направленная на разработку комплекса автоматизированной поддержки татарско-русского и русско-татарского перевода учетно-регистрационных форм в системах обработки документов. Разработка систем автоматизированного перевода является одной из актуальных проблем современных компьютерных технологий, особенно в связи с развитием сетевых технологий коммуникации, позволяющих осуществлять доступ к многоязыковым ресурсам сети. Машинный перевод является одним из приоритетных направлений исследований современной компьютерной лингвистики. Разработка приемлемого машинного переводчика, как показывает опыт наших коллег из Нью-Мехико (США) и Билкентского университета г. Анкары (Турция), требует финансовых вложений до миллиона и более долларов. Известно, что для исследований и осуществления практических разработок в области создания систем обработки знаний, включая системы понимания естественного языка, поисковые Интернет-машины, распознаватели речи, США расходуют более 1.5 миллиардов долларов в год. Важнейшие проекты ведущих компаний и фирм (SYSTRAN – официально признанный инструмент перевода в странах общего рынка, проект EMIR – Европейский многоязычный информационный поиск (Франция), поколения систем машинного перевода «ЭТАП» (Россия, ИППИ РАН), Socrat (фирма «Арсеналъ», Россия), MIROSLAV (многоязыковой машинный переводчик, Германия и др.) базируются на развитых формальных моделях описания морфологии и синтаксиса естественного языка (ЕЯ), формальных моделях организации словарей различного типа. Исследования в этой области нами осуществляются с 1978 г . в рамках научного направления Казанского государственного университета «Математическое и программное обеспечение интеллектуальной деятельности», с 1996 г . реализуется совместный международный проект с Билкентским университетом при финансовой поддержке Европейской программы «Наука за стабильность».

    К компьютерным программам, помогающим изучению татарского языка и различных предметов на татарском языке, относятся автоматизированные обучающие и тестирующие курсы. В нашей лаборатории совместно с республиканским фондом «Сэлэт» создан ряд мультимедийных компакт-дисков с обучающей программой татарскому языку на основе книги Фариза и Чулпан Харисовых «Мой первый словарь», выпущенной издательством «Магариф» и учебника татарского языка 5 класса. Обучающие программы позволяют изучать татарский язык, просматривая картинки на разные темы, слушая голос диктора и читая тексты на татарском, русском и английском языках, а также работая над произношением собственной речи на татарском языке, проговаривая слова и предложения в микрофон. В самой программе можно выбрать три языка интерфейса: татарский, русский, английский. Выбирая одну из 50 тем, обучающийся имеет возможность изучать татарский язык, просматривая картинки и тексты с переводом. Последняя версия мультимедийного диска «Татар телле заман» содержит три типа упражнений, блок диалогов и 11 увлекательных лингвистических игр. Сегодня этот диск помогает изучать татарский язык и в школах Татарстана, и в Москве, и во многих других городах России, а также в Турции, Америке, Финляндии, Вьетнаме, Австралии.

     

    3. Татарский язык – язык искусственного интеллекта

    Третье направление – использование татарского языка в новых информационных технологиях как языка системы искусственного интеллекта. В настоящее время существует множество различных определений систем искусственного интеллекта (СИИ). В качестве обобщающего можно сформулировать следующее определение. СИИ – это программно-информационный комплекс, способный принимать адекватные решения на основе знаний и самообучаться. Практически – это система, моделирующая умственные функции человека. Основной задачей искусственного интеллекта является обработка информации. Наиболее важные вопросы искусственного интеллекта – адекватное описание знаний; компактное хранение информации; быстрый доступ к данным (поиск и извлечение, наличие или разработка соответствующих средств, стратегий, способов, методов); возможность корректной работы при неполных, нечетких и недостоверных данных. Современные системы искусственного интеллекта созданы на основе английского языка и практически реализуют американскую языковую ментальность.

    Наши исследования и исследования зарубежных ученых показывают, что регулярность татарского языка, его внутренняя логика и стройность позволяют говорить о возможности и эффективности использования татарского языка как машинного языка искусственного интеллекта для разработки интеллектуальных систем. Раскрывая вопрос о формальной элегантности и естественной сложности татарского языка на международных конференциях, мы видим, как внутренние механизмы татарского языка становятся объектом большого интереса специалистов в области информационных технологий.

    Формальная элегантность татарской морфологии объясняется тем, что ограниченное количество аффиксов имеет стандартную схему присоединения к определенным типам словоформ. Сложность морфологии определяется, с одной стороны, тем, что присоединение некоторого аффикса может изменить тип словоформы, с другой стороны, каждая аффиксальная морфема может присоединяться к слову с различными значениями, в зависимости от контекста. Например, даже по следующему разложению можно увидеть формальную элегантность и естественную сложность татарской морфологии. Татар/ча/лаш/тыр/у/чы/лар/дагы/ныкы/лар/га/мыни (здесь косая черта обозначает позиции морфем в слитном слове) (перевод: ‘Разве тем, кто (что) принадлежит тем, кто (что) на тех, кто время от времени переводит на татарский’): Татар (имя) + ча(наречие) + ла(глагол) + штыр (глагол) + у(имя) + чы(имя) + лар (множ.) + дагы(имя, мест.-вр.падеж) + ныкы(имя, притяж. падеж) + лар(мн.) + га (направит.) + мыни(вопр., удивление). Причем, благодаря наличию таких аффиксов, как –дагы, -ныкы для имен существительных и –гала, -штыр для глаголов, из одного корня может быть образовано практически неограниченное число словоформ. Такое явление в математике определяется как рекурсия, то есть как образование новых смыслов по одной и той же формуле. Возьмем к примеру, словоформы: урманныкыныкы (урман+ныкы+ныкы), урмандагыдагы (урман+дагы+дагы), югалаштыргалаштыргала (ю+гала+штыр+гала+штыр+ +гала). Начиная с корня, добавление очередного аффикса изменяет сам объект рассмотрения (для существительных) или определенную частотность действия (для глаголов). Таким образом, в татарском языке имеется естественная смысловая сложность морфологии, однако такая сложность является благом для плотной, компактной передачи информации, а благодаря строгому подчинению правилам, такие словоформы легко распознаются и понимаются в контексте. В силу естественной почти автоматной регулярности татарской грамматики, татарский язык обеспечивает быструю обработку информации. Компактность передачи смысла текста на поверхностном, лексическом, уровне объясняется во многом возможностями языка синтетически, то есть словоформой, кодировать смысл, который для других языков (английский, русский) формируется аналитически, чаще всего несколькими предложениями. В качестве упражнения, предлагаю читателю самому убедиться в сказанном на примере перевода следующей словоформы: «урмандагыныкыныкылардагыдагыларныкындагыларга» = «урман [‘лес’] дагы [место-временной падежный аффикс] ныкы[притяж.пад.афф.] ныкы [притяж.пад.афф.] лар [множ.афф.] дагы [место-времменной пад.афф.] дагы [место-времменной пад.афф.] лар [множ.афф.] ныкы [притяж.пад.афф.] ндагы [место-времменной пад.афф.] лар [множ.афф.] га [направительный пад.афф.. Вполне обоснованно можно возразить, что в речи такие длинные формы вряд ли будут активны. В речи, как правило, практикуется присоединение 2-3, редко 4 аффиксов, чаще вместо длинных фраз используются аналитические формы, в виде последовательности словоформ. Однако приведенный пример является естественным с точки зрения татарской грамматики, закономерным словоизменением для татарского языка. С точки зрения же интеллектуальных машин, такая возможность – это находка и благо, позволяющее синтетически, а не аналитически, то есть компактно передавать смысл фразы.

    При этом стоит включить в соответствующие позиции определенные параметры-[урман]дагы(x)ныкы(y)ныкы(z)лар(u)дагы(w)дагы(v)лар(s)ныкы(q)ндагы(r)лар(k)га, и такая словоформа становится как бы универсальной схемой, при определенных параметрах, конкретных значениях аффиксов и в зависимости от контекста придающей то или иное конкретное значение всей фразе, передаваемой одной словоформой. Например, при конкретных параметрах «[урман]дагы(ель) ныкы(ветка)ныкы(хвоя)лар(хвои)дагы(росинка)дагы(искорка)лар(искорки) ныкы(сияние)ндагы(таинство)лар(таинства)га» такую словоформу можно прочитать следующим образом: «Тем таинствам сияния искорок, которые на росинках, что на хвоях веток елей, которые в лесу».

    Приведем в качестве примера, подтверждающего компактность хранения информации, данные из опыта перевода файлов помощи системы ДИОНИС. Текстовый файл на русском языке занимает 162 Kb (т.е. порядка 80 страниц машинописного текста), на английском языке – 142 Kb (порядка 70 стр.), а на татарском языке тот же текст занял 128 Kb (64 стр.), то есть получается естественное сжатие информации почти на 20%.

    Агглютинативность языка, алгоритмические закономерности, минимальность исключений, наличие мощного мета-аппарата, достаточно жесткий синтаксис позволяют ставить задачу о построении языка промежуточной трансляции, то есть языка-посредника на базе татарского языка, и даже разработки новых операционных систем на основе новой идеологии.

    Исследуя строение предложений на английском и татарском языках, легко заметить следующую четкую закономерность. Английские предложения строятся по схеме S-V-O (subject-verb-object:субъект-глагол-объект), а татарские – по схеме: S-O-V. То есть, англичанин, если говорит, например, о намерении сходить в кино, сначала скажет пойдет или не пойдет, а уж только после этого выдает информацию – куда, какой, зачем, с кем, когда и т.д. («I’ll go to the cinema “Atilla” with my friend afternoon, because I like it»). Очевидно, здесь действие управляет ситуацией, после того, как я высказал однозначно свое намерение, дальнейшая информация становится пассивной, малоинтересной, практически не влияет на выбор способа действия или усложняет его. А татарин же сначала дает информацию и ее анализ, и только после этого, возможно, с учетом реакции слушающего, обозначает положительное или отрицательное действие. («Min dustim belen toshten song bulasi uzem yaratkan “Atilla” kinosina baram/barmiym» – буквально: ‘Я со своим другом после обеда на любимый мной фильм «Атилла» пойду/не пойду’). В системах искусственного интеллекта это явление называется активностью знаний, что является одним из важных признаков интеллектуальности системы. Не командный стиль: действие-анализ, алгоритм-цель, как в современных технологиях, идущих с запада, а стиль размышления: анализ-действие, размышление-цели-алгоритмы). То есть сначала анализируется, обрабатывается информация, а уж затем, в зависимости от реакции слушателя осуществляется то или иное действие. Такие естественные возможности татарского языка позволяют создавать интеллектуальные программы накопления и извлечения знаний в банках информации компьютерных сетей, что, как известно, становится сверхактуальной задачей в современном информационном мире, когда буквально по экспоненте увеличивается объем информации и сложность обнаружения и извлечения ценной информации в хаотическом потоке данных.

     

    Заключение

    В данной статье рассмотрены три направления исследований и разработок, осуществляемых в Академии наук Республики Татарстан, с целью внедрения татарского языка в компьютерные технологии и обеспечения его паритетного функционирования в компьютерных системах наравне с другими языками. В настоящее время разработан программный пакет ТатСофт 2, включающий полный комплекс стандартных программ татарской локализации современных компьютерных систем, включая татарскую локализацию интерфейса и офисных приложений MS Windows Vista, а также ряд прикладных программ, используемых в автоматизации обработки татарского языка, обучении татарскому языку, в делопроизводстве и издательском деле.


    Джавдет Шевкетович Сулейманов, Джаудат Сулейман
    теги: Джаудат Сулейман, Джавдет Шевкетович Сулейманов, татарский писатель, поэт






    ← назад   ↑ наверх