Басты бет | Байланыс | Біз туралы | tbi.kz | tbikitap.kz | qazcorpus.kz | soztekser.kz

Text around image

АХМЕТ БАЙТҰРСЫНҰЛЫ АТЫНДАҒЫ ТІЛ БІЛІМІ ИНСТИТУТЫНЫҢ КАРТОТЕКАЛЫҚ ҚОРЫ



Ахмет Байтұрсынұлы атындағы Тіл білімі институтының Картотекалық қоры – қазақ сөзінің семантикалық өрісі мен тілдің грамматикалық жүйесін мәтін ішінде тануға мүмкіндік беретін, беделді авторлар мен академиялық басылымдардан, құнды кітаптардан, халықтың тіл қазынасынан жинақталған қазақтілді жазбаша сөз қор саналады. Қор – елдігіміздің бірден-бір нышаны ретіндегі мемлекеттік тілдің лексика-фразелогиялық байлығын, сөзтізбелік құрамын анықтайтын құнды мұра.

Қазақ тілінің картотекалық қорын құру жұмысы ертеден, 1930 жылдары бастау алған. Қордағы кейбір қимақағаздар 1930-1937 жылдардағы Сталиндік репрессияға ұшыраған авторлардан алынған, олардың басым бөлігі, бір өкініштісі, өртеліп, азын-аулақ бөлігі ғана сақталған. 

1959-1961 жылы І.Кеңесбаевтың редакциясымен екі томдық түсіндірме түсіндірме сөздік шыққан. Мұнда көп сөз қамтылмағандықтан, жағдай түзеле басталған соң көп томдық кітап шығаруды ұйғарды. 1961 ж. Қаныш Сəтбаев пен Мұхтар Əуезовтің, Ісмет Кеңесбаевтың мəселе көтеруімен Тіл жəне əдебиет институты негізінде Əдебиет жəне өнер институты мен Тіл білімі институты бөлініп шықты. Осыған дейін жиналған картотекалық қор аз болғандықтан, оны толықтыру жұмыстарын жүргізу керек болды.   Картотека жинау жұмыстары бойынша институт қызметкерлері, сырттан тіл мамандары, журналистерді келісімшартпен Картотека бөліміне ақылы жұмысқа тартты. 

Көркем әдебиеттің көрнекті өкілдері С.Мұқанов, М. Әуезов, Ғ. Мүсірепов, Т.Жароков, Ғ.Орманов, Ж.Молдағалиев Д.Досжанов, Ә.Сәрсенбаев, Т.Әлімқұлов, С. Мұратбеков, М. Шаханов, Ф. Оңғарсынова т.б. сияқты ақын-жазушылардың шығармаларынан материалдар алынды. Сондай-ақ Социалистік Қазақстан, Қазақ әдебиеті және Жұлдыз   т.б. мерзімді басылымдар алынды. Тілдік материалдар жиналды. Оларды саралап, жүйелеу жұмыстары атқарылды.

 Бұдан кейін де картотека қорын жинау жұмысы үздіксіз жалғасын тауып отырды. Әсіресе қазақ тілінің он томдық сөздігін шығару қарсаңында қазақ сөзін жинау, қима қағаздарға түсіру жұмысы қарқынды, жүйелі түрде жүргізілді. Қордың ауқымды бір бөлігі – диалектологиялық материалдар құрайды. Қазіргі таңда Картотека қорында шамаменен 5 миллиондай қимақағаз бар. Оның ішінде көптеген қимақағаздар өте бағалы, қазір қолға түсе бермейтін кітаптардан алынған. Осы қордың көмегімен қазақ тілінің үлкен академиялық түсіндірме сөздіктері және т. б. жасалды. Әсіресе 1974-86 жылдары 10 томдық «Қазақ тілінің түсіндірме сөздігі»,  15 томдық «Қазақ әдебиеті тілінің сөздігі» жарық көрді. 

Pineapple

Қазақтың рухани қазынасын, қазақ тілінің байлығын, ұлт пен ел тарихын көрсететін баламасыз мұндай Қор Ахмет Байтұрсынұлы атындағы Тіл білімі институтында ғана бар. Картотека қорындағы қимақағаздардың мәтіндік мазмұны нақтылығымен, стильдік жағынан алуан түрлілігімен, арнайы іріктеліп, сапалы өңделуімен де құнды.

Институттың осы бірегей Қоры, уақыт өте келе, шаң басып, қағаздардың сапасы нашарлап, жыртылып, сарғайып, жазулары өшіп, қағаз форматтағы тіл қазынасының өміршеңдігіне қауып төнгенде, оған қоса күнделікті тілтанымдық зерттеулерде кеңінен, толық пайдалануға қолайсыздық тудыра бастауына байланысты тез арада цифрландыру қажеттілігі туды. 

Отандық компьютерлік лингвистиканың негізін салушы А.Жұбанов және институт директорының бұрынғы орынбасары ф.ғ.д., профессор 

Pineapple

Н.Уәлидің ұдайы алаңдаушылық білдіруі де Қорды цифрландырудың күн тәртібіне қойылуына себеп болды. 

Ғалым А.Жұбановтың басшылығымен «Қолданбалы лингвистика» бөлімінің қызметкерлері «Қазына» қорына 900 мың кәртішкі-мәнмәтін ішінен 70 мыңдайын сұрыптап алып, оларды компьютер жадына енгізген болатын. Бастапқы әріптері «А» әрпінен «С» әрпіне дейінгі сөздерге қатысты мәнмәтіндер жаңаша жетілген түрдегі «Тіл – қазына» компьютерлік базаға енгізіліп, тұтынушы-лексикограф үшін қажетті деген мәліметті  іздеп табу  жұмыстары жүзеге асырылды.

Pineapple

2020 жылдың екінші жартысынан бастап Институт директоры А.Фазылжан бастамасымен картотекалық деректер қорын жүйелі түрде цифрландырудың алғашқы жұмыстары жүргізіле бастады. Оған Институттың жас ғалымдары тартылды. 2021 жылдың екінші жартысынан бастап Институт директорының арнайы тапсырмасымен қарқынды жүргізіле бастады. Цифрландыру жұмысына директордың орынбасары Е.Маралбек тікелей ұйымдастырды. Қолданбалы лингвистика бөлімінің ғылыми қызметкері, докторант Ақтоты Қожахметова үйлестіру жұмыстарын табысты жүргізді

Картотеканың деректер қорын цифрландыруға Институтқа келген практиканттар да жұмылдырылды. 2021 жылдың ортасынан бастап,  2021-2022 жылдарға арналған «Мемлекеттік тілді латынграфикалы ұлттық әліпбиге көшіруді қамтамасыз ететін жаңартылған нормативтік сөздіктер мен академиялық басылымдар сериясын әзірлеу» (OR11465483) бағдарламалы-нысаналы қаржыландыру жобасының «Латын әліпбиі негізіндегі Қазақ тілінің ұлттық корпусының мәтіндік базасының бір бөлігі ретіндегі Тіл білімі институтының картотекалық қорын цифрландыру» міндеті аясында жүргізілді.

Соның нәтижесінде Ә.Карбозова, А.Жұманқызы, Т.Аққұлова, А.Мамытова жоғары оқу орнының студенттері 3 миллионнан астам қима қағазды цифрландырды. 

Цифрлық форматтағы картотекалық деректер қоры іздеу жұмысын барынша жеңілдету, жылдамдату, уақыт үнемдеу, деректерді қамту ауқымын мүмкіндігінше кеңейту мақсатын көздейді. Картотекалық қор деректері ендігі кезекте тек тілтанушы ғалымдарға ғана емес, қазақ мәтіндерімен жұмыс істейтін барлық қоғам өкілдеріне қолжетімді болады.