Праект “ВСБМ”

Праект “Парадыгма”

Праект “Літара”

Публікацыі Ф. А. Піскунова

Фёдар Антонавіч Піскуноў (12.1.1950 — 5.4.2013) — беларускі лінгвіст, вядомы сваёй працай ў галіне камп’ютарнай лексікаграфіі, прыкладной марфалогіі і ўніфікацыі беларускага правапісу.

На чале групы супрацоўнікаў стварыў першую прафесійную праграму праверкі беларускай арфаграфіі “Літара” для Microsoft Office 2000 – 2003 і перадаў ў вольнае карыстанне http://pravapis.tut.by (2004 г.). Упершыню ў беларускай лінгвістыцы апісаў поўную марфалагічную класіфікацыю парадыгмаў беларускага дзеяслова (Роднае слова, №10/2008) і назоўніка (Роднае слова, №8/2011), на аснове якіх стварыў электронны слоўнік “Парадыгма” аб’ёмам звыш 134 тысяч лексем. Прэзентацыя і перадача ў вольнае карыстанне (http://pravapis.tut.by) адбылася ў 2010 г.

На працягу двух апошніх дзесяцігоддзяў самастойна распрацоўваў электронную базу дадзеных беларускай мовы. Вынікам гэтай працы стаў выпуск у свет у 2012 г. Вялікага слоўніка беларускай мовы (аб’ём рэестра каля 223 тыс. слоў), першага ў беларускай лексікаграфіі арфаграфічна-граматычнага слоўніка.

Многія назіранні і меркаванні, якія ўзніклі падчас сістэматызавання фактаў марфалогіі і арфаграфіі, адлюстраваныя ў шэрагу публікацый, змешчаных у часопісе “Роднае слова”. У канцэнтраваным выглядзе погляды Фёдара Піскунова аб стане беларускай мовы і надзённых задачах для яе адраджэння змешчаны ў аўтарскай прадмове да Вялікага слоўніка беларускай мовы.

Фёдар Піскуноў атрымаў дыплом хіміка (БДУ, 1971) і далей працаваў у тэхнічнай галіне: з’яўляўся навуковым супрацоўнікам Інстытута электронікі НАН Беларусі, з 2008 – 2010 навуковым супрацоўнікам Фізічна-тэхнічнага інстытута НАН Беларусі.

Фёдар Піскуноў лічыў, што “зварот да прадстаўнічых моўных БД – гэта эфектыўны шлях выяўлення тэндэнцый напісання, што паслужыць асновай для фармулявання прапаноў па ўдакладненні або змене правапісных нормаў” (гл. арт. “Правапіс спалучэнняў еа/эа, ея/эя”). Ён быў упэўнены ў “непрымальнасці пашырэння паняцця “нарматыўнасць” за межы чыста правапісных фактаў мовы” (гл. арт. “Арфаграфічны слоўнік беларускай мовы: межы нарматыўнасці”). У дачыненні да стандартызацыі мовы аб’ектам крытыкі сп. Піскунова з’яўляюцца “шабланізацыя падыходаў і кіраванне “літарай”, а не “духам” прадпісанняў, непераадольнае і пакуль пашыранае ўяўленне “няма слова ў слоўніку – няма ў мове” (гл. арт. “Правапіс О ў складаных словах”).

Праекты

2012 — “Вялікі слоўнік беларускай мовы”

Піскуноў, Ф. А. Вялікі слоўнік беларускай мовы : арфаграфія, акцэнтуацыя, парадыгматыка (каля 223 000 слоў) / Ф. А. Піскуноў. – Мінск : Тэхналогія, 2012. – ХVІ + 1208 с.

(Рэцэнзія)Пацюпа, Юрась. Дзве галавы добра, а адна лепш… Да выхаду ў свет “Вялікага слоўніка беларускай мовы” Дзеяслоў, 2012, №3, с. 330-333;

(Рэцэнзія)Цыхун, Генадзь. Новы слоўнік і старая праблема нормы. Маладосць, 2012, №7, с. 72-73.

“Краязнаўчая газета” (справаздача з прэзентацыі слоўніка)

“Веды” (справаздача з прэзентацыі слоўніка “Парадыгма”)

(Рэцэнзія) Прыгодзіч, Мікалай НОВЫ СЛОЎНІК БЕЛАРУСКАЙ МОВЫ. – Роднае слова. – №4. — 2012. – С. 51-52.

Піскуноў, Фёдар. Вялікі слоўнік беларускай мовы

  • Вокладка.
  • Звесткі пра кнігу.
  • Ад кансультацыйнай рады слоўніка.
  • Прадмова.
  • Падзяка.
  • Склад слоўніка.
  • Будова слоўніка.
  • Спіс асноўных скарачэнняў.
  • Графічныя пазнакі і скарачэнні на аснове лацінскага алфавіта.
  • Асноўныя лексікаграфічныя крыніцы.

“ВСБМ” у СМІ

“Наша ніва”: Выходзіць «Вялікі слоўнік беларускай мовы» на 223 000 словаў

svaboda.org: Фёдар Піскуноў прэзэнтаваў “Вялікі слоўнік беларускай мовы”

tut.by, 15.05.2012 Выходзіць “Вялікі слоўнік беларускай мовы” на 223 тысячы словаў

(пераклад на рас.)

Часопіс “Роднае слова”, 16 мая

15 мая 2012 г. супрацоўнікі часопіса “Роднае слова” ўзялі ўдзел у прэзентацыі “Вялікага слоўніка беларускай мовы” Фёдара Піскунова, якая адбылася на філалагічным факультэце БДУ.

Некаторыя матэрыялы слоўніка праходзілі апрабацыю на старонках часопіса (№№ 1, 5, 7, 11 за 2010 г.; №№ 5, 8 за 2011 г.). “Вялікі слоўнік беларускай мовы” – вынік шматгадовай працы аўтара – утрымлівае каля 223 тысяч рэестравых адзінак і з’яўляецца найбольш поўным зводам лексікі сучаснай беларускай мовы. Слоўнік створаны на аснове адмысловай электроннай базы, што адлюстроўвае больш за 70 млн словаўжыванняў з 2300 літаратурных крыніц. Выданне адрасуецца як спецыялістам, так і ўсім тым, хто вывучае беларускую мову.

У прэзентацыі ўдзельнічалі вядомыя дзеячы навукі і культуры Беларусі, члены Міжнароднай асацыяцыі беларусістаў і супрацоўнікі выдавецтва “Тэхналогія”.

Арыгінал / пераклад на рас.


2009 — “Парадыгма”

“Наша Ніва”, 23 лiпеня 2009

Новы прадукт ад стваральнікаў «Літары»

З’явіўся электронны слоўнік «Парадыгма», які спросціць працу з тэкстамі па-беларуску.

Першы электронны граматыка-парадыгматычны слоўнік беларускай мовы «Парадыгма» ад 14 ліпеня адкрыты ў свабодным доступе на сайце. Слоўнік распрацавала творчая група пад кіраўніцтвам навуковага супрацоўніка Фізіка-тэхнічнага інстытута НАН Беларусі Фёдара Піскунова.

Слоўнік утварае адзіны праграмны комплекс з праграмай праверкі арфаграфіі «Літара». Гэты праграмны комплекс забяспечвае зручную працу з беларускамоўнымі тэкстамі, як у працэсе іх стварэння, так і падчас апрацоўкі (чытання, праверкі, рэдагавання). Лексічны склад слоўніка — больш за 134 тыс. Адзінак.

— Праграма праверкі арфаграфіі, гэта толькі арыенцір для карыстальніка, які прымушае яго засумнявацца, палезці ў слоўнік, адпаведную даведку для сябе зрабіць, — кажа Фёдар Піскуноў. — Таму з’явілася ідэя, каб праверка арфаграфіі і слоўнік з даведкамі былі ў комплексе — гэта ж натуральна.

«НН»: На якія аналагі вы арыентаваліся, ствараючы слоўнік?

ФП: Якраз у той час ішла праца з электронным слоўнікам Украіны. Там гэта ішло з вялікім размахам, быў прыняты указ прэзідэнта Кучмы, вялікая рэкламная кампанія. «Парадыгма» зробленая па ўкраінскім узоры, але удасканаленая.

Электронны слоўнік Украіны, гэта фактычна вялікая табліца. Але, калі ў тэксце сустракаецца слова не «пісаць», а «пішу» — праграма ў ступары. А «Парадыгма» адразу планавалася, як дапаможны сродак для атрымання граматычных даведак. Карыстальнік атрымлівае пералік усіх формаў. Напрыклад, націсне ён на слова «душу», атрымае душа, душ, душыць і г. д. Акрамя таго, атрымае ўказанне, дзе ставіць націск, і пабачыць усе формы гэтага слова.

У «Парадыгме» прадугледжаны яшчэ і рэдкія формы словаў.

Напрыклад, да слова»есці», ні ў водным слоўніку мы зараз не знойдзем такіх формаў, як «ямо», «ясцё». Я лічу, гэта незаслужана забытыя формы, якія вымываліся з ужытку. Што фактычна пазбавіла нашу мову адметнасці.

«НН»: Ці працуе «Парадыгма» у розных варыянтах правапісу?

ФП: Сама «Парадыгма» цяпер толькі афіцыйным правапісам. Гэта звязана з рухамі, якія адбыліся на прававым полі. Але я не буду супраць, калі хтосьці зробіць варыянт тарашкевіцай.

«НН»: «Парадыгма» улічвае новыя правілы афіцыйнага правапісу?

ФП: Пакуль у інтэрнэце змешчаны варыянт па дзейных правілах мовы. Вось як уступяць новыя правілы ў сілу, «Парадыгма» будзе мяняцца. Гэта пытанне некалькіх дзён, каб унесці тыя змены.

«НН»: Мова развіваецца, з’яўляюцца новыя словы. Ці ёсць у слоўніку новатворы ці кампутарныя тэрміны, напрыклад?

ФП: Я, як кажуць у шахматах, зраблю ход канём і спашлюся на вашае выданне, якое ў гэтым плане мабільнае і рухомае. У аснову слоўніка былі пакладзеныя не толькі слоўнік Бірылы, але і корпусы тэкстаў газеты «Звязда» і «Нашай Нівы». Думаю, шмат слоў, якія адлюстроўваюць новыя рэаліі, увайшло ў слоўнік.

«НН»: Раскажыце пра тэхнічныя магчымасці «Парадыгмы». З якімі праграмамі і аперацыйнымі сістэмамі яна стасуецца?

ФП: Пакуль я магу выказацца упэўнена толькі наконт сістэмы ХP і Microsoft Word 2000—2003. Думаю, што хутка хтосьці абавязкова паспрабуе прыстасаваць «Парадыгму» да Microsoft Office-2007.

Што тычыцца праграмы праверкі арфаграфіі «Літара», то яна дакладна не працуе ў Microsoft Office-2007. Гэта звязана з тым, што «Майкрасофт» памяняў сваю тэхнічную палітыку і абсек магчымасці самастойным праграмістам апераваць з іх прадуктамі. Таму,

каб пад Microsoft Office-2007 зрабіць «Літару», трэба афіцыйна атрымаць ад кампаніі дазвол. Але я не губляю надзеі, што хто-небудзь возмецца за гэтую справу

і «Літара» з «Парадыгмай» у комплексе будуць працаваць на любым кампутары з рознымі сістэмнымі патрабаваннямі.

«НН»: Якую праграму можна чакаць ад Вас наступнай?

ФП: Буду займацца ўдасканаленнем. Думаю, як дадаць тлумачальную частку. То бок не толькі даваць парадыгму слова, як яно скланяецца і гэтак далей, а і ў нейкім адмысловым вакенцы падаваць значэнне. Думаю гэта будзе карысна для больш зручнай працы з беларускамоўнымі тэкстамі.

Я спадзяюся, што мае будучыя распрацоўкі будуць такімі ж папулярнымі як і мінулыя. Праграма можа жыць толькі, калі будуць у яе карыстальнікі і калі будзе зваротная сувязь. Калі няма зваротнай сувязі, то і імпэт будзе слабець у распрацоўшчыкаў.

Гутарыла Настасся Шамрэй

http://nn.by/?c=arprint&i=27969

Газета “Звязда”, 21 лiпеня 2009 года, № 133 (26491)

Падказка для канчаткаў

У свабодным доступе з’явiўся першы электронны граматыка-парадыгматычны слоўнiк беларускай мовы

З гэтымi канчаткамi бяда ды й толькi, асаблiва назоўнiкаў 2-га скланення ў родным склоне адзiночнага лiку. Не так i лёгка бывае разабрацца, дзе “а”, дзе — “у”: рэгiёну i завода, народа i капiталiзму, мёду i хлеба, у ценi ясеня i мэбля з ясеню… Аднак цяпер дзякуючы намаганням энтузiястаў з’явiўся ўнiверсальны падказчык.

Iнстытут мовы i лiтаратуры iмя Якуба Коласа i Янкi Купалы Нацыянальнай Акадэмii навук i творчы калектыў распрацоўшчыкаў правялi прэзентацыю першага ў Беларусi электроннага граматыка-парадыгматычнага слоўнiка беларускай мовы “Парадыгма”, створанага пад кiраўнiцтвам навуковага супрацоўнiка Фiзiка-тэхнiчнага iнстытута НАН Беларусi Фёдара Пiскунова. Электронны слоўнiк з’яўляецца працягам працы над праграмай праверкi беларускай арфаграфii “Лiтара”, якая атрымала шырокае распаўсюджанне i прызнанне (карыстаюцца ёю i ў нашай рэдакцыi).

Што ўяўляе электронная “Парадыгма”? Звярнуцца да слоўнiка можна непасрэдна ў тэкставым рэдактары Word. Некалькi нацiсканняў клавiш — i перад вамi iнфармацыя не толькi пра правапiс усiх формаў патрэбнага слова, але i яго нацiск. Асновай для электроннай версii стаў акадэмiчны слоўнiк беларускай мовы пад рэдакцыяй М. Бiрылы. Усяго ў рэестры “Парадыгмы” каля 140 тыс. слоў. Электронны слоўнiк абсалютна бясплатны, скачаць яго можна з сайта (дарэчы, i гэта слова ёсць у “Парадыгме”) www.pravapis.tut.by — выпрабавальны варыянт (у надзеi на тое, што паступяць водгукi).

“Па сукупнасці функцыянальных магчымасцяў рэцэнзуемы слоўнiк з’яўляецца арыгінальнай распрацоўкай. Стварэнне такога слоўнiка ў электронным выглядзе робiць магчымым хуткае атрыманне ўсёй неабходнай граматычнай iнфармацыi аб пошукавым слове цi словаформе. Слоўнiк дае правiльнае арфаграфiчнае напiсанне пэўнага слова i ўсёй яго парадыгмы з акцэнтуацыяй нацiскнога склада. Па сутнасцi ён нагадвае вядомы слоўнiк А.А. Залiзняка, толькi выкананы ў адпаведнасцi з магчымасцямi сучасных камп’ютарных тэхналогiй. Нават блiжэйшы аналаг (Электронны слоўнiк украiнскай мовы) не прадугледжвае функцыю пошуку зыходных слоў (лексем) да адпаведных словаформаў. Рэцэнзуемы слоўнiк выкананы на высокiм тэхнiчным узроўнi i мае вялiкi патэнцыял для выкарыстання яго ў рэдакцыйна-выдавецкiм i навучальным працэсе. Можа быць рэкамендаваны шырокаму колу камп’ютарных карыстальнiкаў”, — значыцца ў водзыве на слоўнiк доктара фiлалагiчных навук, загадчыка аддзела сучаснай беларускай мовы Iнстытута мовы i лiтаратуры iмя Якуба Коласа i Янкi Купалы НАН Беларусi Валянцiны Русак.

Сам кiраўнiк праекта “Парадыгма” Фёдар Пiскуноў упэўнены, што “мова — гэта справа ўсiх, усiх дасведчаных, усiх прафесiяналаў”. Таму, вiдаць, i не застаецца абыякавым, па ўласнай iнiцыятыве на чыстым энтузiязме ўзворвае моўную нiву. “У такiм выкананнi, я не пабаюся сказаць, гэта першы прадукт такога роду, вiдаць, нават i на прасторах СНД. Прадукт прызначаны для шырокага кола, спатрэбiцца, спадзяюся, у выдавецкiх працэсах, думаю, ёсць шырокiя перспектывы ў сферы навучання. Гэты слоўнiк — ненавязлiвая падказка, захацеў карыстальнiк — даведаўся, якi канчатак або нацiск у той цi iншай форме”.

Адным з iстотных здабыткаў навiнкi энтузiяст лiчыць гнуткасць i актуальнасць: “Звычайны папяровы слоўнiк заўсёды адлюстроўвае сiтуацыю са спазненнем, а ў электронны можна аператыўна ўносiць змяненнi”. Тым больш што, на думку “бацькi” “Парадыгмы”, правапiс — гэта “пытанне пагадненняў, у вельмi шматлiкiх выпадках няма адзiнага падыходу, нават на гэтай прэзентацыi былi абмеркаваннi наконт таго, як тое цi iншае слова пiшацца, дзе нацiск ставiцца”. “Ёсць лiтара, а ёсць дух, хутчэй, трэба ў духу працаваць”, — кажа Фёдар Пiскуноў.

Зоя Варанцова.

Арыгінал

Газета “Культура”

Лічбавы код нашага слова…

Знаёмства з Фёдарам Піскуновым, аўтарам камп’ютэрнай праграмы праверкі беларускай арфаграфіі “Літара”, пачалося з таго, што ён усталяваў на мой працоўны камп’ютэр сваю новую праграму — першы ў Беларусі электронны граматыка-парадыгматычны слоўнік беларускай мовы “Парадыгма”.

Навуковы супрацоўнік Фізікатэхнічнага інстытута Нацыянальнай акадэміі навук Беларусі Фёдар Піскуноў і праграміст Мікалай Зелянкоў працавалі над гэтым праектам з 2004 года, пасля заканчэння працы над “Літарай”. У праграме кожнае беларускае слова атрымала адпаведны граматычны код. Па словах Фёдара Антонавіча, “Парадыгма” можа працаваць як самастойная праграма, так і разам з “Літарай”, дапаўняючы адна адну. — Я лічу, што кожны карыстальнік камп’ютэра абавязкова павінен мець як сваю электронную энцыклапедыю, так і праграму праверкі арфаграфіі і ўбудаваны слоўнік, — кажа кіраўнік праекта. — Я планую размясціць “Парадыгму” ў Інтэрнеце. Яе можна будзе бясплатна скачаць, папярэдне зарэгістраваўшыся для статыстыкі. Дадам, што новая праграма будзе адкрыта для заўваг і пажаданняў па паляпшэнні яе работы. Як жа функцыянуе “Парадыгма”? Вельмі проста: як дапаможны сродак для атрымання граматычных даведак пры рабоце з тэкставымі матэрыяламі ў праграме Microsoft Word. Рэестравы склад слоўніка — каля 140 тысяч слоў. Ён цалкам утрымлівае ў сабе матэрыялы шырока вядомага “Слоўніка беларускай мовы” пад рэдакцыяй акадэміка Мікалая Бірылы, што дазваляе камфортна працаваць з тэкстамі універсальнага характару. Атрымаць граматычную даведку можна праз кантэкстнае меню або шляхам навядзення курсора на слова ў тэкставым дакуменце з наступным націсканнем на сімвальную кнопку на панелі інструментаў. Таксама можна надрукаваць патрэбнае слова ў акенцы “Парадыгмы” і атрымаць такі самы вынік. “Парадыгма” атрымала высокую ацэнку супрацоўнікаў Інстытута мовы і літаратуры НАН Беларусі, якія адзначылі высокі тэхнічны ўзровень праграмы і вялікі патэнцыял яе выкарыстоўвання, у тым ліку — і ў навучальным працэсе. А своеасаблівая “абкатка” праграмы вялася цэлы год з дапамогай шэрагу беларускіх СМІ. Як паабяцаў Фёдар Піскуноў, наступную сваю праграму ён будзе “экзаменаваць” і ў рэдакцыі нашай газеты.

Юрый Чарнякевіч

http://www.kimpress.by/index.phtml?page=2&id=2686

generation.by: Office мяняе «Парадыгму»


2004 — праграма праверкі правапісу “Літара”

Свабода. 14 траўня 2004

УПЕРШЫНЮ ВЫЙШАЎ СПЭЛЧЭКЕР БЕЛАРУСКАЙ МОВЫ ДЛЯ MICROSOFT WORD

“Літара 1.0” — так завецца праграмны прадукт, які сёньня прэзэнтаваўся ў Менскім лінгвістычным унівэрсытэце. Унікальнасьць праграмы ў тым, што яна ахоплівае дзьве правапісныя традыцыі: афіцыйную — “наркамаўку” і клясычную — “тарашкевіцу”.

Праграма “Літара 1.0” сталася самым вялікім слоўнікам беларускай мовы, бо ўтрымлівае больш за 170 тысяч словаў. Да прыкладу, украінскі аналяг налічвае каля 137 тысяч словаў. Галоўным навуковым кансультантам “Літары 1.0” стаў прафэсар мовазнаўства Генадзь Цыхун. Над варыянтам тарашкевіцы працавалі Зьміцер Саўка, Юрась Бушлякоў, Зьміцер Санько, Сяргей Шупа і Вінцук Вячорка.

Распавядае каардынатар праекту прадстаўнік Таварыства Беларускай Мовы Сяргей Кручкоў:

(Кручкоў: ) “Усе, хто ўваходзіў у рабочую групу, прыйшлі да згоды, што ў нас няма дзьвюх моваў, а ёсьць дзьве правапісныя традыцыі. І калі, прыкладам, сёньня слова сустракаецца пераважна ў тарашкевіцкіх тэкстах, то яно мусіць сустракацца і быць раўназначным і ў наркамаўскіх тэкстах. Няма такога, што слова “выбарнік” — яно толькі тарашкевіцкае. І мы таксама верым у тое, што наш прадукт будзе выкарыстоўвацца і ў дзяржаўных установах”.

Праца над праектам яшчэ працягваецца. Напрыклад, незавершаная граматычная частка “Літары 1.0”. Праграма правярае адно правільнасьць напісаньня словаў, але паасобку, без прывязкі да склонаў. Альбо — у тарашкевіцы ёсьць спрэчныя пытаньні з напісаньнем замежных уласных імёнаў. Тлумачыць Зьміцер Саўка:

(Саўка: ) “Напрыклад, якім чынам мы будзе перадаваць прозьвішча папулярнага ангельскага пісьменьніка Swift — праз “ў”, “у”, ці “в”?”

Дарэчы, ва Ўкраіне падобная праграма існуе даўно. У стварэньне праграмы ўкраінская дзяржава ўклала вялікія грошы. А ў Беларусі праграма створаная на голым энтузіязьме. Самую складаную, манатонную працу ўзяў на сябе Фёдар Піскуноў — тэхноляг праекту. Той самы чалавек, які перапрацаваў сотні тысяч словаў і адпаведным чынам спарадкаваў іх у сыстэму:

(Піскуноў: ) “Не было ніякіх надзейных крыніцаў у электронным выглядзе. Вельмі вялікі пласт лексыкі ня ўлічаны ў лексыкаграфічных працах. Лексыка з газэтаў, радыё, тэлебачаньня. Усё тое новае, што зьявілася зь цягам часу. Напрыклад, “іпатэка”, “харызма”.

Праект “Літара 1.0” ёсьць грамадзкай ініцыятывай. Таму праграма ня будзе прадавацца, але распаўсюджвацца бясплатна. Напрыклад, вэрсія, што месьціцца ў Інтэрнэце па адрасе www.pravapis.tut.by мае абнаўляцца не радзей як раз на тры месяцы.

http://archive.svaboda.org/news/articles/2004/05/20040514151413.asp

Севярын Квяткоўскі, Менск

Перадрук са “Свабоды”: Дзедзіч. Чэрвень 2004. № 4 (29). С. 2.

Газета “Звязда”, 22 мая 2004 г., № 126 (25139)

З «Лiтарай 1.0» — без памылак

Нарэшце тыя, хто працуе на камп’ютары па-беларуску, займелi ў выглядзе гэтага самага камп’ютара дарадцу i памочнiка ў выяўленнi памылак i апячатак у тэксце. Дакладней, не ў выглядзе камп’ютара, а ў выглядзе праграмы праверкi беларускай арфаграфii, распрацаванай для выкарыстання ў тэкставым рэдактары MS Word 2000. Карацей, калi пры наборы вы дапусцiце арфаграфiчную памылку, пры наяўнасцi ў вашым камп’ютары названай праграмы няправiльнае слова тут жа аўтаматычна падкрэслiцца i будуць прапанаваныя варыянты яго правільнага напісання.

Праграма, якая атрымала назву «Лiтара 1.0», — першы «спэлчэкер» нашай мовы такога маштабу. Раней былi спробы зрабiць падобны «камп’ютарны карэктар», але нiводзiн з iх не меў дастатковай слоўнiкавай базы i базы словаформаў. У «Лiтары 1.0» — 170 тысяч слоў, у аснову яе быў пакладзены «Слоўнiк беларускай мовы», якi выйшаў у выдавецтве «Беларуская энцыклапедыя» пад рэдакцыяй М. Бiрылы ў 1987 годзе i змяшчае каля 120 тысяч слоў. Карысталiся ўкладальнiкi i рознымi тэрмiналагiчнымi слоўнiкамi, i слоўнiкам iншамоўных слоў, i картай Беларусi, а таксама — чым не можам не пахвалiцца — нашай газетай за апошнiя чатыры гады.

«Беларуска-расiйскi слоўнiк» М. Байкова i С. Некрашэвiча 1926 года выдання i слоўнiк газеты «Наша нiва» былi пакладзены ў аснову так званага «класiчнага варыянта» праграмы — акрамя сучаснага правапiсу, «Лiтара 1.0» правярае i тэксты, напiсаныя на «тарашкевiцы», i нават мае магчымасць пераўтварэння тэкстаў з адной правапiснай сiстэмы ў другую.

Праект ажыццяўляўся ў рамках грамадскай iнiцыятывы. Узначальваў яго Фёдар Пiскуноў, навуковы супрацоўнiк Iнстытута электронiкi НАН Беларусi. Каардынатарам праекта выступаў намеснiк старшынi Таварыства беларускай мовы Сяргей Кручкоў. Галоўным навуковым кансультантам быў прафесар мовазнаўства Генадзь Цыхун…

Да афiцыйнай прэзентацыi праграма праходзiла «выпрабаванне» ў часопiсе «Роднае слова». «Звязда» таксама спрабавала працаваць з «Лiтарай 1.0». Прыемна, што нашы заўвагi былi ўлiчаныя распрацоўшчыкамi праекта пры стварэннi канчатковай версii .

Хаця версiя яшчэ далёка не канчатковая, праца над праграмай працягваецца. Яна пакуль што правярае толькi правiльнасць напiсання слоў, але паасобку, без прывязкi да склонаў, таму што граматычная частка праграмы яшчэ не завершаная. Канешне, стваральнiкi чакаюць таксама заўваг i прапаноў ад карыстальнiкаў «спэлчэкера».

Займець «Лiтару 1.0» можа кожны жадаючы, прычым абсалютна бясплатна. Варта толькi зайсцi на сайт у Iнтэрнэце: www.pravapis.tut.by.

Алена Ляўковіч

http://www.zvyazda.minsk.by/second.html?r=30&p=25&archiv=22052004

БелаПАН, 14 Мая 2004

В Минске состоялась презентация компьютерной программы проверки орфографии белорусскоязычных текстов

Презентация компьютерной программы проверки орфографии белорусскоязычных текстов состоялась 14 мая в Минске. Заместитель председателя республиканского общественного объединения “Таварыства беларускай мовы імя Францішка Скарыны” Сергей Крючков сообщил, что с созданием программы электронного корректора решена “самая острая компьютерная проблема” для белорусского языка. По его словам, наибольшей трудностью для разработчиков программы явилось отсутствие научно подготовленного реестра белорусских слов. “Нам пришлось составлять свой собственный электронный реестр на основе десятков белорусских словарей различных лет издания”, — отметил С.Крючков. По его словам, подготовленная программа поддерживает обе традиции правописания белорусского языка — официальную (“наркомовку”) и классическую (“тарашкевицу”), а также позволяет осуществлять их конвертацию. Как полагает С.Крючков, созданная программа будет способствовать “развязыванию многих проблем белорусского правописания”, более широкому употреблению белорусского языка в стране, особенно среди чиновников, а также позволит снизить количество “русизмов” и “полонизмов” в текстах и облегчить труд корректоров издательств и СМИ. Главный разработчик программы проверки орфографии белорусскоязычных текстов Федор Пискунов отметил, что программа учитывает все богатство белорусского языка, включающее 200 тыс. слов, около 2 млн. неповторяемых словообразований и около 5 млн. словоупотреблений. За помощь в разработке программы специалист выразил признательность редакциям газет “Звязда”, “Наша Ніва”, издательствам “Беларуская энцыклапедыя імя Петруся Броўкі” и “Мастацкая літаратура”, сотрудникам Института языковедения Национальной академии наук Беларуси Евгении Волковой, Валентине Авиловой, Владимиру Кощенко, а также филологам Геннадию Цыхуну, Винцуку Вячорке, Змитеру Савке, Юрасю Бушлякову, Змитеру Санько и Сергею Шупе. Научный консультант проекта, доктор филологии Г.Цыхун полагает, что проблема наличия двух традиций правописания белорусского языка может быть решена путем конвергенции, тем более что эти нормы не очень сильно разнятся. “Именно конвергенция позволяет сохранить единство белорусского литературного языка и не допустить нежелательного процесса окончательного его разделения по принципу приверженности той или иной традиции правописания”, — подчеркнул ученый.

Марат Горевой

(На дату 10.06.2012 арыгінал публікацыі недаступны ў Інтэрнэце)

naviny.by, 15.05.2004

Адбылася прэзэнтацыя першага беларускага электроннага карэктара

14 траўня адбылася публiчная прэзэнтацыя кампутарнай праграмы праверкi беларускага правапiсу ў яго абодвух варыянтах — клясычным (тарашкевiца) i зрэфармаваным (наркамаўка), паведамляе прэс-група Партыі БНФ.

Чарговае з паседжаньняў Цэнтру беларускае мовы й культуры Менскага лiнгвiстычнага ўнiвэрсытэту на гэты раз было аддадзена гасьцям: аўтарам i кансультантам стварэньня беларускага электроннага карэктару. Сумяшчальны з “Microsoft Office” пакет “Лiтара 1.0” прэзэнтаваў супрацоўнiк акадэмiчнага Iнстытуту электронiкi Фёдар Пiскуноў, якi выканаў праграмную працу. Мэнэджэр праекту — намесьнiк старшынi ТБМ iмя Скарыны Сяржук Кручкоў, кансультанты — д-р Генадзь Цыхун i група ўпараднiкаў беларускага клясычнага правапiсу (тарашкевiцы): Юрась Бушлякоў, Вiнцук Вячорка, Зьмiцер Санько, Зьмiцер Саўка.

Вiнцук Вячорка, якi выступiў на прэзэнтацыi, мiж iншага, сказаў: “У чалавечай гiсторыi новае стагодзьдзе неабавязкова пачынаецца з нулявога году. Вось жа 21-е стагодзьдзе для беларускае мовы пачалося сёньня. Са зьяўленьнем артаграфiчнае праграмы нашая мова стаецца адэкватнаю iнфармацыйным выклiкам сучаснасьцi. На жаль, дзяржава ня брала нiякага ўдзелу ў стварэньнi беларускага электроннага карэктару, хаця ўсе суседнiя дзяржавы цалкам узялi на сябе цяжар распрацоўкi падобных праграмаў для сваiх моваў. Што ж, тым больш вартая праца, якую зрабiлi людзi на грамадзкiх асновах, i тым больш вiдавочна, што беларуская мова жыве паўнавартасным жыцьцём, нягледзячы на дзяржаўную палiтыку”

http://naviny.by/rubrics/computer/2004/05/15/ic_news_128_253014/

Компьютерные вести. №21, 2004 год.

Белорусская орфография для MS Word

В Минском государственном лингвистическом университете разработали первую программу проверки орфографии белорусского языка для текстового редактора MS Word 2000. Программа “Лiтара 1.0” является самым большим электронным словарем белорусского языка в мире. В него входит более 170 тыс. слов. Уникальность “Лiтары” еще и в том, что она охватывает две традиции правописания: официальную и классическую. В словарь входит более 2 млн. словоформ для каждого варианта правописания, причем программа выполняет автоматический перевод текстов из современного правописания в классический и наоборот.

Основную часть работы выполнил технолог проекта Федор Пискунов. Научным консультантом стал профессор языкознания Геннадий Цихун. Работа над проектом продолжается. Пока остается незавершенной грамматическая часть программы. Она лишь проверяет правильность написания слов по отдельности, без проверки написания склонений. Существуют и другие проблемы.

Последнюю версию программы можно бесплатно скачать с сайта www.pravapis.tut.by, где она бесплатно распространяется в составе пакета “Правапiс”. Кроме того, в офисе ТБМ (Минск, ул. Румянцева, 13) один диск с программой меняют на два чистых CD-R.

Анатолий АЛИЗАР.

Арыгінал

Компьютерные вести. №28, 2004 год

Microsoft признала беларускую мову

Компания Microsoft пообещала включить белорусский в стандартный набор языков, которые поддерживаются в текстовом редакторе MS Word. Об этом сообщил Сергей Крючков, зам. председателя Таварыства Беларускай Мовы (ТБМ): “Раньше они говорили, что это нецелесообразно, но теперь согласились с нами. Белорусский язык войдет в стандартный набор, куда компания включила около 30 языков мира”.

Разработанная по инициативе ТБМ программа проверки орфографии белорусского языка “Лiтара 1.0” (см. “КВ” №21/2004) является самым большим электронным словарем белорусского языка в мире. Уникальность “Лiтары” еще и в том, что она охватывает официальную и классическую традиции правописания. В словарь включено более 2 млн. словоформ для каждого варианта правописания, причем программа выполняет автоматический перевод текстов из современного правописания в классическое и наоборот.

Анатолий АЛИЗАР

http://old.kv.by/index2004282107.htm

Пераклад на бел.: “Бацькаўшчына”

Microsoft па-беларуску

Кампанія Microsoft паабяцала ўключыць беларускую мову ў стандартны набор моваў, якія падтрымліваюцца ў тэкставым рэдактары MS Word. Як паведаміў Сяргей Кручкоў, намеснік старшыні Таварыства беларускай мовы: “Раней яны казалі, што гэта немэтазгодна, але цяпер пагадзіліся з намі. Беларуская мова ўвойдзе ў стандартны набор, куды кампанія ўключыла каля 30 моваў свету”.

Распрацаваная з ініцыятывы ТБМ праграма праверкі арфаграфіі беларускае мовы “Літара 1.0” ёсць найбольшым электронным слоўнікам беларускае мовы ў свеце. Унікальнасць Літары яшчэ і ў тым, што яна абыймае афіцыйную і класічную традыцыі правапісу. У слоўнік уключана больш за 2 млн. словаформаў для кожнага варыянту правапісу, прычым праграма выконвае аўтаматычную канвертацыю тэкстаў з афіцыйнага правапісу ў класічны і наадварот.

http://zbsb.org/index.php?option=com_content&view=article&catid=21%3A2004&id=2150%3A2009-11-16-14-07-07&Itemid=23


Публікацыі

Піскуноў, Фёдар. Правапіс спалучэнняў ЕА/ЭА, УЯ/ЭЯ. Спроба камп’ютарна-лінгвістычнага аналізу. – Роднае слова. – 2006.– №1. – С. 31—32.

Зварот да прадстаўнічых моўных БД – гэта эфектыўны шлях выяўлення тэндэнцый напісання, што паслужыць асновай для фармулявання прапаноў па ўдакладненні або змене правапісных нормаў. Напісанне спалучэнняў еа/ея, эа/эя і іх варыянтаў пад націскам ео/её, эо/эё не рэгламентуецца “Правіламі арфаграфіі і пунктуацыі” ў рэдакцыі 1959 г. Праект новай рэдакцыі “Правілаў арфаграфіі і пунктуацыі” (Мінск, 2004) таксама пакідае па-за ўвагай напісанне названых спалучэнняў. Між тым інтэнсіўнае развіццё навуковай і тэхнічнай сфер камунікацыі аб’ектыўна вядзе да неабходнасці ўводу ў мову значнай колькасці іншамоўных слоў, напісанне якіх павінна адбывацца на аснове выразна сфармуляваных правілаў або выключэнняў з іх…

Піскуноў, Фёдар. Класіфікацыя дзеясловаў. Камп’ютэрна-лінгвістычны падыход. – Роднае слова. – 2008. – №10.– С. 61—65.

Словазмяняльныя тыпы дзеясловаў традыцыйна апісваюцца ў рамках крытэрыяў прадуктыўнасці і ўліку фармальнага суаднясення асноў інфінітыва і цяперашняга (простага будучага) часу. У адпаведнасці з гэтай класіфікацыяй дзеясловы дзеляцца на чатыры прадуктыўныя і адзінаццаць непрадуктыўных класаў, што пры наяўнасці шматлікіх падкласаў абумоўлівае пэўную ўскладненасць і непразрыстасць прынятага апісання мадэляў дзеяслоўнага словазмянення…

Піскуноў, Фёдар. Дуба ці дубу? Яшчэ раз пра формы роднага склону назоўнікаў мужчынскага роду ў святле камп’ютэрна-лінгвістычнага аналізу. – Роднае слова. – 2010. – №1.– С. 40—47.

Варыянты канчаткаў назоўнікаў мужчынскага роду ў родным склоне адзіночнага ліку традыцыйна вызначаюцца ў рамках аднясення адпаведных назоўнікаў да пэўных семантычных груп. Некаторы час існаваў у нейкім сэнсе ліберальны падыход да выбару паміж формамі -а(-я) і -у(-ю), што зыходзіў з усведамлення класіфікацыйных праблем….

Піскуноў, Фёдар. Спалучэнне галосных у запазычаных словах: ІЯ (ЫЯ), ІЕ (ЫЕ) ці ІА (ЫА), ІЭ (ЫЭ). – Роднае слова. – 2010. – №5. – С. 55—56.

З нагоды з’яўлення ў адным з нумароў часопіса каментарыя да § 9 новай рэдакцыі “Правілаў беларускай арфаграфіі і пунктуацыі” (“…нягледзячы на тое, што ў гэтым параграфе сфармуляваны асноўныя, найбольш тыповыя правілы правапісу спалучэнняў галосных у словах іншамоўнага паходжання, застаецца пэўная колькасць напісанняў, якія могуць быць вызначаны толькі па слоўніку”) паўстае патрэба працягнуць аналіз, каб паказаць, што сфармуляваныя ў § 9 правілы дастатковыя для правільнага напісання пэўнага корпуса слоў.

Піскуноў, Фёдар. Два гарады ці два горады. Лічэбнікі два, тры, чатыры ў колькасна-іменных спалучэннях. – Роднае слова. – 2010.– №6. – С. 51—53.

Колькасныя лічэбнікі два, тры, чатыры, ужытыя ў форме назоўнага склону, утвараюць з назоўнікамі сінтаксічна непадзельныя спалучэнні, у якіх у пераважнай большасці выпадкаў назоўнікі дапасуюцца да адпаведных лічэбнікаў у форме множнага ліку назоўнага склону: два (тры, чатыры) камп’ютэры / аўтары; два (тры, чатыры) вудзільны / звераняткі; дзве (тры, ча- тыры) канавы / каровы

Піскуноў, Фёдар. Арфаграфічны слоўнік беларускай мовы: межы нарматыўнасці. Роднае слова. – 2010. – №7.– С. 52—55.

Найноўшы “Беларускі арфаграфічны слоўнік”, першы ўкладзены з улікам новай рэдакцыі “Правілаў беларускай арфаграфіі і пунктуацыі”, утрымлівае ў выдавецкай прадмове напамін пра яго нарматыўны характар: “Слоўнік мае нарматыўны характар…”. Асобныя памылкі, выяўленыя пазней аўтарамі гэтага слоўніка, выклікалі калектыўнае рэагаванне аўтарска-рэдактарскага калектыву…

Піскуноў, Фёдар. Гендарная роўнасць і граматычная схема. Да пытання суфіксальнай тыпізацыі назоўнікаў агульнага роду. Роднае слова. – 2010. – №11. – С. 44—49.

Вызначальнай характарыстыкай назоўнікаў агульнага роду з канчаткамі -а (-я) звычайна называюць іх здольнасць: а) выступаць у якасці назваў асоб як мужчынскага, так і жаночага роду, напрыклад: плакса, гарэза, ціхоня; б) скланяцца і спалучацца ў сказах і словазлучэннях з усімі дапасавальнымі формамі ў жаночым ці мужчынскім родзе: яна такая (ён такі) плакса, выступіла (выступіў) старшыня калгаса, яна стала выдатнай кіназнаўцай (ён стаў выдатным кіназнаўцам). Пэўная частка назоўнікаў аг. р. маюць нейтральную ацэначную характарыстыку (сведка, цёзка, сірата і г. д.), але ў большасці выпадкаў ім уласціва адмоўная (выхваляка, хітруга) ці станоўчая (міляга, чысцюля) канатацыя.

Піскуноў, Фёдар. След ваўчышчы ці ваўчышча? Назоўнікі мужчынскага роду з суфіксамі -ішч-а (-ышч-а), -іск-а (-ыск-а). – Роднае слова. – 2011. – №5. – С. 35—40.

Працуючы над адным з артыкулаў, мы сутыкнуліся з некаторымі прадпісаннямі, што змешчаны ў найноўшай “Кароткай граматыцы беларускай мовы” (далей КГБМ-2007) і тычацца склонавых канчаткаў назоўнікаў мужчынскага роду на -а (-я). У мэтах нагляднасці падамо іх з нашай нумарацыяй у форме вытрымак з тэкстаў, апускаючы праз шматкроп’е месцы, у якіх не фігуруюць назоўнікі згаданага тыпу…

Піскуноў, Фёдар. Класіфікацыя назоўнікаў субстантыўнага скланення. Камп’ютарна-лінгвістычны падыход. Роднае слова. – 2011. – №8. – С. 31—35.

Развіваючы падыход, ужо ўжыты ў класіфікацыі дзеясловаў, пры вызначэнні словазмяняльных класаў назоўнікаў мы зыходзім не з традыцыйнага падзелу на назоўнікі першага, другога і трэцяга скланення, а з тыпаў словазмянення, якія можна вылучыць у межах кожнай родавай катэгорыі на грунце аналізу ўсёй сукупнасці парадыгматычных крытэрыяў: сістэмы канчаткаў, пазіцыі націскнога склада і змяненняў у аснове слова.

Піскуноў, Фёдар. Правапіс О ў складаных словах: з досведу распрацоўкі электроннай базы беларускай мовы. – Роднае слова. – 2012. – №2. – С. 31—35.

Пытанне правапісу о ў першых кампанентах складаных слоў у беларускай мове застаецца актуальным на працягу ўсяго перыяду станаўлення новай правапіснай традыцыі, закладзенай Б. Тарашкевічам ужо ў першым выданні “Беларускай граматыкі для школ”. Ад гэтага часу падыходы да правапісу О ў названай пазіцыі мяняліся адпаведна рэальнай вазе складаных слоў у лексічным складзе мовы і ступені абазнанасці аўтараў даведнікаў у фактах моўнай статыстыкі.

Дадаць каментар