អគ្គនាយកដ្ឋានវិទ្យុជាតិកម្ពុជា លោកស្រី ឃួន លក្ខិណា
លោកអ្នកនាងស្តាប់ជាទីមេត្រី!
បច្ចុប្បន្ននេះ ក្រុមអ្នកជំនាញភាសាខ្មែរបានរកឃើញពាក្យខុស ដែលមានរហូតទៅដល់ជាង៥ពាន់ពាក្យនៅក្នុងការប្រើប្រាស់ព្យាង្គសម្រាប់ប្រកបអក្ខរាវិរុទ្ធខ្មែរនៅលើយូនីកូដនិងតាមប្រភពផ្សេងៗជាច្រើនទៀត។ ដោយសារការស្វែងរកឃើញនូវពាក្យខុសជាបន្តបន្ទាប់យ៉ាងដូច្នេះ ទើបធ្វើឱ្យក្រុមអ្នកជំនាញផ្នែកភាសាខ្មែរ បានមកជួបជុំគ្នាកាលពីពេលថ្មីៗនេះ ដើម្បីរិះរកដំណោះស្រាយ ក្នុងការឆែករកពាក្យខ្មែរឬព្យាង្គដែលត្រឹមត្រូវ ដើម្បីកាត់បន្ថយការសរសេរពាក្យខុស ដែលធ្លាប់តែកើតមាននាពេលកន្លងមក។ ជាមួយគ្នាផងដែរ ក្រុមអ្នកជំនាញបាននិងកំពុងសិក្សាយ៉ាងស៊ីជម្រៅលើបទពិសោធន៍នៃការរៀបចំ Software ពិនិត្យអក្ខរាវិរុទ្ធភាសាខ្មែរ ដើម្បីឱ្យប្រាកដថារាល់ដំណោះស្រាយដែលគ្រោងអនុវត្តនាពេលខាងមុខនេះ អាចដំណើរការទៅប្រកបដោយភាពជោគជ័យ។
លោក ដាញ់ ហុង អ្នកបង្កើតកម្មវិធីអក្ខរាវិរុទ្ធខ្មែរនៃសមាគមអ្នកនិពន្ធខ្មែរ បានស្នើឱ្យបង្កើតក្រុមអ្នកបច្ចេកទេសរៀបចំ DATA បញ្ញាសិប្បនិម្មិត (AI)ដែលជាបច្ចេកវិទ្យាទំនើបចុងក្រោយនៅកម្ពុជា ក្នុងការដាក់បញ្ចូលទៅក្នុងភាសាខ្មែរ ដើម្បីងាយស្រួលស្វែងរកពាក្យព្យាង្គខ្មែរឱ្យបានត្រឹមត្រូវទៅតាមក្បួនខ្នាត ។ បើតាម លោក ដាញ់ ហុង បានឱ្យដឹងថា បញ្ហាដែលប្រឈមខ្លាំងបំផុតនាពេលសព្វថ្ងៃនេះ គឺអក្សរខ្មែរមានភាពស្មុគស្មាញ ព្រោះបើតាមការបង្ហាញរបស់អ្នកស្រាវជ្រាវកន្លងមក គឺអក្សរខ្មែរនេះអត់មានដកឃ្លាទេ ប៉ុន្តែអ្វីដែលលោកបានកត់សម្គាល់នៅក្នុងបញ្ហានេះ គឺមានភាសាច្រើនណាស់នៅលើពិភពលោកដែលអត់ដកឃ្លាដែរ ប៉ុន្តែចុះហេតុអ្វីបានជាមិនសូវស្មុគស្មាញ?
សំឡេង១៖«យើងមានក្បួនសរសេរអក្សរខ្មែរ ប៉ុន្តែជាក់ស្តែងពេលខ្លះ នៅពេលដែលយើងសរសេរពេលខ្លះយើងទទួលឥទ្ធិពលពីបារាំង ពេលខ្លះទទួលឥទ្ធិពលពីអង់គ្លេស ហើយពេលខ្លះទៀតយើងទទួលឥទ្ធិពលពីចិន ហើយដូចពេលខ្លះព្រះយូឡាយ ពេលខ្លះគេសរសេរយូឡាយហ្នឹង ឡដាក់ស្រៈអាយ...និងយឡាយហើយពេលខ្លះសរសេរលាយដាក់ស្រៈអាយវាមានន័យដូចគ្នាន័យតែមួយមែន ក៏ប៉ុន្តែសរសេរបែបខុសគ្នាច្រើន ដល់អ៊ីចឹងហើយការដែលរកព្យាង្គតាមក្បួនខ្នាតខ្មែរយើងនេះគឺវាអត់គ្រប់គ្រាន់»។
លោក ដាញ់ ហុង បានបញ្ជាក់ថា ឆ្លើយបតនឹងបញ្ហាខាងលើនេះ គឺត្រូវទាមទារឱ្យមានការប្រើ AI ឬបច្ចេកវិទ្យាចុងក្រោយ ដែលមានលក្ខណៈទំនើបនាពេលបច្ចុបន្ននេះ ដើម្បីអាចជួយស្វែងរកនូវពាក្យត្រូវ។
សំឡេង២៖«អ៊ីចឹងហើយវាមានតែប្រើ AI ឬបច្ចេកវិទ្យាចុងក្រោយប៉ុន្តែវាទំនើបនាពេលបច្ចុប្បន្នយកមកដោះស្រាយបានរាល់ថ្ងៃបញ្ហាដែលមានគឺយើងខ្វះក្រុមដែលរៀប Data ឱ្យបានត្រឹមត្រូវ បើមាន data ត្រឹមត្រូវហើយ AIយើងទៅមុខគឺអាចឆែកបានល្អ»។
ដើម្បីរួមចំណែកកាត់បន្ថយលើបញ្ហានេះថែមទៀតនោះ លោក ដាញ់ ហុង បានជំរុញឱ្យមានការចាប់ផ្តើមដំបូងគឺផ្តោតសំខាន់លើផ្នែកផ្សព្វផ្សាយ ដោយអ្នកសារព័ត៌មានខ្លួនឯងត្រូវធ្វើយ៉ាងណាចេះប្រើអក្សរខ្មែរឱ្យបានត្រឹមត្រូវជាមុនសិន ទើបអាចនាំមកវិញនូវទិន្នន័យដែលច្បាស់លាស់ច្រើន ហើយខណៈនោះAIក៏នឹងមានភាពវៃឆ្លាតទៅតាមការនិយមប្រើប្រាស់អក្សររបស់យើងផងដែរ។
សំឡេង៣៖«ដំបូងគឺការផ្សព្វផ្សាយដូចជាសារព័ត៌មានអ៊ីចឹង សារព័ត៌មានអាចប្រើធ្វើម៉េចឱ្យអក្សរខ្មែរយើងឱ្យបានត្រឹមត្រូវ អ៊ីចឹងហើយទើបទិន្នន័យត្រឹមត្រូវល្អច្រើនAI ឆ្លាតតាមហ្នឹង ហើយប្រសិនបើឧទាហរណ៍មានក្រុមហ៊ុនវិនិយោគគឺល្អ ប៉ុន្តែសព្វថ្ងៃនេះគឺអត់មាននោះទេ គឺការងារនេះបុគ្គល ទាំងអស់ហ្នឹងគឺការងារអ្នកស្រាវជ្រាវការងាររបស់បុគ្គលការងាររបស់ឯកជនទេមិនទាន់មានជាស្ថាប័នធំឬមួយក្រុមហ៊ុនធំដែលចូលរួម ដូចជាក្រុមហ៊ុន Microsoft ឬ មួយ Google អីហ្នឹង មិនដែលឃើញគេនិយាយអំពីរឿងហ្នឹងគេមានModel ធំ គេធ្វើធំអ៊ីចឹង ប៉ុន្តែពាក់ព័ន្ធនិងរឿងភាសាខ្មែរហាក់ដូចជាទីផ្សារតូចណាស់ គេហាក់ដូចជាមិនចាប់អារម្មណ៍»។
ត្បិតលោក ដាញ់ ហុង បានស្នើឱ្យមានការរៀបចំអ្នកបច្ចេកទេសសម្រាប់រៀបចំទិន្នន័យបញ្ចូល Data ក្នុងភាសាខ្មែរក៏ពិតមែន ប៉ុន្តែអ្នកជំនាញនៃក្រុមប្រឹក្សាជាតិភាសាខ្មែរ ក៏បានសាទររាល់ការដាក់ចេញជាវិធានការថ្មីៗជាច្រើនថែមទៀត សម្រាប់ជាគន្លឹះរួមចំណែកក្នុងការដោះស្រាយ។
ជុំវិញរឿងនេះក្រុមប្រឹក្សាជាតិភាសាខ្មែរដែលហៅកាត់ថា គ.ជ.ត.ខ.នៃរាជបណ្ឌិតសភាកម្ពុជា កាលពីពេលថ្មីៗនេះ បានជួបពិភាក្សាគ្នាយ៉ាងលម្អិតទៅលើបទពិសោធន៍នៃការរៀបចំ Softwareពិនិត្យអក្ខរាវិរុទ្ធ នៅក្នុងភាសាខ្មែរ ដើម្បីកាត់បន្ថយនូវរាល់កំហុសដោយអចេតនា ក្នុងការប្រើប្រាស់ពាក្យព្យាង្គភាសាខ្មែរ តាមរយៈការប្រកបអក្សរនៅលើក្តាចុចយូនីកូដខ្មែរផងដែរ។
មានប្រសាសន៍នៅក្នុងវេទិកាស្តីពីបទពិសោធន៍នៃការរៀបចំសុសវែពិនិត្យអក្ខរាវិរុទ្ធភាសាខ្មែរ ឯកឧត្តមបណ្ឌិត ហ៊ាន សុខុម ប្រធានក្រុមប្រឹក្សាជាតិភាសាខ្មែរបានលើកឡើងថា នៅក្នុងសម័យសាកលភាវូបនីយកម្ម ការអភិរក្ស និងការអភិវឌ្ឍភាសាជាតិ ពិតជាមានសារៈសំខាន់ណាស់ ព្រោះដើម្បីរក្សាអត្តសញ្ញាណជាតិ។
សំឡេង៤៖«នៅពេលដែលភាសាខ្មែរយើងមានពាក្យកាន់តែច្រើននិងការប្រើប្រាស់ឯកភាពគ្នា នោះការសិក្សាស្រាវជ្រាវការងារក្នុងក្រសួងស្ថាប័ន ក្នុងវិស័យអាជីវកម្ម ឬទំនាក់ ទំនងនានានិងមានភាពងាយស្រួល ប្រកបដោយប្រសិទ្ធភាព និងស័ក្តិសិទ្ធិភាពខ្ពស់។ នាសម័យបដិវត្តន៍ឧស្សាហកម្ម៤.០នេះ ការធ្វើឌីជីថលកម្មភាសានិងប្រព្រឹត្តកម្មភាសាធម្មជាតិ គឺជាចំណែកមួយយ៉ាងសំខាន់ក្នុងការអភិវឌ្ឍភាសាជាតិឱ្យបានសមស្របទៅនឹងយុទ្ធសាស្រ្តបញ្ចកោណរបស់រាជរដ្ឋាភិបាលអាណត្តិទី៧នៃរដ្ឋសភា»។
ឯកឧត្តមបណ្ឌិត បានបញ្ជាក់ថា កន្លងមកនេះ មានអ្នកស្រាវជ្រាវជាតិមួយចំនួនបានសាកល្បងដោះស្រាយបញ្ហានេះ ដោយបានរៀបចំបង្កើតសុសវែពិនិត្យអក្ខរាវិរុទ្ធភាសាខ្មែរ ដែលជាសុខូបករណ៍មួយ ផ្តល់ភាពងាយស្រួលដល់សិស្ស និស្សិត មន្ត្រីរាជការ អ្នកប្រើប្រាស់ទូទៅក្នុងការស្វែងរកពាក្យ និងផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវក្នុងការសរសេរពាក្យខ្មែរនីមួយៗ។
សំឡេង៥៖«ភាសាជាតិយើងនៅមានបញ្ហាជាច្រើនដែលមិនទាន់ដោះស្រាយពេញលេញរួចនៅឡើយ ហើយនៅក្នុងនោះអក្ខរាវិរុទ្ធគឺជាបញ្ហាមួយដែលត្រូវដោះស្រាយជាបន្ទាន់ផងដែរ។ កន្លងមកយើងឃើញថា មានអ្នកស្រាវជ្រាវជាតិយើងមួយចំនួនបានសាកល្បងដោះស្រាយបញ្ហានេះដោយបានរៀបចំបង្កើតសុសវែពិនិត្យអក្ខរាវីរុទ្ធភាសាខ្មែរ ដែលយើងគិតថាជាសុខូបករណ៍មួយផ្តល់ភាពងាយស្រួលដល់សិស្ស និស្សិត មន្ត្រីរាជការ អ្នកប្រើប្រាស់ទូទៅក្នុងការស្វែងរកពាក្យនិងផ្ទៀងផ្ទាត់ភាពត្រឹមត្រូវក្នុងការសរសេរពាក្យខ្មែរនីមួយៗ»។
បើតាម ឯកឧត្តមប្រធានក្រុមប្រឹក្សាជាតិភាសាខ្មែរបានបន្ថែមថា សម្រាប់ផលប្រយោជន៍នៃសុខូបករណ៍នេះគឺនឹងផ្តល់ឱ្យអ្នកប្រើប្រាស់រួមមាន ១. ការកែលម្អទំនាក់ទំនងជាមួយអ្នកដទៃដោយហេតុថាអក្ខរាវិរុទ្ធត្រឹមត្រូវ ធ្វើឱ្យភាសាជាតិ មានភាពច្បាស់លាស់និងមានលក្ខណៈវិជ្ជាជីវៈចៀសវាងការភាន់ច្រឡំ ២.សន្សំសំចៃពេលវេលា ដោយហេតុថាមិនចាំបាច់ផ្ទៀងផ្ទាត់អក្ខរាវិរុទ្ធច្រើនដង ដោយប្រើភ្នែកក្នុងការអាន ៣. ជាជំនួយការក្នុងការរៀនភាសា ដោយហេតុថាសុសវែ នេះ គូសបង្ហាញពាក្យដែលខុសនិងស្នើពាក្យដែលត្រូវជំនួសវិញ ៤.កាត់បន្ថយកំហុសដោយអចេតនានៅក្នុងការវាយអត្ថបទដោយប្រញាប់ប្រញាល់។ បើទោះបីជា ភាសាជាតិនៅមានបញ្ហាច្រើនដែលមិនទាន់ដោះស្រាយពេញលេញរួចនៅឡើយក្តី ហើយត្រូវទាមទារឱ្យមានការដោះស្រាយជាបន្ទាន់យ៉ាងក៏ដោយ ប៉ុន្តែក្រុមអ្នកជំនាញនិងអ្នកពាក់ព័ន្ធនៅក្នុងវិស័យនេះ នៅតែបន្តការខិតខំប្រឹងប្រែង ដើម្បីជំនះនូវឧបសគ្គមួយចំនួនដែលនៅតែបន្តកើតមាន។
សំឡេង៦៖«ហេតុនេះហើយថ្ងៃនេះ គឺជាឱកាសដ៏ប្រសើរមួយដែលក្រុមប្រឹក្សាជាតិភាសាខ្មែរបានរៀបចំសិក្ខាសាលានិងអញ្ជើញវាគ្មិនដែលជាអ្នកឯកទេស ក្នុងវិស័យនេះដែលបានខិតខំប្រឹងប្រែងមកពិភាក្សាគ្នា ដើម្បីរកដំណោះស្រាយដើម្បីបោះជំហានទៅមុខឱ្យដល់គោលដៅ»។
ជាការរួមចំណែកក្នុងការស្វែងរកដំណោះស្រាយលើបញ្ហានេះ លោក កែ ជាប៉ូ ប្រធានផ្នែកស្រាវជ្រាវនៃក្រុមហ៊ុន ខូតាហ្វឺឯ.ក បានធ្វើបទបង្ហាញស្តីពីបទពិសោធន៍ នៃការរៀបចំសុសវែពិនិត្យអក្ខរាវិរុទ្ធភាសាខ្មែរដោយបានលើកឡើងពីចំណុចចាប់ផ្តើមដំបូងនៃមូលហេតុដែលក្រុមហ៊ុន ខូតាហ្វឺ មានបំណងចង់បង្កើតសុសវែមួយសម្រាប់ត្រួតពិនិត្យអក្ខរាវិរុទ្ធភាសាខ្មែរ។
បើតាមលោក កែ ជាប៉ូ បានលើកឡើងថា ក្រុមហ៊ុន ខូតាហ្វឺក៏មានកម្មវិធីមួយដែរ គឺផ្តល់ការអានសៀវភៅតាមបែបអេឡិត្រូនិក ដែលមានអត្ថបទបែបអប់រំច្រើន និងមាននៅក្នុងបណ្តាញសង្គមផងដែរ។
សំឡេង៧៖«ដើម្បីផ្តល់ជូននូវមាតិកាល្អៗសម្រាប់អ្នកអានរបស់យើងនោះ ជាទូទៅយើងតែងតែផ្ទៀងផ្ទាត់អក្ខរាវិរុទ្ធនិងពាក្យពេចន៍ ដែលមុននឹងយកមាតិកាទាំងអស់នោះទៅផ្សាយជូនអ្នកអានរបស់យើង ដូច្នេះហើយយើងគិតថា គួរតែមានសុសវែមួយសម្រាប់ធ្វើការងារនេះដើម្បីសម្រួលដូចឯកឧត្តមបណ្ឌិតបានលើកឡើងអ៊ីចឹងគឺយើងថាចង់មានសុសវែមួយដែលអាចធ្វើការងារហ្នឹងដោយអត់ចាំបាច់ពឹងមនុស្សប្រើភ្នែកយកទៅផ្ទៀងផ្ទាត់»។
ជាមួយនឹងគម្រោងចង់បង្កើតសុសវែពិនិត្យអក្ខរាវិរុទ្ធនេះទៀតសោតលោក កែ ជាប៉ូ ក៏មានបំណងចង់ចាប់ផ្តើមដាក់ សុសវែមួយនេះទៅលើ platform Microsoft word មុនគេដែរ ព្រោះដើម្បីឱ្យអ្នកប្រើប្រាស់ងាយស្រួលក្នុងការប្រើខ្លួនឯងនៅក្នុងបរិបទផ្ទៀតផ្ទាត់អក្ខរាវិរុទ្ធផង និងទី២ វាជា platform មួយដែលប្រជាជនខ្មែរតែងប្រើប្រាស់ជាទូទៅ ជាពិសេសអ្នកដែលទើបរៀនកុំព្យូទ័រដំបូងដូចជាសិស្សានុសិស្ស និស្សិតជាដើម។
សំឡេង៨៖«អ្វីដែលយើងចង់បានពីសុសវែមួយនេះទី១ គឺយើងចង់ឱ្យសុសវែមួយនេះអាចរកកំហុសអក្ខរាវិរុទ្ធ ទី២ អាចណែនាំពេលដែលសរសេរខុសហើយគួរសរសេរត្រូវបែបម៉េច ទី៣ អាចយកពាក្យត្រូវមកជំនួសពាក្យខុស ទី៤ គឺនៅពេលដែលពាក្យមួយហ្នឹងអត់ទាន់មាននៅក្នុងវចនានុក្រម ឧទាហរណ៍ដូចជាឈ្មោះ ដូចជាពាក្យកម្ចីពីបរទេស ដែលគាត់សរសេរតាមសូរបរទេស ឬក៏ពាក្យបច្ចេកវិទ្យាមួយចំនួន ដែលយើងអត់ទាន់បានអនុម័ត អ៊ីចឹងពាក្យហ្នឹងយើងចង់ឱ្យគាត់ជាអ្នកប្រើប្រាស់គាត់អាចចូលទៅក្នុងវចនានុក្រមមួយដែលគាត់ប្រើផ្ទាល់ខ្លួន»។
ដោយសារភាសានិងសំណេរត្រូវបានផ្សារភ្ជាប់គ្នានិងធ្វើការឆ្លុះបញ្ចាំងអំពីអត្តសញ្ញាណជាតិយ៉ាងដូច្នេះ ទើបអ្នកស្រាវជ្រាវភាសាជាតិ បានគិតគូរយ៉ាងយកចិត្តទុកដាក់លើការពិនិត្យអក្ខរាវិរុទ្ធ ដែលជាកិច្ចការមូលដ្ឋានមួយចាំបាច់ត្រូវប្រើជារៀងរាល់ថ្ងៃ។
បើតាមលោក ប៊ួយ រីណា អ្នកស្រាវជ្រាវបញ្ញាសិប្បនិមិត្តនៃមជ្ឈមណ្ឌលបណ្តុះធុរកិច្ចថ្មី«តេជោ» បានឱ្យដឹងថា ការពិនិត្យអក្ខរាវិរុទ្ធ គឺមានសារៈសំខាន់និងមានការប្រើប្រាស់យ៉ាងទូលំទូលាយដែរនៅកម្ពុជា។ លោកបន្តថា ការពិនិត្យអក្ខរាវិរុទ្ធសម្រាប់ភាសាបរទេសឬហៅថា High rescues Language ដែលមានដូចជា៖ ភាសាអង់គ្លេស ជប៉ុន កូរ៉េ ចិន...ជាដើមនេះ គឺមានភាពត្រឹមត្រូវខ្ពស់ណាស់ ដោយសារតែទាំងអស់នេះ គឺបានកើតឡើងដោយសារប្រទេសនោះសំបូរទៅដោយធនធាន មានទិន្នន័យគ្រប់គ្រាន់ មានក្បួនច្បាប់ត្រឹមត្រូវ ដែលអាចងាយស្រួលនៅក្នុងការយកមកប្រើប្រាស់ និងធ្វើកំណែអក្ខរាវិរុទ្ធ។
អ្នកស្រាវជ្រាវដដែលនេះបានបញ្ជាក់ថា សម្រាប់ការពិនិត្យអក្ខរាវិរុទ្ធភាសាខ្មែរនៅកម្ពុជាវិញ នៅតែមានបញ្ហាប្រឈមនៅឡើយ ដែលនេះអាចចាត់ទុកថា គឺជាបញ្ហាមួយដែលមិនទាន់អាចដោះស្រាយបាន ដូច្នេះទើបមានការជួបជុំក្រុមអ្នកពាក់ព័ន្ធ និងក្រុមអ្នកជំនាញភាសាខ្មែរ និងក្រុមអ្នកបច្ចេកទេស ដើម្បីធ្វើយ៉ាងណារួមគ្នាស្វែករក មធ្យោបាយដោះស្រាយណាមួយ ដែលសមស្របនិងប្រកបទៅដោយភាព រលូន។
សំឡេង៩៖« បើយើងពិនិត្យទៅលើឬសគល់មួយចំនួនហេតុបានជាការពិនិត្យអក្ខរាវិរុទ្ធនៅក្នុងភាសាខ្មែរមានការលំបាក ហើយនៅតែជាបញ្ហាដែលមិនទាន់ដោះស្រាយបាន បញ្ហាទី១គឺយើងមានភាពខុសគ្នា ជាទូទៅមុននឹងយើងអាចពិនិត្យថាពាក្យហ្នឹងខុសលុះត្រាតែយើងយកពាក្យ១ប្រយោគហ្នឹងទៅពុះបំបែកជាពាក្យ អ៊ីចឹងយើងត្រូវការModel មួយដែលអាចបំបែកពាក្យបាន ដោយសារភាសាខ្មែរយើងសរសេរយើងអត់មានសញ្ញាដកឃ្លា space ដូចភាសាអង់គ្លេស អ៊ីចឹងក្នុងន័យហ្នឹងយើងយកប្រយោគយើង Run model ដែលបំបែកពាក្យ បន្ទាប់មកទៀតយើងបានពាក្យមួយៗ ហើយដើម្បីដឹងថាពាក្យហ្នឹងខុសទាល់តែយើងទៅឆែក យើងយកទៅប្រៀបធៀបជាមួយនឹងពាក្យនៅក្នុងវចនានុក្រម ប្រសិនបើមាននៅក្នុងវចនានុក្រមយើងគិតថាពាក្យហ្នឹងវាត្រូវ ហើយប្រសិនជាអត់មានទេចឹងយើងសន្មត់ថាពាក្យហ្នឹងមានកំហុសអក្ខរាវិរុទ្ធ»។
ជាមួយគ្នាផងដែរ លោក ប៊ួយ រីណា បានបន្ថែមថា គិតមកដល់សព្វថ្ងៃនេះ នៅមិនទាន់មានស្តង់ដាModelបំបែកពាក្យដែលអ្នកស្រាវជ្រាវទាំងអស់ មានការឯកភាពគ្នាជារួមនៅឡើយទេ ដូច្នេះហើយទើបធ្វើឱ្យអ្នកស្រាវជ្រាវផ្សេងៗទៀត ត្រូវកសាងទិន្នន័យបំបែកពាក្យដោយខ្លួនឯងទៅវិញ មិនត្រឹមតែប៉ុណ្ណោះ អ្នកស្រាវជ្រាវភាសាក៏អាចបង្កើតនិយមន័យនៃពាក្យណាមួយ សម្រាប់យកមកប្រើរៀងៗខ្លួន ដែលនេះមានភាពខុសគ្នាពីអ្នកស្រាវជ្រាវដទៃៗទៀត។
លោកអ្នកនាងស្តាប់ជាទីមេត្រី!
ស្រដៀងទៅនឹងការលើកឡើងពីបញ្ហាប្រឈមនៃការប្រើប្រាស់ព្យាង្គរបស់លោក ប៊ួយ រីណា គឺមិនខុសគ្នាពីអ្វីដែលបានបញ្ជាក់ដោយលោក ដាញ់ ហុង នោះទេ។ ប៉ុន្តែនៅក្នុងបទបង្ហាញរបស់លោក ដាញ់ ហុង ក៏បានរៀបរាប់នូវការប្រើប្រាស់អក្សរខ្មែរ ដែលត្រូវមានការប្រកបពិសេស និងមានក្បួនប្រកបតាមបែបខ្មែរ ព្រមទាំងទទួលរងឥទ្ធិពលភាសាបាលីសំស្រ្កឹតដែរ ហើយក៏ទទួលឥទ្ធិពលពីភាសាធំៗ ដែលមានដូចជា៖ បារាំង អង់គ្លេស ចិន...ជាដើម។ល។ ដែលនេះធ្វើឱ្យការសរសេរអក្សរខ្មែរងាយខុសផងដែរ។ ជាមួយគ្នានេះ លោក ដាញ់ ហុង ក៏បានលើកឡើងនូវបញ្ហាប្រឈមមួយចំនួនទៀតដូចជា៖ កម្មវិធីកុំព្យូទ័រជំនាន់មុន ពិបាកក្នុងការពិនិត្យអក្ខរាវិរុទ្ធភាសាខ្មែរ។ ដោយឡែក Next spell ពិនិត្យអក្ខរាវិរុទ្ធតាមរយៈគំរូភាសា (Model) ត្រូវបានបង្កើតដោយទិន្នន័យភាសាខ្មែរ ហើយការសរសេរអត់មានដកឃ្លានៅចន្លោះពាក្យនីមួយៗទេ ដែលកត្តានេះទាមទារឱ្យការសរសេរកូដត្រូវបង្កើតឱ្យមានលក្ខណៈស្វ័យប្រវត្តិ។ ម្យ៉ាងទៀតអក្សរខ្មែរមានស្រៈផ្សំច្រើន មានគ្រាមភាសា និងព្យាង្គតម្រួតច្រើនជាន់។ មិនត្រឹមប៉ុណ្ណោះ អក្សរខ្មែរនៅខ្វះបញ្ជីពាក្យ ដែលប្រើប្រាស់ញឹកញាប់។ រីឯការស្រាវជ្រាវនិងការផ្តល់មូលនិធិវិញគឺមានតិចតួច។ ដោយឡែកការគាំទ្រពីសហគមន៍ នៅមានកម្រិតសម្រាប់ Khmer NLPជាដើម៕